安向京:无人驾驶终端具身移动 是充满想象力的新赛道

新闻舆情
  12月8日-9日,在2025地平线技术生态大会期间,行深智能CEO 安向京 莅临新浪汽车高端访谈间时表示:未来不再是送一个一个具体的东西,而是实现空间转移平台的管理,把物流变成空间转移。不同的物流企业,甚至能服务快递、生鲜、烟草、预制菜等等广大的物流城配体系,甚至更进一步可以服务环卫、服务安防,甚至包括煤气泄露的巡检等等一系列的应用,所有的终端移动的应用或者是具身移动的应用,都可以被无人驾驶的能力所覆盖和赋能,这个就是非常有想象力的空间和有想象力的赛道。   新浪汽车:感谢安总来到新浪汽车的直播间,安总简单地和大家打个招呼。   安向京:大好!我是行深智能的安向京,我们行深智能是2017年成立的,到现在已经有八年了,我们聚焦在L4的末端无人物流赛道上。   新浪汽车:您刚才说到了末端无人赛道L4级,这和我们理解的最后一公里有什么具体的场景吗?   安向京:对,末端在物流领域大概是这么分,分干线物流、支线物流和末端物流,所以说末端物流基本上涵盖了城配以及您刚才说的最后一公里,甚至最后50米所有的场景,所以末端物流的概念相对可能比最后一公里要大一点,一般最后一公里的概念都是老外这么讲,但是我们国内一般都是讲末端物流、支线物流和干线物流这三个概念。   新浪汽车:我们以快递举例,干线,我可以理解为城市到城市之间?   安向京:对,城市到城市,一般是走高速公路,一般月跨城,它最大的区别就是跨不跨城,跨不跨区,它是从中央仓岛中央仓。   新浪汽车:支线就是城市内?   安向京:对,支线是城市内,以及城市周边的卫星城、卫星县、卫星镇,它往往是指从干线下来以后到二级分拣的过程,就是一级分拣到二级分拣的过程,然后二级分拣再往下就统称为末端了。   新浪汽车:二见分拣,那就是从快递的收发点到家里这一段?   安向京:不是,还要往前,有一个网点叫做分拣中心,分拣中心再往下到驿站,再到家里,再到手上这个过程。   新浪汽车:所以未来,我们在家中是能体验到这种末端配送送上门的体验吗?   安向京:这个其实就是行深智能一直在探索和追求的一个点,因为我们认为物流是一个非常大的场景,同时,L4的无人驾驶仅仅是更大一个概念的子集,就是具身移动,现在大家都在讲具身机器人,具身机器人有两个典型的应用,一个是移动,一个是操作,像我们说的灵巧手、搬运,甚至翻跟头,这些可以看作是动作、操作,还有更大的一类是A点到B点,这个A点到B点有很多,比如高速公路上的一个城市到一个城市也叫A点到B点,从网点到驿站也叫A点到B点,从驿站到家也叫A点到B点,所以我们认为未来这个货直接递到你手上,不是梦想,是很快就会到来的现实,这个就是具身移动生动的体验。所以我们行深也有一款车,就是无人车加机器人,把机器人和无人车作一个接力,作一个协同,无人车走室外的大范围场景,对跃障能力要求高的,速度要求高的,机器人走街串巷,走上户进门的场景,走这个。   新浪汽车:现在这个产品已经上了吗?   安向京:有一个雏形,还没有规模化的商用,已经在测试了。   新浪汽车:我可以理解为是一个机器人骑着一个小车奔波在大街小巷之间?   安向京:对,但我们有一个形象的名字叫“袋鼠”,就是袋鼠妈妈负责室外,袋鼠宝宝负责室内,因为袋鼠宝宝比较灵巧灵活,它可以上楼上电梯,然后送到你的家门口。   新浪汽车:您估计这个产品会在什么时候投入商用?   安向京:我们预计明年就可以实现规模化的测试和商用。   新浪汽车:这个还挺期待的,其实我们看到行深智能产品大多数都是在园区里面,像有一个货舱的无人驾驶车辆在那边转边吆喝着矿泉水、饮料、火腿肠,这种场景其实已经很成熟了,刚才您还提到了干线、支线和末端,这三个场景对于L4的难度来讲,有什么区别吗?   安向京:我们是这样理解的,本质上,无人驾驶车是一个人工智能的产品,人工智能的产品,它的核心就是数据、算力、算法这三个,数据其实来源于场景,所以从场景的丰富度来讲,它的难度,如果难度和场景的丰富度相关,我们认为它是干线的小于支线的,支线的小于末端的,因为干线是高速公路,这是属于是高速无人驾驶,支线有更多的城区、城域,这个难度就提高了,然后末端有很多大量的非结构化的场景,比如说走街串巷,比如说背街小巷,比如说上下楼梯,比如说走非机动车道,甚至连地图都没有的场景,比如走一些网点的地下室、网点的仓库等等,这些都是没有地图和没有参考的,这样它需要的数据量就会大大增加,场景的难度就会增加。   新浪汽车:今年自动驾驶有了很多舆情方面的事件,您应该也看到了,有一个典型场景是天黑的时候在高速上有一些需要避让的场景,比如锥桶或者修路的路段,面对这种情况,我们既然是L4,面对这种场景,是不是能做到游刃有余?   安向京:对,这其实是一个非常严肃的问题,所以我们一开始在定义行深智能能力的时候,我们就始终认为安全是第一位,这是一个责任,所以我们一开始公司就立了一个发展的路径,一定是从低速到高速,我一定是先覆盖低速的场景,比如说厂内物流,不超过20公里,我们刚才说的末端场景,毕竟速度要限制在40公里以下等等。另外一个是从运货到运人,就是我先只运货不运人,运人,两者就有一个类似于电车悖论的难题,当一旦万不得已出现危险的时候,你是保护车外的人,还是保护车内的人?只要是运货,货的价值永远是有限的,而生命是无限的,所以我一定是保护人,就是车外的人,所以这个问题很好解决,但一旦运人,这个事情就有一点悖论了,这个时候就会很麻烦,比如说像您刚刚举的这个例子,如果我以一个物理极限能达到的速度去减速,其实我是可以不撞这个锥桶的,但这就意味着里面的人,会被这么大的减速而受伤,我要是减速,里面的人受伤,我要是不减速,外面的人受伤,这就是一个悖论。另外一个,先是有限场景,然后再扩展到随机场景,像刚才您提到的都属于随机场景,而我们说的有限场景是指点对点,事先我就知道这条路的情况是怎样的,它不会出现随机选路的情况,这个我认为也是现在我们应该认真对待的一个点。   新浪汽车:所以我们现在所有产品基本上还是处于末端低速的?   安向京:末端低速的城配场景。   安向京:面对高速场景,现在还没有做?   安向京:高速场景,我们有实验,但是没有推出产品。   新浪汽车:预计未来大概是什么时候(会推出)?   安向京:我觉得随着技术的进步和数据的积累,我们会慢慢地推出这些产品,刚才说的低速到高速,载货到载人,限定到随机,会慢慢地解锁,一点一点地解锁。   新浪汽车:明白,尤其是今年,全网的网友对自动驾驶高速的辅助驾驶、城区辅助驾驶的关注度特别高,整个汽车行业乘用车这一块,基本上已经成了一个标配必选项了,在这么一个场景下,我们也看到,尤其是今年华为提出了世界模型的架构,相对于早期的端到端,它相当于换了一套底层的算法,然后他们又会说L2是基于L4而来的,我们做L4的话,当面临这种算法改变的话,我们是怎么应对的呢?   安向京:这个地方的观点,我要稍微纠正一下,L2不是L4而来的,其实大家都是人工智能无人驾驶的算法,只不过场景不同,L4的传统思路是基于高精地图,基于这种重地图、轻感知的这种模式发展起来的,它也是不得已而为之,因为在过去L4大部分的场景下是没有地图的,或者是无法获得,或者是无法测绘地图,但L2就是针对城区NOA等等,它本来就有地图,本来就有大量商用的导航服务,所以这是两个不同的场景,核心还是那句话,有多少数据就有多少智能,核心是你在这些场景上拓展的量以及在拓展的过程中有没有把这些数据有效地变成你自己的能力,这一点其实是核心的技术壁垒和护城河。   新浪汽车:所以您觉得进入L4时代的话,高精地图是必不可少的?   安向京:也不是,它一定是和L2的轻图是结合的,在有普通地图的地方就用普通地图,在没有普通地图的地方,我们可以用高精地图来做辅助。   新浪汽车:在园区场景里,我们会遇到的最极限的案例是什么?   安向京:比如进到一个分拣中心,需要到某一个指定的分位置上去,这个时候的场景变化很多,因为随时堆的货物会发生剧烈的变化,另外场景上又有建筑物,有天花板,然后会导致GPS定位信号丢失等等,这样的场景其实挑战是很大的。   新浪汽车:没有信号的话…   安向京:靠识别,靠感知,靠高精地图,靠这些辅助手段。   新浪汽车:不会说没有网了就完全不受控了?还是按照自己的理解做的。   安向京:对。   新浪汽车:商用车有没有我们做的这种产品,营销的话术,您可能会看到乘用车今年提到很多世界模型也好,VRM也好,VRA、一端式端到端、两段式端到端各式各样的词汇,大家听得也是云里雾里,但是在商用车领域,貌似大家没有说过这些东西。   安向京:道理上是一样的,只不过商用车更强调的是解决问题,你给我送货,而乘用车更强调的是感受,是人机交互。举一个很典型的例子,VRM和VRA其实是同源的,和A有一个界定的区别就在于你能不能和人类的语言对齐,和人类的感觉对齐,就是说L2的无人驾驶,它强调的是我做起来像老司机在开车,这种感受很重要,同时,我要理解我在干什么,你也要理解我在干什么,我怎么让你理解说话,你怎么让我理解语言,这就变得很重要了,但乘用车没有必要,乘用车只需要A点到B点,你替我解决问题就行了,所以说乘用车它不是太强调跟人类的感受对齐这一点,你只要安全地把货及时安全地送到就行了,它不强调开得像不像一个老司机,刹车多不多,加速度大不大晃不晃,这些不是太care(关心),也不太需要去跟人通过交互来理解你要去哪里,这个地方怎么会更好地到哪儿,它不需要这些东西,所以可能从术语上就会有一点不一样,但是这些事都是存在的,核心的核心是如何用通用人工智能的技术来逐步地提高我的无人驾驶的能力,来服务无人驾驶A点到B点的运力交付。   新浪汽车:关于强化学习,我们这边是怎么布局的呢?包括因果推理能力,商用车如果只是单纯地完成任务,不追求过程中的体感的话,那这部分的能力还需要吗?   安向京:需要,这个因果推理能力对于无人驾驶是非常重要的,因为人的学习和机器的学习有一个本质的区别,人的学习一定是基于过去的学习,但机器的学习可以基于未来,为什么?我这一次的数据可以改变我的算法,可以用我记录到的未来的数据来改变我的算法,所以这一点是人所不具备的优点,所以说,我们的因果推理以及数据闭环非常的重要,对于我们来说,一个corner case(音),我可能要记住前20秒后15秒所有的数据,来达到更优化的设计,人类很难采取这种学习的办法。另外一个就是强化学习,强化学习的本质其实是像一个最终的目标学习,就是用最终的目标来奖惩过去历史上的一些动作和决策,这个时候就有一个很重要的概念,就是价值观的对齐,强化学习奖惩的东西到底是什么?是安全?是流畅?是舒适?是效率?还是感受,就很重要,对于商用车来说,我们更强调的是安全,一定要安全是第一位,用安全作为奖惩。   新浪汽车:所以在保持安全的情况下,我们可以往后看几年,往未来看三到五年、五到十年,您觉得下一个能给商用车带来巨大变革的时间或者一个场景、一个技术的突破会是什么?   安向京:我认为随着算力的提升,VRM、VRA会大规模地应用到无人驾驶里,而且会实现周伯通练武左右互搏,这个世界模型在这一点上价值是巨大的,它可以实现左右互搏,就是我用真实的场景虚拟处或者仿真出各种各样的动态场景,来训练我的无人车的算力,让我的无人车的算法性能会快速地提升,而不是一定要走到这些场景,我才能够学习这种场景,这里面有几次技术上的跃迁,最早的一次就是我们把人开车的行为变成了规则,然后通过程序员的语言让车跑,那是几十年前的无人驾驶技术,到了2010年前后,深度学习的技术就是我可以让所有会开车的人都提升车的性能,怎么办?就是画框框,这是人,这是物,这是自行车,他是机动车,你的车需这么要绕,这个过程中需要的是画框框的能力,需要的是深度学习算法工程师的能力,而这就不仅是一个会开车的程序员了。再往后,那个时代,我们还是有多少人工就有多少智能,因为是画框框。再往后,到了Transformer时代,到了AGI时代,这个时候,我的标注是自动化的,我的能力是自动生成的,我已经不需要你画框框了,我就可以反复地训练和提升我的性能,这个时候你采多少数据就有多少能力。再往后,就是这个世界模型,通过世界模型,我可以模拟场景上发生了什么事,有什么车,不再需要实车去采数据,我觉得这是开发效率和生产效率一个巨大的提升,高效的提升,所以会带来无论是无人车的安全,还是效率,都会带来质的飞跃。   新浪汽车:我看到一些车会说自己是1000万Clips版本,在商用车领域里,也会有片段数量吗?   安向京:一样的,概念是一样的,它是训练模型,就是端到端的模型,无论是一段式的,还是两端式的,这个端到端的模型需要多大规模的数据来喂,这里面我们强调的是有效数据或者是多样化的数据,就是看这个数据的质量。   新浪汽车:还是要看质量。   安向京:对,它叫分布,看这个数据的分布是不是足够宽,足够广,不能光聚焦在高速公路,这就会产生孤僻动作。   新浪汽车:所以也会怎么数量极少质量高的,效果会比纯数量极高的这种效果要好?   安向京:这是肯定的,怎么来评价质量,学术界就有很多争议了。   新浪汽车:最后一个问题,我想问一下您,如果用一个技术名词来代表企业的能力,您觉得会用哪个关键词呢?   安向京:我觉得是“认知创新”,这一点是我们最大的一个特点,因为行深在无人驾驶赛道已经积累了30年,我们还想再做30年,我们是非常执着于技术的一群人,在这里面,我们始终认为无人驾驶不是一个简单的平替,不是把司机从车上裁掉,而是整个运力载具的信息化共享,这个才是它真正的核心价值。既然你实现的是运力载具的信息化共享,那你应该反过来去从业务逻辑上去想这个产品该怎么构建,而不是现有的产品是怎么样的,你考虑怎么替代它,所以行深智能一直是在这方面,认知上的革命,包括对技术认知的不同,对场景认知的不同,以及我们对业务本身逻辑认知的不同。比如我们就提出了未来无人物流车一定不是送一件一件的货,而是送标准化的单元容器,实现一个空间转移共享平台的理念,未来不再是送一个一个具体的东西,而是实现空间转移平台的管理,把物流变成空间转移,在这个过程中,你就可以搭载很多很多的东西,不仅能服务三通一达,不同的物流企业,甚至能服务快递、生鲜、烟草、预制菜等等广大的物流城配体系,甚至更进一步可以服务环卫、服务安防,甚至包括煤气泄露的巡检等等一系列的应用,所有的终端移动的应用或者是具身移动的应用,都可以被无人驾驶的能力所覆盖和赋能,这个就是非常有想象力的空间和有想象力的赛道了,这就是我们行深的愿景和使命,也是我们行深不同于其他无人驾驶企业的核心地方。   新浪汽车:感谢安总,我们今天的采访到这里结束!
提问
反馈