理想 TOP2 09月11日
理想汽车VLA架构中L语言的重要性
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

理想汽车自动驾驶负责人郎咸朋解释了VLA架构中L语言部分的作用,强调其与人类理解和认知世界的关系。L语言并非显式的文字推理,而是通过人类语言提供的数据进行隐式的逻辑推理,是VLA架构的核心。L语言塑造和限制了人类对世界的认知、理解和表达、推理能力,是人类和动物的最大区别之一。在VLA架构中,V是感知,A是动作,而L承担的是语言能力部分,对V感知的内容做出认知理解并形成A的行动规划和决策。如果没有强大的L,再好的V和A都无法发挥出来。随着自动驾驶技术的发展,VLA架构将在L3/L4阶段发挥出强大的优势。

🧠 L语言在VLA架构中扮演着核心角色,它通过人类语言提供的数据进行隐式的逻辑推理,对感知到的内容进行认知理解并形成行动规划和决策。

🗣️ L语言并非指显式的文字推理,而是指利用人类语言提供的数据进行隐式的逻辑推理,是人类和动物最大区别之一,是人类认知世界的框架。

🚗 VLA架构中,V代表感知,A代表动作,L代表语言能力,三者协同工作,而强大的L语言能力是VLA架构发挥优势的关键。

🌏 不同的语言以其独特的词汇、语法和结构,为使用者提供了不同的认知框架,影响着人们对世界的理解和表达。

📈 随着自动驾驶技术的发展,VLA架构将在L3/L4阶段发挥出强大的优势,获得碾压的胜利,这得益于其强大的L语言能力。

2025-09-04 10:30 四川

2025年9月4日,理想汽车自动驾驶负责人郎咸朋微博表示:

自从交付VLA之后,我经常被问到的问题是:如何看待VLA里面L语言的部分,这与人类理解和认知世界有什么关系,如果没有语言行不行?我也在不同场合做过一些解释,今天抽时间整理下做个正式的回答。

“语言即世界”是哲学家维特根斯坦在其著作《逻辑哲学论》中提出的一个核心哲学命题,原话为:“语言的界限意味着我的世界的界限”。它并非指物理世界由语言构成,而是强调语言在根本上塑造和限制了人类对世界的认知、理解和表达、推理能力。这些高级能力的习得,不是直接通过视觉和听觉的原始信息就行的,而是人类利用语言学习到的,这也是人类和动物的最大区别之一。

语言是认知世界的框架,而不仅是沟通工具。人类所能思考、理解和表达的一切,都被限制在语言的范畴之内。我们所理解的世界,很大程度上是我们所使用的语言的产物,对于无法用语言表述的事物,我们难以形成清晰的思想。而且,不同的语言以其独特的词汇、语法和结构,为使用者提供了不同的认知框架。所以我们会看到,来自于不同语言体系的人,其思维方式是有差别的。

在VLA架构里面,V是感知,A是动作,而L承担的是语言能力部分。L对V感知的内容做出认知理解并形成A的行动规划和决策。VLA的L不是用语言做显式的文字推理,而是用人类语言提供的数据学习做隐式的逻辑推理,这才是L真正的核心。很多人以为L就是输出在交互界面的那几行文字以及语音控制命令,这个理解是不对的。其实文字输出和语音输入都是可选的,输不输出都不太关键(看人类想不想要),真正发挥作用的是背后推理的长思维链。如果没有强大的L,再好的V和A都无法发挥出来。这跟人与动物的区别很相似。论视觉能力人比不过鹰,论行动速度比不过猎豹,但人之所以能够称霸地球,靠的是强大的认知和理解能力。而这个认知和理解能力就来自于人类特有的语言能力。

由于现在的辅助驾驶任务还比较简单,所以VLA方案与其他端到端方案相比优势还不明显。相当于人跟猴子赛跑,可能互有胜负。但我们认为在L3/L4阶段,自动驾驶作为Agent要独立完成复杂AGI任务的时候,VLA就会发挥出强大的优势,获得碾压的胜利。

加微信,进群深度交流理想实际经营情况与长期基本面。不是车友群。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

理想汽车 自动驾驶 VLA架构 L语言 认知能力
相关文章