当前学术界和产业界对于“会聊天≠会思考,大语言模型造不出通用人工智能”的共识日益明确,核心论点可归纳为以下四方面:
一、语言能力≠思维本质
神经科学证据:人类思维独立于语言存在。失语症患者虽丧失语言能力,仍可完成数学推理、逻辑规划等复杂认知任务,证明思维核心机制不依赖语言126。
语言的功能定位:语言本质是交流工具而非思考载体,大脑的语言网络主要负责信息编码与传输,而非推理本身。非语言任务(如空间推理)的脑区激活与语言网络分离,印证了思维的多元性6。
二、大语言模型(LLM)的固有缺陷
模仿而非理解:
LLM仅通过统计关联生成文本,缺乏对物理世界的内在表征。其输出本质是对训练数据的重组,无法建立因果逻辑5723。
例如:LLM可描述“冰块融化”,但无法基于热力学原理预测融化速度12。
缺乏具身性与实践反馈:
人类智能依赖与物理环境的交互(如触觉、运动反馈),而LLM被困于文本宇宙,无法通过感官体验形成真实认知812。
杨立昆指出:LLM对物理世界掌握有限,无持久记忆与规划能力,是“本质上不安全”的系统79。
幻觉与不可控性:
LLM的生成结果高度依赖输入提示,且错误随机不可控。即使投入更多算力,其本质仍是“语言复读机”,无法实现稳定推理161723。
三、通用人工智能(AGI)的核心要素
实现人类水平智能需突破四重能力:
具身认知(Embodiment):通过机器人载体与世界交互,获得感知-行动闭环812;
符号接地(Symbol Grounding):将抽象概念关联到实体经验(如将“红色”映射到视觉信号)12;
因果推理(Causality):超越相关性,识别事件间的因果机制51223;
持续进化(Self-evolution):动态适应新环境的能力,而非依赖静态训练数据14。
李飞飞强调:空间理解与物理推理是LLM无法跨越的鸿沟,AI需建立“世界模型”应对不确定性8。
四、技术路径的反思
当前LLM的定位:作为工具可提升信息处理效率,但其架构天花板显著。76%科学家认为仅扩展模型规模无法实现AGI17。
未来方向:
放弃纯文本依赖,开发多模态交互系统(如视觉-动作模型);
融合强化学习与神经符号计算,使AI从环境反馈中自主学习1223;
构建“世界模拟器”,让AI在虚拟环境中试错进化(如DeepMind的虚拟训练场)9。
结语
LLM的聊天能力是智能的“表象”,却非“实质”。若将语言流畅等同于思考深度,无异于将舞台灯光误认为戏剧本身。真正通用智能的诞生,需回归人类认知的本源——在物理世界中学习、试错与创造。