我们永远造不出理想中的 AI

🧠 人类思考方式的本质是什么？

首先要明确”人类思考”有哪些核心特征，这是讨论的基础：

特征	描述
具身性	思维依赖身体感知，冷/热/痛会影响判断
连续意识流	时间是线性的，有”当下感”
情绪驱动	决策深度受情绪左右（杏仁核 vs 前额叶）
主动遗忘	大脑会压缩、重构、甚至篡改记忆
元认知	知道自己不知道，能感知自身思维过程
目标自发性	人类会自己产生欲望和动机，不依赖外部 prompt
慢/快思考共存	直觉（系统1）+ 理性推理（系统2）并行

⚙️ 当前 LLM 的本质局限

现有大模型本质是静态的条件概率分布机器，它的几个根本问题：

无时间流：每次推理都是独立的，没有”活着”的感觉
无内驱动机：没有 prompt 就不存在，动机全靠外部
无真实具身：没有感知世界的传感器，知识来自文本而非经验
无真正记忆：上下文窗口≠记忆，关掉就全忘了
推理是模拟的：CoT 是”写下来的推理”，不是真正的内部计算过程

🔬 当前有哪些方向在尝试”改变底层”？

1. 神经符号融合（Neuro-Symbolic AI）

把 LLM 的模糊感知能力 + 符号逻辑的严谨推理结合。代表：MIT 的 Neurosymbolic Concept Learner、AlphaGeometry

更接近人类”直觉+推导”的双轨模式，但还远未达到通用性。

2. 世界模型（World Model）

让 AI 内部维护一个对现实世界的动态模型，而非仅处理文本。代表：Yann LeCun 的 JEPA 架构、DreamerV3

LeCun 明确认为 LLM 路线无法实现真正智能，世界模型才是方向。

3. 具身智能（Embodied AI）

给智能体身体，让它通过与物理世界的交互来习得概念。代表：Google DeepMind 的 RT-2、Figure 机器人

接近婴儿学习方式，但泛化能力仍然很弱。

4. 持续学习 / 可塑架构

解决”推理完就忘”的问题，让模型可以真正积累经验。代表：Titans（Google 2025）、MemGPT

在长期记忆上有进展，但离人类记忆的选择性重构差距很大。

5. 多智能体自组织（MAS）

多个 agent 分工协作，模拟大脑不同区域的分工。代表：AutoGen、Society of Mind 架构

有点像大脑皮层的模块化，但协调机制仍需人为设计。

🧩 核心矛盾：我们根本不知道意识是什么

这里有一个哲学硬墙：

人类思考 ≠ 人类行为模式的模仿

即使一个系统在所有行为上都像人类，它是否”真的在思考”？这就是经典的**“哲学僵尸”问题和”中文房间”论证**。

目前科学界对意识的起源仍无定论：

整合信息理论（IIT）：意识 = 信息整合度 Φ 足够高
全局工作空间理论：意识 = 信息广播到全脑的过程
预测编码理论：意识 = 大脑对世界的持续预测与修正

如果我们连人类意识的机制都不清楚，“模仿”它就更无从下手。

💡 结论：可能的路径

不是"改造 LLM"，而是"LLM 作为其中一个模块"

一个更接近人类思考的系统，可能需要：

感知层 — 具身传感器（视觉、触觉、本体感）
世界模型层 — 内部动态模拟现实
记忆层 — 可写入、可遗忘、可重构的长期记忆
动机层 — 自发的内驱目标生成机制
语言层 — LLM 承担的部分（沟通、推理表达）
情绪调控层 — 影响决策权重的情感状态机

LLM 在这个体系里只是”语言皮层”，不是全部。

短期内不会有”真正像人的智能体”，但我们正在逐步拼出这张拼图的各个碎片。最大的障碍不是算力，而是我们对自身意识的无知。

💃 Lii's Blog

Recent Writing

2026-05-29记录

2026-05-28记录

2026-05-27记录

2026-05-26记录

2026-05-25记录

CONOCIMIENTO