🧬 AI 大 脑 · 具 身 智 能
本体再强没有"大脑"也只是演示机。VLA 模型(Vision-Language-Action)是把 GPT 装进机器人的关键技术。这一层利润最高、壁垒最深、变化最快——谁掌握具身大模型,谁就掌握下一代 OS。
📈 具身智能 · 技术演进路径
2018-2021
第一代:强化学习 + 模仿学习
DeepMind / OpenAI 用强化学习教机器人单一任务(堆方块、拧瓶盖)。每个任务训练一个模型,不通用。
2022-2023
第二代:RT-1 / RT-2 (Google DeepMind)
第一个 VLA 模型——同一个模型可以处理多个任务,能听懂"把可乐放到桌子上"这种自然语言指令。具身智能元年。
2024 GTC
第三代:NVIDIA Project GR00T
英伟达推出"机器人版 ChatGPT"——开源基础模型 + 仿真训练平台 + 专用芯片三件套。降低了所有整机厂的门槛。
2024-2025
第四代:百花齐放
Figure 02 配 OpenAI、Tesla 用 FSD 大脑、智元启元、银河通用、Pi 0、字节 ByteRobot……每家都在做自己的"机器人 GPT"。
2026-2028 预期
第五代:通用具身智能
如果按 GPT 升级节奏推演,2027 年前后会出现能完成 90% 家务任务的通用模型。这是机器人能否走进家庭的拐点。
🌍 全球具身智能玩家
美系
- OpenAI:投资了 Figure、1X,自己也在做内部具身大模型。
- Google DeepMind:RT-2 / Gemini Robotics · 学术领军。
- NVIDIA:GR00T 基础模型 + Isaac Sim 仿真平台。
- Tesla:FSD-for-Optimus · 把自动驾驶模型迁移到机器人。
- Physical Intelligence (Pi):Karpathy 投资的具身智能初创,2024 年发布 Pi 0 模型。
中国系
- 智元机器人(智元启元):稚晖君创立 · 大模型 + 整机一体化。
- 银河通用:清华系 · 王鹤教授带队 · 抓取通用大模型。
- 星动纪元:陈建宇带队 · 通用 VLA 路线。
- Pi-Cube / 自变量机器人:北大系 · 通用具身。
- 字节 ByteRobot:低调切入。
- 百度 Apollo Robotics:传闻中。
- 千寻智能 · 穹彻智能 · 灵心巧手:第二梯队。
🔬 三大关键技术
1. VLA 模型(Vision-Language-Action)
把视觉理解 + 语言理解 + 动作生成融合在一个模型里。代表:RT-2、π0、OpenVLA。
2. 世界模型(World Model)
让机器人"在脑子里预演"——给一个动作,预测会发生什么。降低真实试错成本。代表:英伟达 Cosmos、Tesla World Model。
3. 仿真训练(Sim-to-Real)
在虚拟环境里训练几百万次,再迁移到真实机器人。代表:Isaac Sim、MuJoCo、Genesis。
💡 数据是终极护城河
大语言模型靠互联网文本,具身大模型靠真实交互数据。谁先在真实场景跑出 100 万小时数据,谁就赢。特斯拉的优势是工厂可以源源不断生成数据;中国的优势是工业产业带 + 制造业场景多。
💰 A 股投资视角
⚠️ A 股纯具身智能标的几乎为零
真正做具身大模型的核心玩家(智元、银河通用等)都是未上市初创。A 股能买到的只有:
- 算力侧:寒武纪 · 海光 · 海康威视(机器视觉)
- 大模型侧:科大讯飞 · 360 · 昆仑万维(不专注具身)
- 整机叠加大模型:优必选(自研大模型)· 软通动力(华为生态)
所以这一层的投资更多通过整机和算力间接受益,纯弹性标的需要等智元、银河通用等 IPO 后再谈。
🎯 AI 大脑赛道三句话总结
- 这是利润最高、壁垒最深的一层,但短期 A 股没有纯标的。
- 2026-2027 是具身大模型出现"GPT 时刻"的可能窗口,盯紧 RT-2 / GR00T / Pi 升级节奏。
- 中国整机厂在大脑上落后美系 6-12 个月,必须拼数据规模来弯道超车,否则会沦为"硬件代工"。
⚠️ 本内容仅供学习参考,不构成任何投资建议。