Embodied AI: LLMs | Humanoid APAC

三十年來，人形機器人一直是令人印象深刻的展示，但沒有人能負擔得起實際部署。缺少的成分從來不是身體，而是大腦。能夠進行實時物理推理的大型語言模型的出現徹底改變了這一計算。在亞太地區，全球最積極的人形機器人部署正在發生，具身AI是研究原型與工廠現場資產之間的差距。

「具身AI」的真正含義

具身AI是指通過物理身體在現實世界中運作的人工智能——通過傳感器感知、推理環境並通過執行器行動。這個術語將與物理世界互動的系統與處理文本或數據的純軟件AI區分開來。

直到最近，具身AI對於真正的工業使用來說要麼太慢（經典規劃），要麼太僵化（預設程序序列）。被編程為拾取特定零件的機器人在任何事情改變時都會失敗。

LLM通過提供靈活的推理層改變了這一點。當AGIBOT的A2被告知「將藍色板條箱移到4號線」時，它推理指令、識別板條箱、規劃路徑並實時適應。

84億美元

2030年具身AI市場（估計）

40%

使用LLM層後的任務成功率提升

6個

2025–26年主要亞太LLM-機器人集成

中國在將LLM集成到人形平台方面動作最快。AGIBOT使用騰訊的混元；宇樹與百度的文心合作；優必選的Walker S2運行在訓練了5000萬小時工業任務數據的內部模型上。

日本的方法不同。索尼機器人部門正在開發「具身場景理解」——一個將機器人環境建模為結構化表示的系統，使用更小、更快的推理模型在結構化工廠環境中實現更低延遲。

韓國的Rainbow Robotics和新加坡的A*STAR採用混合方法，將LLM推理與靈巧操作的專業模型相結合。

核心瓶頸是訓練數據。與文本LLM不同，具身AI系統需要物理交互數據——機器人在現實世界中執行任務的數百萬小時。這些數據收集成本高昂，被鎖定在各個公司內部。

中國工業和信息化部建立了國家具身智能數據平台。新加坡智慧國倡議資助了跨行業機器人數據聯盟。日本國立先進工業科學技術研究院正在構建合成數據生成平台。

下一個前沿是多機器人協調——同時為整個機器人群規劃和分配任務的LLM。AGIBOT在其比亞迪部署中已展示了早期版本。

贏得具身AI競賽的公司很可能是那些積累最多部署數據的公司。人形機器人在工廠地板上度過的每個小時都是一個難以輕易複製的競爭護城河。

Sources

具身AI 大語言模型技術亞太地區分析