繼「大模型」(Large Language Model、LLM),「具身智能」(Embodied Intelligence)成為今年科技界新焦點,被視為新一波AI浪潮的重點方向。最能夠代表「具身智能」的相信是像人一樣的機械人,目前中美正在爭取研發改進,雙方幾乎都處於1,000米賽跑起跑階段。
「具身智能」一詞本身具有濃厚的技術哲學色彩。1945年,法國哲學家梅洛蓬蒂(Maurice Merleau-Ponty)提出「具身性」概念,認為人類需透過身體與周圍環境互動和感知,從而理解世界。1950年,被稱為「AI之父」的英國電腦科學家圖靈(Alan Turing)在論文《電腦機器與智能》(Computing Machinery and Intelligence)中首次提出「具身智能」這概念。
人形機械人|「具身智能」指像人一樣可跟環境互動的AI
具身智能是一種AI概念,強調智能發展不只在乎運算能力,亦應考慮與環境的互動。具身智能是連接虛擬和現實空間的橋樑,把AI融入機械人等物理實體,賦予它們像人一樣的感知、學習,以及跟環境互動的能力。例如讓機械人根據視覺、觸覺及動作,在本來不熟悉的環境負責導航,目前已應用於物流業。
具身智能亦可用於增強實景(AR)及虛擬實景(VR)上,讓用家身體動作與虛擬環境有更自然互動,增強沉浸感;也可用於醫療培訓,提高模擬手術訓練效果。家居智能系統也會因具身智能發展而得益,令系統懂得透過環境數據及用戶動作來作出調整。
人形機械人|新一代機械人要有「多模態感知+大腦決策」
智能化水平較低的工業機械人如機械臂等,早已在製造業廣泛應用,但傳統工業機械人是「固定程序加上機械臂」的組合,而擁有「具身智能」的機械人則是改良版,是「多模態感知加上大腦決策」的組合。「多模態感知」是指透過不同的感知方式,來獲取、分析及理解不同模式和狀態。
如果說大模型是「有趣的靈魂」,那麼具備具身智能的人形機械人,則是有「好看的皮囊」的人類得力助手。隨著技術發展,預料未來將出現各式機械人,有雙足、四足、輪式,又或是機械狗及機械昆蟲等,但相信人形機械人始終最適合用於幫助人類,尤其是在家庭、護理及公共服務等,人形機械人更有利於融入環境。此外,具備具身智能的人形機械人,也可協助解決一般流水線式生產線,無法做到的客製化定制任務,把量產的零部件按客戶需求組裝成產品。
人形機械人|機械人「大腦」「小腦」「身體」發展待突破
人形機械人的研發,可以理解成人類的「大腦」、「小腦」和「身體」三大部分。「大腦」是機械人自主學習、規劃和決策的中樞;「小腦」負責控制動作,包括行走跑跳,以至細緻的手部動作等;「身體」則包括靈活合理的軀幹和四肢結構設計。
內地研發或展出的人形機械人︰
目前這三大領域的技術均有待突破。「大腦」方面,「雲邊端」(雲端數據、電腦基礎設施以及手機等終端)架構、多模態感知與環境建模(對特定環境作出系統和科學性的描述)等是近年技術焦點,而擬人的最大難處在於對人腦的模仿,現有科學對人腦的研究仍遠遠不足。「小腦」方面,還須研究人機互動能力、在複雜地形移動以及機械人全身協調和精細動作等。至於「本體」,須繼續研發剛柔並重的機械結構,以及可靈活郁動的四肢等。
幸而大模型的出現,令機械人「大腦」有顯著進化,讓其具備更強學習能力,並結合視覺、聽覺及觸覺等各種輸入,提升機械人對複雜場景的理解,擴闊其泛用性;也有望降低人形機械人的開發成本,讓它們更快「融入家中」。
人形機械人|中美企業人形機械人 爭相登場
環顧全球,人形機械人已進入產業化初步階段,在工業製造、商用服務和家庭陪伴領域試水溫。無論是技術突破、落地進展抑或融資規模,人形機械人競賽基本上以中美為主導。內地方面,優必選人形機械人Walker今年聚焦汽車、消費電子等製造業重點領域,已進入多家車廠實訓;宇樹科技的機械人實現了完全模仿人類的自然行走;優理奇機械人則正醞釀「進家」計劃。美國方面,波士頓動力(Boston Dynamics)的新版Atlas機械人,實現了在工廠中不同儲物櫃之間靈活搬動零件;而特斯拉(Tesla)的人形機械人「擎天柱」(Optimus)則計劃2025年開始量產。
人形機械人|中國在工業應用 場景及人口資源佔優
在大模型研發能力及感知技術上的領先,令美國企業在機械人的決策系統和處理複雜任務方面較具競爭力。中國的優勢則在於工業機器人領域,特別是在製造業中的應用較成熟;在人形機械人技術專利方面,中國也走在前列。雖然中國在機械人「大腦」如演算法及高端晶片等方面正面對挑戰,但中國機械人行業擁有豐富的應用場景,以及龐大的潛在用戶人口,數據是最大競爭優勢之一。優必選科技副總裁焦繼超直言,「如果把人形機器人行業比喻成一場馬拉松,中國和歐美國家,目前幾乎都處在前面1,000米的起跑階段」,各有爭勝機會。