東北大學與蘇黎世聯邦理工學院開發能模仿人類動作的生成AI基礎技術——期待應用於運動生成任務
日本東北大學於2024年5月7日宣布,該校工學研究院與蘇黎世聯邦理工學院洛桑校的共同研究團隊開發出了可模仿人類動作的生成式AI基礎技術。研究團隊採取結合深度強化學習與模仿學習兩種運動生成方法,來發揮各自優點、彌補缺點,並為生成式AI的運動生成應用鋪路。
深度強化學習是指結合了深度學習與強化學習方法的技術,而強化學習是指可透過評估行動的結果來進行試行錯誤,因此相對來說較能夠適應未知的環境。但相對地,當給定及限制條件較少時,強化學習模型的計算成本也會大幅增加。另一方面,模仿學習是透過模仿人類執行相同運動任務時所獲得的運動數據來訓練機器人,適用於環境和運動任務不變的情況。但其學習的搜尋範圍較窄,對未知環境的適應性較低。
中樞模式發生器(Central Pattern Generator,CPG)是一種可以在不需要解讀傳感器訊號反饋的情況下給出運動訊號的神經網路技術,被用在模仿中發揮決定運動意圖的功能。傳統CPG所生成的運動模式並不一定類似於現實中人類的運動模式,研究團隊因此引入新的計算方法來改善模型所生成的結果。此外,團隊還在模型中加入使用深度強化學習的反射網路,相當於給CPG接上了能感知外部環境五官,更加接近人類身體運動的機制,讓CPG可以根據數據來適應與訓練時不一樣的環境。然而,由於生物體的身體結構在執行同一類運動任務的時候,可能有無數的解方(又稱冗餘性),因此在限制條件極少的系統(高自由度)中利用AI來進行自主運動任務執行一事的難度很高。
這次東北大學和蘇黎世聯邦工學院所提出的方法,僅透過模仿學習降低了系統的冗餘性而並未在原理上針對自由度做出限制,只是縮小了模型訓練學習時的搜尋計算空間,並簡化深度強化學習對未知環境進行的探索過程,也因能自由調整運動速度而更接近現實生物的運動狀態。總結來說,本研究作為基礎、準備工作雖未一步到位,但仍將有助於未來生成式AI在運動生成任務應用上的技術開發。
資料來源:engineer fabcross新聞(2024-05-08)
【原文/出處】
發表評論
Want to join the discussion?Feel free to contribute!