RLWRLD 把老師傅動作變成機器人訓練資料,Physical AI 真正競爭的是現場知識

| |

南韓人工智慧新創 RLWRLD 最近受到業界的關注,主要原因是因為它把攝影機綁在真實工作者身上。根據美聯社報導,首爾樂天飯店(Lotte Hotel Seoul)的餐飲主管 David Park,在頭部、胸前與手部配戴攝影機,示範他多年來反覆做過的宴會餐巾摺疊、擦拭酒杯與整理餐具等動作;而 RLWRLD 也從 CJ 物流倉儲員工、日本便利商店 Lawson 員工身上蒐集類似資料,目標是建立一套可以訓練機器人「大腦」的人類專業動作資料庫。
這個事件值得新創與台灣產業思考的是:Physical AI 的競爭,正在從誰有比較炫目的機器人外型,轉向誰能掌握更多真實場域裡的工作知識。這些知識過去都藏在老師傅的手感、節奏、判斷與臨場調整裡,很少被寫成 SOP,更少被轉成可訓練模型的資料。而 RLWRLD 的案例正好提醒我們,下一階段的機器人競爭,可能不只是硬體、感測器與模型架構之爭,還有「現場知識能不能被資料化」的競爭。

真正被記錄的是工作裡的隱性判斷
摺一張餐巾,看起來是簡單動作,但對機器人來說並不容易。人類手指會自然判斷布料厚度、摺痕位置、力道大小與下一步順序;擦拭酒杯時,也會根據材質、角度、接觸力與清潔狀態做微調。這些動作不只是「手往哪裡移動」,而是眼睛、手部、身體姿勢、記憶與力覺共同完成的結果。
RLWRLD 的方法,是把這些過去難以描述的細節變成機器可以讀取的資料。首先是把工作者影像轉成機器可讀資料,再由工程師配戴攝影機、VR 頭戴裝置與動作追蹤手套重複任務,捕捉關節角度、施力大小等細節。這些資料包含手指位置、關節角度與施力方式,並被用來訓練配備類人金屬手與攝影機的機器人。
因此,這裡的關鍵並不是「把人拍下來」,而是把現場經驗切成模型可學習的訊號。對 AI 產業而言,這很像大型語言模型需要文字、圖片與程式碼資料;對機器人而言,真正稀缺的是可代表真實工作情境的身體動作資料。

Physical AI 的資料來源,正在從網路走向現場
過去幾年,生成式 AI 的競爭很大一部分建立在網路資料上。文字、圖片、影片、程式碼,這些都是可規模化蒐集的訓練材料。但 Physical AI 面對的則是另一個問題:機器人不只要「看懂」世界,還要在真實世界裡移動、接觸、抓取、放下、避開障礙,並承受錯誤帶來的實體後果。
所謂的 Physical AI 我們指的是:機器結合 AI 與感測器,能在真實環境中感知、決策與行動,並且超越傳統工廠機器人只做重複任務的模式。這也解釋了為什麼南韓會把製造業、半導體、服務業與熟練技術工人的經驗視為戰略資產。例如,南韓政府近期宣佈一項 3,300 萬美元計畫,希望把「老師傅」的直覺知識與技能建立成 AI 製造資料庫,用來提升生產力並因應高齡化與勞動力縮減。
這對台灣很有啟發。台灣同樣有大量現場知識存在於製造、物流、醫療照護、餐飲、維修、精密加工與中小企業營運之中,而這些知識未必都寫在系統裡。當 Physical AI 開始需要真實場域資料時,台灣的價值不只在硬體供應鏈,也可能在把現場流程與專業手感轉成資料資產。

從 demo 到部署,差距往往藏在手部細節
人形機器人的 Demo 影片很容易吸引注意,尤其是跑步、翻跟斗、搬箱子或模仿人類動作。但產業真正關心的是,機器人能不能穩定完成重複但多變的工作。
RLWRLD 近期也發佈 RLDX-1 技術報告,將其描述為一個面向靈巧操作的 Vision-Language-Action 模型,嘗試整合動作感知、長期記憶與物理感測訊號,例如觸覺與扭矩。據報告指出,許多既有 VLA 模型雖然在視覺理解與語言指令泛化上有進展,但在動態環境、接觸力判斷、長流程記憶等真實操作能力上仍有侷限。
這正是「Physical AI」與一般生成式 AI 最大的不同。聊天機器人回答錯誤,通常造成資訊風險;機器人動作錯誤,可能打翻物品、撞到設備、損壞商品,甚至造成安全問題。因此,機器人的競爭不只是模型能不能理解指令,還要把感知、記憶、施力與動作控制整合在足夠穩定的系統裡。
所以,RLWRLD 把飯店、物流與零售現場納入資料蒐集範圍,其目的不只是為了讓機器人學幾個動作,而是要建立一種跨場域的技能資料層。也就是說,未來的機器人公司很可能不只販售機器本體,還會販售「能在特定場域工作的大腦」。

台灣新創的機會,未必是在做出令人驚豔的人形機器人
人形機器人是資本、硬體、供應鏈、控制系統與安全驗證高度密集的領域,不是所有團隊都適合正面切入。Physical AI 的落地,不只是需要機器人本體,還需要有資料、工具、流程、驗證、場域整合與營運服務。
因此,台灣比較有機會的位置,可能是在協助企業盤點哪些工作流程具有資料化價值。因為,很多現場任務看似例行,但實際上包含大量判斷與手感,若能被拆解成可記錄、可標註、可驗證的資料,未來就可能成為 AI 導入的基礎。
再來就是建立垂直場域的動作資料蒐集與標註工具。製造業、醫療照護、倉儲、維修、餐飲後場,每個場域的攝影角度、隱私要求、安全規則與標註方式都不同。這不是單靠通用模型可以解決的問題,還需要懂場域的人參與。
最後是發展「人機共工」的流程設計。首爾樂天飯店認為,目前人形機器人清潔一間客房可能需要數小時,而人類約 40 分鐘可完成;飯店期待 2029 年後機器人可投入清潔與後場任務,但涉及人與人互動的部分仍難以取代。這代表短期內更合理的方向,並不是完全自動化,而是重新分工:哪些任務交給機器?哪些保留人類來做?以及需要人類監督、修正與接手?

現場知識變成資料,也會帶來新的治理問題
但是,把老師傅的動作變成資料,除了技術問題外,還會涉及勞動、權益與治理。勞動者的經驗被蒐集後,資料屬於誰?是否能被重複用於其他場域?若未來機器人學會這些技能,原本提供資料的人是否得到合理回饋?企業是否應該揭露資料用途、保存期限與再利用範圍?這些問題都需要逐一釐清。
對此,南韓工會已經對擔心機器人可能掏空熟練勞動力,而這些熟練勞動力原本正是南韓產業競爭力的一部分。這個矛盾也值得台灣提前思考:企業把員工經驗轉成 AI 訓練資料,不能只把它視為效率工具,還要重視資料授權、工作重新設計、教育訓練與利益分配等議題。
這也是 Physical AI 與一般數位工具不同之處。它會進入工廠、倉儲、飯店、照護機構與公共空間,直接影響工作安全與勞動力的安排。導入前如果只看技術展示,很容易低估了現場阻力;但如果只看取代風險,又有可能忽略它在缺工、危險作業與重複性任務上的實際價值。

不必神話但不能低估指標意義
RLWRLD 還是一家年輕的公司,技術能否大規模部署,需要時間驗證。外媒曾報導 RLWRLD 取得約 1,480 萬美元種子輪資金,目標是建立面向機器人的基礎模型,並與策略投資人推動概念驗證;這代表它仍處於早期商業化階段,而非已經證明大規模替代人力。
但它的指標性在於:AI 產業正在把「資料」的概念推進到更深的現場層次。過去企業談 AI 導入,常把資料理解為 ERP、CRM、文件、報表與影像;但是 Physical AI 讓我們看見另一種資料:人怎麼拿、怎麼折、怎麼擦、怎麼判斷力道、怎麼在不完美的環境中完成工作。
對台灣來說,很多企業最有價值的資產,可能不是系統裡已經結構化的資料,而是資深員工每天用身體與判斷所完成的細節。當 AI 開始進入實體世界,誰能把這些現場知識轉成可學習、可驗證、可部署的資料,誰就有機會在下一波 Physical AI 競爭中取得位置。


.

Cover image created with AI
本文依 CC 創用姓名標示 - 非商業性 - 相同方式分享 4.0 國際釋出
Previous

科技創業週報 #532:語音 AI 從聊天走向企業服務,關鍵在流程與責任設計

發佈留言

Share via
Copy link
Powered by Social Snap