RLWRLD 把現場工作者動作變成機器人訓練資料，Physical AI 真正競爭的是現場知識

Physical AI 新創 RLWRLD 以機器人基礎模型 RLDX-1，於 2026 年 6 月 4 日獲得 InnoVEX 2026 Pitch Contest 首獎 Grand Prize。6 月 9 日，RLWRLD 又宣佈與輝達（NVIDIA）合作推動 DexBench。根據 RLWRLD 公布的規畫，雙方將圍繞靈巧操作評估基準、資料標準，以及與 NVIDIA Isaac Lab-Arena 的整合展開合作。
這兩則消息如果分開來看，一則是競賽得獎，另一則是合作與評估基準建置，彼此似乎沒有直接關聯。但把時間往前拉一個月，就能看見串起兩件事的主線：RLWRLD 正嘗試把真實工作現場中的操作經驗，轉化成可以被蒐集、訓練與評估的機器人資料。
根據美聯社報導，RLWRLD 正在旅館、物流倉儲與便利商店蒐集工作者的動作資料。例如，首爾樂天飯店的宴會主管 David Park 會在頭部、胸前與手部配戴攝影機，示範如何摺宴會餐巾等日常工作；CJ 物流員工則示範商品的抓取、搬運與處理方式；日本 Lawson 便利商店提供的資料，則包括食品陳列等操作。

這些動作看起來很普通，背後卻包含大量沒有寫進操作手冊的經驗。
一個酒杯要用多大的力道握住，擦拭時手腕要如何轉動；商品形狀不同時，手指要如何調整抓取方式；食品上架時，員工又如何同時考量位置、方向、速度與商品完整性。這些細節，人類工作者往往憑經驗就能完成，機器人卻需要大量資料才能逐步學會。
RLWRLD 的案例顯示，Physical AI 的競爭焦點正逐漸從單一模型能力，擴大到真實世界資料、評估方法與部署場域。
大型語言模型的發展，主要建立在網際網路數十年累積的文字與影像資料之上。Physical AI 如果要進入旅館、倉儲、零售、工廠與其他真實工作現場，還需要補上另一種資料：人類如何使用身體、工具與環境完成工作的紀錄。
因此，下一階段 Physical AI 的競爭，可能不只取決於誰能做出更強的模型，也取決於誰能更早取得高品質的工作資料，並把現場經驗轉化為機器人可以學習、測試與反覆驗證的能力。

老師傅沒有說出口的，是機器人最需要學習的
想像一位飯店主管正在摺宴會餐巾。他不會一邊摺，一邊思考手指應該移動幾公分，也不會計算每次施力的大小。
當布料比較厚時，他自然會調整折法；當餐巾有些歪斜時，也會立刻修正。同樣地，倉儲員工搬運不同商品時，會自然改變抓取角度。
類似的經驗也存在於其他工作現場。例如，維修人員可能從設備聲音、震動或溫度變化中，憑經驗判斷異常位置。
這些能力通常被稱為隱性知識。它們來自多年工作經驗，很難完整寫成文字，也不容易透過傳統 SOP 保存下來。
過去企業做數位轉型，主要處理文件、訂單、設備數據與管理流程。Physical AI 則把資料範圍延伸到人的身體、動作與現場判斷。
機器開始學習人的視線往哪裡看、手指如何移動、身體如何維持平衡，以及遇到偏差時如何立即修正。現場工作者因此不再只是機器人的使用者，也可能成為機器人能力的重要來源。
企業多年累積的工作經驗，也開始出現新的價值。過去這些內容可能只存在於少數資深員工身上，未來則可能先被整理成資料，再進一步轉化為模型可以學習的能力。

真正困難的是建立一條可靠的資料供應鏈
看到 RLWRLD 的案例，很多人可能會直覺認為，只要把工作過程拍成影片，就能拿來訓練機器人。實際上，影片只是訓練資料的起點。
根據美聯社報導，RLWRLD 會先把工作者的影像轉成可以分析的資料，再由工程師重新執行相同任務，搭配攝影機、VR 頭戴裝置、動作追蹤手套與其他控制設備，蒐集更完整的操作資訊。報導提到的資料包括關節角度與施力程度。
從 RLDX-1 的技術設計來看，RLWRLD 也希望模型能處理動作歷史、觸覺與扭矩等物理訊號。對機器人而言，需要學習的不只是「手怎麼移動」，還包括關節與手指的位置、動作軌跡、接觸後的變化，以及不同力道對物品造成的影響。
這些細節會直接影響機器人能否穩定抓取物品、控制力道，並在不同環境中完成任務。
在機器人模型開發中，真人示範資料通常還會搭配模擬、遙控操作或合成資料，用來補足難以大量重複、成本過高或具有安全風險的情境。RLDX-1 的技術報告也提到資料合成與模擬訓練的設計。
從商業模式來看，RLWRLD 顯然希望形成一套資料飛輪：先把工作者的操作經驗整理成訓練資料，再將模型帶入更多工作場域，累積新的任務、操作與失敗案例，進一步改善模型表現。
不過，這套循環目前仍處於早期。它是否能形成可持續擴張的資料優勢，仍要看 RLWRLD 未來的部署規模、資料品質，以及企業與工作者之間的資料權利安排。
隨著 Physical AI 逐步進入工廠、倉儲與服務業現場，企業對資料品質的要求也必須跟著改變。
文字資料標註錯誤，可能讓 AI 回答不準；動作資料如果出現偏差，可能導致機器人撞上設備、損壞商品，甚至使現場人員受傷。這些都是 Physical AI 部署時必須面對的一般性風險。
對 Physical AI 而言，資料品質不只是模型準確度問題，也直接關係到設備安全、營運風險與責任歸屬。

RLDX-1 想處理的是機器人如何接觸真實世界
RLWRLD 在 2026 年 5 月公開 RLDX-1，將它定位為一套以靈巧操作為核心的視覺、語言與動作模型（Vision-Language-Action Model，VLA）。
這套模型嘗試整合機器人看到的畫面、接收到的語言指令、機器人本體狀態、先前動作，以及觸覺與扭矩等物理訊號，讓機器人能處理更複雜、更細緻的手部操作。
目前已有不少機器人模型可以辨識物品、理解指令，並完成固定的抓取與放置任務。困難通常出現在機器人離開受控測試環境，真正進入工作現場之後。
現實世界裡的物品不會永遠待在固定位置。它們可能滑動、變形、傾倒或破裂，重量、角度與表面材質也各不相同。同一個抓取動作，換成不同物品、位置或力道，就可能得到完全不同的結果。
這些變化，正是機器人在真實工作環境中容易失敗的原因。
根據 RLWRLD 的技術報告，RLDX-1 特別強調三項能力：理解連續動作中的變化、保留先前狀態的資訊，以及讀取觸覺與扭矩等物理訊號。
這代表機器人不能只根據眼前畫面決定下一個動作。它還需要知道自己剛才做了什麼、物品受到多大力道，以及手部與物品接觸後發生了哪些變化。
RLWRLD 團隊自行公布的測試結果則顯示，RLDX-1 在部分模擬環境與真實機器人任務中，成功率高於部分比較模型。
不過，這些結果目前主要來自 RLWRLD 團隊發表的 arXiv 預印本，尚未經過正式同儕審查，也缺少跨越更多機器人硬體、資料集與工作場域的廣泛第三方驗證。
因此，現階段較穩健的判斷是：RLDX-1 已展現出靈巧操作、動作記憶與物理感測整合的技術潛力，但還不能把研究測試結果直接視為大規模商業部署的成效。

DexBench 試圖補上機器人缺少共同評估方式的問題
6 月 9 日，RLWRLD 宣佈與輝達合作推動 DexBench。根據 RLWRLD 的說法，這項計畫希望建立一套可供不同模型與機器人平台比較的靈巧操作基準、資料標準，以及與 NVIDIA Isaac Lab-Arena 相容的模擬與實體驗證架構。
從 RLWRLD 公布的設計來看，DexBench 將靈巧操作分為五項評估領域，並進一步拆解成 18 項基礎任務：
● 抓取多樣性
● 空間精準度
● 時間精準度
● 接觸精準度
● 情境理解
這項計畫反映出一個重要問題：機器人產業仍缺少可供不同硬體、模型與測試環境共同比較的方法。
目前不同公司的機器人，使用的機器手、攝影機、感測器與測試環境往往都不相同。即使執行的是同一項任務，例如拿起杯子，各家公司公布的成功率也很難直接比較。
只有當產業能使用相對一致的方法衡量成功率、穩定性、泛化能力與安全性，Physical AI 才有機會從技術展示，進一步成為可採購、可驗收、可持續改善的產業產品。
不過，DexBench 現階段仍是由 RLWRLD 發起，並由公司對外說明合作內容的評估倡議。它能否成為業界廣泛採用的共同基準，還要看更多機器人公司、研究機構、企業客戶與平台供應商是否實際參與。
現階段較能確定的是，Physical AI 的競爭正逐漸從模型能力，擴大到資料格式、測試方法、開發工具與部署環境。誰能影響這些基礎規則，誰就更有機會參與定義未來的產業分工。

對台灣來說，更大的機會可能藏在現場知識裡
RLWRLD 在台北 InnoVEX 獲獎，對台灣的意義，不只是一家海外新創受到關注。
台灣既有的晶片、伺服器、工業電腦、感測器、馬達、控制器與機器人零組件供應鏈，本來就提供了參與 Physical AI 發展的產業基礎。
但在硬體之外，台灣企業也需要重新看見另一項更難被複製的資產：長年累積在製造、設備維護與高精度作業現場裡的工作知識。
當 Physical AI 的競爭愈來愈依賴現場資料，真正稀缺的可能不只是零組件與算力，也包括那些掌握在資深技術人員手中、尚未被完整記錄下來的操作經驗。
過去，這些內容通常被稱為老師傅的經驗。未來，它們可能先被記錄、拆解與整理，再進一步變成模型可以學習的能力。
對台灣新創而言，不一定要直接投入資本密集的人形機器人整機競爭。更貼近台灣既有優勢的機會，可能包括：
● 動作資料蒐集工具
● 工業資料標註平台
● 機器人模擬環境
● 垂直場域模型
● 感測與動作資料整合
● 安全驗證與測試工具
● 現場知識數位化服務
這些環節都可能協助企業把分散在工作現場的經驗，整理成可以被保存、分析與訓練的資料。
RLWRLD 的發展仍處於早期。RLDX-1 能否跨越不同機器硬體、工作場域與產業流程，DexBench 能否獲得更多公司採用，都還需要時間驗證。
但這個案例已讓一條方向變得更清楚。
生成式 AI 的訓練資料，主要來自人類留下的文字與影像；Physical AI 所需要的資料，則更多來自工廠、倉儲、旅館、商店與其他真實工作現場。
當模型能力逐漸普及，真正稀缺的資產，可能會轉向那些存在於工作現場、卻還沒有被完整記錄與數位化的知識。
對製造業來說，接下來更值得追問的是：那些未來可能被機器學習的現場經驗，是否已經開始被有系統地保存下來？

RLWRLD 把現場工作者動作變成機器人訓練資料，Physical AI 真正競爭的是現場知識

科技創業週報 #536：Siri AI 補上Apple Intelligence 缺口：蘋果重做 iPhone 的個人助理入口

發佈留言 取消回覆

發佈留言取消回覆