您當前的位置 : 東北網  >  龍江看天下  >  網媒聯播

300萬條數據哪裡來?揭秘人形機器人『數據特訓』

時間:2026-03-24 08:05:31  來源:央視網  作者:

  央視網消息:記者日前從北京市經濟和信息化局了解到,北京人形機器人創新中心數據采集與訓練基地投用4個月以來,內部研發數據采集量已經超過300萬條,開源數據超30萬條,已為多家頭部企業及科研機構交付超數萬小時高質量數據。這些數據究竟有什麼用途?

  作為全國最齊全場景覆蓋的機器人數據訓練基地之一,北京人形機器人創新中心數據基地一期建築面積近5000平方米,包括約200平方米的專業光學動作捕捉場地。記者在現場看到,120多臺機器人分別在家居、商超、辦公、工業、醫藥、康養等領域30餘個典型場景中,進行現場的數據采集與訓練。這些場景並非靜態的『樣板間』,其光照條件、物體擺放、人員動線均可按需調整,確保采集數據具備充分的泛化能力。

  總臺記者馬欣欣:在搭建的是『兒童房』的場景中,模型訓練師正在操控機器人去把這個反了的襪子給翻過來。完成這些動作的同時,也會實時采集這些機器人關節角度值、運行軌跡等多個數據,一共300到1000次纔能完成一個動作的數據采集。

  針對初期機器人數據采集存在的場景碎片化、不同構型機器人適配難、數據質量參差不齊等瓶頸問題,基地也通過制定標准化的采集流程規范,確保整體數據合格率穩定在95%以上。截至目前,內部研發數據采集量已超300萬條,開源數據超30萬條。

  北京人形機器人創新中心具身天工事業部負責人蔣未來:可以為中小型機器人用戶至少節省50%以上的數據采集成本。

責任編輯:所雙雨