12日,,成都人形機器人創(chuàng)新中心(以下簡稱“創(chuàng)新中心”)在四川成都發(fā)布了我國首個機器人多模態(tài)模型以及雙臂協(xié)作系統(tǒng)。該模型能夠使機器人理解,、推理抽象的語義指令,,并調(diào)度雙臂協(xié)作系統(tǒng)執(zhí)行任務。
多模態(tài)數(shù)據(jù)協(xié)同推理是指融合兩種或兩種以上不同感知來源,,進行綜合推理,,并完成復雜任務的過程。創(chuàng)新中心研究人員將多模態(tài)應用于人形機器人領域,,使機器人融合圖像,、語義、力感知,、環(huán)境感知等多種因素,,綜合判斷、生成任務并執(zhí)行,。這是人形機器人具有自主思考能力的關鍵核心技術,。
創(chuàng)新中心董事長張睿睿介紹,語義指令包括相對明確地將飲料和非飲料進行區(qū)分和分揀,,也包括相對抽象地將圓柱體和長方體物體,、可食用和不可食用物品進行區(qū)分和分揀。完成以上任務,,需要機器人通過多模態(tài)模型自主對所有物品進行提取歸納,。特別是對多個相似瓶子形狀的物體,機器人需進一步通過瓶身包裝上的文字,、圖片等要素綜合判斷其是否為可食用物品而非化妝品等非食用瓶裝物,,才能完成任務。
“多模態(tài)模型的發(fā)布,,不僅加速了‘AI物理化’的進程,,也讓人形機器人從‘預設擺拍’‘遙控操作’進化到擁有更強的‘大腦’和自主執(zhí)行能力?!睆堫n1硎?,下一步,創(chuàng)新中心將繼續(xù)深化技術研發(fā),,不斷優(yōu)化多模態(tài)模型與雙臂協(xié)作系統(tǒng)的融合應用,,提升人形機器人在復雜環(huán)境中的感知,、決策與執(zhí)行能力。(劉俠 記者滕繼濮)
責任編輯:王彥赟