據(jù)悉,Google DeepMind推出了一款全新的機(jī)器人控制模型Gemini Robotics On-Device,該模型能夠在機(jī)器人本地運(yùn)行,具備視覺(jué)識(shí)別、語(yǔ)言理解和動(dòng)作執(zhí)行能力。即使在完全離線的情況下,Gemini On-Device也能夠理解人類指令并流暢地完成任務(wù)。這款模型是一個(gè)專為雙臂機(jī)器人打造的VLA(視覺(jué)+語(yǔ)言+動(dòng)作)基礎(chǔ)模型,能夠直接理解自然語(yǔ)言指令并執(zhí)行相應(yīng)的動(dòng)作。Gemini On-Device在醫(yī)療操作、災(zāi)難救援、工廠自動(dòng)化等任務(wù)中具有優(yōu)勢(shì),因?yàn)樗恍枰獙?shù)據(jù)傳至云端,從而減少了延遲并提高了穩(wěn)定性。此外,該模型通過(guò)少量學(xué)習(xí)即可適配不同機(jī)器人平臺(tái),有望加速機(jī)器人技術(shù)的普及和應(yīng)用。不過(guò),Gemini On-Device仍存在安全性和邏輯規(guī)劃方面的挑戰(zhàn),需要進(jìn)一步改進(jìn)。