網(wǎng)站二維碼
與OpenAI官宣合作13天后,F(xiàn)igure旗下人形機(jī)器人的性能突飛猛進(jìn)。
近日,F(xiàn)igure AI釋出的一段視頻顯示,人形機(jī)器人Figure 01可以識別眼前物體,回答開放性提問,并聽從指令將黑色塑料袋收拾進(jìn)框子里、將杯子和盤子歸置放在瀝水架上。
Figure創(chuàng)始人兼首席執(zhí)行官Brett Adcock強(qiáng)調(diào),視頻中Figure 01展示了端到端神經(jīng)網(wǎng)絡(luò)框架下與人類的對話,不存在任何遠(yuǎn)程操控。同時(shí)機(jī)器人的速度有了顯著提升,開始接近人類的速度。
能識別、能對話、能思考
“Figure 01,你現(xiàn)在看到了什么?”
“我看到桌中間有個(gè)紅蘋果,一個(gè)瀝水籃、一些杯子和盤子,以及你站在旁邊,手搭在桌子上?!?/p>
既能識別出靜態(tài)物體,還能判斷人類的動作,F(xiàn)igure 01的視覺識別和理解能力可見一斑。
在隨后的多輪對話里,F(xiàn)igure 01繼續(xù)展現(xiàn)了其在上下文回溯、推理、多任務(wù)處理等方面的能力。
當(dāng)被問到桌上有什么可以食用的,F(xiàn)igure 01回答:“當(dāng)然”,隨后流暢地把紅蘋果遞給了提問者。
隨后提問者往桌上倒了幾個(gè)黑色塑料袋,要求Figure 01一邊解釋剛剛為何遞給他蘋果,一邊把桌上垃圾收起來。Figure 01隨后迅速給出反應(yīng),雙手一邊將塑料袋放回垃圾筐里,一邊回答道:“我剛剛給了你個(gè)蘋果,因?yàn)檫@是桌上唯一能吃的東西?!?/p>
緊接著,提問者給出了開放式提問,要求Figure 01結(jié)合面前的場景,判斷應(yīng)該把盤子放在哪。Figure 01表示,杯子和盤子可能該放在瀝水籃里,并根據(jù)指令將杯子和盤子放進(jìn)了瀝水籃。
在問答中,F(xiàn)igure 01也顯露了其在上下文推理上的能力。當(dāng)提問者問道:“你能把它們放到那兒去嗎(Can you put them there)?”,沒有明示把何種物體放到何處,F(xiàn)igure 01根據(jù)前后文準(zhǔn)確判斷出代詞所指代的含義,并完成相應(yīng)指令。
Figure 01最后對上述表現(xiàn)進(jìn)行了自我評估:“我覺得我做得很好,蘋果找到了新主人,垃圾被扔掉了,餐具也放到了該放的地方?!?/p>
OpenAI提供“智力支持”
Figure成立于2022年,2023年10月,F(xiàn)igure正式推出了該公司首款人形機(jī)器人Figure 01。根據(jù)官方介紹,F(xiàn)igure 01身高5英尺6英寸,重132磅,設(shè)計(jì)可承載44磅的重量,續(xù)航達(dá)5小時(shí)。