返回栏目
首页科技 • 正文

“地表最强”人形机器人亮相:视觉&语音推理能力 每天打工20+小时

发布时间:  浏览: 次  作者:网络

来源: 财联社 上海 

财联社8月6日讯(编辑 史正丞)当地时间周二早晨,获得微软、英伟达、OpenAI投资的人形机器人明星企业Figure如期发布最新款人形机器人Figure 02。基于机载算力和各个组件的全方位升级,AI人形机器人朝着“进厂打工”又迈进了一大步。

顺便一提,随着人工智能大模型的飞跃式发展,这款被不少媒体称为“地表最强人形机器人”的AI设备,也已经具备视觉推理和聊天沟通的能力——操作机器人的默认UI就是语音控制。

新产品有哪些亮点?

与2023年发布的第一代产品相比,Figure 02最为明显的区别在于外观的彻底重构——机器人完全采用外骨骼结构(由外皮承担负载和压力),机器人的电源和算力布线集成在机体内部,从而提高了机器人的可靠性,也使得封装更加紧实。

(两代产品外观差异显著,来源:Figure)

Figure的创始人兼首席执行官布雷特·爱德考克(Brett Adcock)透露,为了这个设计,公司还重新定制了电线端子和连接器。

当然,人形机器人最关键的升级点,依然是如何从一堆电线、芯片和算法,拼出一个活灵活现的“打工(机器)人”。

公司披露,Figure 02身上总共装了6个RGB摄像头,分别位于头部、胸前和后背,因此这个机器人也拥有着“超人”视觉。

配合输入的图像资料,机器人能够通过AI驱动的视觉系统感知和理解真实的物理世界。Figure 02配备了机载的视觉语言模型(VLM),使其能够进行快速的常识性视觉推理。

爱德考克表示,相较于上一代产品,Figure 02的机载计算和AI推理能力翻了3倍,使得许多真实世界的AI任务能够完全自主执行。公司的AI数据引擎将不断提供最新的模型,供机器人在本地GPU上运行。

除了视觉以外,Figure 02也搭载了公司投资人OpenAI专门定制的语音到语音推理模型,通过机载麦克风和扬声器与人类进行对话。爱德考克也透露,这个机器人的默认UI是语音。

虽然在谷歌和OpenAI的较劲升级后,AI实时语音聊天已经不再是夺人眼球的新鲜功能,但对于人形机器人而言,应用这项技术仍有重大的意义。毕竟这个70公斤的大铁块,迟早有一天将会与人类在同一个屋檐下“打螺丝”,能够响应语音指令,将会是人类重要的安全工具。

在投资者最为关心的连接器等方面,Figure并没有给出明确的信息。公司仅表示,Figure 02上搭载的第四代机械手具备16自由度,拥有与人类相当的力量,能够完成许多近似人类的工作。同时整个机械手的机械、电器、控制和传感器设计,都是由公司内部完成的。

最后,这台机器人还有一个不怎么起眼但很重要的升级,机器人内部的电池组容量提高了50%至2.25KWh。爱德考克解释称,这个设计旨在最大限度地延长机器人的运行时间,公司希望Figure 02能够实现每天实际有效的工作时间超过20小时。

值得一提的是,公司官网的参数说明一栏中,显示Figure 02的续航时间只有5小时。合理推断爱德考克提供的应该是“充电+干活”的极限工作时间。

稍有遗憾的是,Figure公司目前并没有广泛推出Figure 02的时间表,仅暗示各位吃瓜群众不要把想象力局限在“机器人进厂打螺丝”上。公司表示,Figure 02将人类形态的灵巧性与先进的人工智能相结合,可以在商业应用中执行各种任务,并且在不久的将来,还可以在家中执行各种任务。

相关文章Related

返回栏目>>

首页   |   关于

Copyright © 经济报道网 版权所有