8月21日,2024世界机器人大会在北京召开,再一次探索机器人的技术创新与产业发展,169家国内外机器人企业亮相600多件创新产品,其中27款人形机器人更成为大会关注焦点。
布局人形机器人这一新赛道的企业,大体可分为传统机器人巨头、初创机器人企业与AI公司。其中科大讯飞就是AI布局人形机器人的代表企业之一。
科大讯飞布局人形机器人赛道,目标是打造机器人的“大脑”,推动机器人行业“脑力”升级。此次大会,科大讯飞亮相了大模型+具身智能的人形机器人最新进展,整体运动性能提升2倍,复杂任务拆解成功率超过95%,交互能力、运动性能进一步提升。
产业赋能上,讯飞机器人超脑平台已赋能420家机器人企业,深度链接1.5万机器人开发者,与优必选、宇树科技、智元机器人、银河通用、人形机器人创新中心(上海)等人形机器人企业达成广泛合作。
大模型助力人形机器人“脑力”再升级
在本次机器人大会上,科大讯飞带来了“讯飞超脑2030计划”的最新科技成果,大模型加持下的“脑力”再升级的讯飞人形机器人。今年的机器人大会上,基于星火大模型的加持下,讯飞人形机器人在人机交互能力、具身智能、运动性能以及国产自主可控方面带来全新升级。
当前,科大讯飞最新发布的讯飞星火V4.0,使得大模型“智商”不断升级。大模型的思维链推理能力将显著提升具身通用机器人对于复杂任务 的理解能力,并提供符合物理世界常识的拆解规划;将具身感知模型和具身决策模型相结合,极大提升具身通用机器人在真实场景下的多模态感知和理解能力。
对于以机器人产业为代表的新兴科技领域而言,核心技术及生态链自主可控至关重要。讯飞星火一直坚持大模型底座的自主可控,去年10月24日,科大讯飞与华为联合发布了中国首个全国产算力平台“飞星一号”,讯飞星火成为中国基于全国产算力训练出的全民开放的大模型,保障了科大讯飞人形机器人及国内机器人大脑底座生态更加自主可控。
此外,多模态大模型与具身智能的结合,让科大讯飞人形机器在复杂任务拆解、开放场景物体识别、多模态感知与理解等维度显著提升。这次科大讯飞展示的人形机器人高约1.7米,体重为60公斤,几乎跟一位成年男子相仿。要灵活控制这么大一个躯体,首先需要提升人形机器人在开放场景下的环境感知能力和理解能力,还极度考验四肢协同能力。在现场,我们不仅能看到科大讯飞人形机器人直立行走和屈膝站立,还能看到它轻松倒一杯咖啡,相较于上一代人形机器人,整体运动性能提升2倍。
始于2022年初的“讯飞超脑2030计划”,其终极目标是打造懂知识、会学习的软硬一体式陪伴机器人。进入大模型时代,星火大模型成为赋能人形机器人迈向具身智能通用机器人的关键一步,也在加速讯飞超脑2030计划的实现。
超拟人交互技术让人形机器人更具“人情味”
语音是万物互联的入口,语音交互的变革也将引领新一轮机器人产业变革,这恰恰是科大讯飞最重要的优势所在。8月19日,科大讯飞宣布星火语音大模型升级,重磅推出了星火极速超拟人交互功能。在技术层面,它拥有更快的响应和打断速度,更知性的情绪感知和更知心的情感共鸣,同时在语音可控表达和人设扮演方面迎来了突破,进一步聚焦于解决复杂环境下机器人听得清、听得懂、有温度、有情感的交互问题。
当这项功能与人形机器人结合,不仅能让机器人更快听懂用户的语言表达,还能结合当下语境和场景洞察用户意图,也就是我们常说的“听话要听音”,继而提供真正有用的陪伴式服务。从长远来看,超拟人交互能力可进一步提升人形机器人的交互能力,助力人形机器人更加智能化,智慧化,让其无限接近类人级别的领悟水平和响应速度。讯飞星火语音大模型超拟人交互能力对人形机器人的赋能,进一步让科大讯飞人形机器人“脑力”再升级,大模型让人形机器人更有“人情味儿”。