在以“重塑创新增长”为主题的“2025 Inclusion·外滩大会”上,共有40余家具身智能企业亮相。如何协同产业链上下游,将技术突破转化为商业回报,成为不少与会行业人员关注的问题。
“我们的愿景是把具身智能大模型所带来的智能和高性能人形硬件本体结合起来,形成一个完整的产品力服务,让它真正能够实现跨行业应用、走进千家万户、服务千行百业。”9月12日,在“具身智能:从泛化到行动,重塑产业未来”的分论坛上,北京银河通用机器人有限公司联合创始人、大模型负责人张直政分享了团队在具身智能训练方面正在探索的途径和方向。
一个聪明的、会干活的机器人是通过场景训练出来的。在人形机器人迎来爆发的关键阶段,不少企业要面临“具身智能训练的数据从哪里来”的问题。
张直政在现场演讲中介绍,目前行业内已经有通过真机遥操作采集数据。他以特斯拉举例介绍称,在训练电池分拣任务上,需要数十万条数据,40个人要花费一个月时间进行采集。“如果按国内的人力成本来算,我们可能要花数百万人民币。”
在张直政看来,如此耗时耗力的数据采集方式是否会是通往具身智能的最终解决路径值得思考,尤其是当具身智能面临跨任务泛化时,可能需要上万亿条数据。
从2023年创立到现在,银河通用机器人坚持探索的技术路线则是用仿真合成数据。据了解,仿真合成数据具有可控性、效率高,但在文理和语义的学习上比不上真实场景的数据。
张直政表示,目前这个问题已经被图文大模型、数字大模型解决了,现在可以用更多的互联网数据让机器人学语义。银河通用目前在探索的便是,机器人学习动作用仿真数据,学习语义可以部分结合真实数据。
“从前端的各种形态、各种功能数据资产的生成,到动作轨迹的生成,再到最终的渲染,我们实现了一条完整的高效的仿真合成数据的管线。有了这样的管线,我们就可以更快速、更低成本生产更高质量的动作数据来训练我们的具身模型。”张直政讲述称。
据他介绍,银河通用已经生产出世界上目前规模最大的数据集——10亿级别的仿真合成数据,目前内部已经进一步将数量级扩大至百亿级别、千亿级别。
“有了大规模仿真合成数据,我们就能够做到通过预训练让模型在视觉、语言、动作层面实现不同维度的泛化。”张直政提到,这将直接实现效率上的提高,“同样是做电池分拣任务,一个遥操员可能只要花半天不到的时间就能够让具身智能完成技能的学习。”
“通过少量真实数据后训练,可以1000倍提升真实数据效率。”张直政表示,未来还可以打开想象,当学习更多技能时,效率提升可能是上万倍甚至是数十万倍。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
全国春播粮食近四成 进度快于去年
				眼下,全国春播粮食近四成,各地推进农机农艺融合,加大良种推广力度...
努比亚红魔27英寸电竞显示器4K/2K618活动
				,努比亚红魔27英寸电竞显示器4K版618活动直降500元,活动...
5月31日开启,《马力欧卡丁车巡回赛》游戏推出P
				,《马力欧卡丁车巡回赛》游戏将于5月31日推出《Princess...
GPDWINMax22023掌上游戏本预售:可选
				,据GPD消息,WINMax22023现已在京东开启预售,6月2...
联想推出小新Pro162023笔记本新配置:i5
				感谢IT之家网友华南吴彦祖的线索投递!,联想今日推出小新Pro1...
保险业支持防灾减灾有新招
				近日,中国保险行业协会印发《关于做好2023年全国防灾减灾日有...