• 正文
  • 相关推荐
申请入驻 产业图谱

人形机器人也要喂草料

10/17 11:24
444
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

为什么数据成为了人形机器人的卡点?

数据已经成为了人形机器人突破的卡点,目前大家遭遇的困境,并不在于模型算法和原理,而是缺乏足够的数据,来训练出一个可用的算法模型。

你看看几个当红炸子鸡的人形机器人公司,拿了地方政府的钱,要返投的第一件事,就是在当地建设各种数据采集工厂。

从底层说起,人工智能构成三要素算力、算法、数据,缺一不可。

人工智能要多智能,就要多少“人工”。这里的“人工”,指的就是通过数据标注,人工加工出来的数据。

要么说这是人工智能领域的“富土康血汗工厂”。

人脸识别模型,需要的是海量的人脸标注数据;智驾模型,所需要的是日积月累路测车辆跑出来的路况数据;大语言模型,需要的是海量的互联网数据……

但所有这些数据,都是一维和二维的,而具身智能大模型所需要的数据,则是多维的,不光是三维空间数据,还需要其他的N个维度。

因为所有目前成熟的AI,都还是局限在数字世界里的AI,并没有演进到物理世界。

李教母喊的世界模型,黄教主喊的物理AI,都是愿景。

AIGC生成的内容,也都是数字内容;即便是智驾,也只是道路环境的识别判断,汽车和物理世界的交互甚少,当然,谁也不希望汽车和物理世界有太多交互,那就成了事故了。

但是具身智能不行,人形机器人不行,他们存在的意义,就是和物理世界的交互。

不能物理世界自由交互的人形机器人,和充气娃娃有什么区别?

人形机器人,不要计较人不人形的,人形机器人的定义,用“自由移动机器人”这个名词更为合适,终极目标就是自主运动,和物理世界自主交互、完成任务。

这一点,以往模型的训练经验并不能够完全照搬,数据规模上,和以往的AI模型训练数据相比,更是不在一个量级。

训练具身智能大模型需要什么样的数据?

我们经常听到VLA模型的这个概念,Vision-Language-Action。其中的Vision泛指环境感知,Language泛指通过语言实现逻辑推理,Action泛指机器人和外界的行为交互。

所以,训练具身智能大模型所需要的数据,就是支撑V、L、A所需要的数据。

首先是多模态感知数据(V),包括视觉数据(图像、视频、点云等)、本体感知数据(关节的角度、速度、力矩等)、力感知数据(力觉、触觉等)、其他环境感知数据(温度、声音、湿度等)。

其次是任务与规划数据(L),以目标任务为导向,由大语言模型(LLM)或专家模型,生成子任务步骤、逻辑规则,完整记录下的任务执行过程。

最后是交互与控制数据(A),记录机器人执行任务的时候,端执行器或关节在连续时间序列上的位置、姿态或目标状态。

这三大类数据中,V和L,其实有相对成熟的采集方案,复杂归复杂,但和以往的AI模型有相通的地方。

最缺乏的则是A部分。

人形机器人和外界交互控中,涉及到的场景非常复杂,和自动驾驶汽车行驶的路面相比,不是一个量级的。即便是自动驾驶领域,相对简单的路况信息,各种cornercase频频出现,到目前为止还没有有效的办法解决。

训练一个垂直功能的人形机器人容易,训练一个无所不能的人形机器人难于登天。

所谓的人形机器人行业的主要矛盾,已经转化为机器人的泛化能力不足和垂直能力性价比又不如工业机械臂之间的矛盾。

这些数据应该如何获取?

到目前行业内对于几个技术路径还是存在争议,遥操作、数据仿真、互联网视频数据等,都有大儒在各自辩经。

遥操作好是好,通过VR设备、数据手套或仿形控制器远程操控机器人,录制的数据精准且高质量。

问题是,五花八门的机器人应用,不同型号的机器人关节配置,难不成都要挨个遥操作无数遍?

就是不把操作员当人使了呗?

互联网视频数据嘛,虽然易得,但肯定不好用,连视角都不一样,也缺乏力觉感知数据,这要是生灌给机器人,很容易扰乱心智。

我还是比较看好仿真数据这块。

当年自动驾驶cornercase问题,也试图通过仿真环境,模拟不可再现的一些小概率场景,增强自动驾驶模型的安全性。

但需求不足,没有足够的市场需求撑起这个技术路线,因此发展的不是特别顺利。

现在具身智能机器人来了,天然的刚性需求。

要么你遥操作机器人到处跑采集数据,要么你用数据仿真引擎模拟出各种场景数据,孰优孰劣大家各自判断。

大语言模型时代,催生出了像ScaleAI这样的数据服务商,被各家大模型公司当成香饽饽;未来具身智能时代,是否也会出现一个类似的数据服务商?

投资就是要在确定性趋势中寻找机会,先人一步。

对这个话题和相关项目感兴趣的朋友,欢迎对接联系,我们后续也会邀请一些创业项目创始人来深入分享这个话题。

————————

创道硬科技,专注于科技领域投融资服务,为创业企业、投资机构、科技服务机构和政府产业园提供如下服务:

1)科技融资服务:FA融资顾问、企业融资优化咨询(融资规划&方案&投资协议解析)、企业融资宣传和路演。

2)公司治理&管理:股权激励架构设计和搭建、科技创业企业销售体系建立、绩效考核体系搭建。

3)培训&媒体&活动:硬科技行业主题峰会/私董会、科技Pilot行业访谈、硬科技新势力公众号……

业务联系:riseen001

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录

公众号科创之道主笔,标准的EE、CS专业理工男。从事研发、咨询、投资工作15年,主要关注领域为半导体、人工智能、物联网、云计算等,目前专注于风险投资和企业服务领域,平时喜欢把一些工作上的感悟随手记下来,希望通过自己的文字,融合IT产业和投融资行业知识,为跨行业沟通搭建一座桥梁。