投资提醒: 本文内容仅供参考,不构成投资建议。外汇和差价合约交易涉及高风险,可能不适合所有投资者。
特斯拉(TSLA.O)正在采用一种成熟的克的看视方法来训练其人形机器人Optimus。据内部人士透露,新思习折公司在6月底通知员工,或通将更多地专注于“纯视觉”训练方法。过观
以往,频学特斯拉使用动作捕捉服和虚拟现实设备来记录人类操作员的叠衣数据,现在将主要依靠拍摄工人执行任务的克的看视视频来训练机器人,例如教其拾取物体和折叠T恤。新思习折
知情人士指出,或通抛弃动作捕捉和远程操控将使团队能够加速数据收集的过观规模。
这一转变显著改变了特斯拉的频学机器人战略,与马斯克长期以来的叠衣信念一致,即通过摄像头,克的看视人工智能能掌握复杂任务。新思习折特斯拉的或通自动驾驶软件也采用类似训练方法。
这一变化恰逢Optimus项目主管米兰·科瓦奇辞职,AI主管阿肖克·埃卢斯瓦米已接手该项目。
动作捕捉和遥控是行业常见做法,领先的机器人公司如波士顿动力也使用遥控训练其机器人。在训练过程中,工人穿上动作捕捉服,以执行各种任务,收集的数据随后被输入到机器人中。
尚不清楚特斯拉是否会在未来重启动作捕捉和遥控优先级,或是会在已有信息的基础上,利用视频数据继续开发。
人类与机器认知研究所高级研究科学家罗伯特·格里芬表示,依赖视频数据训练机器人面临很多挑战,因为没有直接的物理交互,难以将视频中的动作有效转化为现实操作。
叠衣与捡物
马斯克于2021年首次公布Optimus项目,预计该机器人将执行多种工厂和护理工作。
去年,公司曾招募“数据采集操作员”,要求他们执行并记录基本家务,且需长时间穿戴动作捕捉服和虚拟现实设备。
到6月底,项目依然包括远程操控和动作捕捉的训练方式,内部人士称,工人需应对服装和机器人相关问题,限制了数据收集的效率。
自训练方式调整后,工人们开始使用一套由特斯拉自制的五台摄像头记录动作,摄像头安装在工人的头盔和背包上,精准捕捉环境信息。
佛罗里达农工大学与佛罗里达州立大学联合工程学院的机器人实验室主任克里斯蒂安·胡比基指出,这些角度的摄像头可能使特斯拉能够捕捉更细致的细节,如关节和手指位置,并改进机器人的定位。他补充道,这些视频可以补充先前收集的数据。
在训练中,工人会接收到明确的任务指令,尤其是手部动作方面,以确保动作尽量接近人类。一位员工提到,可能需要数月时间反复执行同一简单任务。
谢菲尔德大学的机器人专家乔纳森·艾特肯表示,特斯拉需找到方法让Optimus通过可泛化的动作学习多种任务。
他补充道,特斯拉或许会借鉴Physical Intelligence公司的策略,通过大量演示数据让机器人学会灵活适应多种技能,而不是单一任务的死记硬背。
特斯拉式的机器人研发
这一新策略与特斯拉开发自动驾驶软件的方式保持一致。与其他依赖激光雷达和毫米波雷达的公司不同,特斯拉主要利用摄像头。
公司通过数百万辆配备8到9个摄像头的特斯拉汽车收集数据。马斯克曾指出,特斯拉在中国推出辅助驾驶软件前,已用当地街道视频训练AI系统。
马斯克在今年1月的财报电话会中承认,训练Optimus的需求可能至少是汽车的10倍。
“这是一种非常特斯拉式的机器人研发方法,其他公司并未以如此规模尝试。”艾特肯表示,“他们需要像训练汽车那样庞大的数据量。”
俄勒冈州立大学的AI与机器人专家艾伦·费恩认为,训练Optimus对特斯拉而言,比研发自动驾驶汽车更具挑战性。
他说:“驾驶只是一个任务,”依赖视频学习意味着机器人必须理解视频内容和具备执行任务的技能。“有些事情可以靠观察学会,但有些需要在模拟器或现实中实践。”