对于一年融7轮当红企业智元机器人来说,2024年公司层面遇到的最大的问题,可能是创始人要离职。
这位B站百大UP主“稚晖君”,以及一天只吃一顿饭的创始人,真实名字叫彭志辉。2023年2月,搭档上海交大教授闫维新,正式在上海成立智元机器人公司。这两位其实都是联合创始人,据悉背后还有华为大佬坐镇。
但台前一直是网红负责人稚晖君,公司高速发展一年后,几个“老板”在发展路线上有了一定的分歧,侧重做资本概念更热的人形机器人,还是做商业化更好的任何智能机器品类?
公司内闹了一圈后,智元高层协商的解决办法也比较折中,彭志辉身份被定为CTO,主要做人形机器人。联合创始人闫维新带着团队做商业清洁机器人。一边顾着营收,一边顾着理想,这样好在没影响智元的新一轮融资。
其实,机器智能的江湖中,很多家公司都面临着这一问题。“到底要不要做通用人形机器人”?在知名资本如创新工场创始人李开复眼中,智能机器并不一定要做人形:“绝大多数应用场景并不需要人形机器人,炒菜机器人应该长得像锅,吸尘器也长得并不像人。像是波士顿动力那种很酷的、跳来跳去的机器人,真的会有很多应用场景吗?”
但现实是资本蜂拥的具身智能热潮中,大家都在投人形机器人,实际上在赌一个泛化能力出现的明天。特斯拉的Optimus已经迭代到第三代,OpenAI投资的Figure则能和人类对话。这些机器人做出了无数个第一:“第一个拿起苹果”“第一个煮咖啡”等成绩。
人形机器人未来市场潜力很大,数据统计,2024年(截至11月5日)发生46起融资,投资金额共计116.8亿元,融资总计金额翻倍;2030年,我国人形机器人市场规模有望达约8700亿元,这导致大家一拥而上。另据不完全统计,目前市场上有86家人形机器人企业,这些机器人形态各不一样,仿佛都拥有开启未来的能力。
对于市场来说,仍有不少具身智能公司在做机器狗、轮式机器人等产品,毕竟人形未来前景好,但活在当下也很重要。成为下一个产品驱动的公司,对标机器领域的大疆,就是一个很好的模式;他们选择聚焦在具身智能本体,比如核心是四足的宇树科技、老牌机器人企业优必选等,就是该领域的代表玩家。
而对于另一部分具身智能公司来说,打造泛化能力的资本驱动型产品,也是当下最容易拿投资的企业类型。这些创业者则是从“世界模型”入手,推动机器人会思考学习,也就是所谓的“具身大脑”,代表企业有银河通用、星动纪元等,想对标特斯拉的Optimus。
据公开资料,大疆的市场估值在1600亿元左右,这是一个相对成熟稳定的市场;特斯拉的人形机器人业务并未独立,但马斯克自己预测,Optimus的售价低至1万美元时,这项业务估值将达到25万亿美元的高度,这是一个挑战巨大的潜力市场。
尽管行业融资还集中在A轮附近,但分化已经从现在就开始。
逐梦者最先拿到大笔资金
在ChatGPT等大模型展现出通用智能的曙光后,资本纷纷形成共识,投资人形机器人,赌注下一个拥有FSD的特斯拉。
谁能在这个市场分一杯羹,大家纷纷拿出了看家本领。陪伴型、工厂型、服务型等各种业务机器人如雨后春笋般出现。
“其实对于机器人来说,实现‘去帮我倒杯水’,比翻个跟头更难。”一位机器人从业者说道。
对于前者来说,是包含理解、评估、决策、执行等多个步骤,涉及到的技术跨越太多,北航机器人研究所名誉所长、中关村智友研究院院长王田苗认为,从进化的角度来看,如何协调语言认知智能、行为智能和视觉智能等三个计算空间,并高效地利用真实、优质、海量的数据,高效的输出执行能力,现阶段挑战很大。
而对于后者来说,翻个跟头看似很难,解决关节电机的问题即可,难度没那么大。
学术派下决心创业,他们想做倒杯水的机器人,成为逐梦“通用机器人”的主力军。
作为清华出来的创业者,在机器人顶会RSS 2024上,陈建宇的DWL端到端强化学习框架,是全清华大学3篇满分论文之一。这让资本相信其具备追逐通用机器人的能力,天使轮获得了1亿元融资,2024年10月份又完成3亿Pre-A 轮融资。
他创办了人形机器人公司“星动纪元”,也是对人形机器人是最乐观的一位,预计未来五年将迎来“机器人的ChatGPT时刻”。
在很多企业底层还在用MPC的时候,星动已经完全端到端AI驱动了,这款模型已在“星动纪元”第六代人形机器人STAR 1中应用。
星动目前努力从强化学习向端到端模型跨越。通过语言和视觉信号直接生成动作,一定程度避免信息传递损耗。这让其在上下半身的控制方面都有不错的成绩。星动全自研上半身灵巧手+模仿学习操作保持,是行业中的T0级别。
而作为具身智能最大追梦者的银河通用,成立不到一年就融资7亿元,可谓含着金钥匙出生。银河通用本身很擅长3D视觉,从一开始也在攻克多模态大模型、世界模型等等,更像是特斯拉的Optimus。
银河通用创始人王鹤曾经在一场投资人内部活动中,对波士顿动力看起来很牛的机器人,表达了自己的不屑:“对已知物体进行位姿追踪,在MPC的框架下跟随一条已经设计好的运动轨迹移动,也就是说物体怎么运动是提前设计好了的。它技术的先进性依然在于控制,任务的开放性和物体的泛化性都没有得到体现。”
波士顿动力作为机器人最大的鼻祖,一直沉迷于液压动力,对智能化认知较浅。在这波具身智能热潮中无缘参与,此前因为商业化基因不足,先后被谷歌、软银和韩国现代购买。
所以银河通用从一开始就追求人形,追求泛化能力。尽管人形机器人现在还经常磕倒,但银河还是将其机器人最主要的场景,定在了货架领域。在美团买药的板块中,银河机器人可以走到货架前,识别出药品并分装。
捡药是个十分要求准确的活,银河的机器人需要学习药品知识,并做到准确分装,这也让美团战投投资了其年度最大天使轮融资。
半推半就地进军人形市场
对于机器人创业者来说,大家都知道通用机器人的前景,但都怕活不到具身智能的奇点时刻,所以很多企业想做下一个大疆,进军人形机器人也是半推半就。
这方面的典型是宇树科技,作为从四轮机器狗起家的机器人企业,经常有产品演示视频出圈。产品也在电巡和军工领域率先找到了落地场景,同时,做出了春晚和冬奥会等机器狗表演案例。
宇树在电机控制和硬件上确实是很强,商业化导向很明显。其创始人王兴兴也经常口出暴论,坚决不做人形机器人,甚至“非常欢迎客户用我们的硬件,哪怕把我软件全删了,我们也非常欢迎。”
这导致宇树对于AI的投入十分谨慎,但在近期,王兴兴提到投资人的催促,有客户主动提需求,大模型给AI带来质变等等因素作用下,还是做了人形机器人。
从2月立项做人形机器人,8月就发布了第一个原型产品,只用六个月就做出来了。不仅时间快,而且用人奇少。据悉宇树全职做这个事情的只有三个人,公司涉及到的人也就不到十个。
对于为什么能这么高效做出来,王兴兴不无自豪地说道:“其实没有太大的难点,可能就是关节电机的扭力要求更高一点。四条腿变成两条腿,每条腿的负载会更大一点。控制算法很多能直接从四足机器人拿过来用。”王兴兴曾对“晚点Auto”表示。
其实,宇树人形机器人采用的是3个手指,相比特斯拉Optimus的5个手指、22个关节来说,确实难度不是一个层级。雅克比机器人创始人邱迪聪对鲸哥谈到:“十个关节、五个关节对我们来说其实是一样的。因为我们有通用的这种算法,可以处理任何数量的关节。”他认为这点没有跨越式的难关,更多是工程上的难题。
有其他行业人士分析,宇树一定程度避开了这个耗费时间的工程。
宇树发布的名为Unitree G1(简称“G1”)的新型人形机器人,最大意义是基础款售价仅为9.9万元,惊爆了市场。特斯拉的“擎天柱”人形机器人目标价位为2.5万美元(约合18万元人民币),而上海智元机器人的期望售价设定在20万元。宇树成了人形机器人领域的“拼多多”。
而对于智元来说,要和宇树打差异化,那就要做人形机器人领域的淘宝。不能比你便宜,就比你种类更多。8月份,智元一次性发布5款机器人,轮式和人足形态的机器人都有,还有为开源而生的灵犀系列。价格来到了20万元,虽然比宇树科技的贵一倍,但是智能化程度也高一些。
现阶段,硬件成本仍然是大头。摩根士丹利最新报告显示:现阶段特斯拉0ptimusGen2总的Bom成本(不含软件)为每台5—6万美元。一家机器狗企业告诉鲸哥,现阶段狗型的Bom成本占到最终售价的40%,人形硬件成本会更高。
稚晖君认为必须要降到20万才能商业化落地,智元通过自研如关节电机和灵巧手等部件来降低成本。其实,人形机器人智能层面的成本,还没有分摊进去。不赚钱做通用人形机器人,20万元现在是行业低价底线了。
对于智元来说,融资金额太高也是一种无形的压力。所以在走进家庭和工业等场景中,智元还在量产下肢是轮盘的机器人,瞄准的是物流和家庭等场景。据悉,单深圳就有好几家在备货,用的是睿尔曼的机械臂和坤维的六维力传感器。
稚晖君自己就坦言,短期市场上会有各种正、负反馈,但对一家初创公司,最重要的是留在牌桌上。做人形机器人更要坚持得久一些。
|