365文库
登录
注册

“稚晖君”停更这一年:想赢下人形机器人,要像大公司那样去创业

2024-09-05 22:03    财经科技    来源:网易新闻



许多基础问题还没搞清楚的人形机器人行业,就要面临激烈竞争。

文丨贺乾明
编辑丨程曼祺

我们下午 3 点见到彭志辉时,他还没吃当天的第一顿饭。一日一餐是彭志辉的常年状态,他觉得自己 “习惯了,不影响活着,吃饭比较浪费时间”。

2023 年 2 月,彭志辉参与创办智元机器人,任 CTO,致力于做出商业化的人形机器人。在这之前,他更为人熟知的身份是 “天才少年” 和 B 站 “百大 UP 主”。

彭志辉 2017 年开始以 “稚晖君” 为网名发布各种硬核 DIY 视频,现在他的 B 站账号有 250 多万粉丝,同体量的 UP 主通常是团队运作,而他是一个人兼职做。不少人觉得 “全栈工程师” 难以概括他的能力,称他为 “溢栈工程师”。

智元机器人成立后,彭志辉把一切重心放到了公司,他基本没休过周末。B 站最后一次发布自制视频是 2023 年 4 月。

极致地投入,是因为他想成就更大的事业。“我们的愿景是用智能机器创造无限的生产力。” 彭志辉说。

也因为人形机器人行业许多基础问题尚未解决,就要面临激烈竞争。去年至今,中国已出现不下 20 家人形机器人公司。想把机器人送进工厂的智元机器人,还要与 2016 年前后成立的上一波 “AI+ 机器人” 公司竞争,它们服务客户更久、经验更多;再往后,更大的威胁是对具身智能蠢蠢欲动的车企,它们能调动的资源远超一般创业公司,而且有自己的工厂,这是现成的场景。

智元机器人认为,获胜概率最高的方法是 “高举高打”,用一种运营大公司、操大盘的方式创业。

多数同行专心研究一款产品时,智元机器人用一年半做出两代人形机器人,并在今年 8 月一次发布了 5 款人形机器人,还给同行提供数据采集方案。今年初,智元机器人还发布过一款商用清洁机器人。



智元机器人 8 月 18 日发布的 5 款产品。

大部分人形机器人公司会先侧重某个技术方向,有的主攻硬件,有的主攻软件智能系统。形态上,有的重点放在上半身的操作能力,有的优先做下半身的运动能力。

智元机器人则 “全都要”:他们做完整的人形机器人,也根据不同场景开发分支形态;他们自研关节电机等核心零部件,也研发 “灵巧手”,还自己开发多模态大模型,同时研究强化学习、模仿学习、视觉模型等当前具身智能的主流技术。

今年 2 月,多数新公司仍在代工组装机器人时,成立刚一年的智元机器人就开始建设上海临港首期工厂,计划年底投产。

“看不太懂”“不是常规的创业公司”,数位科技投资人如此评价,他们很少看到初创企业同时做这么多产品,下注这么多技术方向,如果管理和后续资金跟不上,很容易出问题。

彭志辉说,他们不是有意要如此,而是行业特点使他们必须这么做:“人形机器人的研发涉及硬件、软件、算法、供应制造等一大堆问题,系统工程极其重要。在技术实现上,有的是工程问题,有的还是科学问题。这个行业空间大、门槛高、变化快,人才、资金和商业成果最后都会向头部集中,如果只是小打小闹,很难保持领先。”

最多资本投票向智元机器人。成立一年半,这家公司已至少融资 15 亿元人民币,估值达 70 亿元人民币,投资方有高瓴、红杉、高榕、蓝驰、比亚迪、上汽、三花智控、临港新片区等 20 多家机构。智元还在今年初的股东会上给部分投资机构颁了奖。

纪录片导演竹内亮曾在拍摄彭志辉时,惊讶他精通如此多的跨领域技能,问:“有没有你不会的东西?” 彭志辉说:“不会生孩子”。这次我们又问了这个问题,他说:“不会停止学习”。



彭志辉摆在工位上的书,大都是《托马斯微积分》《编译原理》等教材,唯一的例外是《埃隆·马斯克传》。马斯克是他的学习对象之一。

“在学校里学习更多是自底向上,先打好基础然后做上层应用,出了校园之后更多是自顶向下,以项目导向,缺啥学啥。” 彭志辉说。聊到时间管理方法,他说是 “操作系统中的抢占式调度”,动态调整任务优先级,允许打断,但是任何时间都专注于当前的任务。

他不喜欢 “天才少年” 的称呼,他觉得教科书中那些能改变人类发展进程的科学家才是天才。

相比过去用几个月就能独自完成的小型项目,参与创办一家公司开发成功的产品要难得多。他要从单兵作战走向带团队协作,做出来的东西不能只是酷,还要能赚钱。这是一场新的、更复杂的学习。

以下是《晚点》与彭志辉的对话:

耐心地冲刺,留在牌桌上

《晚点》:回到起点,为什么 2023 年决定创业?

彭志辉:人形机器人本身不是新事物。我做人形(机器人)比较早,16 年还在学校时就创业做了原型机,那时 “具身智能” 还没出现,主要做本体(机器人硬件部分),还拿过 500 万投资。

这两年具身智能跟人形机器人这么火,并不是本体有了什么黑科技,最主要的还是 AI、大模型的出现让机器人可能在本体之外有更多应用价值。我在华为昇腾就做 AI 计算,这个趋势看得比较清楚。这是我出来创业的一个原因。

《晚点》:如果你想在华为做,应该也会得到支持。为什么选择创业?

彭志辉:风格问题。华为在技术方面主要是搞基建,比如操作系统、芯片、数据库等非常底层的根技术。

而机器人是一个非常新的赛道,特别是 AI 机器人,更适合一些迭代比较快的团队。创业不仅要有一个好点子或好技术,更重要的是在正确的时间点做正确的事。

《晚点》:现在创业做人形机器人是正确的时间吗?它需要的硬件、材料、能源等技术还不成熟,有些还在科学探索阶段。一位资深科技投资人就说,他对 5-10 年后才会发生的事没兴趣。

彭志辉:我们也没想过短期就做成这件事。我们要求大家 “耐心地冲刺”,一方面迭代和创新速度要非常快,一方面要有耐心。

短期市场上会有各种正、负反馈,但对一家初创公司,最重要的是留在牌桌上。

《晚点》:留在牌桌很重要的一点是钱够多。智元的融资速度和规模都领先同行。怎么做到的?

彭志辉:我觉得可以换位从投资人的角度看,他们为什么会选我们?

首先我们有非常硬核的创始团队背景;又有全栈技术布局:不只做本体,也不只做具身 AI,我们是本体、具身、数据都有布局,能力相对友商可能更全面;其次我们对整个赛道的理解也非常务实,一直在积累量产的系统能力,团队的执行力超强。

去年发布会(2023 年 8 月)时,我们整个人形研发团队才不到 50 人,一年后的现在已经超过 300 人了。规模敢增长这么快,前提是我们想清楚了要做什么事情、各个阶段的技术实现路径,以及商业化的逻辑,这点也是投资人比较看重的。

《晚点》:智元长期想成为一家什么样的公司?有什么对标对象?

彭志辉:比如贝尔,贝尔发明电话,改变了大家信息沟通的方式。人形机器人未来可能也会改变社会生产力。我们的公司愿景就是 “用智能机器去创造无限的生产力”。

智能最终决定机器人能做什么

《晚点》:创业一年多,人形机器人哪些方面比你预想的更难?

彭志辉:从 0 做到 40、50 分,甚至 60 分都不算太难,但再往上就非常难。

本体成熟度还不够。比如大部分人都在卷两条腿走路,而双臂的灵活度,灵巧手这些都还处于初级状态。然后是智能。现在大家都往模仿学习方向尝试,但它真的能在复杂开放环境中达到很好的效果吗?还有触觉,声音跟视觉结合起来的多模态融合感知、操作等,做得也不是非常好。这里面有一部分是工程问题,还有一部分还处在科学问题阶段,业内还没有看到非常成熟的解决方案。

我们一边落地一边做预研,整个节奏要把握得比较稳,才能体现我们的竞争优势。全栈也是我们的一个优势,所以未来可能会走得更远一些。



智元机器人研发的灵巧手,与人手还有差距。人手有 27 个自由度、行动灵活,遍布高敏感的触觉神经,力控能力强大。要做好灵巧手,灵活、耐用、稳定且成本可控的硬件部件和材料只是基础,人手还具备手、脑协同能力,比如人能接住移动的物体,是因为人脑对重力、加速度等物理规律有认知,因而能预判轨迹,身体又有运动能力,才能完成这个看似简单的动作。

《晚点》:我们了解到,智元在机器人的智能上投入的人手更多。你们认为智能比本体更重要?

彭志辉:本体肯定是基础,但我们一直觉得,(人形机器人)最核心的其实不是本体,而是它基于本体,能完成什么实际任务,产生什么有价值的应用。

所以本体的价值一定是通过具身来体现,你可以看到我们起名智元的初心:“智” 就是具身智能,“元” 就是人形机器人本体的两条腿(象形)。

《晚点》:一个人形机器人能站起来到能走,再到能上台阶,是智能问题吗?

彭志辉:它其实更多的是智能问题,而不只是硬件问题。高阶的运动能力主要靠大脑体现,在很多运动项目中,正常人跟运动员的身体没有本质区别,运动员更多是长期训练中让大小脑协同,对环境的感知、反馈达到了更好的状态。

《晚点》:在获取训练数据的方法上,行业里也有分歧。比如有公司认为,遥控操作机器人采集数据算不过来账,应该用大量仿真数据。智元为什么造上百台机器人专门采集数据?

彭志辉:数据来源就那几类:互联网数据、仿真数据、真实采集的数据。如果只靠仿真和生成数据,会有可能出现用 ChatGPT 训练大模型的情况,出现幻觉、Sim2Real Gap 等问题。所以真机数据必不可少,价值也最大,但它的量不会有仿真数据那么大,可能占 10%。

还要考虑采集成本,有些公司硬件能力没么强。我们本体做得足够好,所以才有条件在今年下半年有几百台机器人能采集数据。我们会找到一些场景,让人遥控操作不能自主执行任务的机器人。让客户为这一部分的功能买单,降低硬件成本。



《晚点》:在你的设想里,通用人形机器人最终会是什么样的?

彭志辉:就科幻电影里的那种。比如 I,Robot。科幻电影拉高了大家的预期,但我们希望最终能做出来。

《晚点》:那是一种超人的状态,而不是像人。

彭志辉:可能很难有中间态。一旦人形机器人达到正常人类的水平,那它很快就会远远超过人类。

《晚点》:那个未来距离现在还有多远?

彭志辉:我比较乐观,未来 10 年是有希望的。

人形机器人最早落地的场景是 “PPT”

《晚点》:你们说今年是智元商业化元年。其实不少人觉得,人形机器人还处于早期阶段,刚学会走路,没必要这么快去上班。

彭志辉:我们是一家商业公司,商业化是检验成果最有效的方式,把产品卖出去,客户给了积极反馈,才能吸引到更多人才。一个落地遥遥无期、不太有希望的团队,大家也不会加入。

《晚点》:你们说人形机器人商业化路径是先工厂、后家庭,现在处于工厂阶段,他们能做什么场景?

彭志辉:目前最快落地的就是 “PPT”,Pick(抓取)、Place(放置)和 Transfer(转运)。

灵巧手更成熟后,还可以做各种装配工作,因为灵巧手有触觉、力觉等各种复杂感知能力。这个场景的量会更大,我们评估了一下,PPT 可能就只占整个制造行业场景的 20% 不到。

《晚点》:你们说今年就会卖出 300 台机器人。200 台有腿,100 台靠轮子移动。更具体来说,他们会做什么工作?

彭志辉:卖的主要是远征系列,灵犀系列不卖,都开源。

远征系列里,双足(人形机器人)的可靠性和自由度还要进一步迭代,现在更适合做一些体现人机交互能力的场景,主要是服务业。比如我们发布会上展示的汽车门店里的迎宾导览。轮式的就是 A2-W,在工厂里做 “PPT” 那些工作。



智元的人形机器人远征 A2 在汽车门店当导购。

《晚点》:行业里也有一些机器人公司,比如梅卡曼德、思灵等,给机械臂增加视觉、力控能力,用上大模型,在工厂里也能做 PPT,而且他们已在稳定性和成本上打磨了更久。你们新方案的优势是什么?

彭志辉:它们的确是机械臂厂商中最贴近具身智能的公司。我们从单臂演化到了双臂,然后还带一个移动底盘,一些高层的双臂规划上,我们会有一些技术差异化。

比如典型的转运场景中,用单臂搬一个托盘很难实现,双臂做这个任务就更合理。从单臂到双臂,听起来很简单,其实会涉及复杂的力控和双臂配合、环境感知、动态避障、轨迹规划等。更关键的是,以上这些能力我们要做成可以泛化的标准技能,降低机器人的部署成本。



智元机器人 A2-W 在工厂中搬托盘。

《晚点》:智元卖出去的 A2-W,已经能解决这些问题了?

彭志辉:能解决一部分,重点是找到客户需求和我们已有技术的匹配点。我们的投资人也比较给力,确实提供了一些很有价值、能在短期落地的场景。

《晚点》:刚才你也提到,你们非常在意成本。去年你说人形机器人要降到 20 万以内。这个数字是怎么算出来的?

彭志辉:要看客户的期待是什么。一个工人的成本一年大概是 10 万,机器人可以两班倒。20 万客户差不多一年或一年半就能回本。我们也拆解了零部件成本,只要量足够大,的确可以达到这个水平。

《晚点》:智元的产品距离 20 万还有多远?

彭志辉:不远了。我们批量发货的目标成本就是这个,要不然可能就是亏本了。

《晚点》:你们的竞争对手会是谁?

彭志辉:这个赛道足够大,大家都还在做大蛋糕的阶段,现在还没有什么直接竞争对手。

有一些潜在的竞争对手还没下场。比如新能源车厂,它们有动力做这件事,如果人形机器人在产线上体现出价值,它们肯定会投资源做。它们也有能力做这件事,你看机器人本体上用到的各种核心零部件,电机、电控、电池等技术,就是新能源汽车擅长的那一套。

《晚点》:你预想的人形机器人很硬核,但现在商业化的产品看上去似乎很无聊。你会感到矛盾吗?

彭志辉:不冲突。我们是并行研发,都在做。我们有几条线,一个是产品化、量产的线,一个是探索预研的线。我们经常在内部说,要吃着碗里的,看着锅里的,还得想着田里的。

像运营大公司那样去创业

《晚点》:你们 8 月一次发了 5 个人形机器人产品,还卖关节电机、夹具、提供数据采集方案。今年还发布了商业清洁机器人。你们的产品线是不是铺得太开了?

彭志辉:这其实是一个主线落地加很多支线探索,我们觉得还是有必要做这些布局的。我们叫饱和式投入。一方面我们有这个条件,同时整个赛道也还不太明确。

当然我们也会控制支线的资源投入。比如我们这次发布了 X-Lab 实验室做的两款产品,全职参与的人其实不到 5 个,从全新的关节到结构软硬件算法都是这几个人做的,在 X-Lab 我比较追求人效。

商业清洁机器人则是一个相对成熟的产品,能为我们人形的量产提供前置帮助,比如渠道、制造、售后等。它又能复用人形的一些能力,比如给清洁机器人加机械臂,让它做更多事。

《晚点》:技术布局上,不少人形机器人公司都不做全栈,比如硬件本体上,一些公司不研究灵巧手,就用夹具;还有一些公司认为腿没必要,只做上半身。具身智能系统上,很多公司也会在强化学习、模仿学习中有侧重。

彭志辉:你得看各家公司擅长什么或想做什么。我们想用智能机器去创造无限的生产力,就不得不关注全栈。这是从最终产品的竞争力出发的布局。

《晚点》:你们的计划的开发节奏也很快:半年一代样机,一年销售一代产品。

彭志辉:所有的创新都要可持续,要考虑长期竞争力,并提前布局。创新的速度和创新一样重要。

《晚点》:但人形机器人能做成什么样都不明确。智元怎么确定每一代产品的迭代方向?

彭志辉:就是刚才讲的,把事情想清楚,具体要做哪些场景,怎么做?需要什么核心零部件和核心技术?

我们调研了很多客户的需求,制造业的、服务业的。我们的股东也提供了很多输入。从不同场景出发,我们提炼出技术路径,发现有的更偏传统自动化,有的更偏未来 AGI ,还存在一些中间状态。这就是我们在发布会上的 G1-G5 智能演进路线。



智元目前商业化的产品处于 G2 阶段,正在研发 G3 阶段的系统。

《晚点》:同时做这么多东西,又想做得快,这真的可能吗?

彭志辉:其实我们成立半年就做出了第一代人形机器人。首先是靠人才,大家的战斗力都很强。然后也有一些我的个人经验积累,还有整个行业的发展,AI 技术大规模应用。

与前几年相比,现在做这个事情的难度会降低一些。机器人的技术栈和新能源汽车很像,新能源汽车行业带动了上游制造业。在国内做通用机器人会有一些额外优势。



智元第一代人形机器人远征 A1。彭志辉说,考虑到站在操作台前工作的场景,下半身采用关节往后弯的 “鸵鸟腿”。

《晚点》:团队战斗力很强,怎么衡量?

彭志辉:就是工作效率,创新能力,还有投入程度。

《晚点》:很多公司的投入程度也高,也卷。这一点上你们怎么能比对手更强?

彭志辉:首先我们招人时,会尽量筛选志同道合的人。比如价值观要跟公司匹配。我会问他的兴趣点是么?比如 “如果你财务自由了,会不会继续做现在岗位上做的事情?” 实际上我们公司的 Up 主浓度挺高的,他们都是因为热爱主动投入的年轻人。

然后给足够的信任,配足该配的资源;过程中鼓励充分发挥主观能动性,但是在验收结果时,标准要提高;结果好的时候,给足够多的激励。

我们激励方式比较多,年终奖之外也会给股权。我们未来的目标是跟华为一样,优秀的同事都配股。

《晚点》:最近的发布会上你也提到,机器人是一个非常复杂的软硬件协同系统。你们需要同时做好很多事,怎么让各团队高效协同?

彭志辉:系统架构设计,是我们非常看重的能力。我们认为,人员的规模增长一定要有对应的组织能力,否则可能就是灾难。我们的组织架构非常扁平,层级很少,一线研发上面是各个技术模块的研发经理,再上面就直接是我负责了。大家可以充分沟通交流,我们非常鼓励及时反馈,暴露问题。

除了常规项目开发流程外,我们还会以项目攻关组的形式推进一些关键技术的突破。像核心零部件,我们会成立虚拟组织,成员承担的职责更多,要求更高,但是做成之后的激励也会更大。

《晚点》:智元除了自己招人开发,还跟北大合作建实验室,甚至你们还收购了一个电机公司,早期公司很少这么做。

彭志辉:我们其实都是尝试。比如说收购的电机团队,其实只有两个人,又比较出色,也给一些大品牌做过代工,反馈也不错,我们就把他们吸纳进来了。

《晚点》:多产品线、全栈技术布局、整合产业链,包括你们矩阵型的组织架构,感觉你们在用大公司的运作方式创业?

彭志辉:可以这么理解。但我们并不是为了表现得像大公司,而是因为当前的市场环境下,这种方式是最有效的。这是一个相对新兴但迅速发展的领域,我们需要快速占领市场,展示我们的技术实力和产品愿景。

大行业、大赛道最终都会收敛到头部企业,如果只是小打小闹,很难在快速变化的市场中保持领先地位。

“我不是天才”

《晚点》:有人说你是 “全栈溢出工程师”,可以焊电路板,造机器人,还能写代码,训练 AI 模型等。另外你也会弹吉他、剪视频等。你有什么特别的学习方法吗?

彭志辉:可能跟 AI 学习的方式有点像,早期靠一些过拟合,再用更多锻炼,增加泛化性。多参考别人已有的经验,先不要问为什么,哪怕死记硬背,先记下来,慢慢就会理解背后的原理,然后再积极创新。跨领域掌握多个技能后,就会发现它们之间有相关性,一个领域的事情可能会帮你解释另一个领域。

还有时间管理要做得非常好。大家都说我是时间管理大师什么的。我喜欢用靠类似操作系统里面的概念,叫抢占式调度,对要做的事情做动态优先级分配,不是做完一件事再做另外一件事,如果有更重要的事出现了,就去做它,做完再切回到之前做的那个事。每次只做一件事,分时保持专注,可能时间利用效率会比较高。

《晚点》:你的方法比较系统。之前我问宇树科技王兴兴类似的问题,他说 “24 小时不睡觉,我不信解决不了”。

彭志辉:我很多灵感也是睡觉前想起来的。日有所思,夜有所想。我也在梦里想到过一些问题的解决方案,挺神奇的。不过有些事情可能很难,像数学,不会就是不会。

《晚点》:你刚才提到时间管理,哪怕是天才,一天也就 24 个小时。你现在投入这么多精力创业,在其他方面牺牲会很多?

彭志辉:对,现在基本上很少有周末。从去年创业到现在还没有请过假。我个人还有些小习惯,我不太睡午觉,一天只吃一顿晚饭。

《晚点》:为什么一天只吃一顿饭?能维持状态吗?

彭志辉:有的时候确实忙,不太有时间,我觉得吃饭比较费时间。饿了也可以吃点零食嘛,身体也没有什么负面反馈,我觉得只要达到平衡就不算太坏的习惯。

《晚点》:创业一年多,给你印象最深的事是什么?

彭志辉:太多了。比如去年 8 月开第一次发布会时,各种意义上都非常极限。发布会前两个多礼拜,我们研发的同学们基本就在会场打地铺睡觉。

发布会我们选了最有挑战的直播形式,当我已经上台讲了 20 分钟后,才看到台下小伙伴比的 OK 手势,我们终于解决完了最后一些 bug。

《晚点》:为什么不能往后拖?

彭志辉:已经拖过了,这是延过两次之后的时间。还是得逼自己一把。

《晚点》:你之前都是一个人做项目,现在你要带一个团队。你怎么学习管理?

彭志辉:一方面跟有经验的前辈学习。另外就是在实战中学,同时也有一些配合我做管理工作的伙伴帮忙。

《晚点》:那你还看书吗?都看些什么书?

彭志辉:都在我办公桌上,各种论文和书。长篇小说好像只看过《三体》,我喜欢硬科幻,是 big 刘的忠实粉丝,《三体》看了 10 多遍。

《晚点》:见到刘慈欣,你会跟他说什么?

彭志辉:给我签个名。

《晚点》:现在应该有很多找你要签名。遇到这种情况时,你在想啥?

彭志辉:早知道就好好练练字了。

《晚点》:你身上有很多标签,比如 B 站知名 UP 主、天才少年、明星公司联合创始人、野生钢铁侠、全栈溢出工程师。你更喜欢哪个标签?

彭志辉:个人来说可能是工程师吧。我觉得搞技术还是很有意思的。假如我未来财务自由了,我不一定会去做视频,但肯定会继续做技术方面的事情。

《晚点》:你怎么看 “天才少年” 这个称号?

彭志辉:我觉得我不是天才啊。大家也没有必要这么称呼。我只是兴趣使然,愿意动手尝试做一些东西出来,恰好遇上一个比较好的时代,和各种平台、机遇,做出了一点成果,更多的是努力和幸运吧。

《晚点》:你觉得什么样的人才能称得上天才?

彭志辉:他们的存在对整个世界的发展轨迹能有很大影响,比如大家在课本上看到的科学家们。

《晚点》:造出了真正的人形机器人,才算天才?

彭志辉:我会把这个称号让给我们造出的机器人。

题图来源:彭志辉。

tj