做机器人,先别急着进客厅
大连国际会议中心三层,2026夏季达沃斯开幕第一天,“当机器人学‘做人’”的讨论区围满了人,智平方创始人兼CEO郭彦东分享后坐在第一排。问答环节开始后,观众点的第一个名字是郭彦东,第二个是他,第三个还是他。
被追问是有原因的,那是2026夏季达沃斯议程中首场有关机器人的分享,郭彦东是少数几个既有顶尖研究院经历,又在电动车、智能终端厂商积累了实操和管理经验的创业者,是夏季达沃斯唯一邀请的中国具身人形机器人代表。
智平方2023年4月创立,是一家通用智能机器人企业,专注于用一种统一的机器人形态,搭载具身大模型,在不同场景中学习、迁移、完成新任务。旗下产品爱宝机器人在汽车制造、半导体、生物医药、公共服务等多个场景落地。
作为国内最早系统性研发端到端VLA(视觉动作语言模型)具身大模型的企业创始人,郭彦东不说“颠覆”“重构”这类大词。从公司成立开始,他就讲“同款硬件跨场景”,几年过去核心逻辑没变。被问到世界模型和VLA的关系、数据采集方式等热点话题时,他坚持不是非此即彼,而是要融合,取各家之长。
当再次被追问机器人到底该先进工厂还是先进客厅时,郭彦东用自动驾驶的推广逻辑解释:“带有智能功能的硬件进入场景的基本规律,是从边界有限程度的泛化,再逐步地增强泛化能力,到家庭里去。”
这次达沃斯之行,郭彦东很忙,忙着接受媒体采访,忙着与嘉宾分享洞见,直到散场才顾上给自己留影。智平方成立三年也马不停蹄,“因为技术好,所以落地多;因为落地多,所以技术好”。他认为,这种技术与场景相互促进的发展模式正成为中国机器人企业快速成长的重要动力。聊到上市计划,郭彦东只回了一句:“这可能需要跟团队讨论一下,我们应该有一个标准的回答。”
北京商报:第一次参加达沃斯,有哪些观点让您印象深刻?
郭彦东:像今天讨论的工业、家庭、公共服务,这些鸿沟怎么弥合,我觉得这个问题挺深刻的。大家开始思考和讨论,工业场景的机器人工作是不是让机器人走进千家万户一个好的starting point(开始点)。我们是不是可以反其道而行之,直接从家庭入手来做?
北京商报:为什么坚持先工厂后家庭的顺序?
郭彦东:今天给了我一个很好的机会解释,为什么工业可以帮助机器人更好地进入公共服务、家庭,以及在工业场景如何做可以帮助机器人进入公共服务和家庭。跟自动驾驶推广的逻辑很相似,先从限定场景、封闭园区,再到高速结构化道路,再慢慢到城区人车混流。这符合带有智能功能的硬件进入场景的基本规律,只是从边界有限程度的泛化,再逐步地增强泛化能力,到家庭里去。
北京商报:从工业到家庭,智平方是怎么弥合鸿沟的?
郭彦东:并不是工业中的任何任务都能帮助机器人未来进家庭。(尽管)未来公共服务里一些设备的操作,物料的转运、拿取,跟在家庭里的动作,包括一些模型的使用是高度重合的。更重要的是两个很核心的要素,第一我们是同款硬件横跨场景,不管是餐厅使用的机器人,还是工厂使用的,是同一个硬件形态。对于做应用之间的迁移非常有帮助。第二是我们用同一个Foundation model(基础模型),可以把不同操作、使用都吸收到模型里,帮助模型触类旁通。
北京商报:家庭场景有什么隐藏的“知识点”?
郭彦东:去年(2025年)我提到过一点:家庭产品特别适合做数据采集,不适合做商业闭环。我觉得(数据采集)应该更多讨论一种方式的优点和缺点,然后找到好的方式把它们整合起来做一个融合方案。像智平方明确要做最好的大脑,然后做机器人软硬一体system(系统)的公司,我们就是要把各种各样的采集方式整合起来做一个融合方案。
北京商报:智平方近日发布了类脑式具身智能系统NeuroVLA,是要入局神经科技领域吗?
郭彦东:可能跟传统意义上的神经科学还不完全一致。首先我们训练模型,(NeuroVLA)还是基于大数据、基于统计训练出来的一个模型结构。就像您提到的,它也有很多神经科学要素在里面,包括它的SNN(脉冲神经网络)结构,包括它非常稠密的类脊髓设计,它的大脑、小脑、脊髓的分区域设计方式,都是从神经科学上借鉴来的。有了这些借鉴,我们的类脑NeuroVLA有直觉,反应更快;所需要的训练数据可以大幅降低;很多模型在本地,对数据隐私保护有保障。
北京商报记者 魏蔚