AI硬件形态无边界

2026年全国两会期间,全国人大代表、科大讯飞董事长刘庆峰的公文包里多了一件特别的“随行装备”——一台能装进口袋的智能办公本。这不仅是一台录音设备,更是一个搭载着自主可控大模型的“随身秘书”,会议内容实时转写、待办事项自动生成、跨语种交流即时翻译。在接受北京商报记者专访时,刘庆峰表示,这只是AI硬件走向千家万户的序章,“未来的智能助手会化身为眼镜、手表,甚至是书桌上的一个按钮、迎客机器人,形态千变万化,但背后的理解能力始终是拉通的”。

硬件形态的多样化背后,底座大模型的能力才是关键支撑。从春晚舞台上灵活舞动的机器人,到即将进入家庭的具身智能助手,刘庆峰认为核心在于让机器不仅具备运动控制能力,更要实现对真实环境的感知、理解与自主规划。这位连续24年参加两会的“科技企业代表”坚信,只有在国产算力平台上实现从训练到推理的全链条自主可控,中国AI才能在通用大模型和行业应用两个维度上真正并跑乃至领跑。

北京商报

Q:第24年参加全国两会,今年关注什么领域?您带来了哪些建议?

A:今年我的建议都与人工智能有关,聚焦系统应对AI时代就业变革、自主可控的AI研发和应用,以及AI助力医疗、司法、出海等领域,让AI真正助力“十五五”经济和社会发展、惠及民生,帮助每个人在人工智能的肩膀上创造未来。主要围绕三个方向。

第一,要加大自主可控人工智能研发与应用,超前布局下一代人工智能,抢占全球竞争制高点。当前人工智能蓬勃发展,自主可控生态的重要性愈发凸显,亟须予以高度重视。

第二,聚焦人才与就业,要系统应对人工智能带来的就业变革,推动人工智能普惠发展。比如,主动适应AI时代就业结构深刻调整,以提升全民AI素养、培养AI复合型人才为主线,系统重塑教育体系与人才培养模式;建立国家级AI就业风险监测预警与政策评估机制,动态研判就业市场变化趋势;完善转型期稳岗转岗支持政策,扩大公共培训服务供给,强化社会保障兜底功能;健全适配新就业形态的制度体系,为“超级个体”“一人公司”等新型创业就业模式营造良好发展环境,设立跨部门协同推进机制,合力构建AI就业友好型社会。

第三,我们还要解决AI在各个专业领域能否稳定达到专家级水平的问题。需要更好的技术方法、测试标准和第三方公信力机构共同构建服务平台,这对下一步发展至关重要。以基本公共卫生领域为例,要建立AI应用准入与监管体系。

Q:今年参会,您携带了什么智能硬件?从全球看,中国在这个赛道的竞争力如何?

A:这次我带了一个讯飞智能办公本,每天随身使用,可以对采访、会议全程记录并转文字。这台搭载了自主可控的模型的办公本体现了中国大模型的特色。它可以自动生成会议纪要、待办事项,待办事项能随时溯源,确保真实可查,适配各类严肃工作场景。

这个硬件上搭载的端侧模型语音识别能力,可以识别多人讲话,支持翻译,我们说中文,外国朋友拿着它可以马上看到英文。有一项与全球对比的技术我想分享:当背景噪声达到70—80分贝时(高声多人说话),最新的iPhone 17 Pro识别准确率低于60%,我们的语音识别准确率可达95%;在5米外录音,iPhone 17 Pro的准确率达50%左右,我们仍保持在90%。原因在于我们有自主可控的大模型以及专为此设计的麦克风阵列相结合,实现软硬件一体化。

Q:AI创新意味着AI正在从辅助工具升级为生产手段,您认为未来五年,什么样的AI硬件能走进千家万户?

A:未来的AI硬件将呈现多样化形态,既可以是家门口的家庭智能控制中心,也可以是眼镜、手表、纽扣式台灯、桌面上的小按钮、卡通玩具,或是进门主动迎接你的小型服务机器人。人工智能在后台将实现无处不在的支撑,在前端则可融入任意设备形态。

换言之,前端设备主要承担语音识别与多模态感知功能,后台则负责统一的模型分析、推理、决策以及反馈应答。未来每个人都将拥有专属的人工智能助手,它可通过车载、手机、家居、床头、厨房等各类终端与我们交互,后台系统是完全打通、统一协同的,对用户的理解能力保持一致,只是借助不同终端实现与用户的无缝互动。

Q:从AI和硬件的发展来看,中国AI正从技术突破走向规模化应用。在“十五五”开局阶段,您认为中国科技产业最大的转变是什么?中国AI企业在全球科技竞争中有哪些优势?

A:最大的转变首先是对创新的自我认知与发展自信心的全面提升。从全社会高度关注的人工智能大模型发展来看,我国已从过去的跟跑追赶,逐步实现部分领域并跑,并在众多场景中形成独具特色的优势,这充分证明我们在技术创新、硬科技攻关方面具备强大实力,特别是我国自主培养的年轻一代工程师与科学家,可以代表全球顶尖水平。

第二个转变是在自主可控平台上的发展越来越有底气。讯飞已率先基于全国产算力训练出可以对标全球的大模型,不仅是预训练,去年(2025年)关于强化学习、慢思考、MoE(混合专家模型)等,都已在国产平台上实现自主可控的训练。当前受限于国产算力仍在追赶美国,对标可能有三到六个月的差距,但会紧紧跟上。在通用数学能力、语义理解以及对海外合作主流语种的支持上,我们已在很多方面领先于国际水平,又在教育、医疗、能源、司法等越来越多的行业做到了全世界第一。

这些都是在通用大模型基础上,通过完全自主可控的创新,不断深入到行业专家水平的成果。中国有希望、有信心在越来越多的重要行业,让人工智能稳定达到行业专家水平。“稳定达到”是非常关键的,在医疗、教育、能源、金融等领域,只有第一眼惊艳、偶尔出彩但无法稳定达到,就无法规模化使用,这是中国市场带来的应用场景优势,以及产业生态和产业链的自主可控。

Q:目前具身智能还在初级发展阶段,行业普遍认为“大脑”能力是核心瓶颈。如何通过底座大模型的升级,赋能具身智能更强的场景理解和任务执行能力?通用大模型如何与感知运动控制系统深度融合,真正实现“看得懂、想得清、做得到”?

A:从春晚能看到,机器人的运动能力持续提升,与之相关的伺服马达、运动控制技术也日趋成熟。下一步,首先要依托大模型让机器人具备环境感知能力,实现多模态的视觉、听觉等感知,这是机器人实现自主运动的重要前提。在具备感知能力之后,机器人还需能够自主规划运动路径,而非仅按照预设路线运行,这就需要依托正在研发的“世界模型”实现对真实世界场景的深度理解,目前这一领域的发展也很快。

在此基础上,机器人还需在生活中像人类助手一样与自然交互,精准理解人类的手势、表情与语音指令,尤其要提升在多人、远场、高噪声等复杂场景下的理解能力。将新一代人机交互、场景理解、运动整体规划设计与运动能力有机结合,机器人便可真正走进家庭及工业等各类应用场景,这是一项需要各环节协同联动的系统性创新。

北京商报记者 魏蔚

精彩推荐

下载安装手机客户端