百度Create2026:文心5.1登场,一场关于AI「度量衡」的行业变革

文心5.1登场百度AI产业变革

2026年5月15日,北京国家会议中心。百度Create开发者大会的舞台上,李彦宏准时出现在聚光灯下。这一次,他没有像往常一样直接介绍技术参数,而是从一个问题开始: 「什么是好的AI?」

这个问题看似简单,却直指当前AI行业最大的困惑。当ChatGPT、Claude、文心、Kimi们纷纷亮相,当参数规模、上下文长度、推理速度成为各家厂商军备竞赛的核心指标,整个行业似乎陷入了一种「指标焦虑」——模型越来越强,但开发者依然迷茫,用户依然困惑。

百度的答案是: 「DAA」

从「卷参数」到「立标准」:李彦宏抛出AI时代「度量衡」

在Create2026大会的主旨演讲中,李彦宏首次提出 「DAA」(Developer Achievement Acceleration,开发者成就加速) 这一概念。在他看来,AI时代需要一个像「度量衡」一样清晰的标准,来衡量AI工具对开发者的实际帮助。

「过去我们评判AI好不好,主要看模型本身的能力。」李彦宏在演讲中说道,「但真正有价值的AI,应该让开发者用更少的时间、更低的门槛,完成更复杂的任务。DAA就是这个标准——不是看模型多强,而是看开发者能不能真正『起飞』。」

这个观点背后有一个值得深思的背景:尽管AI工具在过去两年疯狂涌现,但开发者的实际生产力提升,却远没有达到预期。GitHub的调研数据显示,2025年全球开发者使用AI辅助工具的平均效率提升约为23%,远低于厂商宣传的「10倍效率」。

百度的DAA标准,包含四个维度:

第一,任务完成度。 不仅仅是生成代码能否运行,更是能否理解业务场景、满足真实需求。李彦宏举了一个例子:「让AI写一个’用户登录模块’很简单,但让它理解这个模块在你们公司系统里的上下文、依赖关系、安全要求,就难了。」

第二,开发周期压缩。 同样的功能,传统开发需要多久,AI辅助后需要多久?这里考量的不仅是编码速度,还包括调试、部署、迭代的全流程效率。

第三,错误率与修复成本。 AI生成的代码,质量到底怎么样?bug多不多?修复起来困不困难?这直接影响开发者是否愿意真正「放权」给AI。

第四,学习曲线与迁移成本。 一个好的AI工具,不应该让开发者在学习如何使用它这件事上花费太多时间。同时,当开发者换到另一个工具时,原有的技能积累能否复用?

百度希望DAA成为行业共识。「如果每个AI厂商都用DAA来证明自己的价值,开发者就能像买东西看’性价比’一样,直观地判断哪个工具更适合自己。」李彦宏表示,百度愿意将DAA标准开放给全行业,「这不应该是一家公司的事情。」

文心大模型5.1:超长上下文+推理速度3倍提升

如果说DAA是百度抛出的「软实力」,那么文心大模型5.1就是「硬通货」。

在Create2026大会上,百度正式发布 文心大模型5.1企业版。相比去年发布的文心4.0,5.1版本在多个关键指标上实现了质的飞跃:

超长上下文能力是本次更新的最大亮点之一。文心5.1正式支持 1000万token的超长上下文窗口,这是什么概念?相当于可以一次性处理约1500万字的中文文本,或者20部标准时长的电影剧本。换句话说,开发者可以让AI一次性「吃下」一整个项目的所有代码、文档、测试用例,然后回答任何关于这个项目的问题。

百度自然语言处理首席架构师在技术分论坛上透露,这个能力背后的核心突破在于 「分层记忆机制」 。简单来说,模型不再试图把1000万token全部记住,而是像人类一样,把最重要的信息放在「短期记忆」里,把次重要的放在「中期记忆」里,把背景信息放在「长期记忆」里。当需要回答问题时,模型会根据问题类型,有选择地从不同层级「召回」信息。

「这样做的好处是,既不会因为信息太多而’消化不良’,也不会因为压缩太狠而丢失关键细节。」这位架构师解释道。

推理速度提升3倍是另一个关键改进。在实际演示中,百度展示了文心5.1处理同一个复杂推理任务的速度:文心4.0需要47秒,文心5.1仅需15秒。这意味着AI可以真正「跟得上」开发者的思路,而不是让开发者干等着AI「思考」。

百度还特别强调了 幻觉率的大幅下降。在内部测试中,文心5.1的幻觉率相比4.0版本降低了约35%。这对于需要AI处理真实业务场景的企业用户来说,是非常重要的保障。

DuMate:「百度搭子」的用户破千万

如果说文心5.1是面向开发者的「重型武器」,那么 DuMate(中文名「百度搭子」) 就是面向普通用户的「轻骑兵」。

DuMate是百度在去年推出的通用智能体产品,最初定位是「帮用户处理日常琐事的AI助手」。经过近一年的迭代,DuMate已经从一个简单的聊天机器人,进化成为一个能够处理复杂任务的智能体平台。

在Create2026大会上,百度公布了一组数据:DuMate的移动端App上线三个月,用户数已突破1000万,日活跃用户超过300万。更值得注意的是,这些用户的使用场景正在发生显著变化——

  • 最初,用户主要用DuMate来「聊天」,问天气、设闹钟、查信息;
  • 后来,用户开始用它来处理「工作」,写邮件、整理会议纪要、生成报告;
  • 现在,越来越多的用户开始用它来完成「复杂任务」,比如「帮我规划一趟五天的杭州出差,包括机票酒店、每天的会议安排、以及根据我的口味推荐餐厅」。

百度AI生态部负责人透露,DuMate团队在设计这个产品时,有一个核心理念: 「让AI适应人,而不是让人适应AI」

这听起来很简单,但在实际操作中,这意味着巨大的技术挑战。「当用户说’帮我规划出差’,AI需要理解:用户是谁、他的偏好是什么、他的日程安排、他的预算范围……这些信息可能分散在短信、邮件、日历、地图等多个应用里。AI需要’打通’这些数据,才能给出真正有用的建议。」

为了实现这个目标,DuMate深度接入了百度内部的地图、搜索、文库、网盘等产品线,同时开放了与钉钉、企业微信、飞书等第三方应用的连接。「我们不是在做一个’什么都自己干’的超级应用,而是在做一个’能够调动各种工具’的智能中枢。」这位负责人说道。

在Create2026的现场演示中,一个让人印象深刻的场景是:演讲嘉宾对着手机说了一句「帮我把今天大会的内容整理成一篇公众号文章,发给市场部的小王」,DuMate自动完成了语音转文字、内容整理、格式排版、选择收件人、发送邮件的全流程——整个过程不到两分钟。

秒哒3.0:从「一句话生成网页」到「一句话生成原生APP」

如果说DuMate是在「用AI」,那么 秒哒 就是在「造AI」。

秒哒是百度在2024年推出的低代码/无代码AI开发平台,核心理念是「让不懂编程的人,也能用自然语言创建应用」。经过两年的迭代,秒哒3.0在Create2026上带来了一个重磅更新:支持通过自然语言生成原生APP,不仅仅是网页应用,而是真正的iOS和Android原生应用。

这意味着什么?

在传统开发模式下,开发一个简单的原生APP,需要前端工程师、后端工程师、iOS开发者、Android开发者、测试工程师等多个角色配合,至少需要几周时间。使用秒哒3.0,理论上只需要一个人、一句话、一个小时。

百度秒哒负责人在技术分论坛上,详细介绍了这个能力背后的技术原理:

「原生APP和网页应用最大的区别,在于它需要调用手机的硬件能力——摄像头、麦克风、GPS、NFC、蓝牙……这些能力网页很难直接访问,而原生APP可以。」这位负责人说道,「秒哒3.0的核心突破,在于我们构建了一个’设备能力抽象层’——当用户说’做一个扫码签到的APP’,AI会自动识别这需要调用摄像头,然后生成调用摄像头的代码,同时生成后端服务来处理扫码结果,最后打包成原生安装包。」

这个能力听起来很美好,但现场的开发者社区反应却是喜忧参半。

乐观的开发者认为,这是AI编程民主化的重要一步,「以前小企业想做个内部工具,预算不够请不起开发团队,现在有了秒哒,至少可以先’跑起来’。」

谨慎的开发者则指出,AI生成的应用在复杂场景下的表现还有待验证,「简单的工具类APP可能没问题,但如果要做电商、做社交、做金融交易这种’吃经验’的应用,现阶段的AI还是差口气。」

百度显然也意识到了这一点。在秒哒3.0的发布中,百度同时推出了 秒哒企业版,针对中大型企业提供了更多的定制化能力和运维支持。「我们不是要取代专业开发者,而是要成为他们的’超级助手’。」秒哒负责人强调。

百度AI生态:「芯云模体」的全栈布局

在Create2026大会上,李彦宏提到了一个概念—— 「芯云模体」 ,这是百度在AI时代构建的全栈能力体系:

  • :指昆仑芯,百度自研的AI芯片,目前已经迭代到第三代,算力性能相比一代提升了8倍;
  • :指百度智能云,提供从算力到模型到应用的全套云服务;
  • :指文心大模型家族,包括 Ernie(文心)基础模型、ERNIE Speed文心增强模型、ERNIE Lite轻量模型等;
  • :指智能体生态,包括DuMate通用智能体、秒哒开发智能体、伐谋决策智能体等。

李彦宏用「四层积木」来形容这个架构:「你可以把’芯’理解为地基,’云’是毛坯房,’模’是里面的装修,’体’是住进去的人。这四层组合在一起,才能真正发挥AI的价值。」

值得注意的是,百度在大会上宣布 文心大模型5.1将与华为昇腾芯片进行深度适配。这意味着,未来开发者可以在华为的Ascend服务器上,高效运行文心模型。对于那些因为「美国芯片禁令」而担心算力供应的中国企业来说,这提供了一个重要的备选方案。

「AI竞争不是百米赛跑,而是马拉松。」李彦宏在演讲的最后说道,「百度愿意持续投入,也愿意和整个行业一起,建立标准、共享能力、推动生态。」

开发者社区:有人兴奋,有人观望

Create2026结束后,参会的开发者们议论纷纷。

在大会场馆外的休息区,几个年轻的开发者正在热烈讨论。「DuMate那个演示太炸了,」一个做电商的创业者兴奋地说,「以后运营活动策划、文案撰写、用户沟通,都可以交给AI处理,我这边的运营团队至少可以减半。」

但另一个来自传统软件公司的技术总监,则显得更加冷静:「百度的技术确实在进步,但对我们来说,最关心的不是技术指标,而是’我的业务能不能用’。一个企业要切换开发工具,迁移成本是很高的。我们会持续关注,但短期内不会大规模采用。」

这种「兴奋与观望并存」的态度,某种程度上反映了当前AI开发工具市场的整体状态——技术发展迅猛,但应用落地还需要时间验证。

写在最后:AI时代的「标准之争」才刚开始

百度Create2026结束了,但这场大会抛出的议题,才刚刚开始发酵。

DAA标准的提出、文心5.1的技术突破、DuMate和秒哒的产品迭代……百度在试图做一件事:从「AI能力提供商」转型为「AI生态规则制定者」

这并不容易。在AI这条赛道上,OpenAI、Google、Anthropic、Meta等美国公司依然占据着技术话语权;在中国本土,阿里、字节、腾讯等大厂也在虎视眈眈。百度想要在「标准」这个维度建立优势,需要技术实力、产品口碑、生态伙伴的三重支撑。

但有一点是确定的:AI时代正在从「蛮荒时代」走向「秩序时代」。当技术不再是最稀缺的资源,「谁能提供更好的开发体验、谁能建立更开放的标准、谁能真正解决开发者的痛点」,将成为决定胜负的关键。

百度的这场「度量衡」之战,才刚刚开始。

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注