分类: AI大模型与产品

  • 腾讯”马维斯”来了:AI助手从”动嘴”到”动手”的时代跨越

    腾讯”马维斯”来了:AI助手从”动嘴”到”动手”的时代跨越

    一、发布背景:AI PC浪潮下的”系统级”争夺战

    从ChatGPT引爆大模型浪潮至今,AI助手类产品已经历三个阶段:第一阶段是”问答型”,AI返回文字回答;第二阶段是”插件型”,AI接入工具生态可调用API完成特定任务;第三阶段则是”系统级代理”——AI下沉至操作系统底层,直接感知并操控文件系统、应用程序和系统设置,成为真正”会干活”的数字助手。

    这一趋势在2025年末至2026年初集中爆发:微软推出Windows Copilot+PC,苹果在macOS Sequoia中引入系统级Siri,谷歌将Gemini集成至ChromeOS。5月20日,腾讯正式发布Marvis(中文名”马维斯”),官网Marvis.qq.com开放下载,无需邀请码,首批支持Windows、macOS和Android三大平台,iOS版仍在开发中。每位用户每天可使用1000万Token免费额度。

    二、技术架构:1+5 Agent体系与安全兜底

    2.1 多Agent协作:主管Agent统领五大专家

    马维斯的核心竞争力在于”1个主管Agent + 5个专家Agent”的协作体系。主管Agent理解用户意图、拆解任务、协调调度;五个专家Agent各司其职:

    File Agent是区别于传统AI助手最直观的能力——用户不再需要记住文件名,用自然语言描述文件内容或主题,Agent即可通过深度语义理解检索文档、图片乃至PDF文字,并按人像、主题、场景自动整理,构建个人知识库。

    Computer Agent直接调用Windows底层API(非模拟键鼠),实现真正的系统级操控:一句话查询硬件配置、电池健康、网络状态;一键优化开机启动项、清理冗余文件、关闭系统广告。这大幅降低了电脑运维门槛。

    App Agent通过GUI感知与操作技术”看见”屏幕应用界面并模拟操作。用户说”帮我在同花顺看特斯拉股价”,Agent自动打开应用、定位搜索框、输入股票代码并读取结果,全程无需手动操作。官方表示该能力已支持Windows平台部分Android应用。

    Browser Agent接管网页交互,支持自动化数据抓取和网站监控,用户一句话即可设置商品价格追踪或竞品动态监测。

    Search Agent整合网络搜索能力,并行调用多个搜索接口,汇总输出结构化答案。

    2.2 双引擎架构:效率与隐私的动态平衡

    马维斯采用”双引擎”设计,用户可自由切换:

    效率模式端云协同——复杂推理由云端处理,文件操作和本地索引尽量在本地完成,调用混元Hunyuan3与DeepSeek V4两款大模型,前者在中文语境更具优势,后者逻辑推理更突出。

    隐私模式完全本地推理,采用通义千问端侧模型,文件内容和对话全程不上云、断网可用,专为财务、法务、HR等数据敏感场景设计。

    2.3 L2级安全兜底:让AI”干活”不失控制

    腾讯为马维斯构建L2级安全机制:普通操作Agent直接执行;敏感操作(删除文件、修改配置)Agent先展示计划获确认后再执行;高敏感操作(支付、账户变更)强制中止交回用户,始终保留人类决策权。

    多Agent协作插图 端云协同

    三、应用场景:办公、隐私与跨端协同

    日常办公入口:传统”整理发票制表”任务需手动切换邮件、文件夹、Excel,耗时十余分钟;马维斯一句话即可触发File Agent检索附件、Browser Agent抓取邮件、Computer Agent调用Excel完成整理。

    隐私敏感场景:隐私模式下,律师审查合同、财务处理未公开财报等场景,首次实现在数据不出本地的同时获得AI辅助能力。

    跨端协同:手机可实时查看电脑屏幕并远程操控——下班路上发现重要文件遗留在电脑,无需折返,手机即可远程传输;父母遇到电脑问题,子女可直接跨端协助。

    四、竞争格局:腾讯的AI PC战略定位

    在全球范围内,马维斯最直接的参照物是微软Windows Copilot+。二者的核心差异体现在:架构深度上,马维斯通过直接调用Windows底层API实现更深度的系统集成,GUI操控和文件语义理解覆盖范围更广;Agent生态上,微软Copilot依赖第三方插件,马维斯的6个预置Agent开箱即用;隐私模式上,Copilot默认云端处理,马维斯完整本地化推理对企业用户合规更友好。

    国内赛道中,讯飞星火聚焦语音输入和内容生成,字节豆包移动端有流量优势但缺少桌面系统级能力,百度文心一言和阿里通义均以对话为主。马维斯在”操作系统层级AI助手”这一细分赛道暂无完全对标产品,其核心壁垒来自腾讯社交账号体系和腾讯文档、腾讯会议的生态协同。

    五、深度分析:AI助手进化的三重意义

    5.1 从”工具”到”代理”:AI价值范式的根本转变

    马维斯最深远的影响在于其代表的AI价值范式转变。过去的AI助手本质是”增强版搜索引擎”——AI回答问题,人类执行操作。操作系统级Agent打破了这一局限:人类定义目标,AI拆解步骤并执行执行,人类角色从操作者变为监督者和决策者。这一转变类似从手动挡到自动挡汽车的跨越:驾驶核心逻辑未变,但门槛和效率发生了质变。

    5.2 端云协同:AI普惠与隐私合规的平衡之道

    马维斯的双引擎架构折射出行业共识——不同类型任务调用不同推理引擎,在效率与安全之间实现动态平衡。随着端侧芯片算力提升和通信协议优化,”数据最小化”与”能力最大化”的双重目标将逐步收敛。

    5.3 腾讯AI战略的新支点

    马维斯的发布标志着腾讯AI战略从”模型能力”向”产品落地”转型。混元大模型持续迭代、DeepSeek战略投资并行、腾讯云TI平台向企业开放,但在大模型应用端,腾讯此前布局相对分散。马维斯首次将腾讯AI能力以统一、高度产品化形态直接面向终端用户,是腾讯从”模型供应商”向”AI平台运营商”转型的重要一步,并有望成为腾讯AI生态的超级入口。

    六、局限与挑战

    硬件门槛:Windows端需至少6核CPU、16GB内存;Mac端需M1及以上芯片。部分老旧设备用户暂时无法完整体验。

    跨端稳定性:当前版本跨端操控存在一定延迟,弱网环境下仍有优化空间,部分第三方应用GUI感知偶有失效。

    非腾讯生态适配:马维斯深度集成腾讯系应用生态,对非腾讯系应用支持仍在扩展中。

    七、展望:AI PC的下一程

    马维斯指向三条技术演进主线:一是感知能力拓展,从屏幕视觉和文件理解向声音、摄像头、IoT设备感知延伸;二是执行能力深化,从软件操作向软硬件协同演进;三是记忆与个性化,AI Agent从每次清零进化为持续理解用户习惯、提供主动服务。

    市场竞争层面,预计百度、字节、阿里等互联网巨头将加速跟进,华为、小米等硬件厂商可能结合自有PC产品推出深度定制版本。AI PC操作系统竞争格局将在2026年下半年至2027年迎来真正爆发。

    对于普通用户,一个全新的计算范式正在到来:人与电脑的交互正从学习软件操作转变为用自然语言指挥AI完成任务。电脑不再是需要学习的工具,而真正成为可对话、可信任、可托付的智能伙伴。马维斯或许只是这个时代的序章,但它所描绘的未来图景,已不再遥远。

    【正文完】

    本文综合自科技日报、环球网、新民晚报、CSDN等媒体报道,参考腾讯官方发布信息。

  • AI Agent全面爆发:从”会聊天”到”能干活”——2026商业化元年启幕

    AI Agent全面爆发:从”会聊天”到”能干活”——2026商业化元年启幕

    一夜之间,AI从”花瓶”变成了”打工人”

    如果你五一假期没怎么刷科技新闻,我来帮你划个重点:2026年5月初,AI圈发生了好几件大事,每一件都在说同一件事——AI Agent(人工智能智能体)真的要开始”上班”了

    OpenAI在5月5日发布GPT-5.5 Ultra,官方说这代产品的推理和编码能力又上了一个大台阶,算力消耗达到每分钟4亿Token量级。说人话就是,这玩意儿现在处理复杂任务的能力,已经不是”玩具”级别了。同时他们还发了专门给网络安全机构用的GPT-5.5-Cyber,恶意代码识别准确率比上一代提升了28%。OpenAI CEO奥特曼甚至透露,GPT-5.5曾经”自己策划了一场发布会”,给出了一个”既美丽又奇怪”的方案——AI不仅能干活,还开始有自己的”想法”了。

    AI Agent商业化落地:自动编码邮件管理数据分析多任务协同

    Anthropic那边也没闲着。他们拉着黑石、高盛这些华尔街顶级PE机构,成立了15亿美元的合资公司。三个顶级PE各出3亿美元,目标是把Anthropic的AI技术直接塞进这些机构投资的几百家企业里。这模式说白了就是”资本+AI”深度捆绑,标志着AI商业化正式进入B2B”渠道为王”的新阶段。更夸张的是,Anthropic的年化营收在4月份突破了300亿美元,正式超越OpenAI成为全球LLM商业化收入最高的公司。

    谷歌的75%代码由AI生成这条新闻可能更让人震撼。谷歌CEO皮查伊亲自披露,他们现在所有新编写的代码里,有75%是AI生成的。而就在一年前,这个数字还只有50%。全球最大代码库之一的谷歌,AI参与度已经超过四分之三——这意味着什么?意味着软件工程师这个职业正在经历根本性转变,未来的开发者可能更多是”AI审核员”而不是”代码写手”。

    三个维度看懂AI Agent爆发逻辑

    为什么是2026年?我研究了一圈,发现有三个关键因素在这一刻同时成熟了。

    第一:模型能力从”考试选手”变成”干活高手”

    过去两年,大家都在刷各种benchmark排行榜,比谁家的模型数学好、谁的法律知识强。但真正商用的核心不是”考高分”,而是”能干活”。

    OpenAI的GPT-5.5 Ultra在Terminal-Bench 2.0测试里得分82.7%,是目前最强的Agent编程模型。这意味着它不仅能回答”这段代码对不对”,而是能自主完成”帮我开发这个功能”的完整流程。Anthropic的Claude Code已经实现了70%-90%的代码自动生成,谷歌在追赶这个指标。

    从实验室到生产线,AI终于补齐了最后一块短板——可靠性。当AI写代码的准确率从80%提升到95%,从”需要人工检查”变成”可以直接提交”,这就是质的飞跃。

    第二:商业模式从”订阅聊天”变成”按效果付费”

    对普通用户来说,最直观的变化来自豆包即将推出三档付费订阅方案的消息。字节跳动旗下这个月活3.45亿的产品,终于要开始商业化了。免费用户继续享受基础服务,而愿意为高算力场景付费的用户可以获得更强的AI能力。

    这背后的逻辑很有意思:豆包的日均Token调用量已经涨到120万亿,这个天文数字意味着它每天处理的AI任务量是惊人的。当用户在豆包上不只是在”聊天”而是开始”办公”,按效果付费就变得顺理成章。

    同样的逻辑在B端更清晰。Anthropic拿下迪士尼这个大客户后,迪士尼单员工9天就调用了46万次Claude。Meta每月消耗60万亿Token——这些数字背后,是企业开始真正把AI当成”数字员工”来使用了。

    第三:具身智能从”实验室”走进”工厂”

    机器人可能是今年最让人惊喜的赛道。三个月内三家头部企业密集完成大额融资,这不是偶然:

    • 星动纪元获超2亿美元新一轮,顺丰集团领投,红杉中国跟投
    • 灵心巧手完成B+轮,估值30亿元,月产能计划从5000套提至1万套
    • 无界动力半年内第四轮融资,累计超2亿美元,还拿下了首个亿元级海外订单

    国家电网更狠,直接宣布68亿元采购具身智能设备,计划年内集中采购约8500台,覆盖电力巡检、带电作业、应急救援、仓储物流四大场景。专家预测,电力行业的机器人市场将是千亿级别的。

    从”会跳舞”到”能干活”,具身智能终于证明自己不只是表演型选手。

    互联网大厂的新战场:谁能让AI真正”落地”

    如果说要评选今年最”卷”的赛道,智能座舱绝对是候选之一。阿里、字节、腾讯这三大厂,在北京车展上集体亮出了自己的AI Agent方案。

    阿里拉上了长安、东风、北汽、比亚迪、吉利、长城、理想、上汽大众等一长串合作名单。他们的目标是:你在车里说一句话,AI就能帮你规划复杂路线、查新闻、订酒店、买门票、点外卖、查快递——全部搞定。

    腾讯则祭出了”全场景智能体开放平台”,七大智能体覆盖日常通勤、长途出游、手车互联、娱乐休闲。他们甚至演示了”一句话点麦当劳”的场景:系统自动找到最近的店家,你可以随时打断让AI改套餐,然后在车机里完成支付,最后车到餐到、立刻领走。

    字节的打法很有意思。他们的豆包座舱助手直接跟手机端App打通,你手机上的豆包风格可以平移到车里。更炫酷的是,当你要求”停到离入口最近的车位”时,系统会调动辅助驾驶和自动泊车系统协同工作;在旅游场景中,豆包还能自动识别沿途美景、推荐观景路线、打开车窗让用户欣赏。

    这场”AI上车”竞赛,本质上是对智能座舱这个”第四空间”定义权的争夺。谁能让AI真正理解用户需求、主动提供服务,谁就能在下一代车里占有一席之地。

    我们正站在历史转折点上

    说了这么多宏观叙事,可能有人会问:这些变化跟我有什么关系?

    我的回答是:可能比你想象的更直接。

    首先,如果你是程序员或者文字工作者,AI渗透你工作的速度可能比你想的更快。谷歌75%代码由AI生成不是孤例——我认识的好几个开发者朋友,现在写代码都是”AI生成+人工审核”的模式。有个朋友甚至说,他每天的工作变成了”写Prompt+验收AI的输出”。

    其次,如果你关注就业市场,AI带来的变革也在加速。最新数据显示,2026年第一季度科技行业裁员5.2万人,同比增长40%,其中约47.9%是因为企业用AI替代了人工。这意味着:不是AI在抢工作,而是会用AI的人在抢不会用AI的人的工作。

    第三,如果你关心投资,AI Agent赛道正在成为新的”吸金黑洞”。具身智能三个月融资超200亿、Cerebras启动400亿美元估值的IPO、Anthropic年化营收突破300亿美元——这些数字背后是资本对这个赛道的真金白银押注。

    冷静思考:繁荣背后的隐忧

    不过,我在调研过程中也发现了一些需要警惕的信号。

    高盛的警告值得重视。他们指出,四大超大规模云厂商(微软、亚马逊、Alphabet、Meta)2026年的资本开支合计将突破6000亿美元,而这个数字可能超过四巨头经营现金流的100%。换句话说,这些科技巨头正在”借钱”投资AI基础设施,如果AI带来的收益出现一个季度的不达预期,被抱团撑到极限的估值可能会引发踩踏。

    传统IT外包的困境也在显现。中软国际因为大客户使用AI编程工具导致人工需求减少,核心IT外包收入受到冲击。这提醒我们:AI变革不会让所有人都受益,部分传统岗位的消失是真实的代价。

    数据安全与隐私始终是悬在AI Agent头上的达摩克利斯之剑。当AI能自主处理邮件、订餐、订酒店时,它也在接触你的个人信息和支付数据。如何在效率和隐私之间找到平衡,将是所有AI企业必须面对的难题。

    写在最后

    回到开头的那个问题:AI从”花瓶”变成”打工人”,这事儿靠谱吗?

    我的判断是:靠谱,但需要时间,也需要我们做好准备。

    2026年可能是AI Agent商业化元年,但元年不等于成熟年。模型能力会继续提升、商业模式会持续优化、应用场景会不断拓展——这些都是确定的。不确定的是:这个转变会多快?普通人如何不被时代抛弃?企业如何找到AI和人工的最优配比?

    这些问题没有标准答案,但有一件事是确定的:你我都正在见证一个重要历史时刻,区别只在于是主动参与还是被动接受。

    我个人的选择是:保持好奇,拥抱变化,同时保持清醒。毕竟,AI再强,也需要人来定义它、服务谁、为谁创造价值。

    最后留个小问题:你有没有发现自己的日常工作已经被AI部分”接手”了?如果有,欢迎在评论区分享你的体验;如果没有,不妨试试让豆包或者ChatGPT帮你处理一件以前必须亲力亲为的事。

    时代在变,早点拥抱变化总没错。

  • AI算力军备竞赛白热化:四大科技巨头2026年豪掷7250亿美元

    AI算力军备竞赛白热化:四大科技巨头2026年豪掷7250亿美元

    正文

    一、从”百亿”到”万亿”:AI投资进入新纪元

    当我们还沉浸在2025年科技巨头们”千亿投资”的震撼中时,2026年的数字已经将这场游戏的门槛提到了一个新的量级。

    7250亿美元。

    这不是某个国家的军费预算,而是谷歌、亚马逊、微软、Meta四大科技巨头2026年AI基础设施投入的预计总和。同比增长77%的背后,是各家对算力制高点的疯狂追逐。

    7250亿美元算力基建:科技巨头AI数据中心服务器机房内部

    如果我们把这个数字形象化一点:7250亿美元相当于全球第五大经济体的GDP总量,足以买下整个丰田汽车公司约15次,或者建造能环绕地球赤道300圈的5G基站网络。

    为什么是现在?

    答案藏在三个关键词里:大模型竞赛的硬件瓶颈、AI Agent落地的算力需求、以及数据中心的电力焦虑。

    GPT-5.5、Claude 3.7、Gemini 2.0……每一次模型参数的指数级增长,都意味着对算力的几何级消耗。OpenAI CEO Sam Altman曾公开表示,算力是最稀缺的资源,”拥有多少GPU决定了你能走多远”。

    而当AI Agent开始从概念走向落地,从”对话助手”进化为”数字员工”,企业端对私有化部署、本地推理的需求急剧上升,这进一步刺激了算力基础设施的扩张。

    二、GPT-5.5-Cyber:OpenAI的”翻身仗”

    就在市场还在讨论OpenAI是否”掉队”的时候,一记重拳出击了。

    GPT-5.5-Cyber的发布,是OpenAI面向全球核心网络安全机构推出的专项模型。它在恶意代码识别准确率上较前代提升28%,支持跨语言实时攻防推演,能够在毫秒级时间内完成漏洞检测与攻击溯源。

    消息一出,OpenAI股价盘中反弹4.7%。此前因Gemini领先而承压的市场情绪一扫而空。

    这背后的逻辑很清晰:在通用大模型趋于同质化的当下,垂直领域的差异化能力正在成为新的护城河。网络安全、代码生成、数学推理——每一个”杀手级应用”都是一个独立的战场。

    GPT-5.5-Cyber的意义不止于此。它证明了算力储备仍然是AI上限的关键。OpenAI通过这款安全导向的模型,向市场传递了一个明确信号:我们不仅在追赶,而且在开辟新的赛道。

    与此同时,OpenAI与高通的合作也在加速推进。2028年量产的AI手机芯片,将集成专用神经处理单元,支持本地运行万亿参数模型。这预示着一个趋势:端侧AI的时代正在到来

    三、AMD的”曲线救国”:终端AI的最后一公里

    如果说英伟达是数据中心GPU市场的绝对王者,那么AMD正在另一个战场开辟自己的领地。

    锐龙AI Halo迷你主机的发布,是AMD首款自研AI终端硬件。它可以本地运行2000亿参数模型,采用统一内存架构,填补了终端设备算力空白。

    2000亿参数是什么概念?这意味着它可以在不依赖云端的情况下,完成复杂的本地推理任务——语音识别、图像生成、文档处理、甚至简单的代码编写。

    为什么这很重要?

    当前的AI应用有一个根本性的矛盾:模型越强大,越需要云端算力支撑;而云端依赖带来的延迟、数据隐私、离线可用性等问题,始终是制约AI普及的痛点。

    AMD的策略是”降维打击”——不与英伟达在数据中心正面对决,而是在终端市场建立自己的生态位。对于企业用户而言,一台能够本地运行大模型的迷你主机,可能比昂贵的云端算力更具性价比。

    这是AMD的”曲线救国”,也是终端AI市场即将爆发的信号。

    四、中国的”红线”:AI出海的监管变局

    在这场全球AI军备竞赛中,中国的身影格外引人注目。

    今天,中国外商投资安全审查工作机制办公室宣布,依法叫停外资收购中国通用AI智能体Manus项目,责令撤销交易。这是《外商投资安全审查办法》实施以来,首个被公开叫停的AI领域外资收购案。

    这释放了什么信号?

    “技术主权高于资本运作”——这不仅是监管层面的表态,更是中国AI产业发展的战略选择。

    过去几年,中国AI产业经历了从”跟随”到”并跑”的转变。在部分领域(如中文语义理解、具身智能、AI Agent应用),中国企业已经展现出独特的优势。Manus项目被叫停,意味着这些优势不能简单地通过资本运作流向海外。

    与此同时,工信部同步启动了”人工智能+软件”专项行动,重点培育模型即服务(MaaS)、智能体即服务(AaaS)等新业态。华为昇腾2026年营收预计达820亿元,同比增长60%,阿里、字节、腾讯等大厂抢购昇腾950芯片,出货量将达75万颗——国产算力的崛起正在改变全球AI芯片格局。

    五、量子通信商用:另一条战线的突破

    在算力军备竞赛之外,另一项技术突破同样值得关注。

    中国今日发布首个商用级量子卫星互联网接入终端,体积仅为传统设备的1/4,支持10Gbps安全传输速率,覆盖3000公里通信距离。这标志着量子加密通信正式具备高端商务及应急通讯市场落地能力。

    为什么量子通信如此重要?

    当AI模型能够生成逼真的文本、图像、视频时,一个根本性的问题浮现:如何验证内容的真实性?

    量子通信提供了答案之一。基于量子力学的不可克隆原理,量子加密通信在理论上无法被窃听或破解。在金融、政务、军事等高敏感场景,这具有不可替代的价值。

    中国在量子通信领域的领先地位,正在从实验室走向商业化应用。商用级量子终端的发布,是这个进程中的重要里程碑。

    六、军备竞赛的终点在哪里?

    7250亿美元、540亿美元、3800亿元——这些数字背后,是一场没有终点的竞赛。

    但竞赛的逻辑正在发生变化。

    第一阶段是”算力为王”,谁拥有更多GPU,谁就能训练更大的模型。现在这个阶段已经过去,进入第二阶段:应用落地。无论多么强大的模型,如果无法转化为可规模化的商业产品,就只是烧钱的游戏。

    这解释了为什么谷歌要在Gemini中引入广告模式,为什么OpenAI要与高通合作AI手机,为什么Meta要收购机器人AI公司ARI。

    第二阶段的竞争,不再是单纯的算力堆砌,而是算力+算法+场景的综合较量。

    七、普通人能从中看到什么?

    7250亿美元——这个数字距离普通人很遥远,但它塑造的未来触手可及。

    当算力基础设施足够便宜,当端侧AI足够强大,我们手里的手机、电脑、甚至家电,都将成为拥有”超能力”的智能终端。AI不会取代人类,但会用AI的人正在淘汰不用AI的人。

    这就是为什么理解这场军备竞赛如此重要。

    它不仅是科技公司的商业博弈,更是决定未来十年你我生活方式的底层变革。从手机里的语音助手,到路上的自动驾驶汽车,从医院的AI诊断系统,到工厂的智能生产线——一切都在算力竞赛的版图上占据着自己的位置。

    结语

    当GPT-5.5在网络安全战场披荆斩棘,当量子卫星终端悄然改变通信规则,当华为昇腾加速国产替代——科技革命的浪潮正以前所未有的速度重塑人类社会。

    在这场没有硝烟的战争中,技术突破与伦理监管的平衡、国际竞争与自主创新的博弈,将成为决定未来十年全球格局的关键变量。

    而今日的每一项突破,都在为历史写下新的注脚。

  • Anthropic估值9000亿美元:AI行业即将迎来新王

    Anthropic估值9000亿美元:AI行业即将迎来新王

    一、9000亿美元:AI史上的估值新纪录

    据CNBC、彭博社多方证实,Anthropic正与投资者洽谈新一轮融资,目标估值高达9000亿美元。若融资落地,这家成立仅5年的公司将直接超越OpenAI(当前估值8520亿美元),成为全球最高估值的AI独角兽。

    这不是天方夜谭。回看Anthropic近一年的融资轨迹,资本市场的追捧近乎疯狂:

    • 2025年9月(F轮):估值1830亿美元,融资130亿美元
    • 2026年2月(G轮):估值3800亿美元,融资300亿美元
    • 2026年4月(拟融资):目标估值9000亿美元,拟融资500亿美元
    Anthropic与OpenAI估值营收对比示意图,企业级B端商业化模式胜出

    从3800亿到9000亿,短短两个月估值暴涨超1.3倍。这是什么概念?相当于一家公司用两个月时间,完成了从中型独角兽到超级巨头的跨越。

    二、钱砸得最多,不代表赚得最猛

    提到Anthropic,就不得不提它的头号竞争对手OpenAI。资本市场的用脚投票,从来都是最诚实的。

    真正让投资者重新站队的,是营收。

    ARR(Annual Recurring Revenue,年经常性收入)的数据更直观:Anthropic的ARR从2025年初的10亿美元飙升至2026年4月的300亿美元,只用了15个月。这个增速是什么概念?当年谷歌和Meta都望尘莫及,这是美国商业史上最快的增长曲线之一。对比之下,OpenAI的ARR约250亿美元,被Anthropic全面碾压。

    在市场占有率方面,截至2025年底,Anthropic的Coding市场份额达到54%,占据着相对明显的身位优势。

    更关键的是回报质量。OpenAI毛利率约33%,一个让人倒吸凉气的数字。这意味着每收1美元,有67美分被直接成本烧掉,这其中绝大部分是推理成本。而Anthropic的毛利率约为40%,训练投入只有OpenAI的四分之一,却跑出了更猛的营收增速。这才是真正吓人的地方——不是它花得多,而是它花得聪明。

    三、商业化路线:拼客流还是拼客单价

    这两家头部为什么营收差距这么大?答案不在“技术谁更强”这种含糊的比较里,而在两个极其清晰的商业模式分野中。

    OpenAI的困局:叫好不叫座,增收不增利

    ChatGPT的周活用户已经摸到9亿的门槛,但这个9亿是一个甜蜜又沉重的包袱。其中绝大多数是免费用户,拿ChatGPT写作业、写周报、答疑解惑、甚至纯属闲聊。他们创造了巨大的流量,但不是付费用户。

    每个月20美元的Plus订阅和200美元的专业版,放在9亿用户的基数上看起来是个天文数字,但真正付费的比率,远不足以覆盖百亿美元的巨大成本。这就是消费者C端路线的残酷真相:用户规模再大,如果变现效率跟不上,结果就是“流量越大,亏得越狠”。

    Anthropic的策略:直接赚企业口袋里的钱

    Anthropic超过80%的收入来自企业端。它不走规模路线,走深度路线。30万家企业客户是什么概念?财富十强中有八家在使用Claude,每年开销超过100万美元的大客户已突破1000家,而且这个数字仅仅两个月内就翻了一倍。

    为什么会这样?原因在于Claude解决的是企业实打实的成本问题。编程、法律文书起草、账单处理、数据分析……这些都是企业IT预算里真切存在的刚性支出,而且消耗的算力Token量也是一个较聊天应用高出数量级的庞大数字。

    一个程序员使用AI编程助手带来显著的效率提升,企业不需要漫长的决策周期就愿意掏钱,而且一旦深度嵌入开发流程,换一个模型的迁移成本高得离谱。

    AI的答案不在“给谁用”,而在“解决什么问题”。花1块钱解决10块钱的问题,那叫好生意。花1块钱产生10块钱的流量泡沫,那叫瞎折腾。面对投资人,投资回报率才是真正的护城河。

    四、从AI对垒到生态大战

    AI大模型的竞争,早已不只是模型参数的军备竞赛。芯片、云平台、资本、生态圈,四条战线全面开打。

    在生态圈打法上,Anthropic展示了一个教科书级别的“借船出海”。它没有花巨大成本自建庞大销售团队,而是和AWS Bedrock、Google Vertex AI深度绑定。亚马逊入股的同时提供算力,谷歌入股的同时打开企业客户渠道,双方直接共享全球最大的企业客户群,节省了高昂的销售获客成本。

    OpenAI的生态则更像“单边押注”。从2019年开始就和微软深度绑定,微软累计投资约130亿美元,换来Azure的独家云服务权和商业化的优先合作。如今随着企业客户需求多样化,OpenAI开始把部分算力转移到谷歌和甲骨文,试图分散供应商风险,这说明单边依赖已经开始出问题了,一旦协议变更,直接打击的就是OpenAI的商业化命脉。

    再看算力底层,前哨战早已提前打响。Anthropic和谷歌、博通合作锁定了约3.5吉瓦的TPU芯片产能,同时与亚马逊签署了涵盖最高5吉瓦算力的协议。这是一场提前部署的未来算力保障。

    大模型的下一阶段,不是拼算法多牛,而是拼算力能不能撑住、成本能不能降下来。谁先锁定了低成本的芯片供应链,谁就能在价格战中拥有主动权。

    花旗银行在2026年4月底最新的研报中,将2030年全球AI市场预测从3.5万亿美元上调到超过4.2万亿美元,企业级AI市场从1.2万亿美元上调到约1.9万亿美元。这是一个极为重要的信号:未来的蛋糕越来越大,但分法变得非常具体,计算芯片、云基建和AI应用层三个赛道泾渭分明。

    那些纯靠炒作技术概念、没有清晰变现逻辑的公司,会被投资者越来越严厉地诟病:“你的CFO怎么看这件事?”

    五、时代变了,游戏规则也变了

    Anthropic从OpenAI内部另立门户而生,用了五年时间让当年嘲笑“情怀自杀”的人闭上了嘴。Dario Amodei和他的团队没有选择正面硬刚OpenAI的C端流量池,而是选择了B端,那条更慢、但更扎实的路。结果证明,慢就是快。

    但更深层的思考是,这个故事的背后藏着三条极其重要的趋势,值得所有关注这个领域的同仁参考。

    第一,AI产业的估值逻辑,正在从“市梦率”回归到“市销率”。 OpenAI 8500多亿估值对应约250亿ARR,市销率约34倍。Anthropic 9000亿估值对应300亿ARR,市销率约30倍。作为对比,微软12倍,谷歌6倍。虽然AI赛道仍在早期高速增长阶段,估值溢价比成熟科技股高是合理的,但投资人已经明确提出,必须拿出足以支撑当前高估值的变现能力。

    单纯投资大模型技术概念、靠明星团队和大厂加持来融资的时代,可能正在飞速结束。投资人现在看得最多的,是毛利率、客户留存率、现金流转正路径、和真正的“投资回报率”故事。

    第二,“安全可控”不是情怀,而是企业级市场的刚需。 Claude的“宪法AI”理念,早期在AI极速研发的环境下看起来像是一副拥抱道德的说辞,结果反而证明是赢得企业信任的重要筹码。企业担心知识产权泄露、数据合规泄露、法律追责风险,在这种情况下,一家愿意从底层把AI模型守约到透明化、可解释化的公司,比一家不断爆出各种数据处理争议的公司更值得信赖。Anthropic今年1月首次采购AI服务的企业中,拿下了约73%的份额,印证了用户的选择。

    第三,OpenAI这一轮的失速,根源不在于技术,而在于公司治理。 微软占据26.79%的股份,而CEO奥特曼的持股为零。没有股权对齐带来的利益捆绑,奥特曼的管理权威在组织内部长期难免不受到质疑。如果持续缺乏确定性,人才流失将是一个不可逆的进程。随着马斯克与奥特曼的法律纠纷持续发酵,要求OpenAI回撤商业化、恢复非营利身份的官司已经打了大半年。内部的动荡给竞争对手提供了极好的切入时机。

    AI行业的竞争已经不再局限于产品本身,产业联盟和公司治理会成为决定未来排位的核心变量。

    对于非专业投资者来说,看懂AI赛道最好的方式,或许不是纠结于哪个模型参数大、哪个聊天机器人说话好听,而是观察真正赚钱的领域在哪里,然后找到那个领域里“花钱最聪明”的公司。

    六、结语:理性繁荣的新阶段

    Anthropic冲击9000亿估值,是AI行业发展的里程碑。它证明,AI不再是资本炒作的概念,而是能创造真实价值、具备可持续商业模式的硬核产业。

    OpenAI的时代并未结束,但Anthropic的崛起,标志着AI行业进入理性繁荣、价值优先的新阶段。未来,谁能在商业化、成本控制、客户价值上持续领先,谁就能真正掌控AI的未来。

    对创业者、投资者而言,信号很明确:忘掉流量神话,回归商业本质。能为自己解决真问题、能持续赚钱的AI公司,才值得长期押注。

    AI技术本身不是泡沫,但对泡沫的过度追逐,本身就是泡沫。投资人宁愿为一个有点想法但已经开始挣钱的公司付溢价,都不愿意再为那些只有PPT和宏大叙事的独角兽买单。

  • OpenAI营收目标落空:AI板块集体跳水背后的深层危机

    OpenAI营收目标落空:AI板块集体跳水背后的深层危机

    一夜之间,AI叙事崩塌

    昨天夜里,科技圈最大的瓜来了——OpenAI没能完成它的”小目标”。

    据内部消息,ChatGPT的营收目标和年末10亿周活用户目标双双落空。这下可好,华尔街直接炸锅了。

    “OpenAI链”全线崩盘:

    • 软银:暴跌近10%,一天蒸发180亿美元(持有OpenAI 11%股权)
    • 甲骨文:跌超4%
    • AMD:跌近4%
    • 英伟达:跌1.6%
    • CoreWeave:跌超5%(紧急发公告:我们客户多着呢!)

    CFO阿姨发出灵魂拷问:”如果营收不达标,我们的GPU采购合同可就要凉凉了~”(6000亿美元的未来支出承诺,1220亿已到账,但三年内可能烧光)

    更惨的是——公司暂不满足上市标准,IPO可能要黄了!

    AI板块跳水:软银暴跌与科技股集体崩盘的交易现场

    OpenAI的困境:从估值神话到营收现实

    6000亿美元的赌注

    故事要从2025年说起。彼时,OpenAI以惊人速度完成多轮融资,估值一路飙升到1570亿美元,成为全球估值最高的AI公司。软银、微软、苹果等科技巨头纷纷下注。

    但估值是估值,营收是营收。当投资人开始追问:”你们的商业化路径在哪里?”问题就来了。

    内部文件显示,OpenAI预计2026年营收目标为127亿美元,但实际情况可能连一半都达不到。更要命的是,年末10亿周活用户的目标也宣告失败——目前ChatGPT的周活用户约为4.2亿,距离目标还差一大截。

    CFO的担忧:GPU合同要凉?

    CFO在投资者会议上坦言:如果营收不达标,公司的GPU采购合同将面临违约风险。

    这可不是小事。目前OpenAI与英伟达、AMD等芯片厂商签有总额高达6000亿美元的采购合同,其中1220亿已经到账。按照合同条款,如果营收连续两个季度低于预期,OpenAI有权重新谈判甚至取消部分订单。

    但问题是:你都签了6000亿的合同了,现在说不要就不要?

    这波操作,属实是把”画饼”玩出了新高度。

    连锁反应:AI板块的集体焦虑

    软银的180亿美元教训

    作为OpenAI的最大外部股东,软银持有其11%的股份。昨天一役,软银股价暴跌近12%,市值蒸发约180亿美元。

    孙正义的”AI帝国”愿景再次遭受重创。此前,软银已经因为WeWork、Wirecard等多个投资失误而备受质疑。此番OpenAI的困境,让市场更加怀疑:软银的AI投资策略是否正确?

    英伟达的隐忧

    英伟达跌1.6%,看似不多,但考虑到其在AI芯片市场的绝对主导地位,这个跌幅背后藏着更深层的担忧:

    AI厂商的算力投入是否会放缓?

    如果OpenAI这样的头部公司都开始控制成本,其他中小AI公司会作何反应?算力需求下降,将直接影响英伟达的业绩预期。

    IPO窗口关闭?

    更糟糕的消息是:由于暂不满足上市标准,OpenAI的IPO可能要推迟。

    这对于那些期待通过IPO退出的一级市场投资人来说,无异于晴天霹雳。软银、红杉等VC手里的OpenAI股票,流动性将进一步恶化。

    行业反思:AI泡沫真的要破了吗?

    从狂热到理性

    过去两年,AI行业经历了前所未有的狂热。”大模型将改变一切”、”AI将取代人类工作”、”AGI将在5年内实现”——各种宏大叙事层出不穷。

    但狂热过后,市场开始追问一个根本问题:这些AI公司到底能赚多少钱?

    ChatGPT很火,但OpenAI还在亏损。Claude很强,但Anthropic还在烧钱。Gemini很酷,但Google还在投入期。

    当投资人开始用放大镜审视AI公司的财务报表,泡沫破灭的声音就越来越响。

    估值逻辑的崩塌

    传统科技公司的估值逻辑是:用户增长→营收增长→利润增长。但AI公司的逻辑似乎变成了:用户增长→算力投入→还是亏损。

    这不是一个健康的商业模型。

    未来展望:危中有机

    行业洗牌的开始

    OpenAI的困境,将加速AI行业的洗牌。那些没有清晰商业化路径的AI公司,将面临融资困难。而那些已经实现盈亏平衡或盈利的AI公司,将获得更多资源。

    技术与应用并重

    过去两年,AI行业过度关注技术突破,忽视了商业落地。现在,市场开始倒逼AI公司:光有技术不行,还得能赚钱。

    中国的机会?

    值得注意的是,在OpenAI陷入困境的同时,中国的AI公司却呈现出不同的发展态势。百度文心、阿里通义、字节豆包等国产大模型,在商业化落地方面表现更为务实。

    或许,这正是中国AI企业的机会?

    结语

    OpenAI营收目标落空,是AI行业的一记警钟。它提醒我们:再先进的技术,也需要找到商业化的出口。再宏大的愿景,也需要脚踏实地的执行。

    AI不是神话,AI公司也不是例外。当潮水退去,我们才能看清谁在裸泳。

    这,或许是AI行业走向成熟的必经之路。

    相关科技资讯

  • DeepSeek V4与腾讯混元同日开源:国产AI大模型生态爆发

    DeepSeek V4与腾讯混元同日开源:国产AI大模型生态爆发

    引言:国产AI大模型的“开源周”

    2026年4月25日,注定要被载入中国AI发展史册。

    同一天,两大国产AI巨头——DeepSeek与腾讯混元——相继宣布开源重磅模型。一个开创了“开源+收费API”的第三条商业化路径,一个祭出295B参数的MoE巨兽。这不是巧合,而是中国AI产业从“跟跑”转向“并跑”的标志性事件。

    DeepSeek V4发布后24小时内,第三方评测数据显示其在代码能力上表现惊艳、推理性能逼近前沿水平。腾讯混元团队开源的295B参数MoE模型,在多项基准测试中同样表现优异,进一步推动国产大模型开源生态建设。

    当“开源”成为共识,中国AI大模型的生态竞争正式进入下半场。

    一、DeepSeek V4:开源的第三条路

    1.1 从免费开源到“开源+收费”

    长期以来,AI大模型的商业化路径主要有两种:要么完全闭源靠API收费(如OpenAI),要么完全开源靠社区贡献(如早期Llama)。DeepSeek V4则走出了一条新路——核心模型开源,但提供高性能收费API服务。

    这种“开源模型+收费API”的模式,本质上是将开源社区作为技术验证和生态培育的土壤,同时通过付费API获取商业收益。对开发者而言,可以免费使用开源版本进行实验和定制;对企业用户而言,则可以获得经过优化的高性能服务。

    1.2 代码能力的“惊艳”表现

    根据第三方评测数据,DeepSeek V4在代码能力方面表现尤为突出。在多个主流代码评测基准上,V4版本均展现出不逊于闭源模型的性能表现。特别是在复杂代码生成、代码修复和多语言编程等场景下,V4展现出了强大的理解和生成能力。

    这一突破意味着什么?对于开发者而言,开源的V4可以成为本地开发环境的强大助手;对于企业而言,基于V4进行定制开发,可以显著降低AI应用的开发成本。

    1.3 开源社区的反应

    V4发布后,全球最大AI模型API聚合平台OpenRouter上的数据显示,DeepSeek系列模型的调用量急剧攀升。事实上,早在2026年2月,中国AI模型的周Token消耗就已经达到5.16万亿枚,三周内增幅高达127%,实现了对美国的超越。

    二、腾讯混元295B:MoE架构的国产巅峰

    2.1 2950亿参数的“巨无霸”

    腾讯混元团队此次开源的MoE(混合专家)模型,拥有惊人的2950亿参数。这是目前已知的参数规模最大的开源中文大模型之一。

    MoE架构的核心思想是“分而治之”——将大模型拆分为多个“专家”子模型,每个输入只激活与其相关的专家,从而在保持高性能的同时大幅降低计算成本。2950亿参数如果按照传统密集模型的方式运行,需要庞大的算力支持;而通过MoE架构,实际激活的参数比例可以控制在较低水平。

    2.2 多项基准测试的“优异”表现

    根据腾讯混元团队公布的技术文档,295B MoE模型在MMLU、CMMLU、GSM8K等多个主流评测基准上均取得了领先成绩。特别是在中文理解、数学推理和代码生成等任务上,模型展现出了强大的能力。

    2.3 推动开源生态

    腾讯混元选择开源这一旗舰模型,显然有着更深的战略考量。通过开源,腾讯可以:

    • 吸引开发者社区:开源模型降低了开发者的使用门槛,有助于扩大混元生态的开发者基数
    • 收集真实反馈:开发者社区的使用反馈可以帮助腾讯快速迭代优化模型
    • 构建行业标准:作为行业头部玩家的腾讯,有机会通过开源影响行业技术标准

    三、国产大模型的“开源联盟”

    3.1 从“单打独斗”到“协同作战”

    DeepSeek V4与腾讯混元同日开源,并非孤立事件。回顾2026年以来的AI大模型发展脉络,国产大模型正在形成一种“开源联盟”的默契。

    从早期的GLM、Kimi、Qwen到如今的DeepSeek和腾讯混元,国产开源模型不仅在数量上快速增长,更在质量上不断逼近甚至超越闭源模型。斯坦福大学HAI研究所的最新报告显示,中国开发者发布的模型在多项国际排行榜上已与美国顶尖系统不相上下。

    3.2 OpenRouter上的“反超”

    一个值得关注的数据是:中国AI模型在OpenRouter平台上的排名已跃升至前三。OpenRouter作为全球最大的AI模型API聚合平台,其排名反映了全球开发者对不同模型的真实使用偏好。

    中国模型能够在这个平台上获得如此高的排名,说明国际用户也在实际使用中认可了国产模型的能力。这对于国产AI企业“出海”具有重要的象征意义。

    3.3 背后的驱动因素

    国产大模型能够在短时间内实现如此快速的追赶,离不开以下几方面因素:

    • 政策支持:“十五五”规划明确提出加强人工智能同产业发展的结合
    • 资本投入:AI领域投资持续火热,国产大模型企业获得充足资金支持
    • 人才聚集:全球AI人才回流,国产大模型企业吸引了一批顶尖技术人才
    • 场景丰富:中国庞大的互联网用户群体和丰富的应用场景,为AI模型提供了得天独厚的训练土壤

    四、商业化前景分析

    4.1 三种模式的博弈

    当前,AI大模型的商业化路径已经清晰分化:

    模式代表企业优势挑战
    纯闭源OpenAI技术领先、品牌溢价成本高、难以定制
    纯开源Meta(Llama)生态繁荣、开发者友好商业化路径模糊
    开源+收费APIDeepSeek V4兼顾生态与商业需要平衡开源与商业利益

    DeepSeek V4开创的“第三条路”,本质上是在开源与闭源之间寻找平衡点。通过开源基础版本吸引开发者,通过收费API服务企业用户,形成了可持续的商业闭环。

    4.2 企业级市场的机遇

    对于企业用户而言,DeepSeek V4这种模式具有独特的吸引力:

    • 低成本试错:企业可以先用开源版本进行POC验证,降低技术风险
    • 高性能保障:付费API提供经过优化的服务等级保障
    • 定制灵活性:基于开源版本,企业可以进行私有化部署和深度定制

    4.3 生态构建是关键

    无论是DeepSeek还是腾讯混元,开源的最终目的都是构建生态。一个健康的AI大模型生态,需要包括:

    • 基础模型层:高质量的开源基础模型
    • 工具层:完善的微调、部署、监控工具链
    • 应用层:丰富的行业应用和解决方案
    • 服务层:专业的技术支持和服务保障

    只有生态繁荣,AI大模型的价值才能真正释放。

    五、技术趋势展望

    5.1 从“堆参数”到“提效率”

    2026年的AI大模型竞争,已经从单纯的参数规模比拼,转向效率优化和落地能力提升。DeepSeek V4和腾讯混元295B的发布,都体现了这一趋势。

    • 更低的训练成本:通过架构创新和训练优化,模型训练成本持续下降
    • 更高的推理效率:模型稀疏化、量化等技术让推理更加高效
    • 更好的场景适配:针对特定场景的微调和优化成为主流

    5.2 多模态融合加速

    除了纯文本模型,多模态能力的融合也在加速。谷歌DeepMind同期发布的新一代通用视觉模型,在多个视觉任务基准测试中达到SOTA水平,进一步加剧了多模态竞争的激烈程度。

    5.3 Agent成为下一个主战场

    大模型之后,AI Agent(智能体)正在成为下一个竞争焦点。DeepSeek V4在代码能力上的突破,很大程度上是为了支撑其Agent能力的发展。

    根据Gartner预测,2026年全球40%的企业应用将嵌入任务型AI智能体。这意味着,大模型的竞争将逐渐从“模型本身”扩展到“模型+Agent”的综合能力比拼。

    结语:开源时代的中国机遇

    DeepSeek V4与腾讯混元同日开源,不仅是两家企业的技术突破,更是中国AI大模型产业集体崛起的缩影。

    当开源成为主流,当生态成为关键,中国AI企业找到了属于自己的竞争策略——通过开源扩大影响力,通过生态构建壁垒,通过持续迭代保持领先。

    这条路并非坦途。开源意味着更多的分享,也意味着更激烈的竞争;生态构建需要长期的投入,也需要与合作伙伴共建共赢。

    但无论如何,2026年4月25日这一天,已经成为中国AI发展史上的重要注脚。国产AI大模型生态的爆发,才刚刚开始

  • DeepSeek首次融资背后:估值百亿与核心人才流失

    DeepSeek首次融资背后:估值百亿与核心人才流失

    正文

    一、首次融资:DeepSeek的转折点

    国内AI大模型公司DeepSeek正在经历其发展历程中的重要转折。

    据多个消息源证实,DeepSeek正与投资者洽谈首轮外部股权融资,计划以不低于100亿美元的估值,募集不少于3亿美元资金。如果消息属实,这将是DeepSeek成立以来的首次外部融资。

    在此之前,DeepSeek一直依靠幻方量化的内部支持运营。幻方量化是国内头部量化对冲基金,拥有强大的算力资源和资金实力。正是这种独特的背景,让DeepSeek能够在成立之初就获得充足的算力支撑,专注于技术研发。

    据知情人士透露,DeepSeek此前曾多次拒绝来自中国头部风投机构与科技巨头的投资邀约。这些机构包括红杉中国、高瓴资本等知名投资机构,以及字节跳动、腾讯等互联网大厂。

    然而,AI大模型的竞争日益激烈,研发投入持续攀升。即使背靠幻方量化,DeepSeek也面临着巨大的资金压力。此次启动外部融资,被认为是公司为下一阶段发展储备弹药的重要举措。

    DeepSeek融资与技术布局全景,开源模型推动AI生态创新发展

    二、人才流失:甜蜜的烦恼

    融资消息披露的同时,另一个问题也浮出水面——核心人才流失

    自2025年下半年以来,DeepSeek已流失至少5名核心研发成员,涉及基座模型、推理、OCR、多模态等关键技术方向。这些人才的去向尚不清楚,但业内猜测他们可能加入了竞争对手或选择自主创业。

    对于任何一家科技公司来说,核心人才流失都是沉重的打击。尤其是在AI领域,技术突破往往依赖于少数顶尖人才的灵感和坚持。DeepSeek在短时间内失去多位核心技术骨干,无疑会影响其技术迭代的节奏。

    有分析认为,DeepSeek此前长期依赖幻方量化的”输血”模式,在人才激励方面可能存在不足。相比之下,那些获得巨额融资的竞争对手们,能够为顶尖人才提供更具吸引力的薪酬和股权激励。

    与此同时,也有声音认为,适度的人才流动是行业健康发展的表现。人才的流动可以促进技术创新在不同机构之间的传播,推动整个行业的进步。

    无论如何,如何留住核心人才,已经成为DeepSeek管理层必须面对的课题。

    三、技术创新:密集发布开源模型

    尽管面临融资和人才方面的挑战,DeepSeek在技术创新方面并未停下脚步。

    就在4月27日当天,DeepSeek在全球最大AI开源社区Hugging Face发布了名为DeepSeek-Prover-V2-671B的新模型。根据目前公布的信息,这款参数高达6710亿的模型使用了更高效的safetensors文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署。

    从命名上看,这款模型可能是去年发布的数学AI模型Prover-V1.5的升级版。Prover系列是DeepSeek在数学推理领域的重要布局,其目标是为数学研究和教育提供强大的AI辅助工具。

    此外,DeepSeek最新发布的DeepSeek-V4-Pro模型API更是开启了2.5折价格特惠,输入(缓存命中)价格仅为0.25元/百万Tokens,输入(缓存未命中)价格为3元/百万Tokens,输出价格为6元/百万Tokens,优惠期截至5月5日。

    对比来看,据OpenRouter数据显示,海外知名AI大模型GPT-5.5 Pro加权平均输入价格为30美元/百万Token,输出价格为180美元/百万Token,DeepSeek V4 Pro与其相差超过700倍

    在AI行业整体算力集体涨价的背景下,DeepSeek V4再次将”AI降价”的理念贯彻到底,进一步打响业内的”价格战”。

    四、大厂争抢:腾讯阿里洽谈投资

    DeepSeek的融资消息传出后,多家互联网大厂表达了投资意向。

    据TechWeb报道,腾讯、阿里正在洽谈投资DeepSeek。这两家中国最大的互联网公司,在AI领域的布局都在加速。对于它们来说,投资DeepSeek不仅能够获得先进的AI技术,还能借此绑定一位重要的合作伙伴。

    腾讯在AI领域的布局以”混元”系列大模型为核心,同时在AI应用层面持续发力。阿里巴巴则依托阿里云,在MaaS(模型即服务)领域建立了显著优势。两家公司都希望借助外部力量,加速自身AI能力的发展。

    投资DeepSeek对大厂们来说是一笔划算的买卖。100亿美元的估值虽然不低,但考虑到DeepSeek在技术上的领先优势和开源生态的影响力,这笔投资有望带来丰厚的回报。

    有分析认为,如果腾讯或阿里成功投资DeepSeek,将对国内AI行业的竞争格局产生深远影响。大厂的资金和资源支持,将帮助DeepSeek在人才争夺和技术研发上获得更大优势。

    五、行业影响:开源生态的新力量

    DeepSeek的发展轨迹,折射出中国AI行业的一个重要趋势——开源生态的崛起

    与OpenAI等坚持闭源路线的公司不同,DeepSeek从一开始就选择了开源策略。其多款大模型在Hugging Face等开源社区发布,吸引了大量开发者和研究者参与使用和改进。

    这种开源策略带来了多重好处。首先,开源模型可以快速获得社区反馈,帮助团队发现和修复问题。其次,广泛的实际应用场景可以积累宝贵的数据,推动模型持续优化。最后,开源生态还能够吸引更多开发者围绕DeepSeek建立应用生态,形成正向循环。

    DeepSeek的实践表明,在AI领域,开源与闭源并非零和博弈。通过开源策略,中小机构也能够获得与大厂竞争的机会,推动整个行业的创新发展。

    六、未来展望:挑战与机遇并存

    对于DeepSeek来说,当前的融资只是一个新的起点。

    AI大模型的竞争正在进入白热化阶段。OpenAI、谷歌、Anthropic等国际巨头持续加大投入,国内的百度、阿里、字节跳动等公司也在奋力追赶。在这场没有终点的竞赛中,DeepSeek需要持续证明自己的价值。

    融资带来的资金将主要用于算力扩充、人才招募和场景拓展。DeepSeek需要在保持技术领先的同时,加速商业化落地,找到可持续盈利的商业模式。

    同时,人才流失的问题也需要尽快解决。建立更有吸引力的人才激励机制,营造良好的研发环境,将是DeepSeek管理层面临的重要考验。

    无论如何,DeepSeek已经成为中国AI行业的一面旗帜。它的每一步探索,都值得整个行业关注和学习。

  • DeepSeek V4与华为昇腾950PR联手:国产AI芯片生态破局,算力自主再进一步

    DeepSeek V4与华为昇腾950PR联手:国产AI芯片生态破局,算力自主再进一步

    正文

    一场改变游戏规则的合作

    4月24日,北京一家酒店会议厅内,深度求索CEO梁文锋按下发布键,DeepSeek V4正式登场。几乎同一时刻,华为昇腾官方确认:昇腾950PR芯片已完成对V4的训练适配,这是国产大模型与国产芯片首次在旗舰级产品上实现深度协同。

    这一刻,中国AI产业等了很久。

    过去几年,国产大模型飞速发展,但底层算力始终依赖英伟达GPU。从H100到H200,这些性能强大的芯片却像一把悬在头顶的剑——随时可能因为出口管制而断供。黄仁勋曾警告,如果中国无法获得高端芯片,“灾难性后果”将随之而来。

    DeepSeek V4与昇腾950PR的联手,用行动给出了回应:不是灾难,而是破局。

    DeepSeek V4价格仅为GPT-5.5的1/6,国产AI芯片生态实现24小时适配

    参数与性能:不是堆料,是精准

    V4系列包含两款产品:旗舰版V4-Pro和轻量版V4-Flash。前者总参数1.6万亿、激活490亿;后者总参数2840亿、激活130亿。两款模型均支持100万Token超长上下文——相当于一次性处理三部《三体》体量的文本。

    这些数字背后,是一系列技术创新。

    V4引入了压缩稀疏注意力(CSA)和流形约束超连接(mHC)等新技术。在百万Token上下文设置下,V4-Pro每处理一个Token的算力消耗仅为前代V3.2的27%,KV缓存占用仅10%。换句话说,它不仅跑得快,还跑得省。

    更重要的是,V4采用混合专家(MoE)架构。与传统大模型每次推理激活全部参数不同,MoE架构让模型在处理不同任务时调用不同的“专家”网络,从而大幅降低计算成本。这解释了为什么V4能以如此亲民的价格提供顶级性能。

    价格革命:不到GPT-5.5的六分之一

    说到价格,这才是V4真正“炸场”的地方。

    V4-Flash的输出定价为每百万Token 2元人民币(约0.28美元),V4-Pro为每百万Token 24元人民币(约3.48美元)。

    对比一下GPT-5.5:输出定价每百万Token 30美元(约217元人民币)。

    按同口径计算,DeepSeek V4-Flash的价格仅为GPT-5.5的约1/100,V4-Pro约为后者的1/6。

    这意味着什么?意味着一家中型企业如果每月需要处理1000万Token的AI任务,使用GPT-5.5每年需要支出约360万美元,而使用V4-Flash仅需约3.6万美元。成本差距高达100倍。

    当然,价格差距背后有性能差距。GPT-5.5在多项基准测试中仍保持领先,V4尚未在所有维度实现超越。但正如一位行业观察者所言:“DeepSeek不需要在每个排行榜上夺冠。如果在1/6的成本下能做到’足够接近’,市场就会重新洗牌。”

    华为昇腾:从备选到首选

    V4的另一个里程碑,是华为昇腾950PR芯片的首发适配。

    过去,昇腾芯片的生态成熟度与英伟达存在差距。适配难度大、工具链不完善、性能调优复杂——这些问题让许多开发者望而却步。梁文锋曾在公开场合表示,昇腾“是备选,但开发体验不够好”。

    这一次,DeepSeek团队花了大量精力优化适配。梁文锋透露,V4在昇腾上的推理速度“基本追平英伟达GPU”。这意味着国产芯片终于迈过了“好用”这个门槛。

    示范效应随即显现。V4发布后24小时内,寒武纪、海光信息、燧原科技等8家国产AI芯片厂商宣布已完成对V4的适配验证。国产大模型与国产算力栈的协同,从单点突破进入规模化阶段。

    华为Fellow刘步召表示:“DeepSeek V4证明了国产算力栈已经具备支撑顶级大模型的能力。这是一个重要信号。”

    开源策略:基础设施供应商的野心

    与OpenAI的闭源路线不同,DeepSeek坚持开源。V4采用对商业友好的MIT协议,权重已在Hugging Face和ModelScope平台开放下载。

    这不是梁文锋第一次走开源路线。2025年初,DeepSeek-R1的开源曾在业界引发震动,被认为是“第二个DeepSeek时刻”。那一次,DeepSeek证明了开源模型可以与闭源模型正面竞争;这一次,V4更进一步,证明了开源模型可以在价格上实现碾压式优势。

    梁文锋在发布会上解释了DeepSeek的定位:“我们不想做一个什么都做的AI应用公司。我们想做的是智能时代的基础设施供应商——提供最强大的模型底座,让合作伙伴在其上构建各种应用。”

    这套逻辑正在被市场接受。阿里、字节跳动、腾讯等大厂已提前下单数十亿规模的昇腾算力,其中相当部分用于部署DeepSeek模型。一位投资人透露:“DeepSeek现在是国内最受欢迎的开源模型,没有之一。”

    挑战与隐忧

    当然,鲜花与掌声背后,也有一些值得关注的问题。

    首先是性能差距。尽管V4在部分指标上逼近GPT-5.5,但在复杂推理、长程对话等场景,差距仍然明显。一位测试过V4的开发者表示:“写代码、处理结构化任务,V4确实很强。但让它做需要深度思考的数学证明,还是能感觉到差距。”

    其次是商业化压力。开源模型如何持续盈利,是所有开源大模型公司面临的共同难题。DeepSeek目前的收入主要来自API调用和云服务,但与GPT-5.5的营收规模相比,仍有数量级的差距。梁文锋表示,公司正在探索更多商业模式,包括企业级定制服务、硬件捆绑销售等。

    第三是芯片供应链。尽管昇腾950PR已实现对V4的适配,但其产能和稳定性仍需市场验证。在全球AI芯片短缺的背景下,昇腾能否支撑大规模商用部署,还是一个未知数。

    写在最后

    DeepSeek V4与华为昇腾950PR的联手,不仅仅是两款产品的结合。它代表了一种可能性:当国产大模型与国产算力真正协同起来,中国AI产业就能摆脱对海外供应链的依赖,走出一条独立自主的道路。

    这条路不会平坦。性能差距、生态差距、商业化压力——这些挑战不会因为一次发布而消失。

    但至少,方向对了。

    就像梁文锋在发布会上说的那句话:“我们不需要打败谁。我们只需要证明,这条路走得通。”

    内链

    1. GPT-5.5与腾讯混元同日对决:AI大模型进入智能体时代
    2. 月之暗面Kimi K2.6开源:300个AI Agent同时开工
    3. 宁德时代超级科技日:钠电+快充王炸组合今日发布
  • GPT-5.5与腾讯混元同日对决:AI大模型进入智能体时代

    GPT-5.5与腾讯混元同日对决:AI大模型进入智能体时代

    正文

    凌晨炸场:OpenAI发布GPT-5.5

    北京时间4月24日凌晨,整个科技圈的目光都聚焦在OpenAI的发布会上。这一次,OpenAI没有让人失望——GPT-5.5正式发布,不是普通的小版本迭代,而是智能体模型时代的正式宣言

    用最直白的话来说:以前的AI是陪你聊天的小助手,现在的GPT-5.5是帮你干活的”数字牛马”。

    这背后意味着什么?意味着AI不再只是回答问题,而是能够自主规划、执行复杂任务,成为真正的数字工作者。

    82.7%准确率:GPT-5.5重新定义AI能力边界

    在Terminal-Bench 2.0编程测试中,GPT-5.5拿下了82.7%的准确率,碾压所有竞争对手。这一数字意味着什么?意味着在代码生成、bug修复、系统调试等专业编程领域,GPT-5.5已经达到了接近人类高级工程师的水平。

    更令人震惊的是,在GitHub问题解决测试SWE-Bench Pro上,GPT-5.5达到了**58.6%**的得分,能够一次性端到端搞定任务。这意味着开发者只需要描述问题,AI就能自动分析代码库、定位bug、编写修复方案、提交PR——整个流程不需要人类干预。

    英伟达CEO黄仁勋显然也看到了这一点。据内部消息,黄仁勋直接给全体英伟达员工发了邮件:10000人全部用Codex编程。这波操作,连黄老板都喊”真香”。

    GPT-5.5编程准确率82.7%与腾讯混元2950亿参数性能对比,AI大模型进入智能体时代

    成本革命:速度和成本双优化

    GPT-5.5不仅能力强,速度也更快、Token消耗更少,成本直接被打下来。这对于企业级应用来说意义重大——当AI编程工具足够便宜、足够快,企业才有动力大规模部署。

    有分析指出,GPT-5.5的性价比提升,可能引发新一轮企业AI化浪潮。从客服、文档处理到代码开发,AI正在渗透到软件开发的每一个环节。

    同日反击:腾讯开源2950亿参数大模型

    就在OpenAI发布GPT-5.5的同一天,腾讯也不甘示弱——开源了混元Hy3 preview模型,参数规模高达2950亿。这波操作被网友称为”中国AI的反击”。

    腾讯混元Hy3 preview采用了快慢思考融合的MoE(混合专家)架构,支持256K超长上下文,相当于可以一次性处理25万字的内容。在腾讯云、元宝、腾讯文档等产品中已经上线,并且支持主流开源Agent框架。

    阿里千问、腾讯混元、字节豆包……国产大模型正在上演”神仙打架”。而这种竞争,正在推动整个行业快速进步。

    智能体时代:AI从”工具”到”伙伴”

    GPT-5.5和腾讯混元Hy3的发布,标志着AI大模型正式进入智能体时代。过去,AI是响应式的——你问它答;现在,AI是主动式的——你告诉它目标,它自主规划执行。

    这种转变的深层意义在于:AI正在从”工具”进化为”伙伴”。它不再只是执行单一指令,而是能够理解复杂目标、分解任务步骤、自主调用工具、协作完成工作。

    对于开发者来说,这意味着编程方式正在被颠覆。对于企业来说,这意味着生产力正在被重新定义。对于普通人来说,这意味着生活正在被AI深度改变。

    竞争加剧:AI大模型格局重塑

    OpenAI和腾讯的同场竞技,折射出当前AI大模型市场的激烈竞争态势。另一边,Anthropic的Claude正在企业市场攻城略地,Google的Gemini持续发力多模态,Meta的Llama开源生态不断完善。

    这场竞争的本质,是AI时代的基础设施之争。谁能够提供更强大、更便宜、更易用的AI能力,谁就能在下一代计算范式中占据主导地位。

    对于中国AI产业来说,腾讯混元Hy3的开源是一个重要信号——国产大模型正在从跟随走向并跑,甚至在某些领域开始领跑。

    展望:智能体时代的机遇与挑战

    GPT-5.5和腾讯混元Hy3的发布,只是智能体时代大幕拉开的开始。接下来,我们预计会看到:

    1. AI编程工具爆发:Codex、Cursor等工具正在重新定义软件开发
    2. 企业AI化加速:从互联网公司到传统行业,AI正在渗透每一个角落
    3. AI Agent生态繁荣:更多垂直领域的AI智能体将涌现
    4. 监管政策跟进:AI能力的快速提升,也带来安全、伦理方面的新挑战

    无论你是否准备好,智能体时代已经到来。

    相关科技资讯

  • “机器人半马破纪录:从’邯郸学步’到超越人类还需要多久”

    “机器人半马破纪录:从’邯郸学步’到超越人类还需要多久”

    2026年4月19日清晨,北京亦庄的赛道上,一场史无前例的”人机对决”拉开帷幕。

    发令枪响的瞬间,你很难想象眼前的场景:300多台人形机器人,身披各色”战袍”,踏着整齐或不那么整齐的步伐,向21.0975公里的终点线进发。赛道两旁,围观的人群和扛着设备的媒体记者屏息凝神——他们正在见证一个历史性时刻的诞生。

    最终,荣耀”闪电”机器人以50分26秒的成绩冲线,不仅大幅超越人类男子半马世界纪录(57分20秒),更将去年首届赛事的冠军成绩(2小时40分)缩短了近两个小时。

    一年前的赛场上,机器人还在”邯郸学步”——有的因平衡力不足连滚带爬,有的边跑边”掉零件”,步态摇摇晃晃仿佛醉酒。一年后,它们已经站上了超越人类的速度之巅。

    这场半马的意义,远不止于一块奖牌。它是一次极限压力测试,用21公里的复杂路况,逼出了中国机器人产业在”大脑”(智能)、”小脑”(控制)、”身体”(硬件)上的全面突破。

    机器人三大系统技术架构分解图,展示大脑、小脑、身体协同进化与关键指标

    一、”大脑”的质变:从执行命令到理解任务

    让机器人跑起来,第一个要解决的问题是:它怎么知道”该怎么跑”?

    在过去,工程师需要告诉机器人精确到毫米的动作指令——”左腿抬起15度,脚掌落地,身体重心前移5厘米”。这套指令稍有偏差,机器人就会失去平衡跌倒。

    现在的突破在于,机器人开始拥有理解任务的能力。

    当研究人员对机器人说”保持高速奔跑,注意避开障碍”时,它不再只是机械地执行预设动作,而是能够分析环境、识别目标、规划策略。这背后的核心技术,是大模型与具身智能的深度融合。

    以智元机器人的GO-2模型为例,它引入了一种”异步双系统”架构:

    慢系统(大脑):以低频运行,负责生成高层的”意图流”,比如”保持速度”、”调整步幅”、”注意前方弯道”。它不关心具体的关节角度,而是关注整体目标和策略。

    快系统(小脑):以高频运行,结合实时视觉反馈,生成具体的控制信号。当慢系统发出”保持速度”的指令后,快系统会根据实际的地形、坡度、风阻,动态调整步频、步幅和身体姿态。

    这就像人类学开车。你不是在记忆”油门踩3厘米、方向盘左打15度”的肌肉指令,而是在学习”如何安全地从A点到达B点”的整体策略。一旦掌握了这个策略,你就能应对不同的路况和车型,而不需要为每种情况都预设一套动作。

    人形机器人正在经历同样的转变——从”动作复刻机”变成”任务理解者”。

    二、”小脑”的协调:高速奔跑中的动态平衡

    如果说”大脑”解决的是”该做什么”,那么”小脑”要解决的就是”怎么做”。

    在本次半马赛事中,机器人峰值速度达到10米/秒,逼近博尔特的极限;均速7.51米/秒通过多弯道赛段,直接超越人类1500米、1英里、2000米三项中长跑世界纪录。

    这些数字背后,是运动控制算法的一场革命。

    关键在于实时预测与全身协同。机器人通过全身28个传感器,每秒采集上千次数据——视觉信息告诉你前方是什么路况,IMU惯性测量单元告诉你身体的倾斜角度,足底压力传感器告诉你脚与地面的接触状态。所有这些信息汇总起来,机器人要在毫秒级时间内预测运动轨迹,并动态协调全身29个关节的力矩输出。

    想象一个顶尖的短跑运动员在弯道冲刺。他不是靠预编程的”左腿迈出75厘米”,而是根据身体重心、地面反馈和风速,在瞬间微调步频、摆臂幅度和身体前倾角度。这种生物级的协调能力,是人类在数百万年进化中习得的本能。

    新一代人形机器人的”运动小脑”,正在通过数千万次的虚拟仿真训练,无限逼近这种本能。

    三、”身体”的强化:告别”一跑就发烧”

    去年赛场上最尴尬的场景之一,是工程师骑着电瓶车跟在机器人后面,不停给过热的关节喷水降温。否则电机可能直接烧毁,续航也只有几公里,换一次电池需要停机重启3-4分钟。

    今年的突破是系统性的工程化能力。

    散热:从”水冷喷淋”到”主动液冷”

    在高速奔跑中,电机持续高功率运转,热量堆积速度极快。如果散热做不好,电机温度飙升至70-80℃,不仅性能暴跌,还可能直接烧毁。

    “闪电”搭载的液冷散热系统,彻底攻克了这一难题。研发团队将液冷管道像人体毛细血管一样,精密埋入电机与关节模组内部,搭配高功率液泵驱动冷却液快速循环。

    实测数据显示,“闪电”连续奔跑10公里后,核心电机最高温度仅31.5℃,与室温基本持平;全程21公里跑完,电机温度始终控制在40℃以内,性能没有出现任何衰减。

    这套散热系统的效率,比传统风冷提升了50%以上。更难得的是,它在实现高效散热的同时,还保持了轻量化设计,没有给机器人增加额外负担。

    续航:从”里程焦虑”到”10秒换电”

    21公里长距离奔跑,对能源供应是极大考验。传统人形机器人多采用集中式电池布局,重量大、重心高,影响奔跑稳定性。

    “闪电”采用分布式电池设计,将电池模块分散布置于全身各处,既有效减轻单体重量,又能精准平衡整机重心。

    更关键的是10秒热插拔换电技术。赛道设置7个换电站,机器人可以在不停机、不重启的情况下,10秒内完成电池更换。整个半马比赛,”闪电”仅换电3次,总换电时长30秒,占比赛总时间不到0.5%。

    这个效率,甚至超过了F1赛车的换胎速度。

    灵巧手:从”抓握”到”绣花”

    除了跑得快,人形机器人的”手”也在进化。

    特斯拉Optimus Gen3的灵巧手,通过仿生的”无销关节”和”肌腱传动”设计,实现了0.08毫米的触觉分辨率。这意味着它能稳定抓取鸡蛋、捏住羽毛,在工厂装配中的错误率比人工低90%。

    从”能抓”到”抓稳”,再到”抓巧”——人形机器人的手正在变得越来越像人类。

    四、从赛场到工厂:技术突破的落地

    技术突破的价值,最终体现在”能用”和”好用”上。

    在工业场景,人形机器人已经不是”实验室玩具”:优必选在2025年已交付1079台工业人形机器人,进入汽车制造、智慧物流产线;小米机器人能在汽车工厂连续拧螺丝3小时,安装成功率超90%。

    成本也在快速下探。核心零部件国产化率已超85%,国产谐波减速器成本仅为国外的1/3,无框力矩电机单价压至500元以下。这为规模化普及扫清了最大障碍。

    当然,挑战依然清晰:复杂家庭环境的适应、灵巧手寿命距离工业标准还有差距、高算力AI芯片的自主可控……

    但回望这一年,人形机器人已经完成了从”技术炫技”到”工程落地”的关键一跃。

    五、超越人类之后:人机关系的新思考

    当机器人开始在运动领域超越人类,一个哲学问题浮出水面:这是威胁,还是机遇?

    业内人士预测,机器人在耐力、爆发力、精准度、抗疲劳上已形成代际优势。乐观来看,2026年年中即可在短跑、长跑等单一项目全面超越人类,3—5年实现全运动品类稳定碾压。

    但也有专家持不同观点。中国商业经济学会副会长宋向清指出,此次机器人半马虽然打破了人类纪录,但更多是在”封闭赛道、无对抗、缺乏复杂干扰的条件下取得的理想成绩”,与人类真实比赛中所面对的环境变化与竞争压力,仍存在不小差距。

    在依赖真实意识与情感的领域,机器人仍难以超越人类。无论是心理咨询、亲子陪伴等深度情感连接,还是原创艺术与科研灵感,人类基于体验与直觉的创新能力,依然是机器人难以企及的高地。

    未来并非人机对抗的零和博弈,而更可能是协同共生的正和关系。 关键不在于机器人何时超越人类,而在于人类如何借助技术释放创造力,最终走向一个更加美好的人机共荣时代。

    结语

    从2025年首届赛事的艰难完赛,到2026年”闪电”的高速冲线,中国人形机器人实现的不仅是速度的跨越,更是创新能力、产业实力的全面跃升。

    这场半马赛事的落幕,不是终点,而是中国人形机器人发展的新起点。

    未来,随着技术的持续迭代,人形机器人将具备更强大的运动能力、更智能的交互能力、更广泛的适应能力,逐步走进工业车间、商场社区、家庭居所等各个场景。

    我们完全有理由相信,在自主创新的道路上,中国具身智能产业将不断突破极限,创造更多科技奇迹,让人形机器人真正成为服务人类、造福社会的重要力量。

    延伸阅读: