送外卖的美团,跑出万亿参数大模型,靠的是全国产算力

送外卖的美团,跑出万亿参数大模型,靠的是全国产算力-第1张图片

  做外卖、打车 、团购的美团 ,在AI战场上亮出一张新牌。

  就在最近,美团LongCat-2.0大模型正式发布,在业内掀起波澜 。若单看技术实力 ,它并非比较优秀 的那个——有评价认为,在工具调用、复杂指令执行等Agent(智能体)核心能力方面,LongCat-2.0-Preview接近Claude Opus 4.6 ,落后于最新的Claude Opus 4.8。

  但在头部玩家动辄刷榜的今天,这样一款不算最优的模型,却获得了颇高的关注度。原因在于——LongCat-2.0是业界首个基于国产算力完成训练、推理全流程的万亿参数大模型 。

训练 、推理全程依靠国产算力

  说到国产“模芯协同” ,很多人会联想到DeepSeek与华为的合作。

  4月24日,DeepSeek正式对外发布DeepSeek-V4预览版,华为同步宣布昇腾超节点全系列产品及华为云已实现对DeepSeek-V4的全面支持。

  之后 ,新的消息传来 。深圳河套学院AI训练平台项目团队联合哈尔滨工业大学(深圳)、深圳市大数据研究院、华为相关团队 ,在昇腾910C国产算力集群上,完成了DeepSeek-V4-Pro的全参数后训练。

  所谓后训练,是在预训练基座模型完成基础上做微调 、对齐优化 ,好比建好毛坯房后再完成精装修,与打地基、盖框架的从头训练还是有很大的不同。

  LongCat-2.0从零开始,用全国产算力训练万亿参数模型 ,覆盖预训练、后训练到推理的全流程,证明了国产算力能独立 、完整地支撑万亿模型从0到1的全生命周期 。

  据悉,该模型采用MoE(混合专家)架构 ,总参数规模1.6万亿,每个Token激活参数约480亿,原生支持1M超长上下文 ,可一次处理百万字级输入,模型适配Claude Code、OpenClaw、Hermes等主流Harness(智能体工程框架)。

  今年4月底,美团曾发布LongCat-2.0-Preview版本 ,并以匿名方式接入全球最大的大模型API路由平台OpenRouter。OpenRouter数据显示 ,截至6月底,LongCat-2.0-Preview的总调用量已跻身全球前三 。在Hermes 、Claude Code 、OpenClaw等Agent(智能体)场景下,LongCat-2.0-Preview的月调用量分列全球第〖One〗、 第二和第三位 ,在Claude Code上的调用量仅次于Claude Opus 4.8 。

OpenRouter数据显示,截至6月底,LongCat-2.0-Preview在Claude Code上的调用量仅次于Claude Opus 4.8。

  业内人士分析 ,这一表现既源于该模型本身的性能,也离不开当前的定价策略——公测期输入Token促销价为0.30美元/百万Token,且提供大额免费调用额度。行业通用玩法是上线初期靠低价和免费额度冲榜、攒口碑 ,再逐步涨价 。一旦进入收费阶段,现在的成绩还能保持多久,才是真正面临的考题。

  但至少 ,这件事验证了一个判断:近来 国产算力卡的单卡性能虽与全球顶尖水平仍有差距,但计算正确性和精度已经可以支撑前沿模型的全流程训练。对于激活存量国产芯片而言,这是一个重要突破 。

让大模型学会“偷懒 ”

  大模型技术本身 ,依然是业界关注的焦点。

  根据公开消息 ,LongCat-2.0全程在国产算力上完成训练,峰值规模超过5万张国产算力卡,是迄今为止国产算力上完成的最大训练任务。

LongCat-2.0全程在国产算力上完成训练 ,峰值规模超过5万张国产算力卡 。

  国产算力集群究竟出自哪家?据业内人士推测,该集群大概率基于华为昇腾架构搭建。不过,美团方面并未对此作出明确回应。

  另一个值得关注的维度 ,是模型层面的设计 。相关技术报告显示,LongCat-2.0引入零计算专家机制等设计。“零计算专家”机制关联的是大模型的经济性问题,当总参数突破万亿级别后 ,单纯堆叠参数带来的性能增益已显著放缓。一个更务实的命题是——如何让大模型用得更省 、跑得更快?

  在当前主流的MoE架构下,大模型每次推理只调动一小部分“专家”参与计算 。这样既保留了海量知识,又将单次推理的计算开销控制在合理范围内 。DeepSeek-V3/V〖肆〗、 Mixtral等头部模型均采用此架构。

  不过 ,该架构下每个Token激活的“专家 ”数量通常是固定的,无论输入文本简单或复杂,都调用同等规模的计算资源。

  LongCat系列引入“零计算专家”机制 ,即在传统“计算专家”之外 ,设置了一类特殊的“专家 ”——它不做任何矩阵运算,只做一件事:把输入原样传递到下一层 。

  模型会动态判断每个Token的复杂度,简单的Token直接分配给“零计算专家”走快速通道 ,复杂的Token才调动真正的“计算专家”深度处理。用更通俗的话说:让大模型学会在简单问题上“偷懒 ”,把算力留给真正需要深思的环节。

AI业务的进攻

  回到一个现实问题:烧钱做大模型,美团到底图什么?

  在2025年3月的业绩电话会上 ,美团CEO王兴明确了战略定位——对AI的策略是进攻,不是防守 。今年3月,他进一步透露 ,自2023年初以来,美团在资本支出和AI人才上进行了大规模投入。“除有云计算业务的企业外,美团在AI上的投入规模 ,大概率是国内企业里最大的,且已经坚持布局三年多。”

  此后,美团核心本地商业(CLC)完成组织架构调整 ,正式成立AI Transformation部门 ,与外卖、闪购等部门平行,由前大众点评总经理牧遥负责,直接向CLC CEO王莆中汇报 。

  美团的野心 ,是成为未来本地生活需求的 “AI超级入口” 。这要求AI能精准理解用户需求并高效执行任务。王兴多次表示,要争取把美团App率先升级成“AI-powered App ” 。

  做万亿参数大模型,是战略的一部分。王兴曾用一个比喻说明问题:“虽然大模型越来越聪明。但我们可以想象 ,就算爱因斯坦当秘书,让他订一个餐厅,他依然不知道那个餐厅有没有座位 。这不是智力问题 ,而是信息问题 。 ”

  基于本地生活场景的复杂性,通用AI近来 还无法可靠地管理和保障现实世界中的服务体验。美团多年积累的结构性数据优势——覆盖全品类的本地服务 、实时信息、海量用户评价,以及履约基础设施 ,恰恰可以成为大模型训练的基础。

  这也关乎一笔“经济账” 。随着业务对AI依赖加深,API调用费将成为不小的投入。通过打造“技术闭环”,也有助于增强业务的灵活性与安全性。

  LongCat-2.0的价值 ,在于为美团的AI战略提供了底层能力支撑 ,帮助形成“基座模型+本地生活Agent+AI生态投资 ”的三层体系 。

  下面 ,就要看AI能力到底多大程度与业务肌理融合。毕竟,大模型的价值从来不在于它本身有多大 ,而在于它最终解决了什么实际问题。

(文章来源:上观新闻)

标签:

相关推荐

  • 伊朗任命革命卫队海军司令

    伊朗任命革命卫队海军司令

      据伊朗学生通讯社4日报道,伊朗伊斯兰革命卫队海军少将阿里·阿兹玛伊被任命为革命卫队海军司令。他此前担任革命卫队海军第五区司令。  报道说,阿兹玛伊就任后发表声明说,革命卫队海军将继续“守护霍尔木兹海峡”,延续已故比较高领袖的道路,以“尊严和力量”坚持维护正义。(文章来源:新华社)...

    2026/07/04
  • 伊朗驻华大使:计划按世界
通行标准对霍尔木兹海峡通航收服务费

    伊朗驻华大使:计划按世界 通行标准对霍尔木兹海峡通航收服务费

      中新社北京7月4日电(记者谢雁冰)伊朗驻华大使阿卜杜勒雷扎·拉赫马尼·法兹里4日在北京出席第〖Fourteen〗、届世界和平论坛期间接受媒体采访时表示,伊朗计划按照世界通行标准对霍尔木兹海峡通航收取服务费。  法兹里表示,在美以伊战争爆发前,霍尔木兹海峡通航一直畅通无阻。近来,伊朗也没有说要收(通行)费或关税,而是计划按照世界通行标准收取服务费...

    2026/07/04
  • 【21号天津限号,2121限号天津】

    【21号天津限号,2121限号天津】

    天津端午节限号吗026年天津端午节假期(6月19日至21日)期间,机动车尾号不限行,外埠号牌及本市区域号牌小客车高峰时段也不限行。以下为具体说明:限行政策依据根据天津市机动车限行交通管理措施规定,法定节假日期间通常不实施尾号限行及外埠号牌高峰限行政策。天津:天津市交通管理部门明确,2026年端午节期间(6月19日至21日)连续3天不限号。外埠号牌及本市区域...

    2026/07/04
  • 【今日限行萍乡限号吗,萍乡今天限行几号】

    【今日限行萍乡限号吗,萍乡今天限行几号】

    各地的车牌号是按照什么顺序排列的_哪些城市限号出行和3和4和5和0,临时号牌按尾号数限行,车牌尾号为英文字母的按“0”管理。尾号轮换限行:更多城市采用按星期固定尾号限行模式。例如:北京:周一限行尾号1和6,周二限行2和7,周三限行3和8,周四限行4和9,周五限行5和0。保定:以车牌最后一位阿拉伯数字为限行依据(若末位为字母则向前推一位数字),但具体限行尾号...

  • 世界疫情地区分布图/世界疫情疫情最新消息

    世界疫情地区分布图/世界疫情疫情最新消息

    特朗普出院!92所英国大学爆疫情曼大最严重!英国名校“团灭”?_百度...〖壹〗、截至2020年10月7日,英国92所大学爆发新冠疫情,曼彻斯特大学确诊病例比较多(1061例),但“英国名校‘团灭’”的说法过于夸张,罗素集团24所名校中仅帝国理工学院未报告确诊病例,其余均有少量或较多病例。【5.9新冠图表】意大利累计治愈超10万〖壹〗、意大利疫情核心数据...

  • 中融世界
信托,进入破产程序

    中融世界 信托,进入破产程序

      记者从黑龙江金融监管局了解到,根据《中融世界信托有限公司关于申请破产清算的请示》,根据《中国银保监会信托公司行政许可事项实施办法》(中国银行保险监督管理委员会令2020年第12号)等相关规定及国家金融监督管理总局授权,经审核,批复:同意中融世界信托有限公司依法进入破产程序。同时,要求中融世界信托有限公司严格按照有关法律法规要求开展后续工作,如遇重大...

    2026/07/04
  • 多股应声涨停!A股中报行情开启,12家上市公司净利比较高
同比预增超150%

    多股应声涨停!A股中报行情开启,12家上市公司净利比较高 同比预增超150%

      财联社7月4日讯(编辑平方)A股中报行情开启,披露业绩预告次日,优彩资源、永太科技、星网锐捷、福蓉科技(维权)、奥飞娱乐、北纬科技、圆通速递、卫星化学涨停,锐捷网络大涨超11%。此外,周二披露业绩预告的韶能股份、益生股份于周四收盘录得2连板,周三披露业绩预告的雷赛智能于周五收盘录得2连板。  据Choice数据统计显示,截至发稿,共有67家A股上市公...

    2026/07/04
  • 电车限号吗威海限行吗/威海机动车限号吗

    电车限号吗威海限行吗/威海机动车限号吗

    电车限号吗〖壹〗、在北京,纯电动车同样需要遵守限号限行规定。具体说明如下:限号限行政策:虽然新能源车享受一些优惠政策,但在北京,纯电动车仍需遵守与燃油车相同的限号限行规定。限行时间段:北京地区的私家车限号限行时间段是星期一到星期五的早上7:00至9:00和下午17:00至20:00。〖贰〗、电车(纯电动汽车)通常不受单双号限制,但具体需以当地政策为准。〖叁...

  • 博纳影业于冬:AI短剧冲击真人剧组,但内容质量并不好

    博纳影业于冬:AI短剧冲击真人剧组,但内容质量并不好

    专题:2026亚布力论坛创新年会  7月3日-4日,2026亚布力论坛创新年会在上海市举行。本次创新年会的主题是“创新驱动智启未来——十五五蓝图与企业机遇”。  博纳影业创始人、董事长兼总经理于冬谈到影视行业受到AI影响巨大,短短一夜之间,90%的真人短剧市场,被AIGC短剧彻底抢占。现在越来越多的竖屏拍摄场地没有剧组拍戏,大量真人剧组解散停工。 ...

    2026/07/04
  • 机器人出口每4元产值有1元深圳造 深圳机器人全球卖爆

    机器人出口每4元产值有1元深圳造 深圳机器人全球卖爆

      深圳海关最新统计数据显示,今年前4月深圳机器人出口额达40.3亿元,占全国同类产品出口总额的25.5%。这意味着,全国每4元机器人出口产值就有至少1元来自深圳,深圳机器人“出海”跑出加速度。依托完备的产业生态,大湾区将核心部件、整机、控制系统到集成服务压成一条“短链”,产品迭代速度快、交付能力灵活,深圳机器人如今已远销全球100多个国家和地区。(文章来源...

    2026/07/04
返回顶部