【四海读报】20260105：人工智能行业专题（14）-四海清单

大模型发展趋势复盘与展望

【原报告在线阅读和下载】：20260105【MKList.com】人工智能行业专题（14）：大模型发展趋势复盘与展望 | 四海读报

【迅雷批量下载】：链接：https://pan.xunlei.com/s/VOXJ23RJHhoECPL5FRrVathfA1 提取码：umqb
【夸克批量下载】：链接：https://pan.quark.cn/s/fe42cc605010 提取码：j4Vv

1. 一段话总结

国信证券报告指出，2026年大模型行业将延续Scaling Law，推理侧需求迎来放量拐点，核心驱动来自多模态+长文本+强化学习技术成熟赋能Agent爆发；北美科技巨头2025年资本开支达4000亿美元（yoy+50%+），2026年预计增速30%+，但电力缺口成核心制约；技术端，后Transformer架构（Titans/Mamba-2/国产混合注意力）持续演进，中美模型差距缩小至3-6个月；应用端AI编程+Agent商业化落地最快（Cursor ARR达10亿美元），端侧（AI手机/眼镜）成为新增长点；投资主线聚焦算力与模型，重点关注谷歌、OpenAI、英伟达及国内技术突破厂商，同时需警惕宏观波动与技术迭代风险。

2. 思维导图

3. 详细总结

一、行业复盘：叙事演进与资本开支高增

股价叙事迭代
- 2023年：OpenAI引领AI浪潮，微软受益独家合作，估值抬升；
- 2024年：叙事转向推理侧，Meta（社交生态+广告）成除英伟达外唯一PE抬升巨头，云厂商因资本开支传导延迟估值回落；
- 2025年：谷歌Gemini反超，生态优势凸显，OpenAI模型差距收敛，市场追逐确定性；
- 2026年预测：推理侧需求放量，模型+算力成最优投资方向。
资本开支高增，电力成核心瓶颈
- 2025年：北美四大巨头（微软/亚马逊/谷歌/Meta）资本开支达4000亿美元（yoy+50%+），均超年初预期；
- 2026年：预计增速30%+，持续投入数据中心建设；
- 制约因素：北美2024-2029年数据中心需新增80GW电力需求，但煤电退役+变压器建设周期长（5-8年），电力缺口显现，巨头通过收购能源公司、海外拓展缓解。

二、技术演进：架构革新与能力升级

后Transformer架构崛起

架构类型	代表方案	核心优势	适用场景
海外创新	谷歌Titans	动态更新参数，支持200万+tokens长文本	生态闭环厂商
	Mamba-2	线性计算成本，长序列速度比Transformer快18倍	长文本处理
国产优化	Qwen3-Next	混合注意力+高稀疏MOE，训练成本降90%	算力受限场景
	Deepseek V3.2	动态稀疏注意力，128K tokens成本低至0.2美元/百万	商业落地场景

Scaling Law延续，强化学习成重点
- 预训练：合成数据+架构优化突破数据瓶颈，谷歌Gemini证明仍有提升空间；
- 中训练：介于预训练与后训练之间，用高质量数据定向提升垂直能力；
- 强化学习：RLVR（可验证奖励）成主流，Deepseek R1通过GRPO算法节省显存，2026年将扩展至更多领域。
多模态+长文本赋能Agent
- 多模态：从“文本+外挂”转向原生多模态（Gemini/Qwen3-Omni/Grok5），核心解决“统一tokens表示”问题；
- 长文本：Titans支持200万+tokens，Mamba-2、Qwen3-Next均实现长序列高效处理；
- Agent基础：推理+多模态+长文本能力成熟，2026年应用端将涌现更多成熟Agent产品。
中美模型差距
- 差距：3-6个月，核心在算力（美国占全球70%算力）与多模态算法；
- 国内优势：数据质量与丰富度无明显落后，算法聚焦训练推理效率提升。

三、巨头格局：路线分化，各有壁垒

厂商	核心路线	关键数据	2026展望
OpenAI	C端优先→发力企业业务	2025年用户8亿+，收入130亿美元；2028年目标1000亿美元	下一代模型基于英伟达B系列芯片，企业业务放量
Gemini（谷歌）	原生多模态+TPU生态闭环	2025年生成式AI流量份额领先，月度tokens接近1400万亿	Tokens消耗持续高增，生态优势强化
Anthropic	2B路线+编程优势	2025估值3500亿美元，ARR10亿美元；毛利率50%	2027年现金流转正，企业端份额提升
Grok（xAI）	大力出奇迹+特斯拉数据协同	2026年Grok5参数达6万亿；2025年算力集群目标30万GB200芯片	原生多模态模型落地，汽车场景协同

四、应用爆发：推理侧主导，场景多元化

推理侧需求核心特征
- Tokens消耗：2025年OpenRouter周度消耗从5000亿增至3.67万亿，编程场景占比50% 成主要驱动；
- 需求结构：2025年以厂商内部消耗为主（谷歌90%），2026年对外需求占比提升；
- SaaS市场：2029年规模达1万亿美元（2025年5800亿美元），通用型工具替代风险高，医疗/能源/会计等垂类风险低。

核心应用场景商业化数据

场景	代表产品	关键商业化数据
AI编程	Cursor	ARR达10亿美元，估值293亿美元
通用Agent	Manus	8个月ARR达1亿美元，被Meta收购
AI搜索→Agent	Perplexity	ARR近2亿美元，估值200亿美元
端侧-AI手机	豆包手机助手	系统级权限，支持跨应用操作
端侧-AI眼镜	雷朋AI眼镜	上线AI功能后销量增长10倍；2026年全球预计出货1000万台

分销伙伴需求崛起
- 大模型厂商发力企业业务（OpenAI Business/Gemini Enterprise），带动IBM、埃森哲等分销伙伴需求，IBM 2025Q3生成式AI订单达95亿美元。

五、投资建议与风险提示

投资建议：聚焦算力基础设施（英伟达、谷歌、阿里-W、百度-SW）与大模型厂商（谷歌、OpenAI、腾讯），关注AI编程、Agent、端侧落地相关标的；
风险提示：宏观经济波动、下游需求不及预期、核心技术升级滞后、AI平权竞争加剧影响云业务利润率。

4. 关键问题

问题1：2026年大模型行业的核心技术演进方向是什么？对产业有何影响？

答案：核心技术演进方向集中在三点：① 后Transformer架构普及，谷歌Titans（动态参数更新）、Mamba-2（线性计算成本）及国产混合注意力方案（Qwen3-Next/Deepseek V3.2）解决长文本与效率瓶颈；② Scaling Law全环节延续，预训练通过合成数据突破瓶颈，中训练定向提升垂直能力，强化学习（RLVR/GRPO）成为性能突破关键；③ 原生多模态成熟，解决“统一tokens表示”问题，赋能端侧落地。影响：技术成熟推动Agent爆发，推理侧需求放量；国产厂商通过效率优化缩小与海外差距；算力与电力成为核心资源约束，头部厂商生态优势进一步强化。

问题2：全球四大核心大模型厂商（OpenAI/Gemini/Anthropic/Grok）的竞争格局与差异化路线是什么？

答案：竞争格局呈现“技术引领+路线分化”特征，差异化显著：① OpenAI：C端壁垒（8亿用户）+ 企业业务拓展，2025年收130亿美元，优势在用户粘性与生态兼容性；② Gemini：技术引领，原生多模态+TPU生态闭环，成SOTA基准，优势在数据（YouTube/Wiki）与算力适配；③ Anthropic：2B路线+编程优势，毛利率50%（2025年），估值3500亿美元，优势在企业级稳定性与高利润率；④ Grok：“大力出奇迹”+特斯拉数据协同，聚焦参数规模（2026年Grok5达6万亿参数），优势在资金与垂直场景数据。2026年竞争焦点将集中在企业端份额与Agent落地能力。

问题3：2026年大模型应用端的爆发点在哪里？核心商业化数据支撑是什么？

答案：2026年应用爆发点集中在三大领域：① AI编程+Agent：AI编程（Cursor ARR10亿美元）、通用Agent（Manus 8个月ARR1亿）商业化落地最快，是当前原生AI应用中估值最高的赛道（Cursor估值293亿美元）；② 端侧落地：AI手机（系统级助手实现跨应用操作）、AI眼镜（2026年全球预计出货1000万台，雷朋眼镜销量增长10倍）成为新流量入口；③ 企业级分销：IBM、埃森哲等分销伙伴承接大模型企业落地需求，IBM 2025Q3生成式AI订单达95亿美元，带动咨询与系统重构需求。核心支撑：全球SOTA市场2029年将达1万亿美元，推理侧Tokens消耗2025年增长7倍，多模态技术成熟打开场景边界。

免费分享是一种美德，知识的价值在于传播；本站发布的图文只为交流分享，源自网络的图片与文字内容，其版权归原作者及网站所有。

THE END