大模型发展趋势复盘与展望
【原报告在线阅读和下载】:20260105【MKList.com】人工智能行业专题(14):大模型发展趋势复盘与展望 | 四海读报
【迅雷批量下载】:链接:https://pan.xunlei.com/s/VOXJ23RJHhoECPL5FRrVathfA1 提取码:umqb
【夸克批量下载】:链接:https://pan.quark.cn/s/fe42cc605010 提取码:j4Vv

1. 一段话总结
国信证券报告指出,2026年大模型行业将延续Scaling Law,推理侧需求迎来放量拐点,核心驱动来自多模态+长文本+强化学习技术成熟赋能Agent爆发;北美科技巨头2025年资本开支达4000亿美元(yoy+50%+),2026年预计增速30%+,但电力缺口成核心制约;技术端,后Transformer架构(Titans/Mamba-2/国产混合注意力)持续演进,中美模型差距缩小至3-6个月;应用端AI编程+Agent商业化落地最快(Cursor ARR达10亿美元),端侧(AI手机/眼镜)成为新增长点;投资主线聚焦算力与模型,重点关注谷歌、OpenAI、英伟达及国内技术突破厂商,同时需警惕宏观波动与技术迭代风险。
2. 思维导图

3. 详细总结
一、行业复盘:叙事演进与资本开支高增
-
股价叙事迭代
- 2023年:OpenAI引领AI浪潮,微软受益独家合作,估值抬升;
- 2024年:叙事转向推理侧,Meta(社交生态+广告)成除英伟达外唯一PE抬升巨头,云厂商因资本开支传导延迟估值回落;
- 2025年:谷歌Gemini反超,生态优势凸显,OpenAI模型差距收敛,市场追逐确定性;
- 2026年预测:推理侧需求放量,模型+算力成最优投资方向。
-
资本开支高增,电力成核心瓶颈
- 2025年:北美四大巨头(微软/亚马逊/谷歌/Meta)资本开支达4000亿美元(yoy+50%+),均超年初预期;
- 2026年:预计增速30%+,持续投入数据中心建设;
- 制约因素:北美2024-2029年数据中心需新增80GW电力需求,但煤电退役+变压器建设周期长(5-8年),电力缺口显现,巨头通过收购能源公司、海外拓展缓解。
二、技术演进:架构革新与能力升级
-
后Transformer架构崛起
架构类型 代表方案 核心优势 适用场景 海外创新 谷歌Titans 动态更新参数,支持200万+tokens长文本 生态闭环厂商 Mamba-2 线性计算成本,长序列速度比Transformer快18倍 长文本处理 国产优化 Qwen3-Next 混合注意力+高稀疏MOE,训练成本降90% 算力受限场景 Deepseek V3.2 动态稀疏注意力,128K tokens成本低至0.2美元/百万 商业落地场景 -
Scaling Law延续,强化学习成重点
- 预训练:合成数据+架构优化突破数据瓶颈,谷歌Gemini证明仍有提升空间;
- 中训练:介于预训练与后训练之间,用高质量数据定向提升垂直能力;
- 强化学习:RLVR(可验证奖励)成主流,Deepseek R1通过GRPO算法节省显存,2026年将扩展至更多领域。
-
多模态+长文本赋能Agent
- 多模态:从“文本+外挂”转向原生多模态(Gemini/Qwen3-Omni/Grok5),核心解决“统一tokens表示”问题;
- 长文本:Titans支持200万+tokens,Mamba-2、Qwen3-Next均实现长序列高效处理;
- Agent基础:推理+多模态+长文本能力成熟,2026年应用端将涌现更多成熟Agent产品。
-
中美模型差距
- 差距:3-6个月,核心在算力(美国占全球70%算力)与多模态算法;
- 国内优势:数据质量与丰富度无明显落后,算法聚焦训练推理效率提升。
三、巨头格局:路线分化,各有壁垒
| 厂商 | 核心路线 | 关键数据 | 2026展望 |
|---|---|---|---|
| OpenAI | C端优先→发力企业业务 | 2025年用户8亿+,收入130亿美元;2028年目标1000亿美元 | 下一代模型基于英伟达B系列芯片,企业业务放量 |
| Gemini(谷歌) | 原生多模态+TPU生态闭环 | 2025年生成式AI流量份额领先,月度tokens接近1400万亿 | Tokens消耗持续高增,生态优势强化 |
| Anthropic | 2B路线+编程优势 | 2025估值3500亿美元,ARR10亿美元;毛利率50% | 2027年现金流转正,企业端份额提升 |
| Grok(xAI) | 大力出奇迹+特斯拉数据协同 | 2026年Grok5参数达6万亿;2025年算力集群目标30万GB200芯片 | 原生多模态模型落地,汽车场景协同 |
四、应用爆发:推理侧主导,场景多元化
-
推理侧需求核心特征
- Tokens消耗:2025年OpenRouter周度消耗从5000亿增至3.67万亿,编程场景占比50% 成主要驱动;
- 需求结构:2025年以厂商内部消耗为主(谷歌90%),2026年对外需求占比提升;
- SaaS市场:2029年规模达1万亿美元(2025年5800亿美元),通用型工具替代风险高,医疗/能源/会计等垂类风险低。
-
核心应用场景商业化数据
场景 代表产品 关键商业化数据 AI编程 Cursor ARR达10亿美元,估值293亿美元 通用Agent Manus 8个月ARR达1亿美元,被Meta收购 AI搜索→Agent Perplexity ARR近2亿美元,估值200亿美元 端侧-AI手机 豆包手机助手 系统级权限,支持跨应用操作 端侧-AI眼镜 雷朋AI眼镜 上线AI功能后销量增长10倍;2026年全球预计出货1000万台 -
分销伙伴需求崛起
- 大模型厂商发力企业业务(OpenAI Business/Gemini Enterprise),带动IBM、埃森哲等分销伙伴需求,IBM 2025Q3生成式AI订单达95亿美元。
五、投资建议与风险提示
- 投资建议:聚焦算力基础设施(英伟达、谷歌、阿里-W、百度-SW)与大模型厂商(谷歌、OpenAI、腾讯),关注AI编程、Agent、端侧落地相关标的;
- 风险提示:宏观经济波动、下游需求不及预期、核心技术升级滞后、AI平权竞争加剧影响云业务利润率。
4. 关键问题
问题1:2026年大模型行业的核心技术演进方向是什么?对产业有何影响?
答案:核心技术演进方向集中在三点:① 后Transformer架构普及,谷歌Titans(动态参数更新)、Mamba-2(线性计算成本)及国产混合注意力方案(Qwen3-Next/Deepseek V3.2)解决长文本与效率瓶颈;② Scaling Law全环节延续,预训练通过合成数据突破瓶颈,中训练定向提升垂直能力,强化学习(RLVR/GRPO)成为性能突破关键;③ 原生多模态成熟,解决“统一tokens表示”问题,赋能端侧落地。影响:技术成熟推动Agent爆发,推理侧需求放量;国产厂商通过效率优化缩小与海外差距;算力与电力成为核心资源约束,头部厂商生态优势进一步强化。
问题2:全球四大核心大模型厂商(OpenAI/Gemini/Anthropic/Grok)的竞争格局与差异化路线是什么?
答案:竞争格局呈现“技术引领+路线分化”特征,差异化显著:① OpenAI:C端壁垒(8亿用户)+ 企业业务拓展,2025年收130亿美元,优势在用户粘性与生态兼容性;② Gemini:技术引领,原生多模态+TPU生态闭环,成SOTA基准,优势在数据(YouTube/Wiki)与算力适配;③ Anthropic:2B路线+编程优势,毛利率50%(2025年),估值3500亿美元,优势在企业级稳定性与高利润率;④ Grok:“大力出奇迹”+特斯拉数据协同,聚焦参数规模(2026年Grok5达6万亿参数),优势在资金与垂直场景数据。2026年竞争焦点将集中在企业端份额与Agent落地能力。
问题3:2026年大模型应用端的爆发点在哪里?核心商业化数据支撑是什么?
答案:2026年应用爆发点集中在三大领域:① AI编程+Agent:AI编程(Cursor ARR10亿美元)、通用Agent(Manus 8个月ARR1亿)商业化落地最快,是当前原生AI应用中估值最高的赛道(Cursor估值293亿美元);② 端侧落地:AI手机(系统级助手实现跨应用操作)、AI眼镜(2026年全球预计出货1000万台,雷朋眼镜销量增长10倍)成为新流量入口;③ 企业级分销:IBM、埃森哲等分销伙伴承接大模型企业落地需求,IBM 2025Q3生成式AI订单达95亿美元,带动咨询与系统重构需求。核心支撑:全球SOTA市场2029年将达1万亿美元,推理侧Tokens消耗2025年增长7倍,多模态技术成熟打开场景边界。


















暂无评论内容