【四海读报】20260105:人工智能行业专题(14)

大模型发展趋势复盘与展望

【原报告在线阅读和下载】:20260105【MKList.com】人工智能行业专题(14):大模型发展趋势复盘与展望 | 四海读报

【迅雷批量下载】:链接:https://pan.xunlei.com/s/VOXJ23RJHhoECPL5FRrVathfA1     提取码:umqb
【夸克批量下载】:链接:https://pan.quark.cn/s/fe42cc605010   提取码:j4Vv

image

 

1. 一段话总结

国信证券报告指出,2026年大模型行业将延续Scaling Law推理侧需求迎来放量拐点,核心驱动来自多模态+长文本+强化学习技术成熟赋能Agent爆发;北美科技巨头2025年资本开支达4000亿美元(yoy+50%+),2026年预计增速30%+,但电力缺口成核心制约;技术端,后Transformer架构(Titans/Mamba-2/国产混合注意力)持续演进,中美模型差距缩小至3-6个月;应用端AI编程+Agent商业化落地最快(Cursor ARR达10亿美元),端侧(AI手机/眼镜)成为新增长点;投资主线聚焦算力与模型,重点关注谷歌、OpenAI、英伟达及国内技术突破厂商,同时需警惕宏观波动与技术迭代风险。


2. 思维导图

image

 


3. 详细总结

一、行业复盘:叙事演进与资本开支高增

  1. 股价叙事迭代

    • 2023年:OpenAI引领AI浪潮,微软受益独家合作,估值抬升;
    • 2024年:叙事转向推理侧,Meta(社交生态+广告)成除英伟达外唯一PE抬升巨头,云厂商因资本开支传导延迟估值回落;
    • 2025年:谷歌Gemini反超,生态优势凸显,OpenAI模型差距收敛,市场追逐确定性;
    • 2026年预测:推理侧需求放量,模型+算力成最优投资方向。
  2. 资本开支高增,电力成核心瓶颈

    • 2025年:北美四大巨头(微软/亚马逊/谷歌/Meta)资本开支达4000亿美元(yoy+50%+),均超年初预期;
    • 2026年:预计增速30%+,持续投入数据中心建设;
    • 制约因素:北美2024-2029年数据中心需新增80GW电力需求,但煤电退役+变压器建设周期长(5-8年),电力缺口显现,巨头通过收购能源公司、海外拓展缓解。

二、技术演进:架构革新与能力升级

  1. 后Transformer架构崛起

    架构类型 代表方案 核心优势 适用场景
    海外创新 谷歌Titans 动态更新参数,支持200万+tokens长文本 生态闭环厂商
      Mamba-2 线性计算成本,长序列速度比Transformer快18倍 长文本处理
    国产优化 Qwen3-Next 混合注意力+高稀疏MOE,训练成本降90% 算力受限场景
      Deepseek V3.2 动态稀疏注意力,128K tokens成本低至0.2美元/百万 商业落地场景
  2. Scaling Law延续,强化学习成重点

    • 预训练:合成数据+架构优化突破数据瓶颈,谷歌Gemini证明仍有提升空间;
    • 中训练:介于预训练与后训练之间,用高质量数据定向提升垂直能力;
    • 强化学习:RLVR(可验证奖励)成主流,Deepseek R1通过GRPO算法节省显存,2026年将扩展至更多领域。
  3. 多模态+长文本赋能Agent

    • 多模态:从“文本+外挂”转向原生多模态(Gemini/Qwen3-Omni/Grok5),核心解决“统一tokens表示”问题;
    • 长文本:Titans支持200万+tokens,Mamba-2、Qwen3-Next均实现长序列高效处理;
    • Agent基础:推理+多模态+长文本能力成熟,2026年应用端将涌现更多成熟Agent产品。
  4. 中美模型差距

    • 差距:3-6个月,核心在算力(美国占全球70%算力)与多模态算法;
    • 国内优势:数据质量与丰富度无明显落后,算法聚焦训练推理效率提升。

三、巨头格局:路线分化,各有壁垒

厂商 核心路线 关键数据 2026展望
OpenAI C端优先→发力企业业务 2025年用户8亿+,收入130亿美元;2028年目标1000亿美元 下一代模型基于英伟达B系列芯片,企业业务放量
Gemini(谷歌) 原生多模态+TPU生态闭环 2025年生成式AI流量份额领先,月度tokens接近1400万亿 Tokens消耗持续高增,生态优势强化
Anthropic 2B路线+编程优势 2025估值3500亿美元,ARR10亿美元;毛利率50% 2027年现金流转正,企业端份额提升
Grok(xAI) 大力出奇迹+特斯拉数据协同 2026年Grok5参数达6万亿;2025年算力集群目标30万GB200芯片 原生多模态模型落地,汽车场景协同

四、应用爆发:推理侧主导,场景多元化

  1. 推理侧需求核心特征

    • Tokens消耗:2025年OpenRouter周度消耗从5000亿增至3.67万亿,编程场景占比50% 成主要驱动;
    • 需求结构:2025年以厂商内部消耗为主(谷歌90%),2026年对外需求占比提升;
    • SaaS市场:2029年规模达1万亿美元(2025年5800亿美元),通用型工具替代风险高,医疗/能源/会计等垂类风险低。
  2. 核心应用场景商业化数据

    场景 代表产品 关键商业化数据
    AI编程 Cursor ARR达10亿美元,估值293亿美元
    通用Agent Manus 8个月ARR达1亿美元,被Meta收购
    AI搜索→Agent Perplexity ARR近2亿美元,估值200亿美元
    端侧-AI手机 豆包手机助手 系统级权限,支持跨应用操作
    端侧-AI眼镜 雷朋AI眼镜 上线AI功能后销量增长10倍;2026年全球预计出货1000万台
  3. 分销伙伴需求崛起

    • 大模型厂商发力企业业务(OpenAI Business/Gemini Enterprise),带动IBM、埃森哲等分销伙伴需求,IBM 2025Q3生成式AI订单达95亿美元。

五、投资建议与风险提示

  • 投资建议:聚焦算力基础设施(英伟达、谷歌、阿里-W、百度-SW)与大模型厂商(谷歌、OpenAI、腾讯),关注AI编程、Agent、端侧落地相关标的;
  • 风险提示:宏观经济波动、下游需求不及预期、核心技术升级滞后、AI平权竞争加剧影响云业务利润率。

4. 关键问题

问题1:2026年大模型行业的核心技术演进方向是什么?对产业有何影响?

答案:核心技术演进方向集中在三点:① 后Transformer架构普及,谷歌Titans(动态参数更新)、Mamba-2(线性计算成本)及国产混合注意力方案(Qwen3-Next/Deepseek V3.2)解决长文本与效率瓶颈;② Scaling Law全环节延续,预训练通过合成数据突破瓶颈,中训练定向提升垂直能力,强化学习(RLVR/GRPO)成为性能突破关键;③ 原生多模态成熟,解决“统一tokens表示”问题,赋能端侧落地。影响:技术成熟推动Agent爆发,推理侧需求放量;国产厂商通过效率优化缩小与海外差距;算力与电力成为核心资源约束,头部厂商生态优势进一步强化。

问题2:全球四大核心大模型厂商(OpenAI/Gemini/Anthropic/Grok)的竞争格局与差异化路线是什么?

答案:竞争格局呈现“技术引领+路线分化”特征,差异化显著:① OpenAI:C端壁垒(8亿用户)+ 企业业务拓展,2025年收130亿美元,优势在用户粘性与生态兼容性;② Gemini:技术引领,原生多模态+TPU生态闭环,成SOTA基准,优势在数据(YouTube/Wiki)与算力适配;③ Anthropic:2B路线+编程优势,毛利率50%(2025年),估值3500亿美元,优势在企业级稳定性与高利润率;④ Grok:“大力出奇迹”+特斯拉数据协同,聚焦参数规模(2026年Grok5达6万亿参数),优势在资金与垂直场景数据。2026年竞争焦点将集中在企业端份额与Agent落地能力。

问题3:2026年大模型应用端的爆发点在哪里?核心商业化数据支撑是什么?

答案:2026年应用爆发点集中在三大领域:① AI编程+Agent:AI编程(Cursor ARR10亿美元)、通用Agent(Manus 8个月ARR1亿)商业化落地最快,是当前原生AI应用中估值最高的赛道(Cursor估值293亿美元);② 端侧落地:AI手机(系统级助手实现跨应用操作)、AI眼镜(2026年全球预计出货1000万台,雷朋眼镜销量增长10倍)成为新流量入口;③ 企业级分销:IBM、埃森哲等分销伙伴承接大模型企业落地需求,IBM 2025Q3生成式AI订单达95亿美元,带动咨询与系统重构需求。核心支撑:全球SOTA市场2029年将达1万亿美元,推理侧Tokens消耗2025年增长7倍,多模态技术成熟打开场景边界。

© 版权声明
THE END
如本文“对您有用”,欢迎随意打赏作者!
点赞10打赏作者 分享
评论 抢沙发

    暂无评论内容