2024Week07:通信行业周报:AI关键词“OpenAI入局算力、Sora与RTX-AI”

春节期间,全球AI热点涌现,利好频出。OpenAI带头执行AI芯片投资计划并发布文生视频新品Sora,英伟达正式发布此前已经有所展示的AI本地部署RAG工具Chat with RTX,谷歌更新Gemini至1.5版本。   

OpenAI宏伟投资计划,剑指改革全球半导体。据华尔街日报消息,OpenAI正在打造全球芯片供应链,来彻底重塑全球半导体行业,Altman一直在关注AI芯片的供需问题,2018年,Altman个人投资了一家AI芯片初创公司Rain Neuromorphics,2019年,OpenAI花费5100万美元购买Rain的芯片;去年11月,Altman为一家代号为“Tigris”的芯片企业寻求数十亿美元的资金。我们认为,从远期来看,算力需求或持续超出我们的想象,如果仅依靠台积电的先进制程产能进行供应,或难以满足未来AI用户持续增长带来的供应缺口,而另起炉灶,构建一套由OpenAI自己领导的算力产业链,当下来看是OpenAI切入基础设施领域的可行方案。   

文生视频大模型Sora横空出世,其能够理解并呈现物理定律,影视动画行业的颠覆性时刻到来。Sora虽然仍旧使用Transformer架构和基于扩散模型,但最大变化在于其能够在生成的视频中展现出火焰反光、物体运动惯性等自然界规律;同时相较于其他扩散模型,视频可以保持相当高的稳定性和一致性,因此,Sora呈现的AI视频给用户一种连续性强、符合逻辑、具有一定观赏性的感觉。最重要的是,Sora依旧符合AI缩尺律(Scaling Law),OpenAI在技术文档中说明,随着训练计算量的增加,样本质量明显提高,进一步佐证了多模态时代,算力需求将成为最核心的瓶颈之一。   

Gemini1.5将实现大模型最大的上下文窗口。相较于Gemini1.0,1.5最主要的改进是处理大文件的能力,Gemini1.5Pro每次可以处理100万个token,结合原生多模态能力,其可以一次性处理大量信息,例如1小时的视频、11小时的音频、超过3万行(或70万个单词)的代码。Gemini基于MoE(Mixture-of-Experts)专家网络,根据给定的输入,MoE模型将选择性地激活其神经网络中最相关的专家路径,从而极大提高模型效率。   

Chat with RTX——AI助理的一小步,边缘推理的一大步。该工具可以使用Mistral、Llama2等开源模型,帮助用户阅读文档/视频并通过检索增强生成(RAG)总结文件内容,全程由本地RTX显卡进行推理。我们认为,边缘推理是AI触及广大潜在用户的“毛细血管”,世界经济论坛在最近的一份报告中预测,能够离线运行生成式AI模型的设备将“大幅增长”,其中包括个人电脑、智能手机、物联网设备等,原因在于,本地模型不仅更加私密,而且与云托管模型相比,本地模型的延迟更低,成本效益更高。   

总结来看,近期的AI行业新闻,在模型层面各家激战正酣,同时在ScalingLaw不断应验的事实下,我们此前对算力需求充分乐观的观点将持续被验证,AI算力有望继2023年后,继续成为新一年的热门投资方向。

2024Week07:通信行业周报:AI关键词“OpenAI入局算力、Sora与RTX-AI”-四海清单
2024Week07:通信行业周报:AI关键词“OpenAI入局算力、Sora与RTX-AI”
此内容为付费资源,请付费后查看
6积分
知识免费:免登录即可查看本站所有文档内容,包括付费下载的文档内容; 文档下载:注册登录签到、评论、发帖等即可免费获得积分用于下载文档;或下方直接打赏作者单独发送;VIP会员免费下载; 付费下载:可编辑的PPT等office文档,用于提升工作效率;点击购买支付后直接下载文档;VIP会员可免费下载;
付费资源
© 版权声明
THE END
如本文“对您有用”,欢迎随意打赏作者!
点赞8打赏作者 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容