OpenAI发布Sora,影视行业或迎巨变时刻。OpenAI发布Sora,可生成长达一分钟的视频。OpenAI正在教AI理解和模拟现实中的运动,以帮助人类解决与现实交互的问题。Sora是一种通用的视觉数据模型,它可以生成不同持续时间、纵横比和分辨率的视频和图像,最多可生成一整分钟的高清视频。从性能上看,首先,Sora具有可选择的视频时长、分辨率和画面比例。传统的视频和图像生成通常将视频素材裁剪或修剪为标准大小,Sora则以原生大小对数据进行训练,这种方式带来了灵活性及优化的取景和构图。其次,Sora具有很强的语言理解能力。OpenAI首先训练了一个高度描述性的字幕器模型,然后使用它为训练集中的视频生成文本字幕。OpenAI还利用GPT将简短的用户提示转换为更长的详细字幕,然后发送到视频模型,这使得Sora能够准确遵循用户提示生成高质量的视频。最后,除了用文本之外,Sora还可以用图像和视频进行提示,执行各种图像和视频编辑任务——创建完美循环的视频、为静态图像制作动画、在时间上向前或向后扩展视频等。
Google发布Genimi1.5,性能超越GPT-4Turbo。Genimi1.5是迄今谷歌的最大模型,目前已经发布了Genimi1.5Pro版本。Genimi1.5Pro带有128000个token的上下文窗口,开发人员和企业客户可以通过AIStudio和VertexAI在个人预览版本中试用最多100万个token的上下文窗口。这意味着Genimi1.5Pro可以一次性处理1小时的视频、11小时的音频、超过3万行代码和70万文字。架构方面,Genimi1.5建立在Transformer和MoE架构的研究之上。根据谷歌公布的论文数据,横向对比看,Genimi1.5Pro的文本、音视频处理能力几乎全面超越GPT-4Turbo。纵向对比看,Genimi1.5Pro性能大幅超越Genimi1.0Pro,小幅领先Genimi1.0Ultra。
Altman万亿美元融资曝光,AI芯片行业或将重塑。根据《华尔街日报》周四晚间的报道,奥特曼正考虑一个项目,旨在增加全球芯片制造能力,并已开始与各种投资者进行接触,其中包括阿联酋政府。若融资能落地,或将重塑半导体芯片行业。据半导体工业协会(SIA)预测,到2024年,全球芯片行业的销售额将增长13%,达到5953亿美元。这标志着与去年下跌8%相比的较大增长。而若以市值计算,如果奥特曼能够筹集到7万亿美元,他甚至可以收购整个芯片行业,包括Nvidia、TSMC、Broadcom、ASML、Samsung、AMD、Intel等公司。
暂无评论内容