Gemini1.5pro、Sora相继发布,AGI时代加速到来。北京时间2月15日,谷歌发布Gemini1.5Pro,在处理大量视频、文本和图像的能力上得到增强。开发者能向Gemini1.5Pro最多提交100万个tokens,相当于大约1小时的视频、11小时的音频或700000字文本数据规模。随即OpenAI发布文生视频模型Sora,可以用文字指令生成长达60秒的高清流畅视频,在生成视频长度、连贯性、多镜头切换方面具备显著优势。相较于此前文生视频模型Runway、Pika、Stable Video实现跨代级提升。我们认为,海外科技巨头对多模态大模型升级迭代速度远超预期,Sora可以模拟以简单方式影响世界状态的动作,通用人工智能时代或将提前到来。
登录后可在下方直接下载文档
© 版权声明
免费分享是一种美德,知识的价值在于传播;
本站发布的图文只为交流分享,源自网络的图片与文字内容,其版权归原作者及网站所有。
THE END
暂无评论内容