Stability AI发布Stable Diffusion3.0,在图像质量、多个对象、拼写能力方面,都得到了显著提升。该模型采用了和爆火Sora同样的DiT架构,即扩散Transformer架构,目前,模型可选择的参数范围在800M到8B之间。模型可以通过学习如何从随机噪音顺利过渡到结构化图像来生成图像。我们认为,多模态进展催化不断,文生图、文生视频模型的不断演进,对于算力的需求有望持续,同时也有望加速AI相关应用的成熟及落地。
© 版权声明
免费分享是一种美德,知识的价值在于传播;
本站发布的图文只为交流分享,源自网络的图片与文字内容,其版权归原作者及网站所有。
THE END
暂无评论内容