3月29日OpenAI发布语音模型Voice Engine,其可根据输入文本和15秒音频样本生成逼真且情感丰富的声音。通过小范围测试,该模型的早期应用有为阅读障碍者和儿童提供阅读帮助、翻译视频和播客内容等。目前,基于对合成语音安全隐患、政治风险等因素的考量,OpenAI并未计划公开发布该模型,同时正积极部署安全措施,如为生成语音添加水印等。我们认为,Voice Engine有望为多模态模型生成内容提供语音支持,看好未来更生动多样的AI内容生成技术的发展。
© 版权声明
免费分享是一种美德,知识的价值在于传播;
本站发布的图文只为交流分享,源自网络的图片与文字内容,其版权归原作者及网站所有。
THE END
暂无评论内容