,Meta 继推出 ImageBind 之后,于今天再次推出了全新的生成式 AI 模型 Voicebox。该模型帮助创作者执行音频编辑、采样和风格化等语音生成任务,即便是普通用户也能轻松上手。
Meta 在介绍 Voicebox 模型时表示,视障人士可以听到好友的回复信息、普通用户可以用自己的语调、语气来说外语。
AI 模型本身可以生成高质量的音频剪辑,消除汽车喇叭等不必要的背景噪音,同时保留音频的内容和风格,同时使用多种语言,以六种语言生成语音。该模型的未来发展包括在元宇宙游戏中为视觉助理或非玩家角色提供自然的声音。
Meta 还比较了 Voicebox 和 Vall-E、YourTTS 等其它音频 AI 模型,表明 Voicebox 更先进,在比较单词错误率和样式相似性时优于两种模型。
IT之家在此附上详细新闻稿链接,感兴趣的用户可以点击阅读。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
证券之星消息:俗话说的好,“一方水土养一方人”,对于在外打拼不能...
所属公司:桂林临桂横山四方井食品有限公司法定代表人:刘*弟电话:...
所属公司:广西北部湾珠乡橄榄食品有限公司法定代表人:王*电话:0...
北京红螺食品有限公司是一家具有多年果品生产经验“中华老字号”企业...
钙尔奇,较早进入中国的国际钙补充剂品牌,被众多中国医学专家和营养...
统一企业于1967年7月1日成立于中国台湾台南,涉足食品、金融、...