Audiobox是Meta于2023年11月30日推出的免费开源的AI语音和声音生成模型,12月11日上线在线网页版本,用户可免费体验该模型的能力。Audiobox是Meta继Voicebox后推出的最新一代的音频生成模型,可以结合使用语音输入和自然语言文本提示来生成语音和音效,从而可以轻松地为各种用例创建逼真的自定义音频。Audiobox的主要功能克隆用户声音:录制声音按照用户的声音风格或以任意音频样本的风格生成语音文本描述生成人声:使用文本描述声音风格的特征以及声学环境生成人声更改声音风格:可结合声音和文本描述更改现有的声音风格本文描述生成音效:根据输入的声音特征文本描述生成声音效果噪音消除:提供MagicEraser功能消除录音中的瞬态噪声声音填充:根据文本描述用新的声音替换音频中的一部分音频故事制作器:结合以上功能,利用AudioboxMaker制作原创有趣的音频故事
数据统计
数据评估
关于Audiobox特别声明
本站嗨次元提供的Audiobox都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由嗨次元实际控制,在2025-03-21 10:24收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,嗨次元不承担任何责任。
相关导航

绘蛙AI视频
绘蛙AI视频是什么绘蛙AI视频是绘蛙推出的AI电商营销视频内容创作平台,帮助用户快速生成高质量的电商营销视频。平台提供多种功能,满足不同场景下的视频创作需求。用户可以通过上传单张全身模特图片或最多4张图片,AI技术生成动态视频。单图生成视频功能适合展示单个产品的动态效果,多图生成连贯短片功能适合制作展示多个产品或多个场景的视频内容。平台支持多种图片格式(jpg/jpeg/png/heic/webp),要求图片大小在20K到15M之间,分辨率大于600×800。可以选择视频的时长(如5秒或10秒)和画质,确保生成的视频符合高质量标准。绘蛙AI视频的主要功能图片生成视频:用户上传全身模特图,绘蛙AI能将静态图片转换成动态视频内容,增加商品展示的吸引力。多图生成连贯短片:用户可以上传最多4张图片,AI将这些图片组合成一个连贯的视频短片。大小20K~15M,分辨率大于600×800,支持jpg