AI音频工具
感受过Midjourney、SD等AI绘画工具带来的视觉震撼后,AI生成音频领域也正在掀起一场革命。
从震撼华语乐坛的AI歌手“孙燕姿”到霉霉说普通话的视频走红,AI音频生成产品在音乐创作、语音合成和音效设计等方面取得了显著的突破。
ElevenLabs
ElevenLabs是一个Text to Speech软件,可以通过将输入的文本转化成情感和语调都十分逼真的语音。
其背后的ElevenLabs是一家软件公司,专门利用人工智能和深度学习开发自然语音合成和文本转语音软件。
2023年6月,ElevenLabs筹集了1900万美元的A轮融资,估值约为1亿美元。
2023年10月,ElevenLabs推出“AI Dubbing”,这是一种能够将语音翻译成20多种语言,并且保留说话者原始语音、情感和语调的AI工具。
Suno AI
Suno AI是一个音乐生成模型,可以通过简短的文本提示生成音频,包括语音、音乐和音效。
其中,Suno AI的语音生成模型BaRK,可以根据用户需求生成各种语音,适用于广告、动画和游戏行业。
Suno AI的音乐生成模型Chirp可以生成包括乐器、歌词和人声演唱等在内的约30秒音乐片段,涵盖流行、古典、电子等多种音乐风格。
Suno AI的音效生成模型可以生成各种类型的音效,为音视频项目增添表现力、氛围感和情感。
Mubert
Mubert是一个AI音乐生成平台,用户可以在Mubert实时生成特定长度、风格流派和情绪的音乐,并支持自定义。主要面向音乐制作人、创作者和品牌,使他们在人工智能的帮助下创作免版税音乐。
Google MusicLM
Google MusicLM是谷歌开发的一个文本到音乐的生成模型,是“AI Test Kitchen”计划的一部分。
MusicLM可以从类似于自然语言提示的简单文本描述中创作高保真的音乐。它以24kHz的高采样率生成音乐,意味着生成的音频质量很高。此外,MusicLM的音乐生成速度非常快,几乎是即时的。
来源:头号AI玩家