AI 音频模型

AI 配音、文本转语音、音效生成等主流音频模型在线体验 · 当前共 8 个可用模型

适合承接 AI 配音模型、AI 语音合成、文本转语音、AI 音效生成、TTS 模型等搜索需求。

Suno Music 是 Kyeo AI 当前接入的成歌 / 配乐页,入口很窄:前台只让你决定写什么、选哪个 Suno 版本、要不要 `instrumental`。它不是把 Suno 整套 Custom Mode 原样搬进来,而是先把最常用的 Simple 路径收成一个能快速试歌的入口;等你拿到可用结果,再从结果页继续做 `extend` 或转 WAV,而不是一开始就把风格权重、Persona 和大堆高级参数堆在首屏。

文生音频

Suno Sounds 是 Kyeo AI 当前接入的短声音资产页,核心不是“做一首歌”,而是把环境声、转场音、鼓点 loop、短促氛围片段先做出来。当前前台只保留最常用的几个控制项:模型版本、要不要循环、BPM 和 Key;KIE 文档里提到的 `grabLyrics` 并没有直接开放,所以这页的真实边界就是一个更克制的声音素材入口。

文生音频

Suno Lyrics 是 Kyeo AI 当前接入的歌词草稿页,作用很单纯:先把主题、hook、段落结构和情绪方向写出来。它不会直接唱给你听,也不会顺手生成配乐;当前结果链只返回多份标题和歌词文本候选,所以这页更像成歌前的文案工作台,而不是音乐页的精简模式。

写歌词
歌词草稿

ElevenLabs Dialogue V3 是 Kyeo AI 当前接入的多角色对白页。它不是把一大段旁白丢进去的单人 TTS,而是要求你按 `dialogue[]` 一句一句写脚本、给每行选 voice 的对白工作流。当前站内它的价值不在“语音更自然”这句空话,而在于你终于可以直接测试多角色短剧、播客互动和人物来回说话时的节奏、区分度和总字数成本。

对话生音频

ElevenLabs Turbo 2.5 是 Kyeo AI 当前接入的低延迟单人配音页。它不是多角色对白页,也不是 Voice Library 全量入口,而是一条更适合短口播、快交付和批量试样的 `text-to-speech` 路线:固定语音角色列表、5,000 字符上限、按 1000 字符计费,并额外把 `timestamps` 和 `previous_text / next_text` 这种更贴近剪辑与续生成的参数放到了前台。

文生语音

ElevenLabs Multilingual V2 是 Kyeo AI 当前接入的单人高自然度配音页。它和 Turbo 2.5 共用近似的前台表单,但真正的任务边界并不一样:Turbo 更像快配音基线,Multilingual V2 更像长文本旁白、跨语言内容和品牌长期音色的主力页。当前站内它同样只走固定语音角色列表和 5,000 字符接入口,但决策重点已经从速度切到听感稳定性和值不值得付双倍字数成本。

文生语音

ElevenLabs Sound Effect V2 是 Kyeo AI 当前接入的文本生音效页。它不是配乐页,也不是后期清理工具,而是把一个短声音资产直接从文字描述里生出来:你可以决定要不要循环、要不要指定时长、要不要让 prompt 更严格,还能在前台直接选输出格式。真正的判断点不是“这个模型会不会说话”,而是这次要补的是一段可剪进项目里的音效,还是一条应该交给音乐 / 生成页处理的内容。

文生音频

ElevenLabs Audio Isolation 是 Kyeo AI 当前接入的音频清理页。它不是生新声音的模型,也不是语音转文字页,而是一条很窄的 `audio-to-audio` 后处理流程:只收 1 段现有音频,不展示 prompt,上游只吃 `audio_url`。真正的判断点不是“这个模型会不会生成更好听的声音”,而是你手里的录音值不值得先做一轮分离和去干扰,再进入后续剪辑或发布。

清理录音
分离人声