AI 音频模型
ElevenLabs
ElevenLabs Dialogue

ElevenLabs Dialogue V3

ElevenLabs Dialogue V3 是 Kyeo AI 当前接入的多角色对白页。它不是把一大段旁白丢进去的单人 TTS,而是要求你按 `dialogue[]` 一句一句写脚本、给每行选 voice 的对白工作流。当前站内它的价值不在“语音更自然”这句空话,而在于你终于可以直接测试多角色短剧、播客互动和人物来回说话时的节奏、区分度和总字数成本。

能力标签
对话生音频
积分消耗
14 积分 / 1000 字符
提示词上限
5,000 字符
上传限制
未公开
当前只承接 `dialogue-to-audio`,不是普通单人 TTS 页
当前脚本核心是 `dialogue[]`,每行都要带 `text + voice`
当前按对白总字数计费:`14` 积分 / 1000 字符,向上取整
更适合 15 到 30 秒的多人对白样本,不该写成实时对话页
30 秒了解
ElevenLabs Dialogue
14 积分 / 1000 字符
它擅长什么
当前站内的 Dialogue V3 更像脚本对白页,而不是配音基线页。它适合在多人互动、来回接话和角色情绪转换里做真实测试,而不是拿来替代普通单人旁白。
适合谁用
适合播客对白、短剧脚本、角色互动音频、多人讲述节目和需要一句句分配声音的对白任务。
大家都在搜
ElevenLabs Dialogue V3 怎么用ElevenLabs Dialogue V3 价格ElevenLabs Dialogue V3 多角色对白

一句话了解

这个模型怎么样?

ElevenLabs Dialogue V3 当前已经接入 Kyeo AI 的AI 音频模型工作流。相比只看模型名或外部宣传页,这个页面更关注真正影响选型的内容,包括能力标签、成本结构、参数控制、上传限制、适用任务与替代候选。对于想做长期模型运营和 SEO 内容沉淀的站点来说,这些信息比一句“最好用”更有价值。

它擅长什么
当前站内的 Dialogue V3 更像脚本对白页,而不是配音基线页。它适合在多人互动、来回接话和角色情绪转换里做真实测试,而不是拿来替代普通单人旁白。
适合谁用
适合播客对白、短剧脚本、角色互动音频、多人讲述节目和需要一句句分配声音的对白任务。
为什么在 Kyeo AI 用
Kyeo 已经把 Dialogue V3 的关键边界收得很清楚:这是 `dialogue[]` 工作流,不是普通 prompt;每一行都可以指定 voice,总字数单独计费。对做多人音频的人来说,这比继续把它写成普通 TTS 页有用得多。

关键参数一览

帮你快速评估这个模型和你的业务场景是否匹配。

模型类别
AI 音频模型
厂商
ElevenLabs
模型家族
ElevenLabs Dialogue
接入提供方
KIE
平台模型标识
elevenlabs/text-to-dialogue-v3
运行方式
异步任务
提示词上限
5,000 字符
上传限制
未公开

它还叫什么

同一个模型在官方文档、社区讨论和 API 接入层可能有不同叫法,这里帮你统一整理。

elevenlabs/text-to-dialogue-v3
Eleven v3
Dialogue Mode

用户常见问题

这些问题和关键词结合公开资料、同类页面写法和当前站内接入边界整理,帮你更快做出选择。

ElevenLabs Dialogue V3 怎么用
ElevenLabs Dialogue V3 价格
ElevenLabs Dialogue V3 多角色对白
ElevenLabs Dialogue V3 dialogue 数组
ElevenLabs Dialogue V3 default_voice
ElevenLabs Dialogue V3 和 Turbo 2.5 区别
ElevenLabs Dialogue V3 和 Multilingual V2 区别
ElevenLabs Dialogue V3 适合播客对白吗
ElevenLabs Dialogue V3 适合短剧配音吗
ElevenLabs Dialogue V3 1000 字符 14 积分

选型指南

还在纠结用哪个模型?先看这几个关键决策点。

1
什么时候优先选它

如果你的任务天生就是两人或多人对白、需要一行一行分配角色、还想直接比较接话节奏和角色区分度,Dialogue V3 更适合作为第一批测试对象。

2
什么时候先比较别的模型

如果你只是做单人旁白、广告口播或课程讲解,就先回到 Turbo 2.5 或 Multilingual V2;Dialogue V3 的价值在脚本化对白,而不是拿来替代普通 TTS。

3
最小验证路径

先写一段 15 到 30 秒、2 到 3 个角色的真实小样本,每个角色至少说两句。只有这种结构,才能真正看清 Dialogue V3 值不值得放进你的多人音频流程。

用户常搜的对比

这些是用户在搜索引擎里真正会搜的对比问题,帮你快速定位差异。

ElevenLabs Dialogue V3 和 ElevenLabs Multilingual V2 区别
ElevenLabs Dialogue V3 vs ElevenLabs Multilingual V2
ElevenLabs Dialogue V3 和 ElevenLabs Turbo 2.5 区别
ElevenLabs Dialogue V3 vs ElevenLabs Turbo 2.5

模型横向对比表

正在纠结选哪个?这张表帮你一眼看清当前模型和替代方案的核心差异。

对比维度
ElevenLabs Dialogue V3
ElevenLabs Multilingual V2
ElevenLabs Turbo 2.5
当前站内角色
脚本化多角色对白页
高自然度单人配音主力页
低延迟单人配音基线页
当前核心输入
`dialogue[]` 每行 `text + voice`
单段文本 + 单人 voice
单段文本 + 单人 voice + 时间戳 / 前后文
当前价格口径
14 积分 / 1000 字符
12 积分 / 1000 字符
6 积分 / 1000 字符
更适合的任务
播客对白、短剧和多人互动片段
长旁白、跨语言内容和正式单人配音
短口播、快交付和剪辑友好的单人 TTS

实际使用体验

不是复读官网宣传,而是基于真实使用场景的观察和判断。

这页最容易被误写成“更强的 TTS”,但其实不是

Dialogue V3 当前站内的本质是脚本结构变化,而不是普通单人 TTS 的升级版。只要继续用“自然度、多语言、低延迟”那套模板去写,它就一定会走偏。

多人对白页最该先测的是接话,不是单句质感

很多人会先听某一句像不像真人,但 Dialogue V3 真正该比的是多人来回说话时的节奏、区分度和整体戏感。这个指标比单句音色更接近真实可用率。

能力详解

当前接入是脚本化对白结构,不是单段旁白

以 KIE 文档、Workbench 交互和 seed model 为准,Dialogue V3 当前核心输入不是一段普通文本,而是 `dialogue[]` 数组。每一行台词都要指定 `text` 和 `voice`,这让它的产品心智和 Turbo / Multilingual 完全不同。

多角色区分比单人自然度更重要

ElevenLabs 官方把 Dialogue mode 明确定位成多说话人、多情绪和自然接话的结构化场景。对这页来说,最值得先比的不是单句“像不像真人”,而是角色切换清不清、来回接话顺不顺、不同 voice 会不会混。

按总字数计费,会把对白脚本写法放大成成本问题

当前站内按 `dialogue[]` 里所有文本的总字符数计费:`14 / 1000 字符`。对白越碎、角色越多、返工越频繁,预算差就越明显,所以这页不适合在脚本都没梳理好时直接重跑很多轮。

适合做什么

短剧和角色互动样本

适合用 15 到 30 秒的小段对白先看角色区分和接话节奏,而不是一上来就做长剧情。

播客主持 / 嘉宾来回说话

适合两人或多人之间需要明显分工、不同音色和清晰接话关系的节目片段。

多角色产品演绎或品牌角色化内容

适合需要人物感、互动感和更明显角色边界的音频内容。

提示词技巧

一行一句,先把角色边界写清

当前这页最重要的不是修辞,而是脚本结构。每句该谁说、说到哪里停、下一句谁接,都应该先写清楚。

先用短样本看区分度

对 Dialogue V3 来说,更稳的做法通常是先做 15 到 30 秒的真实对白样本,而不是直接把长剧情整段丢进去。

默认 voice 只是兜底,不是主控制项

真正决定结果的还是 `dialogue[]` 里每一行的 voice。`default_voice` 更像兜底项,不是替代逐行分配的核心参数。

为什么选它

当前站内已是明确的 `dialogue[]` 多角色对白工作流。
每行台词可以独立分配 voice,更适合脚本化互动内容。
更适合测试角色区分、接话节奏和多人听感。
和单人 TTS 页的边界清楚,不容易再混页。

使用前要知道

当前不是普通单人旁白页,也不适合被当成实时对话页。
对话脚本越碎,返工和字数成本越明显。
角色越多,越需要先用短样本抽听。
如果你只是做单人长旁白,这页通常不如 Multilingual V2 或 Turbo 2.5 直接。

可调参数

帮你快速评估这个模型和你的业务场景是否匹配。

默认语音角色
default_voice
可选
参数类型: select
默认值: pNInz6obpgDQGcFmaJgB
Adam
Alice
Bill
Brian
Callum
Charlie
可选项 20 个
稳定性
stability
可选
参数类型: select
默认值: 0.5
0.0
0.5
1.0
语言代码
language_code
可选
参数类型: text

积分消耗

14 积分 / 1000 字符

当前 Kyeo AI 按 `dialogue[]` 里所有台词文本的总字符数计费:每 1000 字符 14 积分,向上取整;不是固定按次收费。

省钱小技巧

批量出图或出视频前,建议先用同一组素材在当前模型和同类候选之间做 AB 测试,确认效果后再批量跑,避免浪费积分。

常见问题

同类模型推荐

还没决定用哪个?顺手对比一下这几个同类候选。

ElevenLabs Multilingual V2

ElevenLabs Multilingual V2 是 Kyeo AI 当前接入的单人高自然度配音页。它和 Turbo 2.5 共用近似的前台表单,但真正的任务边界并不一样:Turbo 更像快配音基线,Multilingual V2 更像长文本旁白、跨语言内容和品牌长期音色的主力页。当前站内它同样只走固定语音角色列表和 5,000 字符接入口,但决策重点已经从速度切到听感稳定性和值不值得付双倍字数成本。

AI 音频模型
12 积分 / 1000 字符

ElevenLabs Turbo 2.5

ElevenLabs Turbo 2.5 是 Kyeo AI 当前接入的低延迟单人配音页。它不是多角色对白页,也不是 Voice Library 全量入口,而是一条更适合短口播、快交付和批量试样的 `text-to-speech` 路线:固定语音角色列表、5,000 字符上限、按 1000 字符计费,并额外把 `timestamps` 和 `previous_text / next_text` 这种更贴近剪辑与续生成的参数放到了前台。

AI 音频模型
6 积分 / 1000 字符

Suno Music

Suno Music 是 Kyeo AI 当前接入的成歌 / 配乐页,入口很窄:前台只让你决定写什么、选哪个 Suno 版本、要不要 `instrumental`。它不是把 Suno 整套 Custom Mode 原样搬进来,而是先把最常用的 Simple 路径收成一个能快速试歌的入口;等你拿到可用结果,再从结果页继续做 `extend` 或转 WAV,而不是一开始就把风格权重、Persona 和大堆高级参数堆在首屏。

AI 音频模型
生成 / 延长 12 积分 / 次

信息来源

页面内容基于厂商资料、模型家族说明和 Kyeo AI 平台接入配置整理。

来源说明

当前页面优先以 ElevenLabs 官方 Eleven v3 / Dialogue mode 说明、工作区 KIE《ElevenLabs 对话文生语音 V3》与《ElevenLabs 定价说明》,以及 Kyeo 平台实际接入配置为准。当前站内版本只承接 `dialogue-to-audio`,工作流核心是 `dialogue[]` 多行对白数组,每行都要带 `text + voice`;前台额外开放 `default_voice`、`stability(0/0.5/1)` 与 `language_code`。它不是普通单人 TTS 页,也不是实时对话页。

最后更新: 2026-04-14
ElevenLabs Help: What is Eleven v3?
官方
查看原始来源
ElevenLabs Help: What is Dialogue mode?
官方
查看原始来源
ElevenLabs Docs: Models
官方
查看原始来源
KIE Docs: ElevenLabs 对话文生语音 V3
接入

当前 KIE 文档明确给出 `dialogue[]`、每行 `text + voice`、`stability(0/0.5/1)` 与 `language_code`。

KIE Docs: ElevenLabs 定价说明
接入

当前工作区价格说明明确记录 Dialogue V3 为 `14 / 1000 characters`。

Kyeo 平台模型接入配置
接入

当前站内接入模型标识为 elevenlabs/text-to-dialogue-v3,页面中的参数上限、前台控制项与计费方式也以 Kyeo 平台实际接入为准。