🎯 []标签功能:使用 [汉字] 或 [英文字母] 可将标签内容拆分为拼音拼读,例如:你好[世界],[hello]世界
开启后将对生成的音频进行质量检测,不合格时自动重试
阈值越高,音频质量要求越严格
质量检测失败时的最大重试次数
分析音频频谱特征,检测异常频率
检测背景噪音水平,确保音频清晰度
自动调整音频音量到标准水平
暂无自定义预设
⚙️ 高级参数设置
💡 提示:输入情感描述词可以更精确地控制语音的情感表达,如"温柔的"、"激动的"、"悲伤的"等

🎛️ GPT生成参数控制

🌡️ 控制生成的随机性:0=完全确定,1=平衡,2=高随机性
💡 较低值产生更一致的结果,较高值增加创造性和多样性
🎯 控制候选词汇范围:0.1=只考虑最可能的10%,1.0=考虑所有词汇
💡 较低值提高一致性,较高值增加词汇多样性
🔢 限制候选token数量:1=只选最可能的,100=考虑更多选择
💡 较小值提高确定性,较大值增加生成多样性
🔄 防止重复生成:1.0=无惩罚,1.5=适度惩罚,2.0=强烈惩罚
💡 较高值减少重复,但过高可能影响自然度
📏 控制生成长度:<1.0=偏向短序列,1.0=中性,>1.0=偏向长序列
💡 影响音频时长,根据需要调整
⏱️ 限制最大音频长度:300=短音频,1500=中等,3000=长音频
💡 防止生成过长音频,影响处理速度和内存使用
💡 手动设置非默认值时,将优先使用您的设置
启用后,单字符输入将使用完全确定的生成参数,确保每次生成的时长一致
💡 适用于需要精确时长控制的单字符语音合成场景,即使非单字符也可通过此模式控制生成
我的自定义预设:
暂无自定义预设
使用说明:
• 选择预设模板可快速应用专业配置
• 保存自定义预设可重复使用个人配置
• 导出/导入功能支持预设备份和分享