WebUI使用教程:ChatTTS-Forge可视化界面从零开始上手

【免费下载链接】ChatTTS-Forge 🍦 ChatTTS-Forge 提供了完善的 ChatTTS 封装,包括 API WebUI Playground 等,新功能持续开发中 🚀 【免费下载链接】ChatTTS-Forge 项目地址: https://gitcode.com/gh_mirrors/ch/ChatTTS-Forge

ChatTTS-Forge是一个功能完善的ChatTTS封装工具,提供了直观的WebUI界面,让用户能够轻松实现文本转语音功能。本教程将带你从零开始,快速掌握ChatTTS-Forge WebUI的使用方法,无需复杂的代码知识,只需简单几步即可生成高质量语音。

准备工作:安装与启动

在开始使用ChatTTS-Forge的WebUI之前,需要先完成项目的安装。首先,克隆仓库到本地:

git clone https://gitcode.com/gh_mirrors/ch/ChatTTS-Forge

进入项目目录后,按照官方文档的指引安装所需依赖。安装完成后,通过以下命令启动WebUI:

python webui.py

启动成功后,在浏览器中访问提示的本地地址(通常是 http://localhost:7860),即可进入ChatTTS-Forge的WebUI界面。

认识WebUI主界面

ChatTTS-Forge的WebUI界面设计直观,主要分为几个功能区域,让用户能够轻松找到并使用所需功能。

ChatTTS-Forge WebUI主界面

主界面上方有几个主要标签页,包括TTS、SSML、Long Text和README。TTS标签页是默认打开的,也是最常用的功能界面,用于基本的文本转语音操作。左侧是参数设置区域,包括采样参数、风格选择、 speaker设置等;中间是文本输入区域和音频输出区域;右侧则是高级设置,如Refiner功能。

基本文本转语音操作

在TTS标签页中,你可以快速将文本转换为语音。只需在"Text Input"框中输入想要转换的文本,然后选择合适的参数,点击"Generate Audio"按钮即可生成音频。

参数设置说明

  • Sampling参数:包括Temperature、Top P、Top K和Batch Size,这些参数会影响语音的生成质量和多样性。对于新手,建议使用默认值,之后可以根据生成效果进行调整。
  • Style:选择语音的风格,如"auto"、"assistant"等,不同的风格会带来不同的语音效果。
  • Speaker Name or Seed:选择不同的说话人,可以通过名称或种子值来指定。

设置好参数后,点击"Generate Audio"按钮,系统会开始生成音频。生成完成后,你可以在下方的音频播放器中收听结果,并可以下载音频文件。

长文本处理功能

对于较长的文本,ChatTTS-Forge提供了专门的Long Text标签页来处理。在这个界面中,你可以输入大段文本,系统会自动将其分割成合适的片段进行处理。

长文本处理界面

在Long Text界面,左侧可以设置说话人、风格和种子值,中间是长文本输入框。输入文本后,点击"Split Text"按钮,系统会将文本分割成多个短句,并显示在下方的表格中。你可以检查分割结果,如有需要可以手动调整。确认无误后,点击"Send to SSML"按钮,即可将分割后的文本发送到SSML标签页进行进一步处理。

自定义Speaker

ChatTTS-Forge允许用户创建和自定义自己的Speaker,这通过Speaker标签页中的Speaker Creator功能实现。

Speaker Creator界面

在Speaker Creator界面,你可以通过以下步骤创建自定义Speaker:

  1. 输入Seed值,或点击"Random Speaker"按钮随机生成一个Seed。
  2. 在"Name"、"Gender"和"Description"字段中填写Speaker的信息。
  3. 在"Test Text"框中输入测试文本,点击"Test Voice"按钮生成并试听语音效果。
  4. 满意后,点击"Generate speaker.pt"按钮生成Speaker文件,然后点击"Save.pt file"保存。

通过这种方式,你可以创建多个不同风格的Speaker,以满足不同的语音需求。

使用Playground进行高级操作

ChatTTS-Forge还提供了一个Playground界面,让用户可以更灵活地进行语音合成实验。

Playground界面

在Playground界面,你可以输入文本,选择Speaker、Style等参数,点击"Synthesize"按钮生成语音。生成的历史记录会显示在下方,包括每次生成的参数和音频结果,方便你对比不同参数的效果。这对于需要精细调整语音效果的用户来说非常有用。

总结

通过本教程,你已经了解了ChatTTS-Forge WebUI的基本使用方法,包括基本文本转语音、长文本处理、自定义Speaker和使用Playground进行高级操作。ChatTTS-Forge的WebUI界面友好,操作简单,即使是新手也能快速上手。如果你想进一步探索更多功能,可以查看项目中的官方文档 docs/readme.md,里面有更详细的功能介绍和使用技巧。

现在,你可以开始使用ChatTTS-Forge来生成自己想要的语音了!无论是制作语音助手、生成有声内容,还是其他语音相关的应用,ChatTTS-Forge都能为你提供强大的支持。

【免费下载链接】ChatTTS-Forge 🍦 ChatTTS-Forge 提供了完善的 ChatTTS 封装,包括 API WebUI Playground 等,新功能持续开发中 🚀 【免费下载链接】ChatTTS-Forge 项目地址: https://gitcode.com/gh_mirrors/ch/ChatTTS-Forge

更多推荐