使用豆包大模型语音合成API生成语音文件

豆包语音合成API使用指南：注册火山引擎账号后获取APPID和AccessToken，下载Demo工程并配置参数（包括音色类型、文本内容等），通过VS2026编译运行即可生成.wav音频文件。注意部分缩写（如"2B"）的读音可能不符合预期。GitHub提供简化参数的Demo工程供参考。

PascalMing · 2025-11-10 16:51:55 发布

豆包的音色比较好听，试了一下使用C#输入文本，调用远程API，生成音频文件，还是比较简单。

1、首先，开通豆包的火山引擎

输入账号登录-火山引擎，按提示进行注册即可。

主要是APP ID和Access Token，按下图方法查看。这里需要稍微注意一下，不要到“API Key 管理”中去找。

demo使用"豆包语音合成模型1.0" 音色列表，路径如下：

解压Demo后有两个文件，使用Vs2026打开两个工程文件，设置“Volcengine.Speech.Binary”为运行工程，引用项目“Speech.Protocols”。

输入的调试参数：--appid <appid> --access_token <access_token> --voice_type <voice_type> --text "**你好**，这是一个测试文本。我们正在测试文本转语音功能。"

<appid>、<access_token>、<voice_type>替换为上面步骤获取的值。

运行成功后，会在运行目录下生成.wav文件。

部分缩写不如人意，比如“2B市场”读为2B，而不是ToB。

更多推荐

阿里云 Coding Plan Lite 下架，各家算力吃紧，上哪买还能支持GLM-5和5.1的coding plan？_2026-04-15

看遍了市面上的coding plan，我发现还是这个好用

Kandinsky-5.0-I2V-Lite-5s惊艳效果展示：赛博朋克街景→霓虹闪烁+雨滴滑落动态视频

本文介绍了如何在星图GPU平台上自动化部署Kandinsky-5.0-I2V-Lite-5s镜像，实现高效图生视频转换。该工具能将静态赛博朋克街景图片快速转换为动态视频，添加霓虹闪烁、雨滴滑落等效果，适用于短视频制作、广告创意等场景，显著提升内容创作效率。

查看更多评论

已为社区贡献1条内容