语音合成

文章/答案/技术大牛

发布

首页标签语音合成

#语音合成

拟真高效的文本转语音服务

Spring Boot 集成免费的 EdgeTTS 实现文本转语音

程序猿DD 11小时前2025-10-14 15:44:04

在需要文本转语音（TTS）的应用场景中（如语音助手、语音通知、内容播报等），Java生态缺少类似Python生态的Edge TTS 客户端库。不过没关系，现在可...

1300

ESP32 实现人体检测触发天气播报

金鹏 3天前2025-10-11 07:45:24

服务端代码跑在本地电脑，用flask实现。使用到了高德的天气API，腾讯的TTS，都有免费的额度可以申请。代码也极其简单，参考如下：

10721

如何防范利用深度合成技术的钓鱼欺诈

草竹道人

中国互联网络信息中心｜工程师 (已认证)

5天前2025-10-09 14:07:08

深度合成技术是指基于深度学习（Deep Learning）和生成式人工智能（Generative AI）的算法，对图像、视频、音频、文本等数字内容进行生成、编辑...

9810

如何防范利用深度合成技术的钓鱼欺诈

草竹道人

中国互联网络信息中心｜工程师 (已认证)

5天前2025-10-09 14:07:08

深度合成技术是指基于深度学习（Deep Learning）和生成式人工智能（Generative AI）的算法，对图像、视频、音频、文本等数字内容进行生成、编辑...

9810

语音识别与合成的融合技术解析

用户11764306 6天前2025-10-08 15:26:12

随着今年Interspeech会议的临近，"生成式AI"已成为机器学习界和大众媒体的热门词汇，通常指合成文本或图像的模型。文本转语音（TTS）模型作为Inter...

9610

仅需3%训练数据的文本归一化技术

用户11764306 9天前2025-10-05 16:38:17

在语音合成系统中，文本归一化通常是文本转语音转换的第一步。该技术将原始文本（如字符串"6-21-21"）扩展为可供文本转语音模型使用的口语化形式（如"twent...

4410

语音合成技术实现爱尔兰口音转换

用户11764306 18天前2025-09-26 14:22:38

在过去的五年中，语音合成技术已转向全神经网络模型，该模型允许分别控制语音的各个元素——韵律、口音、语言和说话人身份（声音）。正是这项技术使得某中心的文本转语音团...

13710

如何一个接口对接各大厂商的所有TTS（文本转语音）服务

程序猿DD 22天前2025-09-22 16:37:17

大大简化接入各种不同供应商的语音合成服务，并且通过统一的标准化调用参数来解决不同服务的参数差异，以便无缝切换不同的引擎，也方便客户端统一对接。

16010

基于注意力机制的简化歌声合成系统

用户11764306 27天前2025-09-17 18:22:29

UTACO歌声合成系统采用注意力机制序列到序列模型（AS2S），直接以带歌词的乐谱作为输入，无需依赖振动模式（vibrato）和音素时长等特征的独立子模型。该系...

9710

数字人关键技术2：TTS文本转语音

李福春 29天前2025-09-15 09:22:40

在数字人领域，TTS（文本转语音）是数字人与用户实现自然、流畅语音交流的核心能力。TTS技术赋能数字人具备“发声”能力，实现文字到语音的无缝转化。

25310

如何在 Android 中实现文字转语音（TTS）功能？

Front_Yue

浙江大学湖州研究院｜前端开发工程师 (已认证)

2025-09-092025-09-09 22:28:54

Android 平台自早期版本起就已经内置了 TTS 引擎，开发者可以通过系统 API 快速接入。同时，随着深度学习语音合成模型（如 Tacotron、Fas...

58200

语音识别与合成的融合技术解析

用户11764306 2025-09-032025-09-03 15:32:25

随着今年Interspeech会议的临近，“生成式AI”已成为机器学习界和大众媒体的热门词汇，通常指合成文本或图像的模型。文本转语音（TTS）模型作为Inter...

18010

【AI守护Show】

贺公子之数据科学与艺术 2025-08-292025-08-29 16:04:48

要使用以上代码，请确保你已经在腾讯云上注册了账号，并创建了一个语音合成的项目，获得了对应的APP ID和APP Key。将这些信息填入代码中的对应位置，并传入要...

12210

数字人播报视频这么流行，你想要做一个吗

富贵软件 2025-08-282025-08-28 14:05:34

数字人播报视频是一种利用人工智能技术，将文本或语音输入转化为真实的头像和口型动作，并通过视频形式呈现出来的技术。这些数字人播报视频通常使用深度学习模型，其中包括...

13210

全球首个语音合成图灵测试重磅发布！揭秘AI能否用语音骗过人类？

AGI-Eval评测社区 2025-08-272025-08-27 10:20:40

近期，围绕 AI 有声读物和 AI 播客的产品不断涌现，值得注意的是，其生成的语音效果均强调较高的自然度与接近真人的表现力，这一现象的背后，是语音合成（TTS）...

32710

语音助手阿拉伯语本地化技术解析

用户11764306 2025-08-222025-08-22 06:20:10

阿拉伯语版语音助手于2021年12月在沙特阿拉伯和阿联酋推出。与所有新语言版本一样，阿拉伯语在语音识别、语言理解和语音合成方面提出了独特挑战。

23110

构建高表现力语音模型的技术解析

用户11764306 2025-08-162025-08-16 22:43:42

某中心推出的阅读辅助功能需要合成比标准语音更缓慢、更具表现力的声音。由于表现性语音的韵律变化更大，传统模型容易出现突然停顿或语调异常等问题。开发团队通过创新数据...

16400

Alexa阿拉伯语技术实现解析

用户11764306 2025-08-162025-08-16 14:26:09

阿拉伯语版Alexa于2021年12月在沙特阿拉伯和阿联酋上线，其开发面临独特挑战：需同时支持现代标准阿拉伯语(MSA)和海湾方言(Khaleeji)。用户日常...

20910

神经网络TTS实现Alexa跨语言语音合成

用户11764306 2025-08-162025-08-16 06:23:34

2019年推出的双语模式需依赖不同说话人的录音数据，导致英语和西班牙语响应听起来像两个不同的人。最新研发的神经文本转语音（NTTS）技术通过以下创新解决了该问题...

17910

#语音合成

Spring Boot 集成免费的 EdgeTTS 实现文本转语音

ESP32 实现人体检测触发天气播报

如何防范利用深度合成技术的钓鱼欺诈

如何防范利用深度合成技术的钓鱼欺诈

语音识别与合成的融合技术解析

仅需3%训练数据的文本归一化技术

语音合成技术实现爱尔兰口音转换

如何一个接口对接各大厂商的所有TTS（文本转语音）服务

基于注意力机制的简化歌声合成系统

数字人关键技术2：TTS文本转语音

如何在 Android 中实现文字转语音（TTS）功能？

语音识别与合成的融合技术解析

【AI守护Show】

数字人播报视频这么流行，你想要做一个吗

全球首个语音合成图灵测试重磅发布！揭秘AI能否用语音骗过人类？

语音助手阿拉伯语本地化技术解析

构建高表现力语音模型的技术解析

Alexa阿拉伯语技术实现解析

神经网络TTS实现Alexa跨语言语音合成

相关产品

热门专栏

腾讯技术工程官方号的专栏

AI科技大本营的专栏

QQ音乐技术团队的专栏

企鹅号快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐