首页
学习
活动
专区
圈层
工具
发布

#语音

腾讯智绘影音:AI驱动端到端音视频架构演进与业务增长

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

针对语音交互趋势下社交留存低、跨国沟通难及游戏语音技术瓶

100

OpenVINO2025轻松搞定四种生成式大模型部署

OpenCV学堂

因为国内方位HuggingFace不方便,所以请把下面的代码放在最前面,然后运行,就可以使用HuggingFace镜像。

000

腾讯云音视频TweTalk AI对话软硬一体化方案概要

IT资讯研究所

腾讯科技 | 研究员 (已认证)

腾讯云音视频TweTalk是专为智能硬件打造的AI对话软硬一体化方案,聚焦语音智能体与实时音视频通信两大核心。其云端支持语音对话、多模态视觉推理、情绪识别、TT...

4700

语音钓鱼(Vishing)统计特征、技术机理与全链路防御研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

语音钓鱼(Vishing)依托号码仿冒、AI 语音克隆与实时社会工程学交互,已成为 2025—2026 年全球增长最快的网络攻击形式之一。SQ Magazine...

4110

腾讯会议OpenClaw智能语音会议管理功能概览

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

一、产品定位与核心亮点 腾讯会议OpenClaw是一个集成AI技术的语音驱动会议管理功能,针对腾讯会议平台。核心技术属性包括智能参会统计和语音命令处理,核心亮点...

5110

腾讯AI多模态鉴伪解决方案将攻击拦截率提升至97.74%

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

技术首创性:首次融合语义大模型(LLM)与人脸防护模型,实现跨模态精准防御 第一章:金融行业面临生成式AI多模态伪造的全面渗透风险 攻击渗透全业务链路:深度伪造...

6310

腾讯云游戏多媒体引擎 (GME) 产品概要

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

腾讯云游戏多媒体引擎 GME 是一款一站式语音解决方案框架。该产品通过跨平台互通架构提供实时语音、语音消息、语音转文本、语音内容安全及语音录制服务。核心技术属性...

4910

腾讯云音视频TweTalk产品概述

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

TweTalk架构基于云端语音对话引擎与端云协同通信层:云端处理语音识别(ASR)、大语言模型(LLM)响应与合成(TTS);端侧支持微信音视频集成和多模态视觉...

5810

深度学习的基础模型 - CNN 和 RNN

索旭东

RNN 的全称是 Recurrent Neural Network(循环神经网络) ,是一种专门用于处理 序列数据 的神经网络,比如文本、语音、时间序列等。

7010

Skills 推荐清单

张一恒

这类 Skill 帮助你发现、创建和增强 Agent 本身的能力,是使用 OpenClaw 的起点。

19810

多模态测试实战:从理论到落地

顾翔

2024年,多模态大模型(如GPT-4V、Qwen-VL、Kosmos-2)已深度融入智能客服、医疗影像辅助诊断、工业质检、车载语音视觉交互等关键场景。与传统单...

6710

零成本为 OpenClaw 装上“耳朵”与“嘴巴”,一步到位的语音交互指南

Henry Zhang

在 AI 助手普及的当下,语音交互已成为提升用户体验的核心能力。OpenClaw 作为强大的 AI 智能体平台,支持语音输入(STT,Speech To Tex...

36320

跨部门协同治理下语音钓鱼防控效能提升与技术实现研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

本文以韩国政府跨部门电信金融诈骗综合应对小组成立半年来的治理实践为研究样本,结合警方公开数据与技术防控机制,系统分析语音钓鱼案件数量下降 31.6%、涉案损失下...

7710

那些教你用 AI 自动赚钱的,最后到底赚了什么?

随机比特

腾讯 | 高级前端工程师 (已认证)

你不用出镜,不用想选题,不用学剪辑,不用研究平台规则。系统替你生成脚本、配图、语音、标题,甚至帮你抓商家邮箱、发开发信。

18210

普通人的 AI 长什么样?一家汽修店一直响个不停的电话

随机比特

腾讯 | 高级前端工程师 (已认证)

从技术上看,这套方案并不神秘:网站资料抓下来,做成知识库;问题进来后先检索,再交给模型组织回答;语音平台负责接电话、转语音、读回答;服务端再把每次对话和回拨需求...

9310

紧跟“AI生成内容”新规,内容平台如何高效应对?

腾讯云AI

在刷短视频、浏览社交动态时,你一定发现许多内容下方多了一个小小的角标:“该内容由 AI 参与生成”。这背后不仅是技术的迭代,更是内容安全与合规的硬要求。尤其在 ...

15410

JL杰理AC696N系列芯片开发定时器详解:sys_timer与usr_timer的区别与选用

用户12337444

定时器这玩意儿,看起来简单,但用错了地方,要么功耗下不去,要么定时不准,调试起来还挺头疼。JL杰理AC696N的SDK里给了两套定时器:sys_timer和us...

7500

10个GitHub热门的配音/语音合成/语音克隆项目

搜罗万相

这里推荐几个GitHub上热门、好用的配音/语音合成/语音克隆项目,有通用TTS、语音克隆、视频配音、流式/轻量等不同需求的。

37910

12个AI实时翻译、生成字幕等工具推荐

搜罗万相

腾讯这个工具功能可能比较难找!在微信里搜「腾讯云智聆」小程序,直接把语音发给它,普通话识别率97%,比微信自带的语音转文字准一此。关键是免费!每天能转2小时。

1.4K10

本期软件:联想专属软件推荐

搜罗万相

音频转写功能支持一键快速提取音频中的文字内容,支持实时编辑与无限回听。语音录入功能可实现“语音转文字”,支持普通话、方言等多种语音输入,支持语音唤醒功能,可通过...

33510
领券