长文本语音合成-长文本语音合成文档介绍内容-阿里云

接口说明

长文本语音合成功能提供了将超长文本（如千字或者万字）合成为语音二进制数据的功能。返回语音合成产品详情页新推出超高清合成声音持续新增多个超高清合成声音，可提供超高音质合成效果，采样率高达48 kHz，无损声音，纤毫毕现。超高清样...

{"status":200,"error_code":20000000,"error_message":"SUCCESS","request_id":"c541eae489af48d69dae2d2e203a*","data":{"sentences":[{"text":"长文本语音合成接口","begin_time":"0","end_time":"2239"},{"text":"一次返回所有文本对应...

时间戳功能介绍

实时长文本语音合成服务在输出音频流的同时，可输出每个汉字/英文单词在音频中的时间位置，即时间戳。时间戳功能又叫字级别音素边界接口，该时间信息可用于驱动虚拟人口型、做视频配音字幕等。功能概述实时长文本语音实时合成服务的时间戳...

接口说明

长文本语音合成功能提供了将超长文本（如千字或者万字）合成为语音二进制数据的功能。返回语音合成产品详情页新推出超高清合成声音持续新增多个超高清合成声音，可提供超高音质合成效果，采样率高达48 kHz，无损声音，纤毫毕现。超高清样...

C++ SDK

speechSynthesizerRequest.h 语音合成、长文本语音合成。speechTranscriberRequest.h 实时音频流识别。FileTrans.h 录音文件识别。lib：SDK库文件。readme.md：SDK说明。release.log：版本更新说明。version：版本号。编译运行 Linux平台...

通过控制台界面定制

长文本语音合成 SDK调用 长文本语音合成 登录阿里云智能语音交互控制台，选择服务管理与开通>长文本语音合成，单击升级商用版。在 长文本语音合成 区域，选择商用，商用后为付费使用服务。若您合成内容大于300字，选择 长文本语音合成...

SDK和API概览

SDK接入类型接入方式服务能力 RESTful API RESTful API 一句话识别、录音文件识别、录音文件识别闲时版、语音合成、长文本语音合成 移动端移动端iOS SDK 一句话识别、实时语音识别、录音文件识别极速版、语音合成移动端Android SDK ...

语音合成FAQ

长文本语音合成服务和语音合成服务的差异在于：语音合成服务只能支持300字符以下的文本，而长文本语音合成是为了满足更多用户对千字或者万字文本合成需求，最多支持10万字的一次性快速合成调用。具体请参见接口说明。性能类为什么TTS语音...

功能发布记录

结合自动化测试，增加模型可量化的测试指标结果新增概述语音合成 长文本语音合成 长文本RESTful接口集成字幕能力对外正式发布，官网开发文档上线。新增 RESTful API SDK 上线Android/iOS双端新版SDK Android SDK体积减少34.6%、iOS SDK...

服务用量

在控制台，您可以直观地查看智能语音交互服务的调用情况，包括时长、次数、并发路数等，根据运营数据判断当前使用是否合理，并决策...示例二：如果您希望选择 长文本语音合成，需要先将已勾选的语音合成取消勾选后，再勾选 长文本语音合成。

并发与监控FAQ

说明并发概念适用于智能语音交互产品中的一句话识别、实时语音识别、录音文件识别极速版、语音合成、长文本语音合成 等服务。不同服务之间不共享并发额度，同一服务下不同项目（对应不同AppKey）共享并发额度。什么是QPS？QPS是指每秒...

计费概述

长文本语音合成 按照合成字数计费语音分析声音事件检测按照录音时长计费说话人识别按照调用次数计费性别识别按照调用次数计费语种识别按照调用次数计费附加产品费用服务说明超额并发线路一句话识别、实时语音识别默认提供200...

Android SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成 是离线语音合成否录音文件识别极速版是唤醒及命令词否解压ZIP包，在 app/libs 目录下获取AAR格式的SDK包，将AAR包集成到您的工程项目中进行依赖。...

计费说明

3.50元/千次 300～999千次 3.00元/千次 1000～2999千次 2.40元/千次 3000～4999千次 1.60元/千次 5000千次以上 1.20元/千次 长文本语音合成 3元/万字 0～19万字 3.00元/万字 20～99万字 2.80元/万字 100～999万字 2.60元/万字 1000～3999万...

运行示例

通过Curl命令调用异步长文本合成RESTful接口异步长文本语音合成无免费试用版，如果您希望体验长文本语音合成服务，请前往控制台将该服务升级为商用版。在命令行执行如下命令，提交语音合成任务。请在智能语音交互控制台获取Appkey。请...

时间戳功能介绍

使用限制针对长文本语音合成，目前只支持长文本RESTful接口句级时间戳。参数设置在客户端将请求参数enable_subtitle设置为true，开启时间戳功能。以RESTful接口为例、其设置方式如下：/长文本TTS RESTful接口支持句级时间戳，默认为false...

Java SDK

为使用长文本语音合成服务，请将SDK版本更新至2.1.1及以上。下载安装从Maven服务器下载最新版本SDK。依赖文件如下：<dependency><groupId>...

Android SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成 是离线语音合成是录音文件识别极速版是唤醒及命令词否下载语音包，详情请参见接口说明中的语音包列表。重要 SDK和语音包是完全独立的，下载SDK后并...

iOS SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成 是离线语音合成否录音文件识别极速版是唤醒及命令词否解压ZIP包，将ZIP包中的nuisdk.framework添加到您的工程中，并在工程Build Phases的Link Binary ...

iOS SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成 是离线语音合成是录音文件识别极速版是唤醒及命令词否下载语音包，详情请参见接口说明中的语音包列表。重要 SDK和语音包是完全独立的，下载SDK后并...

通过OpenAPI定制

voice-176bb8a","VoiceName":"Demo-1663579664914","Scenario":"story"}],"Success":true} 您可以在提交合成后，通过查询此接口的方式来检查是否合成完成，返回结果中的Status字段为合成状态，取值范围为：WAIT，合成中；SUCCESS，合成...

C++ SDK

speechSynthesizerRequest.h 语音合成、长文本语音合成。speechTranscriberRequest.h 实时音频流识别。FileTrans.h 录音文件识别。lib：SDK库文件。readme.md：SDK说明。release.log：版本说明。version：版本号。编译运行 Linux平台编译 ...

从这里开始

长文本语音合成、录音文件识别（闲时版）和录音文件识别（极速版）无试用版。新开通服务的用户可免费试用3个月，支持2路并发（即同时最大2个任务）或每日2小时的录音文件识别额度。重要新用户试用期3个月内，每隔24小时可免费识别2小时时...

Go SDK

log.Lmicroseconds)logger.SetLogSil(false)logger.SetDebug(true)logger.Printf("Test Normal Case for SpeechRecognition:%s",strId)ttsUserParam.F=fout ttsUserParam.Logger=logger/第三个参数控制是否请求长文本语音合成，false为短...

Python SDK

long_tts bool 语音合成方式，取值说明如下：True：使用实时长文本语音合成，详情请参见接口说明。False：使用实时短文本合成，默认为 False。token String 访问Token，详情可参见获取Token概述。on_metainfo Function 如果 start 方法中...

C# SDK

识别接口 SpeechSynthesizerRequest：语音合成请求对象，用于语音合成及长文本语音合成。接口名功能描述 SetOnSynthesisCompleted 设置语音合成结束回调函数。SetOnChannelClosed 设置通道关闭回调函数。SetOnTaskFailed 设置错误回调函数...

地域和域名

语种识别支持暂不支持暂不支持语音合成短文本语音合成支持支持支持 长文本语音合成 支持暂不支持暂不支持离线语音合成支持支持支持 SDK及 API使用 Java SDK 支持仅修改域名仅修改域名 C++ SDK 支持仅修改域名仅修改域名 ...

接口说明

语音合成为您提供将输入文本合成为语音二进制数据的功能。返回语音合成产品详情页功能介绍支持输出PCM、WAV和MP3编码格式数据。支持设置语速、语调和音量。支持设置不同场景及风格的声音。支持一次性合成300字符以内的文字，其中1个汉字...

接口说明

语音合成/长文本语音合成错误码状态码状态消息原因解决方案 40000001 Gateway:ACCESS_DENIED:No privilege to this voice!设置了错误的发音人名称。请参考官网文档，设置正确的发音人。40000004 Gateway:IDLE_TIMEOUT:Websocket ...

接口说明

语音合成提供将输入文本合成为语音二进制数据的功能。功能介绍 NUI SDK提供更小的工具包和更完善的状态管理。为满足不同用户需求，NUI SDK既能够提供全链路的语音能力，同时可做原子能力SDK进行使用，并保持接口的统一。语音合成功能支持...

SSML标记语言介绍

长文本语音合成请求可使用多个<speak></speak>标签，及SSML与文本结合的方式，以下示例可以将全文作为一次请求，在长文本语音合成服务中进行合成测试。say-as interpret-as="telephone">114查询号码...

Android SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成 是离线语音合成否录音文件识别极速版是唤醒及命令词否解压ZIP包，在 app/libs 目录下获取AAR格式的SDK包，将AAR包集成到您的工程项目中进行依赖。...

错误码查询

语音合成/长文本语音合成错误码状态码状态消息原因解决方案 40000001 Gateway:ACCESS_DENIED:No privilege to this voice!设置了错误的发音人名称。请参考官网文档，设置正确的发音人。40000004 Gateway:IDLE_TIMEOUT:Websocket ...

iOS SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成 是离线语音合成否录音文件识别极速版是唤醒及命令词否解压ZIP包。将ZIP包中的nuisdk.framework添加到您的工程中，并在工程Build Phases的Link Binary ...

iOS SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成 是离线语音合成否录音文件识别极速版是唤醒及命令词否解压ZIP包，将zip包中的nuisdk.framework添加到您的工程中，并在工程Build Phases的Link Binary ...

功能特性

PCM、WAV、MP3 Java/C++/Python/C#Go/Node.js/RestfulAPI/Android/iOS/微信小程序最大2个并发资源包购买 长文本语音合成 实时将超长文本（千字或万字）合成为语音二进制数据。阅读小说、文章等场景。PCM、WAV、MP3 Java/C++ 暂不支持...

Android SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成 是离线语音合成否录音文件识别极速版是唤醒及命令词否解压ZIP包，在 app/libs 目录下获取AAR格式的SDK包，将AAR包集成到您的工程项目中进行依赖。...

长文本语音合成

新品推荐