音频

音频接口请求失败时 数据接口请求失败时(请求失败的情况可能是:网络问题接口报错等)返回并经过过滤器处理后抛出的事件,同时抛出处理后的JSON格式的数据。具体数据示例请参见画布编辑器中组件右侧配置面板 数据 页签的 数据响应结果...

音频处理

本文为您介绍通过OpenAPI进行视频剪辑时音频处理场景的Timeline常用配置示例,包括整体静音、指定区间静音、提取音频、视频静音+完整音频混音、视频静音+音频指定区间混音、视频调节音量+音频调节音量、音频拼接、多轨音频混音、综合...

音频处理

视频静音+音频指定区间混音 视频静音+完整音频混音相比,视频静音+音频指定区间混音增加了音频Clip入出点的设置。例如,截取音频第10秒到第20秒的区间,从输出视频的第5秒开始叠加。示例如下所示:{"VideoTracks":[{"VideoTrackClips...

语音类

背景信息 本文介绍以下语音类标注模板的数据结构:音频分类 音频分割 音频识别 音频分类 音频分类(Audio Classification)是指从一组固定的分类标签集合中,找到与输入音频内容相匹配的一个或多个分类标签,并将其分配给该输入音频。...

功能发布记录(2.0)

Android媒体播放器集成实现 iOS媒体播放器集成实现 虚拟背景 Windows Mac Android iOS 简介 Windows虚拟背景集成实现 Mac虚拟背景集成实现 Android虚拟背景集成实现 iOS虚拟背景集成实现 暗场景增强 Windows Mac Android iOS ...

SDK下载发布记录

增加自定义音视频输入接口。增加麦上UDP发送消息通道。音视频统计回调中增加部分字端。稳定性优化。2023-11-30 V6.7.0 Android 13(API 33)适配,权限治理。直播美颜升级改造,适配Queen SDK高版本。iOS支持摄像头微距模式。直播连麦...

AliRtcEngine接口

1.17.9 setMixedWithMic 设置外部音频输入是否麦克风采集音频混合。1.17.9 setExteranlAudioRender 设置是否启用外部输入音频播放。1.17.9 pushExternalAudioRenderRawData 输入音频播放数据。1.17.9 getCurrentClientRole 获取当前角色...

AliRtcEngine接口

Mac:1.16.2 iOS:1.17.9 setMixedWithMic 设置外部音频输入是否麦克风采集音频混合。Mac:1.16.2 iOS:1.17.9 setExternalAudioRenderVolume 设置外部音频播放音量(仅Mac)。1.16.2 getExternalAudioRenderVolume 获取音频播放音量(仅...

Link Visual视频Media SDK

播放器错误列表 错误主码 错误子码 描述 解决办法 LV_PLAYER_ERROR_CODE_SOURCE LV_PLAYER_ERROR_SUB_CODE_SOURCE_STREAM_CONNECT 数据源建立连接失败 通常因网络问题引起连接失败,请您确保网络正常后重试。LV_PLAYER_ERROR_SUB_CODE_...

功能发布记录

增加自定义音视频输入接口。增加麦上UDP发送消息通道。音视频统计回调中增加部分字端。稳定性优化。SDK下载发布记录 升级 推流SDK互动版本V6.9.0发布:互动直播支持双声道设置。互动直播增加回调,例如:音视频订阅状态、远端用户离开、...

功能发布记录

优化 接口说明 语音识别通用模型和客服质检问题修复 语音识别16k中文通用模型,改善语音活动检测(Voice Activity Detectio)效果,解决纯静音数据误检出语音的问题。语音识别8k中文客服质检/8k英文客服质检/16k韩语模型:语言模型常规更新...

功能特性

单击在线体验 音 视 频增强 音频增强 视频云音频实验室有机结合传统信号处理与深度学习技术,提供全场景音频增强与修复方案。单击在线体验。重要 以下功能需要在 提交转码作业 时 配置相应参数 使用,音频部分按照输出的音频规格和时长,...

Link Visual视频Media SDK

播放器错误列表 错误主码 错误子码 描述 解决办法 LV_PLAYER_ERROR_CODE_SOURCE LV_PLAYER_ERROR_SUB_CODE_SOURCE_STREAM_CONNECT 数据源建立连接失败 通常因网络问题引起连接失败,请您确保网络正常后重试。LV_PLAYER_ERROR...

媒体处理FAQ

本文介绍媒体处理过程中的常见问题处理方法。只想上传不想转码如何操作?“不转码即分发”是一个特殊的转码模板,该模板不会进行实际转码,会将用户上传的视频原片信息写入播放列表,用户在调用获取播放信息GetPlayInfo接口时,可以获取...

媒体处理常见问题

如果转码失败,可能是因为源文件本身问题导致,例如:视频流缺失、metadata存在问题、帧错误、视频头部信息缺失等。通过阅读本文,您可以了解转码异常、转码格式支持及其他常见问题及对应解决方案。转码异常问题 使用SubmitJobs API提交...

SDK FAQ

本文汇总了您在使用SDK时可能遇到的常见问题。公共类 如何使用SDK设置泛热词?SDK中使用POP API训练的泛热词,是通过控制台配置的业务专属热词表项目Appkey绑定的,您无需自行设置;而通过POP API训练获取的业务专属热词表,需要在SDK中...

Windows开播小助手

共享屏幕、其他应用窗口及系统音频,共享屏幕时支持上述摄像头画面叠加。麦克风采集音频信号推流,支持切换至外设麦克风设备。设定直播画质。聊天互动,支持设定全员禁言。支持导入本地多媒体MP4文件插播。说明 集成方可以通过URL唤起...

Windows开播小助手

共享屏幕、其他应用窗口及系统音频,共享屏幕时支持上述摄像头画面叠加。麦克风采集音频信号推流,支持切换至外设麦克风设备。设定直播画质。聊天互动,支持设定全员禁言。支持导入本地多媒体MP4文件插播。说明 集成方可以通过URL唤起...

基本数据类型

AudioStream:音频流信息 名称 类型 描述 Index String 音频流序号,标识音频流在整个媒体流中的位置。CodecName String 编码格式简述名。CodecLongName String 编码格式长述名。CodecTimeBase String 编码时基。CodecTagString String ...

功能发布记录

功能特性 新增自定义转码模板 视频AI费用 2015-08-18 接口:元信息接口更名为媒体信息接口,提供媒体格式信息和音频、视频及字幕流信息。相关接口新增UserData字段,用以存放用户自定义数据,便于用户自行灵活扩展业务逻辑。支持作业优先级...

功能说明

说明 接口的调用需要对接口抛出的异常进行处理,添加try catch处理操作。接口调用的顺序必须按照说明的顺序调用,否则会因调用顺序不正确而出现异常。初始化。在配置好推流参数后,可以使用推流SDK的init方法进行初始化。示例代码如下:...

功能使用

说明 接口的调用需要对接口抛出的异常进行处理,添加try catch处理操作。接口调用的顺序必须按照说明的顺序调用,否则会因调用顺序不正确而出现异常。初始化。在配置好推流参数后,可以使用推流SDK的init方法进行初始化。示例代码如下:...

转码常见问题

说明 metadata中的时长实际持续的码流时长不一致可能导致转码失败,对于metadata有问题的文件,建议您先本地使用ffmpeg工具处理,再进行上传转码。在 错误码 中找到对应的错误码,分析具体失败原因。如果您添加的文本水印中包含特殊字符...

数据类型

通过阅读本文,您可以...枚举名 描述 AliRtcPubObserver 经过音频3A处理后的音频数据。AliRtcSubObserver 当前订阅到的远端用户混音后的音频数据。AliRtcRawDataObserver 本地采集的原始音频数据。AliRtcVolumeDataObserver 音量原始数据。...

Windows

外部音频输入播放 调用接口 setExteranlAudioRender 启用外部音频输入播放,通过参数 enable 设置开启,通过参数 sampleRate 和参数 channelsPerFrame 指定要输入音频数据的采样率和声道数。说明 目前仅支持输入音频PCM数据,数据编码为...

错误码查询

您可以通过返回结果中的错误码快速地定位问题,并根据对应的解决方案尝试修改代码或者反馈给终端用户加以解决。错误码分类 错误码表示 服务端错误码 服务端报错 8位错误码,例如:50000000 客户操作错误导致的服务端报错 8位错误码,例如:...

C# SDK

基础接口 NlsClient:语音处理客户端,利用该客户端可以进行一句话识别、实时语音识别和语音合成的语音处理任务。该客户端为线程安全,建议全局仅创建一个实例。接口名 启用版本 功能描述 SetLogConfig 3.1.9 设置日志文件存储路径。越早...

C# SDK

基础接口 NlsClient:语音处理客户端,利用该客户端可以进行一句话识别、实时语音识别和语音合成的语音处理任务。该客户端为线程安全,建议全局仅创建一个实例。接口名 启用版本 功能描述 SetLogConfig 3.1.9 设置日志文件存储路径。越早...

错误码

240051 UPDATE_AUDIO_ERROR 推送音频错误,一般为输入音频长度大于所需音频。确认推送的音频长度是否非法。240052 MIC_ERROR 连续2s未获取到音频。请确认在音频数据回调中是否正确提供所需长度的音频。调用超时错误 错误码 错误消息 描述 ...

错误码

240051 UPDATE_AUDIO_ERROR 推送音频错误,一般为输入音频长度大于所需音频。确认推送的音频长度是否非法。240052 MIC_ERROR 连续2s未获取到音频。请确认在音频数据回调中是否正确提供所需长度的音频。调用超时错误 错误码 错误消息 描述 ...

Link Visual设备端开发-Linux SDK

intercom_stop_service 发送音频 lv_voice_intercom_send_audio 接收音频 lv_voice_intercom_receive_data_cb 接收音频参数配置 lv_voice_intercom_receive_metadata_cb 五、API详述-SDK生命周期 SDK生命周期管理相关的API如下。...

参数详情

本文介绍媒体处理中转码、工作流、管道等功能API的部分参数详细说明,包含参数类型、参数用途以及参数取值示例等内容。Input详情 本参数被 SubmitJobs-提交转码作业 引用。参数 类型 是否必选 描述 Bucket String 是 输入文件所在OSS ...

接口说明

对一分钟内的短语音进行识别,适用于对话聊天、控制口令、语音输入法、语音搜索等较短的语音识别场景。功能简介 NUI SDK提供更小的工具包和更完善的状态管理。为满足不同用户需求,NUI SDK既能提供全链路的语音能力,同时可做原子能力SDK...

接口说明

使用须知 输入格式:PCM编码、16bit采样位数、单声道(mono)。音频采样率:8000Hz/16000Hz。设置返回结果:是否返回中间识别结果、在后处理中添加标点、将中文数字转为阿拉伯数字输出。设置多语言识别:在管控台编辑项目中进行模型选择,...

基本概念

当存在多个业务需要智能语音服务,如电话客服场景和手机输入法场景,各场景需要的语音能力是不同的,只有当项目配置业务场景匹配才能获得最佳效果。访问标识(AccessKey)程序访问阿里云API的凭证,登录 AccessKey管理页面,创建并查看...

接口说明

当前处理线程状态非法,可能是在未初始化情况下调用了pause接口等,请确保调用接口符合当前状态。140012 TTS_OPEN_FILE_FAILED 打开文件失败。打开wav debug文件失败,或打开日志文件失败。详细可查看日志错误信息进行确认。140013 TTS_...

创建工作流

音频组及音频提取 子节点 参数 说明 音频组 名称 在文本框中输入本组音频名称。音频提取 名称 在文本框中输入本节点名称。转码模板 单击 选择,在弹出窗中设置 转码模板。说明 预置转码模板说明,请参见 预置模板详情。设置自定义转码模板...

C++ SDK

本文介绍如何使用阿里云智能语音交互提供的C++ SDK,包括SDK的安装方法、SDK代码示例以及常见问题等。SDK下载 说明 当前最新版本:3.1.17,支持Linux、Windows及Android平台。发布日期:2023年08月09日。使用SDK前,请先阅读接口说明,详情...

C++ SDK

本文介绍如何使用阿里云智能语音交互提供的C++ SDK,包括SDK的安装方法、SDK代码示例以及常见问题等。SDK下载 说明 当前最新版本:3.1.17,支持Linux、Windows及Android平台。发布日期:2023年08月09日。使用SDK前,请先阅读接口说明,详情...

功能使用

本文详细说明iOS端推流SDK接口、SDK的基本使用流程以及相关功能的使用示例。说明 如果您需要使用移动端进行推流,详细操作请参见 推流、拉流播流。iOS推流SDK特性 支持RTMP推流协议。支持基于RTC的RTS超低延时直播推拉流协议。支持连麦...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
微服务引擎 视觉智能开放平台 智能联络中心 邮件推送 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用