PAI端到端文字识别训练

STRING crnn encoder_cnn_name 否 编码器使用的CNN类型,取值包括:conv5_encoder senet5_encoder STRING senet5_encoder encoder_num_layers 否 编码器层数(通常指RNN层数,CNN不计算在内)。INT 2 encoder_rnn_type 否 编码器使用的...

AudioStream

1 Language string 音频流中使用的语言,格式为 BCP 47 en CodecName string 编码器名称。aac CodecLongName string 编码器名称的全称。AAC(Advanced Audio Coding)CodecTimeBase string 编码器时间基准。1/44100 CodecTagString string ...

SubtitleStream

en CodecName string 编码器名称。mov_text CodecLongName string 编码器名称的全称。MOV text CodecTagString string 编码器标识描述信息。tx3g CodecTag string 编码器标识。0x67337874 StartTime double 字幕流起始时间,单位为秒(s)...

错误码

视频编码器(Video Encoder)错误码 说明-10003001 创建视频编码器失败,参数不支持。10003002 创建视频编码器失败,没有符合该编码场景要求的编码器。10003003 视频编码组件没有设置输出数据的接收方,无效工作。10003004 视频编码器被...

错误码

视频编码器(Video Encoder)错误码 说明-10003001 创建视频编码器失败,参数不支持。10003002 创建视频编码器失败,没有符合该编码场景要求的编码器。10003003 视频编码组件没有设置输出数据的接收方,无效工作。10003004 视频编码器被...

错误码

视频编码器(Video Encoder)错误码 说明-10003001 创建视频编码器失败,参数不支持。10003002 创建视频编码器失败,没有符合该编码场景要求的编码器。10003003 视频编码组件没有设置输出数据的接收方,无效工作。10003004 视频编码器被...

VideoStream

en CodecName string 编码器名称。h264 CodecLongName string 编码器名称的全称。H.264/AVC/MPEG-4 AVC/MPEG-4 part 10 Profile string 档次。High CodecTimeBase string 编码器时间基准。1373627/83160000 CodecTagString string 编码器...

数据类型

gop_size int 编码器GOP大小,单位:秒,取值范围:[0,30],建议取值:[2,5]。max_fps int 视频帧率。video_bitrate_bps int 视频目标码率。单位:Kbps。video_codec alirts_video_codec_e 视频编码器类型。video_preset alirts_video_...

GetMediaMeta-获取多媒体文件信息

0x31637661 CodecTimeBase string 编码器每帧时长。1373627/83160000 TimeBase string 每帧时长。1/90000 Level integer 级别,可用于限制整体参数比率。40 PixelFormat string 视频的存储格式。yuv420p AudioStreams object[]音频流信息。...

重要参数

参数 类型 说明 是否必填 target_kbps Int 编码器的输出码率。是 target_fps Int 编码器的输出帧率。是 CreatRoomParam 创建房间。作为创建房间的参数,只有该参数填写正确,才能顺利创建音视频房间。参数 说明 uid 用户 ID,唯一标识房间...

接口说明

alirts_start 启动RTS推流,根据输入配置启动音视频编码器,与CDN服务端建立连接。alirts_send_frame 发送音视频媒体数据。alirts_get_statistics_info 获取推流统计信息。alirts_stop 停止推流,释放编码器与CDN断开连接。alirts_destroy ...

窄带高清TM2.0

从人眼视觉模型出发,凭借阿里云技术算法,将编码器的优化目标从“保真度更高”调整为“主观体验更好”,突破视频编码器的能力上限,在节省码率的同时,也能提供更加清晰的观看体验。使用限制 窄带高清 TM 2.0目前仅支持北京、上海区域。您...

GetMediaInfoJob-媒体信息任务查询

AAC(Advanced Audio Coding)CodecTimeBase string 编码器时间基。1/44100 CodecTagString string 编码器标签名。[15][0][0][0]CodecTag string 编码器标签。0x000f SampleFmt string 采样格式。fltp SampleRate string 采样率(单位:Hz)...

SubmitMediaInfoJob-提交媒体信息异步任务

AAC(Advanced Audio Coding)CodecTimeBase string 编码器时间基。1/44100 CodecTagString string 编码器标签名。[15][0][0][0]CodecTag string 编码器标签。0x000f SampleFmt string 采样格式。fltp SampleRate string 采样率(单位:Hz)...

SubmitSyncMediaInfoJob-提交同步媒体信息任务

AAC(Advanced Audio Coding)CodecTimeBase string 编码器时间基。1/44100 CodecTagString string 编码器标签名。[15][0][0][0]CodecTag string 编码器标签。0x000f SampleFmt string 采样格式。fltp SampleRate string 采样率(单位:Hz)...

ListMediaInfoJobs-查询媒体信息任务列表

AAC(Advanced Audio Coding)CodecTimeBase string 编码器时间基。1/44100 CodecTagString string 编码器标签名。[15][0][0][0]CodecTag string 编码器标签。0x000f SampleFmt string 采样格式。fltp SampleRate string 采样率(单位:Hz)...

直播延迟

造成直播延迟的原因 推流端 GOP(Group Of Picture)帧是视频的关键帧,是视频图像编码器和解码器存取的基本单位。直播会将每一帧数据打上时序标签,并进行网络传输。视频的关键帧数量过大会造成直播延迟。多数第三方推流软件为解决卡顿...

如何降低延时?

造成直播延迟的原因 推流端 GOP(Group Of Picture)帧是视频的关键帧,是视频图像编码器和解码器存取的基本单位。直播会将每一帧数据打上时序标签,并进行网络传输。视频的关键帧数量过大会造成直播延迟。多数第三方推流软件为解决卡顿...

数据类型

enc_time_ms 采集图像送入编码器的系统时间,使用UNIX时间表示,单位:毫秒。player_delay:拉流延时信息。struct player_delay { long long decoder_time_ms;current utc time when the video frame send to decoder long long render_...

数据结构

decodeFps unsigned int 编码器输出帧率。renderFps unsigned int 渲染器输出帧率。frozenTimes unsigned int 卡顿次数。AliEngineLocalAudioStats 本地音频统计信息。参数 类型 描述 track AliEngineAudioTrack 音频流类型。scene ...

监控面板说明

Encode Utilization:编码器利用率。Decode Utilization:解码器利用率。GPU Node Details 表示集群中GPU节点的信息,包括:Node Name:节点名称。GPU Index:节点上的GPU索引号。GPU Utilization:GPU卡的利用率。Memory Copy Utilization...

基本概念

Two-Pass:编码器执行两次来精准分配码率,以获取体积更小质量更高的编码结果。first pass用于分析视频并生成log文件,second pass会根据分析结果执行编码以获得最佳编码质量。Two-Pass相比One-Pass模式需要花费更多时间,所以无法使用在...

数据类型

3.0 DingRtcVideoEncodedFrameType Qos反馈外置编码器请求帧类型 3.0 DingRtcVideoFrameType 视频帧类型。3.0 DingRtcVideoPixelFormat 视频数据格式。3.0 DingRtcRecordAudioConfig 录制音频设置。3.0 DingRtcRecordVideoCanvasConfig mac...

数据类型

数据成员 描述 on_key_frame_req 请求关键帧回调,收到该请求后设置编码器生成关键帧。on_disconnected 网络连接断开回调,由于网络异常等导致连接断开。on_publish 推流建连是否成功回调,建连过程是异步的,需要回调通知用户是否成功。...

转码

从人眼视觉模型出发,依据阿里云技术算法,将编码器的优化目标从保真度更高调整为主观体验更好,突破视频编码器的能力上限,在节省码率的同时也能提供更加清晰的观看体验。相对于窄带高清1.0,码率更低,分辨率更佳。音频转码 提供音频转码...

数据类型

decoderOutputFrameRate int 编码器输出帧率。rendererOutputFrameRate int 渲染器输出帧率。packetLossRate int 丢包率。DingRtcLocalAudioStats:本地音频统计信息 参数名 类型 描述 track DingRtcAudioTrack 音频流类型。sentBitrate ...

计费项

视频转码说明 说明 转码264:输出的视频使用H.264编码器 转码265:输出的视频使用H.265编码器 LD:视频转换后的分辨率(640 x 480)SD:视频转换后的分辨率(1280 x 720)HD:视频转换后的分辨率(1920 x 1080)2K:视频转换后的分辨率(2560 x ...

更新RTS自定义转码配置

AudioCodec String 否 aac 音频编码器。取值:aac。mp3。说明 如果要使用opus编码,把Opus选项参数置为true即可。AudioRate Integer 否 44100 音频采样率。取值:22050,32000,44100,48000,96000。其中44100比较常用。单位:Hz。说明 ...

音视频处理最佳实践

c:v h264 为输出流选择软件H.264编码器。b:v 5M 将输出比特率设置为5 Mb/s。GPU转码命令 单路转码(1∶1)docker run-rm-it-volume$PWD:/workspace-runtime=nvidia willprice/nvidia-ffmpeg-y-hwaccel cuda-hwaccel_output_format cuda-i ...

one-hot编码

one-hot编码,也称独热编码,对于每一个特征,如果它有m个可能值,那么经过独热编码后,就变成了m个二元特征。此外,这些特征互斥,每次只有一个激活。因此,经过独热编码后数据会变成稀疏的,输出结果也是KV的稀疏结构。功能介绍 one-hot...

视频拼接

说明 该参数与 ab 互斥,若都不设置则按照编码器默认码率进行编码。ab int 否 音频比特率(码率)。单位为比特/秒(bps)。取值范围:1000~10000000。abopt string 否 音频码率选项。取值:0(默认值):始终使用目标音频码率。1:拼接列表...

音频拼接

说明 该参数与 ab 互斥,若都不设置则按照编码器默认码率进行编码。ab int 否 音频比特率(码率)。单位为比特/秒(bps)。取值范围:1000~10000000。abopt string 否 音频码率选项。取值:0(默认值):始终使用目标音频码率。1:拼接列表...

添加RTS自定义转码配置信息

AudioCodec String 否 aac 音频编码器。取值:aac。mp3。说明 如果要使用opus编码,把Opus选项参数置为true即可。AudioRate Integer 否 44100 音频采样率。取值:22050~96000,其中44100比较常用。单位:Hz。说明 如果音频编码AudioProfile...

GetTranscodeJob-查询转码任务

H.264/AVC/MPEG-4 AVC/MPEG-4 part 10 Profile string 编码器预设。High Codec_time_base string 编码时基。1/50 Codec_tag_string string 编码格式标记文本。[27][0][0][0]Codec_tag string 编码格式标记。0x001b Width string 宽。848 ...

数据类型

encode_fps uint32_t 编码器输出帧率。AliRtcRemoteVideoStats:远端视频统计信息。参数 类型 描述 user_id AliRtc:String 用户ID。track AliRtcVideoTrack 视频流类型。width uint32_t 宽。height uint32_t 高。decode_fps uint32_t 编码...

数据类型

AliRtcPluginEncodeOperation 编码器。AliRtcPluginDecodeOperation 解码器。AliRtcPluginRecord 采集。AliRtcPluginRender 渲染。AliRtcAudioType:音频类型。枚举名 描述 AliRtcPubObserver 经过音频3A处理后的音频数据。...

InitiateMultipartUpload

父节点:InitiateMultipartUploadResult EncodingType 字符串 指明返回结果中编码使用的类型。如果请求的参数中指定了encoding-type,那返回的结果会对Key进行编码。父节点:InitiateMultipartUploadResult 此接口还包含其他公共响应头。更...

媒体处理常见问题

如果转码前后的音频编码器一致且转码后的音频码率大于转码前的音频码率,音频码率将会被重置,设置的音频码率不会生效。更多参数信息,请参见 提交转码作业。当API返回数据为空时,应该怎么办?如果遇到返回数据为空或资源不存在的问题,请...

SubmitTranscodeJob-提交转码任务

250 Preset string 否 视频算法预置。只有 H264 支持该参数。支持 veryfast、fast、medium、slow、slower。默认值:medium。medium ScanMode string 否 扫描模式。支持 interlaced、progressive。progressive PixFmt string 否 视频颜色...

数据结构

decodeFps int 编码器输出帧率。renderFps int 渲染器输出帧率。frozenTimes int 卡顿次数。AliRtcLocalAudioStats 本地音频统计信息。参数 类型 描述 track AliRtcAudioTrack 音频流类型。sentBitrate int 发送码率。sentSamplerate int ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
逻辑编排 音视频通信 应用实时监控服务 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用