实时音视频
实时音视频(ApsaraVideo Real-time Communication)依托阿里云全球3200+节点及多年的音视频技术积累,提供高可用、高品质、超低延时的音视频通信服务,主要适用于直播互动、社交语聊、多人通话等场景。

产品优势

多网合一
依托阿里云 GRTN 品牌网络,全球覆盖 3200+ 节点,可以支持直播网络和 WebRTC 网络资源复用 ,保证弱网下的用户体验,实现全球高可靠服务。
实时互动
基于 WebRTC 链路可提供延时 300ms 以内的实时音视频互动,支持频道内连麦和跨频道连麦互动,观众可自由平滑上下麦,切换过程免等待。
超高质量体验
优秀的 3A 音频处理引擎,48kHz 全频带采样支持。支持 720P、1080P、2K、4K 画质,提供优质稳定的互动通话体验。
丰富的媒体处理能力
提供丰富的媒体处理能力,涵盖录制、混流、转码、审核等。
易于接入
提供场景化集成方案及组件,支持低代码集成,另有完善的最佳实践助力开发者快速接入。
多终端支持
支持 Android、iOS、Web 多终端音视频连麦,用户可通过不同平台随时开启互动直播体验。

产品架构

实时音视频(ApsaraVideo Real-time Communication)互动链路采用 WebRTC 协议保证麦上互动的实时性,结合托管型房间管理组件,能够让麦下用户和麦上用户享有相同的超低延时。通过旁路转推直接对接阿里云媒体处理中心,提供录制、转码、混流、内容审核、对接第三方审核等配套能力。同时也可以无缝扩展标准直播,CDN 直播观众可通过 RTS/FLV/RTMP/HLS 协议拉流,不限制并发人数 ,无需加入房间组件。

产品功能

优秀的音视频处理能力和完备的质量监控基于阿里云自研的音频预处理、视频编解码器、弱网对抗算法、数据监控大盘,确保优质的音视频体验和全面的质量监测。
视频互动支持 480P、720P、1080P 等分辨率的多人视频互动,端到端延时 300ms 内,可用于直播间主播与观众连麦、主播跨房间 PK 等多种应用场景。
语音互动支持 48KHz 高音质语音互动,端到端延时 300ms 内,可用于语聊房、KTV 等多样场景。
音频处理支持背景音乐播放,音乐和人声混音,耳返,降噪等音频处理。
智能降噪在高保真还原人声前提下,智能消除周边噪音、抑制突发噪音、消除多设备啸叫。
质量监测通过对海量音视频质量数据采集与分析,实现多维度多层次的质量监测。
丰富多样的业务功能和灵活的接口配置面向各类企业应用,提供多样的产品功能和灵活的接口配置助力客户快速搭建音视频通信场景,开启互动式新体验。
混流转推支持将多路流按照一定规则进行混流布局,并支持转推至阿里云直播或第三方。
CDN 直播联动无缝联动标准直播、超低延时直播,支持麦上麦下平滑切换,可实现麦下 10万+ 用户并发观看。
云端录制可将音视频通话画面同步到云端进行云端混流布局,并将混流布局后的频道内容进行录制保存。
云端转码可以将各路音视频流进行画面混合、音视频转码,针对画面中不同内容进行不同策略的编码优化,使得整个画面更具层次感。
安全审核支持无缝对接阿里云视频和语音审核,或手动对接第三方审核。

应用场景

直播连麦
双人音视频通话
多人音视频通话
语音聊天室
在线 KTV
直播连麦
支持在直播场景快速扩展主播与观众连麦、主播间 PK 互动、多人连麦互动的玩法。实现端到端 300ms 内的延时、观众上下麦平衡切换关键能力,同时可以和阿里云标准直播和超低延时直播实现无缝联动,支持直播间观众 10万+ 并发观看。
能够提供
超低延时
毫秒级别的视频时延,满足主播与麦上观众实时互动需求。
弱网适应
在网络连接不稳定、可用性差的条件下,提供基于 RTC 协议的推流方式,提升推流及连麦的流畅度。
灵活易用
一个推流 SDK 集成连麦能力,满足多场景的直播玩法。
推荐搭配使用
双人音视频通话
支持 720P、1080P 的高清画质及 48kHz 高音质,通话时延低于300ms,打造流畅、高品质的语音通话体验。提供双人音视频通话的 UI 组件,可直接复用。后台服务提供源码,支持集成方二次开发,满足个性化功能需求。
能够提供
低门槛接入
提供丰富的场景化 UI 组件,可快速实现双人音视频通话场景,最大程度降低开发成本。
稳定可靠
基于阿里云多年全球网络服务的经验,提供端到端的弱网对抗能力,弱网环境下,仍然能够有效保障业务稳定运行。
高品质体验
支持 720P、1080P 高清画质及 48 kHz 高音质,打造清晰和沉浸式的互动体验。
推荐搭配使用
多人音视频通话
单个房间最多可支持 50 人同时在线进行音视频通话,支持 720P、1080P 的高清画质及 48 kHz 高音质。提供多人音视频通话的 UI 组件,可直接复用。后台服务提供源码,支持集成方二次开发,满足个性化功能需求。
能够提供
低门槛接入
提供丰富的场景化 UI 组件,可快速实现多人音视频通话场景,最大程度降低开发成本。
稳定可靠
基于阿里云多年全球网络服务的经验,提供端到端的弱网对抗能力,弱网环境下,仍然能够有效保障业务稳定运行。
高品质体验
支持 720P、1080P 高清画质及 48 kHz 高音质,打造清晰和沉浸式的互动体验。
推荐搭配使用
语音聊天室
由房主、主播、观众三种角色组成,其中房主与主播之间可以实时语音通话,观众可以上麦成为主播参与语音互动。
能够提供
低延迟音频互动
依托阿里云 GRTN 品牌网络,全球覆盖 3200+ 节点,构建的低延迟传输网络,保障主播和主播、主播和观众间的低延迟互动效果。
麦位和权限管理
提供数据传输通道,供业务实现麦位、权限管理等功能。
调音器
提供音量调整、混音比例调整、美声变声等功能。支持调整本人和房间内其他主播的声音效果。
背景音乐输入
提供外部背景音乐的输入,支持常见格式的数据解码。
录制
本端直接将数据实时输出和本地直接录制的能力。
推荐搭配使用
在线KTV
还原线下 KTV 场景,用户可在线进行歌曲独唱、合唱、倾听等互动功能,实现线上 KTV 互动新玩法。
能够提供
超低延时保障
稳定的音频传输技术,保障用户低延迟的沉浸 K 歌体验。
歌词组件
根据进度显示歌词,开源组件代码,方便客户自主定制。
实时合唱
支持多人合唱,伴奏精准同步,达到线下 K 歌的效果。
歌单管理和麦位管理
提供数据传输通道,供业务实现歌单管理、麦位管理等功能。
歌曲控制
主唱可以实时控制歌曲的播放状态,歌单管理,并且可以实现实时地将状态同步给其他演唱者和观众。
调音器
提供音量调整、混音比例调整、美声变声等功能。
低延时耳返
适配大量设备,实现低延迟耳返,给演唱者及时的反馈。
推荐搭配使用

更多产品与服务

视频直播
基于领先的内容接入与分发网络和大规模分布式实时视频处理技术(含窄带高清™)打造的音视频直播平台,提供易接入、低延迟、高并发、高清流畅的音视频直播服务。
视频点播
集视频采集、编辑、上传、媒体资源管理、自动化转码处理(窄带高清™)、视频审核分析、分发加速于一体的一站式音视频点播解决方案。
音视频终端 SDK
集成了直播推流、视频播放、短视频创作、美颜特效、音频特效等核心能力,为用户提供一体化 SDK,支持移动端、PC 端、Web 端等多终端接入,搭配开源 UI 组件和产品级 Demo,支持用户根据业务需求集成所需 SDK 以及采用低代码方式快速搭建所需应用。
对象存储 OSS
海量、安全、低成本、高可靠的云存储服务,提供最高可达 99.995 % 的服务可用性。使用 RESTful API 可以在互联网任何位置存储和访问,容量和处理能力弹性扩展,多种存储类型供选择全面优化存储成本。

文档与工具