数字人流媒体
「3D数字人流媒体」是阿里云「虚拟数字人」的一款文本驱动的推拉流形式产品,为具备基础开发能力的用户(软件服务商或合作方)提供AI驱动数字人的实时渲染推流的PaaS技术底座,包含文本实时驱动的流媒体、数字人资产形象管理和智能交互式卡片。客户可基于这套实时流媒体产品开发贴合自身业务的应用,及数字人相关产品服务。

产品功能

数字人流媒体:提供数字人标准化 PaaS 服务,可集成到各种终端上通过阿里云虚拟数字人的 PaaS 接口传递数字人即将播报的文本,可以获得数字人播报的视频流或离线视频文件。通过在端上集成 RTC 拉流或通过 RTMP 推流可以实现数字人在线直播、数字人助理播报等效果。此外也可以通过视频合成能力将数字人用于视频内容生产制作。并且得益于标准接口,数字人能力可以集成在 Web、移动端、PC 端、线下大屏等各种类型终端上。
简单高效的 PaaS 服务接口客户调用虚拟数字人能力只需要通过标准的数字人流媒体以及视频合成接口即可,无需关注底层数字人驱动的具体实现方式。查看文档
配套便捷的运营工具支持自定义数字人的声音、形象等,内置多种风格数字人装扮,方便客户针对不同业务属性创建不同风格的数字人形象。查看文档
语音、视觉多模态表达集成自然语言理解算法,根据播报的内容智能驱动数字人表情和动作,数字人实现语音、表情、手势动作的多模态表达。查看文档

产品优势

快速集成
嵌入多个模块的基础技术,一站式调用驱动数字人所需的各项技术能力
广泛适配
提供标准化接口,客户投入更小成本,可实现数字人在不同的终端展现
延展性强
不受应用场景及交互能力的限制,在客户基础业务上提供数字人赋能
表现力佳
拥有海量的训练数据、丰富的应用经验,数字人动作更流畅,表情更灵动