数字人流媒体服务AndroidSDK

数字人开放平台推出的适用于Android数字人流媒体服务SDK。当您调用服务端OpenAPI StartInstance 接口获取RTC和IM参数信息后,可以在Android搭建App,实现数字人拉流和双工对话。AliyunAvatarSDK通过 阿里云音视频通信服务(阿里云RTC)提供...

常见问题

针对数字视频合成产品,您可以直接下单 数字视频合成商品,该商品属于后付费商品,下单是不需要付费的,通过API生产视频才需要付费,下单成功之后系统会自动为首次下单数字视频合成商品的用户赠送10分钟免费试用时长,超过10分钟之外...

数字人官方形象示例

智能生产制作支持数字视频生成功能,并且内置了多款官方可选数字人形象,在进行云剪辑时您可以根据实际需求选择使用。使用说明 您可以通过控制台或OpenAPI创建数字视频合成任务。具体操作,请参见 创建数字视频合成任务。数字人形象...

升降配或续费说明

支持升级的服务:3D数字人流媒体 3D数字人流媒体(停复机)资源降配退款规则 升降配操作 续费 产品到期后服务将无法使用,如果您想继续使用,必须在指定时间内续费,否则实例将会在到期7天后被自动释放,数据也会丢失。续费 升降配操作 ...

API概览

数字人实例 API 标题 API概述 StartInstance 启动一个数字人 启动一路数字视频流实例,通过传入指定的参数,可以启动一路数字人实例,该接口针对播报数字人、互动数字人等这类使用平台默认视频流渠道的数字人实例会返回阿里公有云RTC拉流...

动态与公告

2022年8月22日 2D数字视频合成邀测发布 3D数字视频合成邀测发布 2D数字人流媒体支持推流数字人能力,支持RTMP协议,可将数字人流媒体用于直播 2022年8月2日 互动数字人增加智能打断功能,用户可以在和数字人互动过程中令其终止播报 ...

智能时间线-集成数字

本文详细说明了如何通过文字内容、音频媒资标识(MediaId)、音频文件地址(MediaURL)这三种不同方式,将数字视频集成到时间线(Timeline)中。背景信息 通过本文所介绍的方法,您可以轻松地将数字人功能集成到剪辑时间线Timeline当中,...

数字视频合成开发指南

数字视频合成服务(包括3D数字视频合成和2D数字视频合成)提供根据指定文本让数字人进行文本播报,平台会基于数字人播报的文本智能同步驱动数字人做出相应的嘴型、表情和动作,同时将渲染的数字人画面合成指定格式的视频文件。...

退订说明

支持退订的服务:3D数字人流媒体 退款入口选择 退订资源,具体操作,请参见 退订方式说明。不支持退款 您在使用产品过程中,如果违反了相关法律法规或违反了所购产品服务条款的规定,则不予退款。如果虚拟数字人开放平台的退订金额显示为0...

提交2D音频合成视频任务

接口说明 提交根据一段 wav 音频离线生成 2D 数字视频任务,该接口会立即返回一个 TaskUuid 作为本次提交任务的唯一 id,后续可以根据 TaskUuid 调用 查询视频合成任务详情 接口查询对应的任务的状态,当任务状态为已完成时可以获取到...

提交3D音频合成视频任务

接口说明 提交根据一段 wav 音频离线生成 3D 数字视频任务,该接口会立即返回一个 TaskUuid 作为本次提交任务的唯一 id,后续可以根据 TaskUuid 调用 查询视频合成任务详情 接口查询对应的任务的状态,当任务状态为已完成时可以获取到...

提交2D文本合成视频任务

接口说明 提交根据一段文本离线生成 2D 数字视频任务,该接口会立即返回一个 TaskUuid 作为本次提交任务的唯一 id,后续可以根据 TaskUuid 调用 查询视频合成任务详情 接口查询对应的任务的状态,当任务状态为已完成时可以获取到对应视频...

QueryVideoTaskInfo-查询视频合成任务列表

xxxx-xxxx-xxx Title string 否 要检索的视频任务标题,长度字符 测试 Type integer 否 任务类型:1:3D 数字视频合成。3:2D 数字视频合成。1 Status integer 否 任务业务状态,已过期和已取消的任务不支持查询:1:等待执行 2:执行中 3:...

提交3D文本合成视频任务

接口说明 提交根据一段文本离线生成 3D 数字视频任务,该接口会立即返回一个 TaskUuid 作为本次提交任务的唯一 id,后续可以根据 TaskUuid 调用 查询视频合成任务详情 接口查询对应的任务的状态,当任务状态为已完成时可以获取到对应视频...

三星堆大型沉浸式数字交互空间最佳实践

解决方案 方案简介 针对《三星堆奇幻之旅》大型沉浸式数字交互空间,需要大规模多人在线、百人同屏、隔空交互等业务诉求,阿里云云渲染(GCS)和视频云(RTC)团队联合,采用了“大规模即时云渲染技术”,用户无需下载任何客户端,扫码就可...

数字人和人声克隆

数字人计费 数字人计费项分为定制和使用两个维度,如下所示:数字人定制 提交训练视频由阿里云生成数字人形象,按定制次数计费。预购买页面:智能数字定制服务资源包。数字人使用 使用训练生成或官方的数字人形象,通过文字或语音驱动数字...

数字人播报API接入指南

} } } 重要 VAML文本消息目前仅支持3D数字人流媒体服务,2D数字人流媒体服务暂不支持。3.SendCommand-发送指令消息 3.1 接口介绍 接口描述:用于发生指令消息,用于驱动数字人执行一些相应的指令,如停止当前正在播报内容。API文档地址:...

数字人端渲染Android SDK

端渲染SDK无需借助音视频媒体服务,直接利用终端设备对3D数字人进行渲染,免去了音视频的推拉流,降低了交互延迟。目前端渲染SDK仅支持3D数字人,暂不支持2D数字人。文档版本 适用的SDK版本 1.0.2 1.0.2 一、系统要求 系统版本:支持...

操作指南概述

异步任务流程 流程适用的任务 MPS的所有任务类型,包括:媒体转码(普通转码、窄带高清1.0、窄带高清2.0、音视频增强等)、截图、获取媒体信息、视频AI(视频生产、智能标签、智能审核、视频DNA)等。流程说明 您可以通过MPS控制台、调用...

自动播放受限应对建议

问题介绍 浏览器为了防止网页自动播放音视频对用户造成干扰,对音视频的自动播放功能做了限制:在用户没有与网页产生交互(例如点击、触摸页面等)之前,带有声音媒体元素的网页将被禁止自动播放(Chrome中的自动播放策略,Safari中的自动...

接口说明

说话人识别功能可以将说话人所读出的连续数字串语音,与语音库中该用户ID所对应的声音特征进行1:1比对验证,当声音特征比对满足阈值条件时则身份验证成功。使用须知 支持的输入格式:PCM编码文件、16 bit采样位数、单声道(mono)。支持的...

通过播报数字人实现对话效果

开通智能语音交互 接入步骤 进入 虚拟数字人开放平台控制台 配置播报数字人 配置数字人形象 发布播报数字人 接入数字人播报能力 后端开发接入 3D播报数字人 或 2D播报数字人 前端引入 阿里云音视频通信 SDK 集成到网页端数字视频流 前端...

多轮对话管理

概述 意图识别与交互:准确识别用户意图,根据用户的回答动态决策,区别于传统的一问一答模式,通过多轮人机交互来解决复杂场景的任务,比如保险推荐、保单查询、预约等场景。因子管理:因子是一段取数逻辑,负责参数的传递和数据获取,...

input

本文介绍输入框(input)。属性名 类型 默认值 描述 最低版本 value String-初始内容-name String-组件名字,用于...键盘与组件的交互目前不再专门适配,如有交互异常问题请使用该方式进行处理。身份证输入键盘"enableNative="{{false}}"/>

创建并配置数字人项目

当您完成虚拟数字人服务开通后,您需要进入虚拟数字人开放平台创建虚拟数字人项目,并且完成项目相关配置,然后您可以在控制台体验虚拟数字人,以及开始接入虚拟数字人项目。前提条件 请您完成虚拟数字人 开通服务。操作步骤 创建数字人...

接入FAQ

1.启动数字人实例遇到“没有闲置资源”提示 该提示表示您购买的数字人实例路数全部在使用中,导致无法启动新的数字人实例,您可以通过在虚拟数字人开放平台进行升配,或者将不需要运行的数字人实例进行停止,停止数字人实例需要通过...

蓝图编辑器常见案例教学

视频链接 DataV小课堂直播视频:蓝图编辑器常见案例教学直播视频使用教程。案例概览 请求数据接口时动态传递参数 本案例是在请求数据接口时传递动态参数,实现Tab列表和数字翻牌器的数据联动。配置案例交互操作步骤如下,具体实操请参见 ...

H5纯订阅模式媒体文件播放失败

可能原因 浏览器为了防止网页在用户非自愿的情况下主动播放声音,对网页上的自动播放(Autoplay)功能做了限制:浏览器在没有用户交互操作之前不允许有声音的媒体播放。受浏览器策略影响,Chrome 70+、Safari、Firefox等浏览器新版本都不...

配置组件交互

本文以 数字翻牌器 组件为例,为您介绍DataV的资产交互配置功能。操作步骤 登录 DataV控制台。选择任一可视化应用,单击编辑,进入画布编辑器页面。添加 数字翻牌器 组件和 通用标题 组件到画布中。选择 数字翻牌器 组件,单击编辑器右侧的...

虚拟键盘

虚拟键盘主要适用发布后想要在组态输入内容的情况,主要针对如下两个场景:拖入“输入框”组件,在组件中输入英文、符号、数字;组件添加了“二次确认”的交互动作 场景一、虚拟键盘和输入框组件的结合使用 步骤一:在页面配置中,勾选...

数字水印(暗水印)

数字水印技术是指在不影响视频画面、图片等视觉质量及完整性的前提下,将数字信息(即数字水印)隐藏式的嵌入到音视频、图片等载体文件中,适用于版权保护、泄露溯源、文件验真等场景。本文为您介绍如何为视频文件添加数字水印,保障版权...

应用场景

本文为您介绍智能语音交互适用的各大应用场景。语音识别 语音搜索 支持各种场景下的语音搜索,如地图导航、浏览器搜索等。可以集成到任何形式的手机应用中,最大限度地解放双手。语音指令 通过语音命令控制智能设备,实现快捷便利的操作,...

数字翻牌器

图表样式 数字翻牌器是文字组件的一种,支持自定义翻牌器的标题、数字、前缀、后缀等样式,通常与其他组件配合使用,通过交互功能在可视化应用中展示实时数据的变化情况。样式面板 搜索配置:单击 样式 面板右上角的搜索配置项图标,可在...

数字翻牌器

图表样式 数字翻牌器是文字组件的一种,支持自定义翻牌器的标题、数字、前缀、后缀等样式,通常与其他组件配合使用,通过交互功能在可视化应用中展示实时数据的变化情况。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,可在 搜索...

名词解释

本章主要介绍数字园区引擎中相关的名词解释。产品名词解释 名词 描述 项目 用于资源管理,方便平台中做资源隔离。客户可以基于不同业态创建项目,例如某某小区、园区、学校。空间管理 对项目中的空间作管理,例如园区中的某栋楼、某个房间...

人声克隆概述

智能媒体服务支持通过对真人语音的学习训练,实现人声克隆定制的功能。通过阅读本文,您可以了解如何定制及使用克隆的人声。人声克隆定制 智能媒体服务提供...驱动方式为“文字驱动”的数字视频合成,详情请参见 创建数字视频合成任务。

二维图标层(v3.x版本)

图表样式 二维图标层是3D平面地图(v3.x版本)的子组件,支持独立的样式、数据和交互配置,包括图标的形状、大小和颜色等,能够以二维图标的形式定位3D平面地图中的地理位置。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,可在 ...

图标散点层(v3.x版本)

图标散点层支持独立的样式、数据和交互配置,包括图标散点层的图标配置、系列配置、弹框样式以及交互配置等。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,可在 搜索配置 面板中输入您需要搜索的配置项名称,快速定位到该配置项,...

矢量散点层(v3.x版本)

矢量散点层支持独立的样式、数据和交互配置。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,可在 搜索配置 面板中输入您需要搜索的配置项名称,快速定位到该配置项,系统支持模糊匹配。详情请参见 搜索资产配置。通用:设置矢量...

呼吸气泡层(v3.x版本)

图表样式 呼吸气泡层是3D平面地图(v3.x版本)的子组件,支持独立的样式、数据和交互配置,包括呼吸气泡的形状、半径、颜色以及发光效果等,能够以呼吸气泡的形式表现地理位置上的点数据信息。配置面板 搜索配置:单击 配置 面板右上角的 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
视频直播 视频点播 视图计算 实时数仓 Hologres 智能语音交互 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用