OCR文档自学习概述

本平台采用少样本训练、智能预标注,视觉-语义联合学习等前沿AI技术,支持客户低成本实现个性化场景的文档数字化和信息化业务。提供用户可控的定制化工具,帮助用户实现其业务场景下的模型定制,实现业务数据驱动AI服务。多模态信息抽取,...

接入准备

文档介绍数字社区平台接入前置准备工作 1.注册阿里云账号【如有请跳过】https://www.aliyun.com/ 2. 开通应用服务平台【如有请跳过】https://si.iot.aliyun.com/ 3. 创建项目 https://si.iot.aliyun.com/ 指导文档:...

2D数字人视频合成接入指南

平台支持在任务开始和任务结束时进行事件回调,具体可参考文档数字人回调事件通知。CallbackParams String 否 回调时需要平台透传的一些参数,传入该参数会在回调时添加在事件内容的callbackParams字段。json格式字符串,callback=false...

3D数字人视频合成接入指南

平台支持在任务开始和任务结束时进行事件回调,具体可参考文档数字人回调事件通知。CallbackParams String 否 回调时需要平台透传的一些参数,传入该参数会在回调时添加在事件内容的callbackParams字段。json格式字符串,callback=false...

数字人视频合成开发指南

核心流程:参考文档数字人回调事件通知。3.数字人视频合成完整调用示例代码 3.1 引入二方包<dependency><groupId>com.aliyun</groupId> <artifactId>avatar20220130</artifactId> <version>${使用最新版本}</version></dependency>...

数字人流媒体开发指南

目的:驱动数字人播报对应的文本 核心流程:客户应用客户端向客户应用服务端发起驱动数字人播报文本请求,客户应用服务端收到请求后通过调用虚拟数字人开放平台服务端SDK的SendText接口驱动数字人播报,具体可参考文档数字人播报API接入...

SubmitAudioTo2DAvatarVideoTask-提交2D音频合成视频...

平台支持在任务开始和任务结束时进行事件回调,具体可参考文档数字人回调事件通知。false CallbackParams string 否 回调时需要透传的一些参数,json 格式字符串,callback=false 时不生效。{"xxx":"xxx"} ExtParams string 否 一些扩展...

VAML协议接入指南

通过SendMessage接口,发送VAML播报请求,可参考文档数字人播报API接入指南 从虚拟数字人开放平台获取数字人动作code,具体参考 1.2 获取数字人动作code VAML文本内容参考下方,修改对应的标签调整为自己想要的动作信息即可?xml version=...

SubmitAudioTo3DAvatarVideoTask-提交3D音频合成视频...

平台支持在任务开始和任务结束时进行事件回调,具体可参考文档数字人回调事件通知。false CallbackParams string 否 回调时需要透传的一些参数,json 格式字符串,callback=false 时不生效。{"xxx":"xxx"} ExtParams string 否 一些扩展...

SubmitTextTo2DAvatarVideoTask-提交2D文本合成视频...

平台支持在任务开始和任务结束时进行事件回调,具体可参考文档数字人回调事件通知。false CallbackParams string 否 回调时需要透传的一些参数,json 格式字符串,callback=false 时不生效。{"xxx":"xxx"} ExtParams string 否 一些扩展...

StartInstance-启动一个数字

启动一路数字人视频流实例,通过传入指定的参数,可以启动一路数字人实例,该接口针对播报数字人、互动数字人等这类使用平台默认视频流渠道的数字人实例会返回阿里公有云RTC拉流需要的参数,使用者无需额外开通阿里公有云RTC产品服务,可...

什么是虚拟数字人开放平台

文档介绍虚拟数字人开放平台的定义、产品架构、产品能力、控制台功能、应用场景、产品优势等相关信息。虚拟数字人开放平台,是由阿里云所提供的数字人服务,它集成了自然语言处理、图形图像、语音等算法能力,提供给客户标准的 PaaS 接口...

数字人端渲染Android SDK

本文介绍了数字人端渲染Android SDK的接入方式。端渲染SDK无需借助音视频流媒体服务,直接利用终端设备对3D数字人进行渲染,免去了音视频的推拉流,降低了交互延迟。目前端渲染SDK仅支持3D数字人,暂不支持2D数字人。文档版本 适用的SDK...

客户端SDK接入

本篇文档介绍虚拟数字人开放平台提供的3D数字人流媒体服务和2D数字人流媒体服务的客户端SDK接入方案。3D数字人流媒体服务和2D数字人流媒体服务简称数字人流媒体服务。虚拟数字人开放平台的数字人流媒体服务通过阿里云音视频通信服务(阿里...

动态与公告

文档更新虚拟数字人开放平台产品更新记录。2023年8月15日 数字人视频合成新增轻量SaaS应用,可从控制台-应用中心-视频合成进入使用。2023年8月1日 2D数字人形象定制商业化发布,可通过控制台上传形象素材完成真人形象定制。2023年6月30日...

API概览

关于阿里公有云RTC拉流SDK接入文档可参考数字人开放平台帮助中心《客户端SDK接入》文档。StopInstance 停止一个数字人 关闭一路数字人实例,停止数字人推流。QueryRunningInstance 查询运行中的数字人实例 查询运行中的数字人实例列表,该...

数字人播报API接入指南

文档介绍如何驱动数字人进行播报、以及执行对应的指令,以及如何通过使用SSML文本实现自定义数字人播报的动作。涉及数字人的播报系列API:SendText-发送普通文本消息、SendVaml-发送vaml文本消息、SendCommand-发送指令消息。播报API介绍...

2D互动数字人接入指南

2D互动数字人(对应开放平台的“智能客服”场景)是虚拟数字人开放平台提供能够支持用户与2D数字人进行实时语音交互的数字人产品能力,需要配合 智能对话机器人 产品使用。本篇文档将介绍如何接入2D互动数字人。警告 目前2D互动数字人公测...

3D互动数字人接入指南

3D互动数字人(对应开放平台的“智能客服”场景)是虚拟数字人开放平台提供能够支持用户与3D数字人进行实时语音交互的数字人产品能力,需要配合 智能对话机器人 产品使用。本篇文档将介绍如何接入3D互动数字人。能力介绍 3D互动数字人是...

服务支持

文档汇总了虚拟数字人的常见问题和服务等级协议等内容。常见问题 数字人开放平台常见问题 品牌智能直播间常见问题 服务等级协议 数字人开放平台产品服务协议 品牌智能直播间产品服务协议

操作指南

文档汇总了虚拟数字人产品的操作指南。3D数字人视频合成用户指南 2D数字人视频合成用户指南 数字人视频合成:如何在平台生成透明背景视频 2D真人形象定制 品牌智能直播间自定义优化设置——直播间功能类 品牌智能直播间自定义优化设置...

接入指南

服务端接入 虚拟数字人开放平台服务端接入依赖OpenAPI 在调用OpenAPI之前需要拿到API调用所需要的AK和SK,获取方式可参考 获取AccessKey文档 详细的服务端接入文档可参考 服务端 API 接入篇 客户端接入 客户端接入,主要解决的是视频流拉取...

总体流程

本篇文档主要描述使用数字园区引擎的主要流程图,以及可以实现的主要场景。总结下来,基于数字园区引擎可以实现的主要场景:创建项目,实现对园区内资源的管理 激活物业管理一体机,分发适配器应用和驱动,实现对园区内网设备或者系统的...

创建并配置数字人项目

选择场景,此处的 资讯播报 对应的文档中的 播报数字人,虚拟直播 对应的文档中的 推流数字人,客服助理 对应的文档中的 互动数字人,视频合成 对应的就是文档中的 视频合成,根据您的需求选择对应的场景,点击下一步。填写项目信息,需要...

子账号开通引擎

本章节主要讲解如何基于子账号开通数字园区引擎。一、主账号开通引擎 用子账号登录数字园区,需要主账号先开通签约数字园区,请参考文档 开通引擎。二、登录RAM平台创建子账号 主账号开通数字园区之后,需要以主账号登录 RAM平台,创建子...

数字人信息获取指南

文档介绍如何在虚拟数字人开放平台获取数字人的相关信息,如数字人形象code、数字人动作code、发音人code等。一、开发者信息获取(TenantId+AppId)1.1 租户ID(TenantId)获取 租户ID是当前登录的阿里云账号在虚拟数字人开放平台的唯一...

功能发布记录

本文介绍数字证书管理服务的产品功能和对应的文档动态。2024年02月 功能名称 变更类型 功能描述 发布时间 相关文档 部署和资源管理 新增 SSL证书多云产品、多证书实例一键部署功能。支持通过创建部署任务的形式,同时部署多个证书、多个云...

数字人平台发音人列表

文档为您介绍虚拟数字人开放平台支持的智能语音合成的声音列表。详细的声音列表也可以从虚拟数字人开放平台控制台的 资产中心 查看,并支持在线调节与试听。多情感(荐)名称 Voice值 描述 支持的情感(emotion category)试听 知哲 ...

OCR文档自学习

以平台化全流程可视化操作,引导用户通过数据处理、模型构建训练、模型管理、部署发布等操作,快速完成更满足场景需求的高精度AI模型生产的一站式工具型平台产品,旨在帮助企业更好地解决多模态文档处理的需求,助力数字化转型。...

快速体验数字人效果

文档介绍如何快速体验虚拟数字人开放平台提供的3D数字人实时播报效果。一、下单开通虚拟数字人开放平台权限 0元下单一路 3D数字人流媒体(停复机),计费方式是开机之后收费,具体计费可点击:计费文档。下单之后默认是关机状态,需要...

快速入门

如果您是初次使用虚拟数字人,请参见快速入门文档,以帮助您快速了解如何购买和使用虚拟数字人产品。快速入门文档 品牌智能直播间快速入门 数字人开放平台快速入门

2D真人形象定制

1.2D数字人(真人模特)拍摄 请参考标准 拍摄文档 进行拍摄。2D数字人的动作依赖于您拍摄视频素材时模特做的动作,目前只能支持小幅度的通用播报动作,不支持有特定含义的动作例如“再见”、“比数字1”、“鞠躬”等。2.在平台的资产管理处...

基本概念

文档介绍了使用阿里云数字证书管理服务时需要了解的基本概念。数字证书 数字证书是一个经权威授权机构数字签名,包含公开密钥的拥有者信息以及公开密钥的文件,是权威机构颁发给网站的可信凭证。最简单的证书包含一个公开密钥、证书名称...

2D播报数字人接入指南

2D播报数字人(对应开放平台的“咨询播报”场景)是虚拟数字人开放平台提供能够支持用户通过发送文本让2D数字人进行播报的实时文本驱动数字人产品能力。本篇文档将介绍如何接入2D播报数字人。警告 目前2D播报数字人公测已经结束,暂时不...

3D语音驱动数字人接入指南

本篇文档将介绍如何接入3D语音驱动数字人。警告 目前3D语音驱动数字人公测已经结束,暂时不支持接入。使用场景 适用于一些不需要真人出镜的场景。前置条件 下述介绍接入3D语音驱动数字人需要提前完成的步骤,每个步骤都需要完成才能顺利接...

2D推流数字人接入指南

本篇文档将介绍如何接入2D推流数字人。警告 目前2D推流数字人公测已经结束,暂时不支持接入。能力介绍 2D推流数字人是虚拟数字人开放平台提供能够支持将数字人流媒体内容推送到用户指定的直播平台的数字人产品能力。使用场景 适用于支持...

SendMessage-发送文本消息

VAML 协议请求对象 Code string 否 VAML 请求类型:默认可以不填 VAML_REQUEST Vaml string 否 VAML 协议请求,具体参考 官方文档 参考文档 Feedback boolean 否 是否需要在数字人进行播报该条消息的时候进行回调通知,默认值 false,具体...

通用WebSocket接入指南

文档向您介绍如何对接虚拟数字人开放平台的通用WebSocket服务,适用于互动数字人这类需要通过WebSocket来持续传输语音流数据的产品服务。建立WebSocket连接 开发者可以通过js、java、python等支持标准websocket协议的语言作为WebSocket...

数字社区体验说明

本章将为您介绍如何体验数字社区中的各类服务,由于正式小区的开通需要提供相关法务合同证明企业和小区间的管理关系,为了简化体验流程,数字社区已经申请数字社区钉钉组织,并创建了2个支付宝小程序,供体验用户使用。加入体验组织 使用...

接入FAQ

1.启动数字人实例遇到“没有闲置资源”提示 该提示表示您购买的数字人实例路数全部在使用中,导致无法启动新的数字人实例,您可以通过在虚拟数字人开放平台进行升配,或者将不需要运行的数字人实例进行停止,停止数字人实例需要通过...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数字证书管理服务(原SSL证书) 阿里邮箱 弹性公网IP 商标服务 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用