功能特性

媒体处理可以将一个音视频文件转换成另一个或多个音视频文件,以适应不同网络带宽、终端设备和用户的需求。对媒体的内容、文字、语音、场景进行多模态分析,实现智能审核、内容理解、智能编辑等多种处理功能。音视频转码 把音视频码流转换...

游戏:图像识别场景

游戏:图像识别场景 游戏多性能指标分析测试。基于图像识别技术的用例技术。多机型覆盖测试。其它疑问,请联系 技术支持。

2020年

2020年12月 类目名称 接口名称 功能描述 发布时间 发布地域 相关文档 图像识别 证件照质量审核 可以识别拍摄的证件照片是否存在质量问题,且有哪些质量问题。2020-12-31 华东2(上海)证件照质量审核 视频生产 视频SDR调色 基于内容语义...

人脸人体介绍

动作行为识别 识别视频图像中的人体动作行为,并返回识别后的行为类别。当前可以识别的行为类别包括:举手、吃喝、吸烟、打电话、玩手机、趴桌睡觉、跌倒。人体计数 识别输入图片中的人脸数量。人体结构化属性 检测图片中人体的属性,...

获取上传地址和凭证

文档中仅提供以V1.0版本的Java和Python语言的阿里云SDK调用视频点播的OpenAPI来获取上传地址和凭证的调用示例,其余语言以及V2.0 SDK的调用逻辑与之类似,请自行实现,具体操作,请参见 SDK概述。调用语言 操作指引 Java 安装Java SDK 初始...

SDK概述

SDK简介 文字识别OCR SDK 封装了2021-07-07版本下的所有API,以访问密钥(AccessKey)识别调用者身份,提供自动签名等功能,方便您通过API识别图片。阿里云开发者中心汇聚了高频使用的编程语言SDK,提供了项目地址、安装命令、版本说明等...

2021年

2021-09-31 华东2(上海)IPC图像目标检测 2021年08月 类目名称 接口名称 功能描述 发布时间 发布地域 相关文档 图像识别 广告素材分析 可以对素材图片中的人物(明星、素人、CG人物)、场景等打上标签信息,可支持数千个内容标签,覆盖...

C++

AI类目 Github链接 人脸人体 facebody 文字识别 ocr 商品理解 goodstech 内容审核 imageaudit 图像识别 imagerecog 图像生产 imageenhan 分割抠图 imageseg 目标检测 objectdet 视觉搜索 imgsearch 图像分析处理 imageprocess 视频生产 ...

接入人工审核服务

视频审核场景 您需要调用 视频异步检测接口,业务流程如下图所示。视频异步检测接口的识别结果会通过异步消息的方式返回到业务服务端(也支持您主动调用 结果查询接口 获取结果),人工审核结果会通过回调的方式返回到您配置的审核结果回调...

产品概览

参考文档 机器翻译通用版调用指南 机器翻译专业版调用指南 定制版翻译模型调用指南 语种识别调用指南 文档翻译调用指南 批量翻译调用指南 批量翻译调用指南 词典干预使用指南 词典干预使用指南 机器翻译自学习平台使用指南 词典干预使用...

行业文档智能FAQ

贸易单证识别产品已上线了11类单证识别能力,分别为出口报关单识别、进口报关单识别、销售确认书识别、发票识别、装箱单识别、进港箱单识别、提单识别、空运运单识别、海运运单识别、订舱委托书识别、原产地证识别。上传对应类型的单据,可...

SDK概述

SDK简介 OCR文档自学习 SDK 封装了2022-12-29版本下的所有API,以访问密钥(AccessKey)识别调用者身份,提供自动签名等功能,方便您通过API调用不同的定制模型。阿里云开发者中心汇聚了高频使用的编程语言SDK,提供了项目地址、安装命令、...

API概览

GetDetectLanguage 语种识别 调用GetDetectLanguage进行多种语言的识别。多模态翻译 API 标题 API概述 TranslateImage 图片翻译 调用TranslateImage进行多种语言之间图片的翻译。TranslateCertificate 证件翻译 调用TranslateCertificate...

文字识别介绍

二维码识别 识别图像中是否含有二维码信息,输出图像中二维码包含的文本信息(每个二维码对应的URL或文本),可支持图像中含有多个二维码识别。资产类证件识别 营业执照识别 识别营业执照关键字段内容,包括:公司地址、营业范围、注册资本...

拍照购物

本文为您介绍如何使用图像搜索(淘宝联盟版)进行拍照购物。前提条件 已开通图像搜索(淘宝联盟版)服务。详情请参见 开通服务。操作步骤 调用图像搜索(淘宝联盟版)服务。您可通过如下两种方式,调用图像搜索(淘宝联盟版)服务:使用API...

通过API进行视频剪辑

视频点播云剪辑服务提供专业的视频剪辑能力,支持音视频、图片、文字等素材剪辑合成新的视频。本文为您介绍如何使用视频点播OpenAPI或SDK进行视频剪辑并合成视频。费用说明 视频点播提供的云剪辑服务分为基础剪辑和高级剪辑两类进行计费,...

API概览

GetDetectLanguage 语种识别 调用GetDetectLanguage进行多种语言的识别。5000字符以下的语种识别。多模态翻译 API 标题 API概述 使用场景 TranslateImage 图片翻译 调用TranslateImage进行多种语言之间图片的翻译。对时延要求较高,10M以内...

多主体识别最佳实践

背景介绍 多主体识别介绍:图像搜索的多主体识别是指在图像搜索任务中,系统能够识别并理解图像中存在的多个主体(物体、人物、场景等)。多主体识别技术使得搜索引擎不仅能够找到包含单一物体的图像,还能够识别和检索出包含多个相关物体...

OCR

使用图像识别节点,可调用云市场购买的API进行驾驶证、车牌、身份证等图像文字识别。节点配置 配置项 说明 节点名称 设置节点名称。支持中文汉字、英文字母、数字和下划线(_),长度不超过30个字符。选择能力 从下拉框中选择您需要使用的...

计量计费相关

本章节介绍阿里云文字识别(OCR)关于计量计费的常见问题与解答。调用量在哪里查看 您可以在“OCR控制台-数据监控功能”查看。您也可以在“OCR控制台-设置-资源包管理”功能里,按照指引查看更详细数据。调用量的扣费顺序是?免费额度->专用...

图像识别

使用图像识别节点,可调用云市场购买的API进行烟雾火焰火灾、动物、植物花卉、花草树木鉴定等识别。节点配置 配置项 说明 节点名称 设置节点名称。支持中文汉字、英文字母、数字和下划线(_),长度不超过30个字符。选择能力 从下拉框中...

产品简介

实时无损分割SDK(macOS)离线视频分割 离线视频分割SDK(Android)基于客户端自身计算资源,对采集的视频实现视频图像序列化分割。离线视频分割SDK(iOS)文字离线识别 证件识别SDK(Android)支持身份证、驾驶证、行驶证正反面离线识别,...

媒资管理

删除媒体调用DeleteStream接口,生成删除媒体流的SDK示例。阿里云OpenAPI门户地址:DeleteStream。批量删除源文件 调用DeleteMezzanines接口,生成批量删除源文件的SDK示例。阿里云OpenAPI门户地址:DeleteMezzanines。批量更新图片信息...

计费概述

长文本语音合成 按照合成字数计费 语音分析 声音事件检测 按照录音时长计费 说话人识别 按照调用次数计费 性别识别 按照调用次数计费 语种识别 按照调用次数计费 附加产品费用 服务 说明 超额并发线路 一句话识别、实时语音识别默认提供200...

媒资管理

删除媒体调用DeleteStream接口,生成删除媒体流的SDK示例。阿里云OpenAPI门户地址:DeleteStream。批量删除源文件 调用DeleteMezzanines接口,生成批量删除源文件的SDK示例。阿里云OpenAPI门户地址:DeleteMezzanines。批量更新图片信息...

媒体基本信息

SDK调用API处理媒体基本信息 查询媒体基本信息 媒体处理提供2种查询方式查询媒体基本信息:通过媒体ID查询、通过OSS文件地址查询。使用媒体ID查询媒体基本信息 说明 如需了解参数详细信息,请参考 查询媒体-使用媒体ID。...

同账号主/子账号AccessKey ID方式调用

AccessKey ID应用场景 AccessKey ID、AccessKey Secret是最常用的风险识别服务调用鉴权字段。一个典型的应用方式是:客户的主账号A(阿里云账号)购买了风险识别流量包,通过创建子账号B(RAM用户)、并赋权,实现基于子账号B的服务调用。...

常见问题

风险识别的服务调用有何调用限制?单用户QPS为200。风险识别的服务耗时一般是多久?风控服务执行一般约为100 ms。地址评分支持多语言么?目前地址评分服务仅支持中文。地址评分支持多长的地址?200个字符以内。调用风险识别API服务返回以下...

并发与监控FAQ

本文为您介绍并发和QPS相关概念、如何查看服务的调用量和并发量以及相关常见问题,方便您查看各服务的使用情况。什么是并发?智能语音交互产品中的并发,是指系统同时处理的请求数。以实时语音转写为例,每当发起一个请求后(比如调用start...

API概览

媒体视频处理 媒体视频处理 IndexVideo 对视频进行自动截帧、分组、识别操作 调用IndexVideo接口将视频添加到媒体集中,并对视频进行自动截帧、分组、识别等操作。ListVideos 获取多个视频的信息 调用ListVideos接口获取媒体集中的视频...

计费概述

风险识别产品支持包年包月付费模式和按量付费模式。本文介绍以上不同付费模式的计费项、计费周期、开通方式等,帮助您快速了解风险识别相关的计费信息。说明 按量付费模式中,又可以分为后付费开通、预付费资源包购买两种购买形式。计费...

风格识别

SDK参考 阿里云视觉AI图像识别类目下的风格识别能力推荐使用SDK调用,支持多种编程语言,调用时请选择AI类目为图像识别(imagerecog)的SDK包,文件参数通过SDK调用可支持本地文件及任意URL,具体可参见 SDK总览。示例 请求示例 http(s):/...

媒资管理FAQ

调用 获取视频播放地址 接口获取要删除的流ID(即JobId),再调用 删除媒体流 接口进行删除。重转码后如何删除旧的流?为了新旧输出流的播放能平滑切换,重转码后会保留旧的流文件。为了保证每次播放的是最新转码输出的流,播放接口默认每...

通用图像打标

SDK参考 阿里云视觉AI图像识别类目下的通用图像打标能力推荐使用SDK调用,支持多种编程语言,调用时请选择AI类目为图像识别(imagerecog)的SDK包,文件参数通过SDK调用可支持本地文件及任意URL,具体可参见 SDK总览。示例代码 该能力常用...

场景识别

SDK参考 阿里云视觉AI图像识别(imagerecog)类目下的场景识别能力推荐使用SDK调用,支持多种编程语言,调用时请选择AI类目为图像识别(imagerecog)的SDK包,文件参数通过SDK调用可支持本地文件及任意URL,具体可参见 SDK总览。...

颜色识别

SDK参考 阿里云视觉AI图像识别类目下的颜色识别能力推荐使用SDK调用,支持多种编程语言,调用时请选择AI类目为图像识别(imagerecog)的SDK包,文件参数通过SDK调用可支持本地文件及任意URL,具体可参见 SDK总览。示例代码 该能力常用语言...

证件照质量审核

SDK参考 阿里云视觉AI图像识别类目下的证件照质量审核能力推荐使用SDK调用,支持多种编程语言,调用时请选择AI类目为图像识别(imagerecog)的SDK包,文件参数通过SDK调用可支持本地文件及任意URL,具体可参见 SDK总览。示例代码 该能力...

菜品识别

SDK参考 阿里云视觉AI图像识别类目下的菜品识别能力推荐使用SDK调用,支持多种编程语言,调用时请选择AI类目为图像识别(imagerecog)的SDK包,文件参数通过SDK调用可支持本地文件及任意URL,具体可参见 SDK总览。示例代码 该能力常用语言...

OCR

返回识别结果调用样例-rpa.ai.ocr.text-#注意事项:无#代码调用样例如下:image_path=r'D:\2_测试文件归档\OCR文字识别.jpg' text=rpa.ai.ocr.text(image_path,engine='paddle')id_card id_card(image_path)方法描述 身份证识别 参数说明 ...

API概览

识别配置 API 标题 API概述 CreateScanTask 创建扫描任务 调用CreateScanTask接口为识别权限授权成功的资产创建识别敏感数据的定制化扫描任务。ModifyDefaultLevel 修改敏感数据的风险等级定义规则 调用本接口修改敏感数据的风险等级定义...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
图像搜索 短信服务 智能视觉 弹性公网IP 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用