图像处理识别变换-图像处理识别变换文档介绍内容-阿里云

来往大陆（内地）通行证识别

本接口图片示例（仅支持正面识别）本接口核心能力分类概述图像增强默认支持图像增强，包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体...

API市场服务私网访问

身份证OCR图像识别 dfidcard.market.alicloudapi.com dfidcard.api.market.aliyunnest.com cn-hangzhou https://market.aliyun.com/products/57126001/cmapi00035059.html 生活服务【数脉API】快递查询全国快递物流查询快递单号查询快递...

RecognizeTrainInvoice-火车票识别

接口说明本接口适用场景阿里云火车票识别，是阿里云官方自研 OCR 文字识别产品，适用于识别火车票上车次、座位号、旅客信息、座位类型、票价等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经多年沉淀...

AliyunOCR

use_new_style_output=False)方法描述 OCR文档结构化识别参数说明 image_path待识别图像路径，支持本地路径或url路径 output_char_info是否输出单字识别结果 need_rotate是否需要自动旋转功能 output_table是否输出表格识别结果，包含单元...

第二类医疗器械经营备案凭证识别

第二类医疗器械经营备案凭证识别。接口说明本接口适用场景阿里云第二类医疗器械经营备案凭证识别，是阿里云官方自研 OCR 文字识别产品。适用于识别第二类医疗器械经营备案凭证备案编号、企业名称、经营方式、法定代表人、经营范围等信息...

RecognizeBankAcceptance-银行承兑汇票识别

接口说明本接口适用场景阿里云银行承兑汇票识别，是阿里云官方自研 OCR 文字识别产品，适用于识别银行承兑汇票上的出票日期、到期日期、票据状态、票据号码、出票人信息、售票人信息、承兑人信息等关键信息的场景。阿里云 OCR 产品基于...

商品理解介绍

商品理解技术是基于阿里云深度学习算法，结合图像或视频的商品检测、分析/比对技术，为您提供对商品类目、标签、属性的识别以及置信度信息等能力。可广泛应用于电子商务、零售、生产等行业，实现货架商品识别、商品二维码识别、商品属性...

RecognizeFoodManageLicense-食品经营许可证识别

接口说明本接口适用场景阿里云食品经营许可证识别，是阿里云官方自研 OCR 文字识别产品，适用于识别食品经营许可证上的经营者名称、法定代表人名称、社会信用代码等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及...

捕捉控件

考虑到匹配的准确性与效率，我们一般推荐您使用基于自动匹配的模式，若您希望捕捉的控件或其所在的界面无法被该模式识别，您也可以通过图像录制的模式，来截取目标操作区域，RPA会通过图像识别的方式对其进行匹配。2.1.自动匹配模式/win32-...

RecognizeFoodProduceLicense-食品生产许可证识别

食品生产许可证识别。接口说明本接口适用场景阿里云食品生产许可证识别，是阿里云官方自研 OCR 文字识别产品。适用于识别食品生产许可证社会信用代码、发证机关、生产地址、签发日期等信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大...

图像识别计费介绍

本文主要介绍图像识别收费能力的计费方式及费用详情。其余未收费能力当前还处于公测阶段，可免费使用。咨询服务如果您有任何购买问题需要咨询阿里云视觉智能开放平台，欢迎各位企业用户、开发商、服务商或者开发者通过钉钉搜索群号 ...

RecognizeAirItinerary-航空行程单识别

接口说明本接口适用场景阿里云航空行程单识别，是阿里云官方自研 OCR 文字识别产品，适用于识别航空行程单所包含的乘机人姓名、身份证号、电子客票号码、验证码、填开日期、销售单位代号、承运人、填开单位、票价、税费、燃油附加费等...

RecognizeHousehold-户口本识别

户口本识别，支持户口本户主页和常住人口页识别。接口说明本接口适用场景阿里云户口本识别，是阿里云官方自研 OCR 文字识别产品，可用于识别户口本户主页的户主姓名、住址、户号等字段。也适用于识别户口本常住人口页的出生日期、出生地...

RecognizeInvoice-增值税发票识别

接口说明本接口适用场景阿里云增值税发票识别，是阿里云官方自研 OCR 文字识别产品，适用于识别增值税发票上所包含的价税合计、发票代码、发票号码等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经...

RecognizeCarInvoice-机动车统一销售发票识别

接口说明本接口适用场景阿里云机动车销售发票识别，是阿里云官方自研 OCR 文字识别产品，适用于识别购车发票上的发票金额、购买方名称、车辆类型、厂牌型号、销售方名称等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI ...

进阶指南

MPImageGrayListener（废弃）/*获取识别图像的平均灰度值*正常范围大约在 50-140 之间，*当灰度值低于或高于正常范围时，通常意味着环境亮度过低或过高，可以提示用户打开或关闭手电筒*注意：该方法在识别过程中会不断被调用*@param gray ...

PDF识别

本文介绍文字识别（ocr）类目下的PDF识别RecognizePdf的语法及示例。功能描述 PDF识别能力可以对PDF上的文字进行结构化识别。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验，您可以单击 ...

计费说明

如：使用录音文件识别处理了30分钟的音频，则计费=0.5小时*2.5元/小时=1.25元；使用长文本语音合成处理了1千字，则计费=0.1万字*3元/万字=0.3元。多声道计费模式：8k处理双声道，按单声道计费，即音频时长进行计费。16k处理多声道，按多...

多媒体分析概述

背景信息多媒体分析支持的算法服务如下：基础模型服务：提供图像领域内开箱即用的算法服务能力，包括图像多标签、图像质量分评定、人脸属性分析（颜值、脸型、发型、发色等信息）、年龄分析、人像身材修改（瘦身/大码）、图像去水印等模型...

API详情

概述 Paraformer语音识别提供的文件转写API，能够对常见的音频或音视频文件进行语音识别，并将结果返回给调用者。常见的音频或音视频文件一般采用16kHz及以上的采样率进行录制，可选择paraformer-v1模型进行中英文语音识别，或选择...

Java SDK

关键接口 NlsClient：语音处理客户端，利用该客户端可以进行一句话识别、实时语音识别和语音合成的语音处理任务。该客户端为线程安全，建议全局仅创建一个实例。SpeechRecognizer：一句话识别处理类，通过该接口设置请求参数，发送请求及...

录音文件识别API详情

Paraformer语音识别说明支持的领域/任务：audio（音频）/asr（语音识别）Paraformer语音识别提供的文件转写API，能够对常见的音频或音视频文件进行语音识别，并将结果返回给调用者。常见的音频或音视频文件一般采用16kHz及以上的采样率...

录音文件识别API详情

Paraformer语音识别说明支持的领域/任务：audio（音频）/asr（语音识别）Paraformer语音识别提供的文件转写API，能够对常见的音频或音视频文件进行语音识别，并将结果返回给调用者。常见的音频或音视频文件一般采用16kHz及以上的采样率...

多主体识别最佳实践

背景介绍多主体识别介绍：图像搜索的多主体识别是指在图像搜索任务中，系统能够识别并理解图像中存在的多个主体（物体、人物、场景等）。多主体识别技术使得搜索引擎不仅能够找到包含单一物体的图像，还能够识别和检索出包含多个相关物体...

什么是文档智能

文档智能深度融合文字识别、自然语言处理、图像处理、电子文档解析、文档预训练模型等多项技术，对非结构化和半结构化文档进行智能自动化处理，从而简化业务操作流程、提升文档处理效率。选择文档智能，您可以高效完成以下文档处理任务：...

图像增强处理

图像增强功能一般用来解决中低端全景相机的画质问题，能够进行有效降噪及色彩增强。重要图像增强处理时间一般为30s左右，如在处理后想取消该功能只需重新点击图像增强功按钮即可。原图对比图像增强后的效果：

什么是阿里云视觉智能开放平台

具体方向包括：生成专区、人脸人体、文字识别、商品理解、内容审核、图像识别、图像生产、分割抠图、视觉搜索、图像分析处理、目标检测、视频理解、视频生产、视频分割共14个类目，上百项AI能力供您使用。平台将持续更新迭代更多视觉AI...

RecognizePassport-护照识别

护照识别。接口说明本接口适用场景阿里云国际护照识别，是阿里云官方自研 OCR 文字识别产品，适用于出入境审查、国内外身份核验等各种需要提取护照信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经多年沉淀...

新手指南

其他类目能力详细说明及使用方法，请参见：生成专区、人脸人体、文字识别、商品理解、内容审核、图像识别、图像生产、分割抠图、视觉搜索、图像分析处理、目标检测、视频理解、视频生产、视频分割。参考案例开发代码示例为身份证识别系统...

2022年

2022-08-31 华东2（上海）会话反馈 2022年7月类目名称能力名称功能描述发布时间发布地域相关文档 图像分析处理 多器官分割多器官分割能力针对放疗场景，基于输入的胸部CT图像，进行危及器官的识别与分割。2022-07-19 华东2（上海）...

智能视觉生产的审计事件

操作审计支持将管控事件投递到日志服务SLS的LogStore或对象存储OSS的存储空间中，满足实时审计、问题回溯分析等需求。操作审计记录了用户通过OpenAPI或控制台等方式操作云资源时产生的管控事件，智能视觉生产支持在操作审计中查询的事件...

系统配置

您可在数据保护伞的系统配置页面，设置数据保护伞的识别内容、识别范围，水印文件保存时间，是否展示风险识别的数据安全等级，以及告警信息的接收邮件及WebHook地址，以便及时发现并处理潜在安全风险。进入系统配置页面进入数据开发页面。...

行业文档智能FAQ

贸易单证识别产品已上线了11类单证识别能力，分别为出口报关单识别、进口报关单识别、销售确认书识别、发票识别、装箱单识别、进港箱单识别、提单识别、空运运单识别、海运运单识别、订舱委托书识别、原产地证识别。上传对应类型的单据，可...

贸易单证识别

功能简介贸易单证识别提供针对贸易类单证文书的识别抽取能力，适合报关、货代、金融风控等贸易业务涉及的单据流转场景，结合文字识别和自然语言处理技术，提供以贸易单证解析能力为主的标准化产品，实现AI协同替代单据信息手动录入。...

Go（不推荐）

AI类目 Github链接人脸人体 facebody 文字识别 ocr 商品理解 goodstech 内容审核 imageaudit 图像识别 imagerecog 图像生产 imageenhan 分割抠图 imageseg 目标检测 objectdet 视觉搜索 imgsearch 图像分析处理 imageprocess 视频生产 ...

通用文字识别

为了能够更好的还原文字信息和文档结构，读光文档识别在通用全文识别能力（文字定位、行分析、文字识别）的基础上，增加了文档结构的版面分析和文档图像处理能力，使得文档类图像也能按照结构化的方式进行文档元素提取，进一步提升文档识别...

2021年

2021年01月14日华北2（北京）华东2（上海）华东1（杭州）华南1（深圳）无 MediaFlow Processor EAS 提供的MediaFlow Processor是通用的编排引擎，可以进行视频、音频及图像分析处理。2021年01月11日华北2（北京）华东2（上海）华东1...

产品功能相关

文档智能是文字识别技术的进一步升级，除了文字识别，文档智能还综合运用自然语言处理、图像处理、电子文档解析、文档预训练模型等多种技术，实现对PDF/Word/Excel/图片等各类非结构化和半结构化文档的智能自动化处理。相较于文字识别只能...

人脸识别类商品准入售卖补充规则公示

在社会公众的强烈呼吁下，相关规则逐步出台，《最高人民法院关于审理使用人脸识别技术处理个人信息相关民事案件适用法律若干问题的规定》于2021年8月1日起施行，《个人信息保护法》于2021年11月1日起施行。阿里云云市场将以《规定》和...

SegmentBody人像分割

SegmentBody用于识别输入图像中的人体轮廓，与背景进行分离，返回分割后的前景人像图（4通道），适用于单人、多人、复杂背景、各类人体姿态等场景。介绍名称：人像分割 Action:SegmentBody 图片限制图片格式：JPEG、JPG、PNG（不支持8位...

图像处理识别变换

新品推荐