智能图像场景识别技术-智能图像场景识别技术文档介绍内容-阿里云

人脸人体介绍

阿里云视觉智能开放平台基于达摩院自研的人脸人体分析技术，提供人脸检测与五官定位、人脸属性识别、人脸比对、人脸搜索、人体检测、人体属性、行为分析等多种功能，为开发者和企业用户提供高性能高可用的人脸人体识别服务。广泛应用于数字...

RecognizeBusinessLicense-营业执照识别

接口说明本接口适用场景阿里云营业执照识别，是阿里云官方自研 OCR 文字识别产品，适用于识别营业执照上的公司名称、地址、主体类型、法定代表人、注册资金、组成形式、成立日期等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大...

什么是城市视觉智能引擎

城市视觉智能引擎（City Visual Intelligence Engine）依托于阿里云分布式计算和存储平台，利用先进的视频图像、图形学处理技术和深度学习算法，建立城市级人工智能模型，通过对相应场景的分析、索引和挖掘，赋能交通、市政综治、商业、...

RecognizeIdcard-身份证识别

接口说明本接口适用场景阿里云身份证文字识别，是阿里云官方自研 OCR 文字识别产品，用于对中国大陆身份证（含临时身份证）正反面图片进行智能文字识别并结构化输出识别结果。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据...

内容安全检测

视频违规检测视频违规信息检测通常用于视频智能鉴黄、视频涉政暴恐、视频不良场景、视频Logo识别、视频图文违规等基本场景。关于视频违规检测支持的检测内容，请参见视频违规检测。使用限制图片违规检测限制项限制图片格式支持检测...

多主体识别最佳实践

多主体识别技术使得搜索引擎不仅能够找到包含单一物体的图像，还能够识别和检索出包含多个相关物体的复杂图像。在实际应用中，这意味着当用户对某一图像进行搜索时，搜索引擎可以通过分析图像的视觉内容，判断出图像中所有显著的元素，并将...

应用场景

媒体处理可以将多媒体数据转码...智能审核提效 智能识别视频色情、暴恐摄政、广告、不良画面等内容，大幅节省人工审核人力成本，降低违规风险。AI赋能视频AI技术结合画面美学和海量用户行为数据，选出最优画面分析截图，提升视频点击转化率。

图像分析处理介绍

图像分析处理基于阿里云深度学习技术，对图像分析后进行相关处理，多用于特殊行业如医疗辅助诊断、工业辅助生产等应用场景。服务开通请单击立即开通在对应产品页面开通该服务，具体开通方式请参见新手指南。服务开通后会开通该能力下的...

OCR文字识别

阿里云文字识别（Optical Character Recognition，OCR）可以将图片中的文字信息转换为可编辑文本，根据客户的业务场景和需求，将产品分为了通用文字识别、个人证照识别、票据凭证识别、教育场景识别、车辆物流识别、企业资质识别、小语种...

产品简介

OCR 支持身份证、银行卡等卡证类、票据类及交通类场景识别，支持提供定制化服务，可以有效提升信息录入效率，广泛应用于身份信息核验、财务会计、金融、出境等场景。产品定价调用次数区间费率 0<调用量≤10 万 0.0825 元/次 10 万<调用量...

功能概览

针对保险、银行等金融领域的双录（录音、录像）场景合规性要求，智能双录质检利用 AI 技术实现对销售过程中各类关键动作、语音、证件的检测，以及关键角色的面部追踪，实现对销售过程的智能化监控。其中，智能双录质检提供的终端检测能力，...

多媒体分析概述

使用指导开通多媒体分析服务和购买资源包新用户首先需要在人工智能平台PAI 的场景化解决方案的多媒体分析中开通服务，具体操作步骤如下。登录 PAI控制台。按照下图操作指引，开通多媒体分析服务。默认使用按量付费（后付费）方式...

猫鼠识别

功能描述猫鼠识别能力基于视觉AI算法、物联网、大数据分析技术，猫鼠识别能力可以检测出场景中是否有猫、老鼠等动物，实现实时预警。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验，您...

2023年

融合戴口罩生成、抗遮挡关键点定位、抗遮挡特征注意力三大技术优化，实现戴口罩时的极速人脸识别。2023-02-02 华东2（上海）口罩人脸比对1:1 图像生产生成式图像卡通化输入一张图像，选择想要生成的卡通化风格，即可生成与输入图像相同...

着装检测

功能描述着装检测能力基于视觉AI算法、物联网、大数据分析技术，检测指定场景范围内的人员帽子、口罩、工作服等穿戴情况，对不规范穿戴行为进行实时预警。说明您可以进入在线咨询获取在线人工帮助。阿里云视觉智能开放平台视觉AI能力...

工业质检解决方案

虽然人工智能和机器视觉等检测技术逐渐成熟，但人工目视的方法仍占据较大比重，导致了生产自动化程度低、生产效率低、难以形成精益化生产等问题。针对该问题，阿里云 PAI 借助人工智能算法，提出了如下解决方案。解决方案基于智能标注...

模板视频人脸融合

对于多人脸视频场景，系统会自动识别出整个视频中的不同人物ID，建议视频中的人物不要出现角度过大的转动以及明显遮挡的情况，否则识别出的人物ID个数可能不准确。推荐图像示例：不推荐图像示例：调用步骤该能力为异步能力，需分两步进行...

API概览

本产品（智能媒体管理/2020-09-30）的OpenAPI采用 RPC 签名风格，签名细节参见签名机制说明。我们已经为开发者封装了常见编程语言的SDK，开发者可通过下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求，可...

新功能发布记录

医疗场景识别资源包多语言识别资源包教育场景识别资源包车辆物流识别资源包企业资质识别资源包票据凭证识别资源包个人证照识别资源包通用文字识别资源包商品定价调整低价档10w次、50w次、100w次三个规格价格下调，高价档全规格...

视频AI概述

视频点播提供智能审核、视频DNA、智能标签、智能封面等多种形式的媒体内容智能处理及内容智能生成能力，通过对音视频内容进行识别、分析和理解，可提升音视频内容生产的效率和质量。本文为您简要介绍视频点播提供的视频AI能力。视频AI服务...

支持文件类型说明

商品名称 API功能通用文件类型特殊文件类型通用文字识别电商图片文字识别.png/.jpg/.jpeg/.jpe/.bmp/.gif/.tiff/.tif/.webp 说明单张图片大小不...试卷切题识别精细版结构化识别整页试卷识别公式识别医疗场景识别 核酸检测报告识别

服务端人脸识别SDK

服务端人脸识别离线SDK，包括人脸检测、人脸跟踪、人脸关键点定位、人脸质量、角度模型、活体检测和人脸识别等能力，可以直接部署服务器上。人脸识别SDK具有授权功能，一旦授权成功，可以在无网的条件下使用，用户可根据自己的业务需求进行...

OCR

使用图像识别节点，可调用云市场购买的API进行驾驶证、车牌、身份证等图像文字识别。节点配置配置项说明节点名称设置节点名称。支持中文汉字、英文字母、数字和下划线（_），长度不超过30个字符。选择能力从下拉框中选择您需要使用的...

场景识别

本文介绍图像识别（imagerecog）类目下的场景识别RecognizeScene的语法及示例。功能描述 场景识别能力可以识别图像中的场景环境，支持数十种常见场景，包括：人物、动物、狗、猫、鱼、鸟、花、草地、蔬菜、植物、水果、餐厅、美食、聚餐、...

医疗场景识别

产品介绍基于OCR技术，医疗场景识别提供中国疫情防控场景下的核酸检测报告的结构化识别服务。说明功能体验地址：https://duguang.aliyun.com/ 开通享免费额度：https://ocr.console.aliyun.com/overview 购买地址：...

同步检测

图片审核帮助您检测图片中的风险或违规内容，具体包括以下场景：图片智能鉴黄、图片暴恐涉政、图文违规、图片二维码、图片不良场景、图片logo。使用说明业务接口：/green/image/scan，表示图片同步检测。您可以调用该接口创建图片同步检测...

人脸活体检测

智慧酒店自助入住：在酒店前台自助办理入住场景中，运用活体检测技术实现无人监管场景下，住客非活体攻击（纸张人脸、电子屏人脸）的高效率拦截。金融远程身份认证：面向投资理财、基金交易、保险理赔等金融业务的活体检测需求，高效率实现...

红外人脸活体检测

智慧酒店自助入住：在酒店前台自助办理入住场景中，运用红外活体检测技术实现无人监管场景下，住客非活体攻击（纸张人脸、电子屏人脸）的高效率拦截。特色优势高精度防伪：基于图片中人像目标的高维度特征（风格化、摩尔纹、成像畸形等）...

口罩人脸比对1:1

融合戴口罩生成、抗遮挡关键点定位、抗遮挡特征注意力三大技术优化，实现戴口罩时的极速人脸识别。两张人脸图片对比：比对两张图片中人脸的相似度，返回这两个人脸的矩形框坐标、人脸五点关键点坐标、比对的置信度，以及不同误识率的置信度...

营业执照识别

本文介绍文字识别（ocr）类目下的营业执照识别RecognizeBusinessLicense的语法及示例。功能描述营业执照识别能力可以识别营业执照关键字段内容，包括：公司地址、营业范围、注册资本、注册日期、公司法人、公司名称、统一社会信用代码、...

增值税发票识别

本文为您介绍文字识别（ocr）类目下的增值税发票识别RecognizeVATInvoice的语法及示例。功能描述增值税发票识别能力可以识别增值税发票（电子发票和纸质发票）关键字段内容，包括：校验码、复核人、开票人、发票代码、收款人等。说明增值...

视频DNA

视频DNA采用先进的视频指纹技术标记视频唯一身份，具有稳定性，不会随音视频文件的格式转换、剪辑拼接、压缩旋转等变换而发生变化，应用于视频查重、版权保护等场景，捍卫数字媒体版权尊严。本文为您介绍如何自动触发或通过API触发视频进行...

请求结构

图像识别服务支持基于URL发送HTTP/HTTPS请求。请求参数需要包含在URL中，请求及返回结果都...公共请求参数>：API接口中使用了公共请求头（Common Request Headers），该内容可以被所有的图像识别服务请求使用。详细说明请参见公共请求参数。

通用文字识别

功能描述通用文字识别能力可以识别图像中文字内容和文字区域坐标，适用于多场景图像文字识别。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验，您可以单击立即试用对该能力进行更直观...

图像识别的审计事件

图像识别已与操作审计服务集成，您可以在操作审计中查询用户操作图像识别产生的管控事件。操作审计支持将管控事件投递到日志服务SLS的LogStore或对象存储OSS的存储空间中，满足实时审计、问题回溯分析等需求。操作审计记录了用户通过Open...

资源包

可用于独立API进行消耗抵扣，支持通用文字识别、个人证照识别、车辆物流识别、票据凭证识别、企业资质识别、教育场景识别、小语种识别、医疗场景识别下的各个接口。价格与购买商品规格 5千点 1万点 10万点 100万点 500万点 1000万点 5000...

计费项

预付费QPS 通用图像打标图像识别计费介绍图像识别计费介绍图像识别计费介绍不支持 场景识别 图像识别计费介绍图像识别计费介绍图像识别计费介绍不支持广告素材分析图像识别计费介绍图像识别计费介绍图像识别计费介绍不支持菜...

新手指引

1.选择所需的OCR产品服务按您特定场景选择所需产品：通用文字识别个人证照识别票据凭证识别教育场景识别 车辆物流识别企业资质识别小语种识别医疗场景识别 票证核验您可通过读光体验馆快速可视化地体验产品服务效果，若上述需求...

证件识别SDK

通过阿里云视觉智能开放平台提供的创新型证件识别技术，可实现证件高效识别。说明阿里云视觉智能开放平台各类目视觉AI能力SDK接入、接口使用或问题咨询等，请通过钉钉群（23109592）加入阿里云视觉智能开放平台咨询群联系我们。能力优势 ...

阿里云智能质检

质检结果复核页面智能对话分析服务使用案例需要解决的问题场景假设某个场景：ECS的客户提出更换磁盘类型，客服人员应该提供正确的解决方案并做出正确引导，质检人员需要通过智能分析服务识别该场景，同时识别客服人员是否进行了正确引导...

智能图像场景识别技术

新品推荐