SDK概述

SDK简介 文字识别OCR SDK 封装了2021-07-07版本下的所有API,以访问密钥(AccessKey)识别调用者身份,提供自动签名等功能,方便您通过API识别图片。阿里云开发者中心汇聚了高频使用的编程语言SDK,提供了项目地址、安装命令、版本说明等...

风险识别与处置最佳实践

方案简介 风险识别 将评估结果以评分(score)、标签(tags)形式返回,您可以根据评分的高低进行处置。常见的处置方式包括:通过/拒绝、人工审核、验证码、实人认证 等。评分(score)与入参维度相关,评分区间及对应的风险等级、处置建议...

车牌识别

功能简介 车牌号识别。请求参数 type(ocr 类型)为 CAR_NUMBER_OCR。返回说明 类别 含义 txt 车牌号 prob 概率值

行驶证识别

功能简介 行驶证识别,用于提取行驶证中的姓名、车牌、注册时间等字段信息。请求参数 type(ocr 类型)为 VEHICLE_LICENSE_OCR。返回说明 类别 含义 plate_num 车牌号 vehicle_type 车辆类型 register_date 注册日期 engine_num 发动机号码...

驾驶证识别

功能简介 驾驶证识别,用于提取驾驶证中的国籍、性别、证号、姓名等字段信息。请求参数 type(ocr 类型)为 DRIVER_LICENSE_OCR。返回说明 类别 含义 end_date 有效期终止 issue_date 初次领证日期 nation 国籍 sex 性别 num 证号 birth_...

学生证

功能简介 学生证识别,用于提取学生证中的姓名、学校名称等字段信息。请求参数 type(ocr 类型)为 STUDENT_CARD_OCR。返回说明 字段 含义 student_name 姓名 degree_type 级别 major 专业 admission_date 注册日期

户口本

功能简介 户口本识别,用于提取户口本中的户别、户号、签发日期等字段信息。请求参数 type(ocr 类型)为 HOUSEHOLD_REGISTER_OCR。返回说明 户口本常住人口页 字段 含义 name 姓名 relationship 户主或与户主关系 formername 曾用名 sex ...

营业执照

功能简介 营业执照识别,用于提取营业执照中的名称、住所、法人等字段信息。请求参数 type(ocr 类型)为 BUSINESS_LICENSE_OCR。返回说明 营业执照竖版 类别 含义 title 标题 date 颁发日期(右下角)num 编号 creditcode 统一社会信用...

贸易单证识别

功能简介 贸易单证识别提供针对贸易类单证文书的识别抽取能力,适合报关、货代、金融风控等贸易业务涉及的单据流转场景,结合文字识别和自然语言处理技术,提供以贸易单证解析能力为主的标准化产品,实现AI协同替代单据信息手动录入。...

医疗发票

功能简介 医疗发票识别,用于提取医疗发票中的发票内容、金额、医院名称等字段信息。请求参数 type(ocr 类型)为 MEDICAL_INVOICE_OCR。返回说明 in_date 入院时间 out_date 出院时间 static_date 孤立字段时间(一般是右上角、右下角,也...

房产证

功能简介 房产证识别,用于提取房产证中的权利人、面积、使用期限等字段信息。请求参数 type(ocr 类型)为 REAL_ESTATE_OCR。返回说明 房产证板式1 字段 含义 certificatenum 证书编号 obligee 权利人、房地产权属人 mutualownershipstate...

二维码识别

功能简介 二维码识别功能可以识别图片(包括照片、截图等多种图片)中多个有效二维码或者条形码的位置及内容,输出图像中二维码或者条形码的位置框和其包含的文本信息。其中位置包含左上角横坐标、左上角纵坐标、宽度和高度的值,如下图所...

管理员首次配置内网访问指南

内网访问安全简介 内网访问是基于软件定义边界SDP(Software Defined Perimeter)技术,打造SaaS化零信任网络访问功能,在不需暴露公网地址和改造企业原有网络架构的情况下,通过 SASE 内网访问解决方案实现企业员工通过内网访问云上业务...

汽车VIN码识别

功能简介 汽车 VIN 码识别,用于识别车架号信息。请求参数 type(ocr 类型)为 VEHICLE_VIN_OCR。返回说明 类别 含义 vin 车架号

职业资格证书

功能简介 职业资格证书识别,用于提取教师和医师资格证中的姓名、性别、身份证号等字段信息。请求参数 type(ocr 类型)为 PROFESSIONAL_OCR。返回说明 字段 含义 nationality 民族 sex 性别 person 持证人 class 资格种类 dateofbirth ...

增值税发票

功能简介 增值税发票识别,用于提取增值税发票中的发票内容、金额、公司名称等字段信息。请求参数 type(ocr 类型)为 VAT_INVOICE_OCR。返回说明 类别 含义 einvcode 发票代码 einvno 发票号码 einvdate 开票日期 antifakecode 校验码 ...

2023年4月4日产品更新通告

功能更新清单​ 功能点 类型 功能简介 TableQA:新增识别规则配置 优化 表格问答功能,新增支持识别规则配置。功能更新详情 TableQA:新增识别规则配置 路径:表格问答->表格问答干预->高级配置->识别规则 功能:识别规则配置,目前支持...

接口说明

对一分钟内的短语音进行识别,适用于对话聊天、控制口令、语音输入法、语音搜索等较短的语音识别场景。功能简介 NUI SDK提供更小的工具包和更完善的状态管理。为满足不同用户需求,NUI SDK既能提供全链路的语音能力,同时可做原子能力SDK...

LLM-语种识别和过滤(MaxCompute)

算法简介 使用fasttext算法识别文本语种并计算置信度,目前支持识别176种语言。包括:['af','als','am','an','ar','arz','as','ast','av','az','azb','ba','bar','bcl','be','bg','bh','bn','bo','bpy','br','bs','bxr','ca','cbk','ce','...

QPS叠加包

以下为QPS叠加包简介。开通OCR文字识别API服务后,即可拥有10QPS的并发,同时您也可购买QPS叠加包来提升API并发量;当前支持QPS叠加包的API包括:身份证识别、通用文字识别、全文识别高精版。您可根据业务需求按天、按月、按年购买;购买...

语音识别

模型简介 说明 支持的领域/任务:audio(音频)/asr(语音识别)Paraformer语音识别API基于通义实验室新一代非自回归端到端模型,提供基于实时音频流的语音识别以及对输入的各类音视频文件进行语音识别的能力。可应用于:对语音识别结果...

接口说明

对长时间的语音数据流进行识别,适用于会议演讲、视频直播等长时间不间断识别的场景。功能简介 NUI SDK提供更小的工具包和更完善的状态管理。为满足不同用户需求,NUI SDK既能提供全链路的语音能力,同时可做原子能力SDK进行使用,并保持...

服务端人脸识别SDK

人脸考勤:提供极速无感人脸考勤,确保签到人员身份识别准确性,实现秒级快速认证,有效防止代打卡行为,提高企业信息化员工管理水平。推荐采用人脸RGB活体检测+人脸识别的方案。闸机通行:通行快速录入人脸信息,用户刷脸通行,可以解决...

人脸对比SDK

人脸考勤:解决方案利用高精度的人脸识别、对比能力,搭建考勤系统,提升考勤效率,加强防作弊能力。人脸搜索:对比指定图片和人脸库中N张人脸,找出最相似的一张或多张人脸,并返回相似度分值。前提条件 该离线SDK目前不支持线上直接支付...

港澳台大陆通行证

功能简介 港澳台大陆通行证识别,用于提取港澳台大陆通行证中的姓名、有效期限、证件号码等字段信息。请求参数 type(ocr 类型)为 INLAND_HK_MC_PASS_OCR。返回说明 类别 含义 title 标题 name 姓名 dateofbirth 出生日期 sex 性别 ...

生物识别(IFAA)介绍

简介 IFAA 是金融级移动端生物识别产品,利用内嵌在移动端硬件加密区的计算能力,结合设备原生的指纹、人脸识别等生物识别能力,进行金融级、硬件级身份认证。特点 支持指纹和人脸识别。采用人体独一无二的特征进行验证,具有唯一性,可以...

录音文件识别API详情

模型概览 模型名 模型简介 paraformer-v1 Paraformer中英文语音识别模型,支持16kHz及以上采样率的音频或视频语音识别。paraformer-8k-v1 Paraformer中文语音识别模型,支持8kHz电话语音识别。paraformer-mtl-v1 Paraformer多语言语音识别...

录音文件识别API详情

模型概览 模型名 模型简介 paraformer-v1 Paraformer中英文语音识别模型,支持16kHz及以上采样率的音频或视频语音识别。paraformer-8k-v1 Paraformer中文语音识别模型,支持8kHz电话语音识别。paraformer-mtl-v1 Paraformer多语言语音识别...

考勤打卡如何设置拍照?

2、笑脸打卡是进行生物识别的,可判断打卡是否为本人,确保考勤结果安全有效。一个人无法给多个账号录入人脸,杜绝代打卡。管理员开启笑脸拍照打卡后员工每日打卡需微笑拍照,引导员工快乐工作,微笑开启每一天。同时管理员可在手机端统计...

实时语音识别API详情

Paraformer语音识别 说明 支持的领域/任务:audio(音频)/asr(语音识别)Paraformer语音识别提供的实时转写API,能够对长时间的语音数据流进行识别,并将结果流式返回给调用者,适用于会议演讲、视频直播等长时间不间断识别的场景。...

实时语音识别API详情

Paraformer语音识别 说明 支持的领域/任务:audio(音频)/asr(语音识别)Paraformer语音识别提供的实时转写API,能够对长时间的语音数据流进行识别,并将结果流式返回给调用者,适用于会议演讲、视频直播等长时间不间断识别的场景。...

实人认证方案

简介 实人认证方案主要包括如下能力:实名校验 用于验证用户证件信息,核实用户的姓名和身份证号码是否真实存在且匹配,防止身份造假,确保用户身份真实。使用时,用户按要求拍摄并上传身份证正反面照片,实名校验采用业界领先的证件OCR...

文档理解

功能简介 文档理解对各类文档和表格进行结构化识别与理解,返回层级树和版面分析等相关内容。功能详情 文档智能解析 进行通用文档解析,从文档中提取出逻辑层级结构、文本内容、表格内容、Key-Value键值字段、样式信息等。基于对文档的内容...

视频AI概述

视频AI服务简介 阿里云视频AI服务可以对音视频内容进行识别、分析和理解。通过使用视频AI服务,您可以:检测违规的视频内容;识别并搜索重复或相似的音视频片段;识别视频中的人物、文字、实体、场景和动作;分析理解视频用以智能生成视频...

API详情

模型概览 模型名 模型简介 paraformer-v1 Paraformer中语音模型服务中英文语音识别模型,支持16kHz及以上采样率的音频或视频语音识别。paraformer-8k-v1 Paraformer中语音模型服务中文语音识别模型,支持8kHz电话语音识别。paraformer-mtl-...

功能特性

BlackLevel、PixelBlackThreshold 支持 视频水印(明水印)在视频中添加可见的明水印(例如,企业Logo、电视台台标),突出品牌和版权,增加产品识别度。为视频添加不可见的盲水印用于版权追溯,详细说明请参见下文 数字水印(暗水印)说明...

身份证

功能简介 支持二代大陆身份证(正反面)所有字段的识别,包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限。请求参数 type(ocr 类型)为 ID_CARD_OCR。返回说明 身份证正面 字段 含义 name 姓名 sex 性别 ...

新功能发布记录

车辆vin码识别 支持 支持 电子面单识别 支持 支持 行驶证识别 支持 支持 驾驶证识别 支持 支持 车牌识别 支持 支持 教育场景识别 公式识别 支持 支持 题目识别 支持 支持 整页试卷识别 支持 支持 试卷切题识别 支持 支持 精细版结构化识别 ...

非开发者使用指南

五、免费试用功能简介 服务能力 免费试用期间权益 试用期过后如何继续使用 语音识别 上传文件:每天免费使用额度为2小时(音频时长),当日免费额度用完后,在24小时后才可以重新使用。麦克风:无使用限制。麦克风和音频文件升级为商用版 ...

产品简介-产品概述

产品分类 文字识别(OCR)可以将图片中的文字信息转换为可编辑文本,阿里云根据客户的业务场景和需求,将产品分为了OCR统一识别、通用文字识别、个人证照识别、发票凭证识别、教育场景识别、车辆物流识别、企业资质识别、小语种文字识别等...
共有155条 < 1 2 3 4 ... 155 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
风险识别 Web应用防火墙 云安全中心 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用