API详情

通义千问VL 说明 支持的领域/任务:aigc 通义千问VL是阿里云研发的大规模视觉语言模型(Large Vision Language Model,LVLM),可以以图像、文本、检测框作为输入,并以文本和检测框作为输出,支持中文多模态对话及多图对话,并具有更好的...

PAIFlow Manifest参数说明

identifier String 无 是 工作流标识,用来区分工作流,Designer平台每个算法的工作流标识都不同。version String 无 是 工作流版本,用来支持工作流的升级。同一个工作流的输入、输出、实现变化后,版本应该与原先不同。版本号推荐用v1.0....

功能说明

AlivcLivePushCustomFilter回调函数customFilterProcess(int inputTexture、inttextureWidth、int textureHeight、long extra参数)中返回的参数inputTexture是图像的纹理texture,第三方美颜库可对纹理进行处理。如果需要返回一个处理过...

功能使用

AlivcLivePushCustomFilter回调函数customFilterProcess(int inputTexture、inttextureWidth、int textureHeight、long extra参数)中返回的参数inputTexture是图像的纹理texture,第三方美颜库可对纹理进行处理。如果需要返回一个处理过...

使用HTTP请求接口代码示例

文档介绍API访问实例的样例程序。通过API访问实例的Java样例程序,请单击 API样例 进行下载。其中Api2Demo.java是图像搜索V2版本searchByUrl、getProductInfoByIds接口示例。

组件参考:所有组件汇总

读数据表 该组件用于读取MaxCompute表数据,默认读取项目的表数据。写数据表 该组件支持将上游数据写入MaxCompute中。数据预处理 随机采样 该组件按照给定的比例或者数目,对输入进行随机独立采样。加权采样 以加权方式生成采样数据。...

ModelScope魔搭社区

在社区中成长 前提条件 DashVector:已创建Cluster:创建Cluster 已获得API-KEY:API-KEY管理 已安装最新版SDK:安装DashVector SDK ModelScope:已安装最新版SDK:pip install-U modelscope 商品图像同款特征 简介 模型是对商品图像进行...

隐私政策

基于此,我们制定《鹿班隐私政策》(下称“政策”或“隐私政策”),帮助您充分了解在您使用我们产品及/或服务的过程中,我们会如何收集、使用、共享、存储和保护您的个人信息以及您可以如何管理您的个人信息,以便您更好地作出适当...

根据图片查询图片

使用说明 接口用于根据图片查询图像搜索实例中的图片信息。说明 如需了解更多产品详情和获取技术支持,请单击 在线咨询 或通过钉钉群(35035130)联系我们。QPS限制 查询操作默认的最大访问频率可在控制台中查看,为您购买时所选择的访问...

脏话识别服务

你不要说我说什么话都有节奏,*不怕我*的干嘛,我就说了咋地,*我不怕没有延迟的马路,*这种话怎么怎么了,*没怎么没怎么没怎么,只不过是这么说而已。\"};RunPreTrainServiceRequest request=new RunPreTrainServiceRequest();request....

解决方案:免费体验AnalyticDB PostgreSQL版以文搜图

该相似度可以用来评估一个图像是否与输入的文本描述相匹配。在以文搜图中,用户可以输入文本描述,CLIP模型自动匹配相关的图像解决⽅案将基于 AnalyticDB PostgreSQL版 的向量检索引擎,实现⽂向量到图⽚向量的快速检索。向量数据集...

产品优势

阿里云工业视觉智能产品主要有以下几点优势:深度优化的模型 算法模型针对工业检测中样本图像语义信息弱、尺度变化大、背景复杂、特征组内差异大组间差异小的特点深度优化,在您再次定制优化前即拥有远优于开源算法的性能。无需专业算法...

简介

空间/时空数据(Spatial/Spatio-temporal Data,统称时空数据)是带有时间/空间位置信息的图形图像数据,用来表示事物的位置、形态、变化及大小分布等多维信息。概述 ApsaraDB PostgreSQL Ganos时空引擎(简称Ganos)提供一系列的数据类型...

简介

空间/时空数据(Spatial/Spatio-temproal Data,以下统称时空数据)是带有时间/空间位置信息的图形图像数据,用来表示事物的位置、形态、变化及大小分布等多维信息。概述 阿里云自研Ganos时空引擎(以下简称Ganos)提供一系列的数据类型、...

简介

空间/时空数据(Spatial/Spatio-temproal Data,以下统称时空数据)是带有时间/空间位置信息的图形图像数据,用来表示事物的位置、形态、变化及大小分布等多维信息。概述 阿里云自研Ganos时空引擎(以下简称Ganos)提供一系列的数据类型、...

色彩分析

输入以下的图像服务可以提取出其色卡为:RGB 58/150/224 207/160/43 185/197/212 146/115/24 63/66/54 24/53/87 HEX 3A96E0 CFA02B B9C5D4 927318 3F4236 183557 占比 0.374724 0.179412 0.15671 0.124081 0.0842831 0.0807904 字段...

简介

空间/时空数据(Spatial/Spatio-temporal Data,以下统称时空数据)是带有时间或空间位置信息的图形图像数据,用来表示事物的位置、形态、变化及大小分布等多维信息。说明 AnalyticDB PostgreSQL版Serverless模式 暂不支持Ganos功能。申明 ...

人工智能最佳实践

神经风格迁移教程 神经风格迁移是一种生成技术,主要用来合成两张图像,即从其中一张图像提取内容,另一张图像提取风格,以合成一张新图像示例通过使用TensorFlow Hub预置模型,完成任意图像的风格合成。合成效果 内容图像 风格图像 ...

人脸属性识别

说明 能力支持企业或个人认证用户开通。更多实名认证操作信息,请参见 实名认证。3.创建AccessKey:请确保您已 创建AccessKey,如果您使用的是子账号AccessKey,您需要给子账号赋予AliyunVIAPIFullAccess权限,具体操作,请参见 RAM授权...

图像分类训练(torch)

如果您的业务场景涉及图像分类,则可以通过图像分类训练(torch)组件构建图像分类模型,从而进行模型推理。本文为您介绍图像分类训练(torch)组件的配置方法及使用示例。前提条件 已开通OSS并完成授权,详情请参见 开通OSS服务 和 云产品...

人工智能最佳实践

神经风格迁移教程 神经风格迁移是一种生成技术,主要用来合成两张图像,即从其中一张图像提取内容,另一张图像提取风格,以合成一张新图像示例通过使用TensorFlow Hub预置模型,完成任意图像的风格合成。合成效果 内容图像 风格图像 ...

文本生成图像API详情

通义万相 说明 支持的领域/任务:aigc/文生图 通义万相-文本生成图像是基于自研的Composer组合生成框架的AI绘画创作大模型,能够根据用户输入的文字内容,生成符合语义描述的多样化风格的图像。通过知识重组与可变维度扩散模型,加速收敛并...

图像关键点训练

如果您的业务场景涉及人体相关的关键点检测,则可以通过图像关键点训练组件构建关键点模型,从而进行模型推理。本文为您介绍图像关键点训练组件的配置方法及使用示例。前提条件 已开通OSS并完成授权,详情请参见 开通OSS服务 和 云产品依赖...

图像度量学习训练(raw)

如果您的业务场景涉及度量学习,则可以通过图像度量学习训练(raw)组件构建度量学习模型,从而进行模型推理。本文为您介绍图像度量学习训练(raw)组件的配置方法和使用示例。前提条件 已开通OSS并完成授权,详情请参见 开通OSS服务 和 云...

应用案例

它就是在分类之前通过目视判读和野外调查,对遥感图像上某些样区中影像地物的类别属性有了先验知识,对每一种类别选取一定数量的训练样本,计算机计算每种训练样区的统计或其他信息,同时用这些种子类别对判决函数进行训练,使其符合于对各...

批量添加人脸数据

重要 能力支持企业或个人认证用户开通。更多实名认证操作信息,请参见 实名认证。3.创建AccessKey:请确保您已 创建AccessKey,如果您使用的是子账号AccessKey,您需要给子账号赋予AliyunVIAPIFullAccess权限,具体操作,请参见 RAM授权...

5分钟使用EAS一键部署Kohya SD模型微调应用

已在同地域下创建OSS存储空间和目录,用来存放训练素材、输出的模型文件、日志等。如何上传文件请参见 控制台上传文件。准备工作 登录 OSS管理控制台,进入某个同地域下的Bucket路径内。例如:oss:/kohya-demo/kohya/。在当前Bucket路径下...

RecognizeEduFormula-印刷体数学公式识别

接口图片示例 接口核心能力 分类 概述 图像增强 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。多类型覆盖 支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别 总体识别准确率可达 98...

基本概念

本文为您介绍通义听悟的相关概念,以便于更好地理解产品。音频采样率(sample rate)音频采样率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。目前语音识别服务支持16000Hz和8000Hz两种采样率,...

RecognizeEduOralCalculation-口算判题

接口图片示例 接口核心能力 分类 概述 图像增强 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。多类型覆盖 支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别 总体识别准确率可达 97...

RecognizeTaxiInvoice-出租车发票识别

接口图片示例 接口核心能力 分类 概述 图像增强 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。多类型覆盖 支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别 总体识别准确率可达 97...

Linux集成开发指南

新建请求 请求的创建主要是通过sail:face:FaceRequestBuilder创建sail:face:FaceRequest请求类,在Builder里必须填写以下信息:图像:所有的请求都需要填入RGB的图像,用sail:face:RequestBuilder:RGBImage,当前SDK只支持RGB活体识别,...

RecognizeWaybill-电子面单识别

接口图片示例 接口核心能力 分类 概述 图像增强 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。全字段识别 智能识别快递运单上所包含的全部字段。多类型覆盖 支持模糊、光照不均、透视畸变、任意背景等...

RecognizeCarVinCode-车辆vin码识别

图像增强 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。多类型覆盖 支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别 总体识别准确率可达 98%。如何使用接口 步骤 概述 1 开通 车辆...

RecognizeMultiLanguage-通用多语言识别

接口图片示例 接口核心能力 分类 概述 图像增强 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。多类型覆盖 支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别 总体识别准确率可达 98...

RecognizeEduPaperOcr-整页试卷识别

接口图片示例 接口核心能力 分类 概述 图像增强 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。多类型覆盖 支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别 总体识别准确率可达 97...

人像素描风格化

功能描述 人像素描风格化能力可以对一张人物图像自动识别其头部区域,生成大头照下的素描画效果。返回结果的分辨率固定为512x512像素。关于该接口功能的示例图如下:输入原图 输出效果图 说明 您可以进入 在线咨询 获取在线人工帮助。当前...

人脸搜索

EntityId String U1 实体ID,用来标识用户的唯一性,如用户ID、员工ID等。每个实体可包含多张人脸图片。支持大小写字母、数字、下划线和减号的组合,长度为2~64。FaceId String 001 人脸图片数据ID,需要全局唯一,不可重复。支持小写字母...

AI写真概述

如果授权合作伙伴将您的信息用于我们未委托的用途,其将单独得您的同意。SDK使用说明 API调用流程如下:注意事项如下:由于图像生成类应用受到国家法律法规的要求,传入写真训练和制作接口的图片或模板都将经过阿里云内容安全服务的审核...

RecognizeHealthCode-防疫健康码识别

接口图片示例 接口核心能力 分类 概述 图像增强 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。全字段识别 智能识别营业执照上所包含的全部字段。多类型覆盖 支持模糊、光照不均、透视畸变、任意背景等...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
图像搜索 云服务器 ECS 云数据库 RDS 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用