API详情

通义千问VL 说明 支持的领域/任务:aigc 通义千问VL是阿里云研发的大规模视觉语言模型(Large Vision Language Model,LVLM),可以以图像、文本、检测框作为输入,并以文本和检测框作为输出,支持中文多模态对话及多图对话,并具有更好的...

请求签名

imageenhan.cn-shanghai.aliyuncs.com是图像生产的访问域名,不同类目的访问域名是不同的,具体类目的API访问域名,请参见 访问域名。JAVA示例 简单参数示例 以图像超分(MakeSuperResolutionImage)为例,完整的Java签名代码示例如下。...

高级模板支持的AE功能及插件

Mask遮罩 遮罩类型:目前仅支持Add(相加)、Subtract(相减)、Intersect(相交)、Difference(不同)模式,不支持Lighten(变亮)、Dark(变暗)、Inverted(反转)模式。遮罩效果:支持蒙版路径动画,不支持Mask Feather(蒙版羽化)、...

手势关键点检测

对于图像宽度width和图像高度height的相对坐标,实际坐标为 x*width 和 y*height。Label String thumb 关键点的标签。Confident Float 0.555 置信度。Box Object 手势的检测框信息。Positions Array of Position 手的检测框信息。格式为...

基本概念

对于VBR和ABR来讲,它压缩出来的文件体积较大,而且视频质量对于VBR和ABR不会有明显的提高。VBR(Variable Bitrate):动态码率模式,也就是非固定码率。音视频编码时,根据输入文件的复杂程度即时确定使用什么码率,对于复杂内容分配...

iOS接入HEIC和AVIF解码说明

} iOS接入AVIF解码说明 AVIF是一种基于AV1视频编码的新图像格式,对于JPEG、Webp图片格式压缩率更高,并且画面细节更好。AVIF通过使用更现代的压缩算法,在相同质量的前提下,AVIF文件大小是JPEG文件的35%左右。iOS系统原生并不支持AVIF...

数值计算

目前支持的计算能力包含:相加、相减、相乘、相除、最大值、最小值、均值。添加参数 设置与数据源输入值进行计算的参数值。可以添加多个参数。节点输出 该节点以参数 calcut_result 输出最终计算结果。节点输出":{"calcul_result":9 }

Web端接入AVIF格式图片说明

AVIF是一种基于AV1视频编码的新图像格式,对于JPEG、WebP等图片格式压缩率更高,并且画面细节更好。您可以通过本文所示的方法,在Web端接入AVIF格式图片。AVIF简介 AVIF通过使用更现代的压缩算法,在相同质量的前提下,AVIF文件大小是...

面向AIGC文生图模型的Prompt自动化生成

其中,Stable Diffusion文生图模型是一种开源且流行的跨模态生成模型,旨在生成与给定文本对应的图像。在Stable Diffusion中,编写Prompt是生成高质量图像的关键。BeautifulPrompt插件利用定制化的大语言模型(LLM)自动实现Prompt的扩写...

Date-Date结果不兼容

背景说明 Oracle中Date与Date类型相减,结果为浮点类型,在PolarDB O引擎中,结果为Interval类型。这种类型差异一般会引起业务SQL中时间计算部分发生语法错误。解决方案 在PolarDB O引擎中对Date类型减法做简单的语法改造即可适配,改造...

图像

image","height":1024 }]} } 图像分类 图像分类(Image Classification)是指从一组固定的分类标签集合中,找到与输入图像内容匹配的一个或多个分类标签,并将其分配给该输入图像。该模板支持单标签和多标签图像分类。应用场景 图片分类...

什么是机器翻译

多模态产品 覆盖文本、文档、图片、音频和视频模态,与文档解析、语音识别、图像识别结合,满足多样化应用需求。产品计费 机器翻译主要是对翻译的内容进行计费。机器翻译目前支持的计费方式包括:后付费:按量计费,先使用再付费。资源包...

图像上传

本文介绍如何将图像上传到图像搜索服务。说明 如需了解更多产品详情和获取技术支持,请单击 在线咨询 或通过钉钉群(35035130)联系我们。背景信息 图像搜索提供两种方式上传图片,一种是通过图像搜索产品API或者SDK,另一种方式是通过借助...

Insights事件概览

API错误事件(ApiErrorRateInsight)会分析您阿里云账号中API错误调用的全部管控事件,其基于API的错误调用率并结合数学模型来分析API当前调用错误与历史调用错误行为较是发生显著变化,并生成Insights事件。IP请求事件(IpInsight)会...

使用限制

图像都必须是RGB 3通道。通用抠图/元素定位 图片大小限制:3MB以内,分辨率2000x2000像素以内,32x32像素以上。图片格式限制:不支持gif、8位png、16位png、64位png数据格式文件。人像分割 图片格式:JPEG、JPG、PNG(不支持8位png、16位...

高清色彩迁移

本文介绍图像生产(imageenhan)类目下的高清色彩迁移RecolorHDImage的语法及示例。功能描述 高清色彩迁移能力用于对高清图像进行颜色拓色,并能够保证人像部分颜色不发生变化。该接口与 色彩迁移 相比:支持高清图。支持自定义拓色程度。...

红外人脸活体检测

功能描述 红外人脸活体检测能力可以检测红外图片中的人脸是否为来自认证设备端的近距离裸拍活体人脸对象,可广泛应用在红外设备人脸实时采集场景,满足红外人脸注册认证的真实性和安全性要求,判断的前置条件是红外图像中有人脸。...

SDWebUI使用方法与实践案例

以下示例是蒙版模糊值0、20、40、60的对比图 蒙版模式(Mask Mode)蒙版区域内容处理 填充:用于填充图像中需要修复的部分,以达到图像修复的目的,常用于删除图像中的不必要内容。(原图此处有一些树干)原图:用于使用原图像的内容来填充...

人脸人体介绍

图像人脸融合模板增加 可以将已通过内容审核的人脸图像,作为人脸融合的模板,供图像人脸融合功能使用。图像人脸融合模板查询 可以查询已创建的人脸模板。图像人脸融合模板删除 可以删除已创建的人脸模板。人体识别 手势关键点检测 获取...

图像内容风控解决方案

在线上业务的内容生产过程中,为了及时识别其中的高风险内容,PAI提供了图像内容风控解决方案。该方案使用Designer预置模板,基于人工智能算法快速构建符合业务场景的风控模型,并部署为EAS在线服务,助力您快速识别高风险内容,进而对其...

视频截图

多张截图:按照设置的间隔时间,均匀的截取对应视频的多帧图像,每帧图像都是一个图片文件。也叫批量截图、序列截图。平均截图:按照设定的截图张数,均匀地对视频进行切分并截取指定数量的图像。截图间隔时间(秒)多张截图时必选 在文本...

冠脉钙化积分测算

本文介绍图像分析处理(imageprocess)类目下的冠脉钙化积分测算CalcCACS的语法及示例。功能描述 冠脉钙化积分测算能力可以根据胸部平扫CT进行冠脉钙化积分测算。输入标准DICOM格式或NIFTI格式的图像,输出钙化积分值和分割结果HTTP下载...

服务商星级考核标准公示通知

在所有考核细项内,销售能力+买家复购+服务能力是固定考核项,另有2个加分项和1个分项,加分项会由云市场运营在每个季度考核前进行加分操作;2个加分项分别是经营稳定性(考核服务商在云市场的续签情况,若连续2年及以上续签的,加10...

使用基于Intel CPU的g8i实例加速Stable Diffusion推理

背景信息 Stable Diffusion模型 Stable Diffusion模型是文本到图像的潜在扩散模型,它可以根据文本提示词生成对应的图像,目前已经可以应用于包括计算机视觉、数字艺术、视频游戏等多种领域和场景。为了更好的用户体验,我们期望能获得在几...

创建工作流

多张截图:按照设置的间隔时间,均匀的截取对应视频的多帧图像,每帧图像都是一个图片文件。也叫批量截图、序列截图。平均截图:按照设定的截图张数,均匀地对视频进行切分并截取指定数量的图像。截图间隔时间(秒)多张截图时必选 在文本...

多器官分割

本文介绍图像分析处理(imageprocess)类目下的多器官分割SegmentOAR的语法及示例。功能描述 多器官分割能力针对放疗场景,基于输入的胸部CT图像,进行危及器官的识别与分割。说明 您可以进入 在线咨询 获取在线人工帮助。阿里云视觉智能...

主动脉瘤肺动脉高压检测

功能描述 主动脉瘤肺动脉高压检测能力可以对输入的胸部CT平扫DICOM影像数据中的主动脉及肺动脉进行分割,并分别提取其中心线,然后根据中心线生成最佳视角的Stretch CPR图像、Cross Section图像及环绕血管一周的Straightened CPR图像,同时...

通用文字识别

功能描述 通用文字识别能力可以识别图像中文字内容和文字区域坐标,适用于多场景图像文字识别。说明 您可以进入 在线咨询 获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验,您可以单击 立即试用 对该能力进行更直观...

胸部CT肺结节检测

本文介绍图像分析处理(imageprocess)类目下的胸部CT肺结节检测DetectLungNodule的语法及示例。功能描述 胸部CT肺结节检测能力可以对输入的胸部常规CT形成的DICOM影像(如5mm的单个序列,API仅接受单序列),进行肺结节的辅助诊断。针对每...

肋骨骨折检测

本文介绍图像分析处理(imageprocess)类目下的肋骨骨折检测DetectRibFracture的语法及示例。功能描述 肋骨骨折检测能力根据胸部CT成像进行肋骨骨折的辅助诊断,并输出骨折的位置及骨折的类型。说明 您可以进入 在线咨询 获取在线人工帮助...

AI写真:PHP SDK使用说明

Image decode error.2 图像无法下载或者解码。Number of face is not 1.3 人脸数量不为1。Image detect error.4 人脸检测出错。Image encoding error.5 人脸编码为特征向量出错。原因一般是无法检测到人脸。This photo is not the same ...

Kohya使用方法与实践案例

如果自己准备的图片分辨率比较小,不是很清晰,可以使用SD WebUI中Extras页面中进行分辨率放大,也可以使用其他图像处理工具去处理图像的分辨率。尺寸调整量调整:可以前往像birme这种站点批量裁剪后批量下载,也可以使用SDWebUI裁剪或手动...

AI写真:Go SDK使用说明

Image decode error.2 图像无法下载或者解码。Number of face is not 1.3 人脸数量不为1。Image detect error.4 人脸检测出错。Image encoding error.5 人脸编码为特征向量出错。原因一般是无法检测到人脸。This photo is not the same ...

涂鸦作画API详情

wanx-sketch-to-image-lite input.sketch_image_url String 是 输入图像草图的url 图片限制:格式为JPG,PNG,TIFF,WBEP等常见位图格式,文件大小小于10MB,分辨率长边不大于2048像素 输入草图的比例需要与输出分辨率的比例一致,否则会导致...

涂鸦作画API详情

wanx-sketch-to-image-lite input.sketch_image_url String 是 输入图像草图的url 图片限制:格式为JPG,PNG,TIFF,WBEP等常见位图格式,文件大小小于10MB,分辨率长边不大于2048像素 输入草图的比例需要与输出分辨率的比例一致,否则会导致...

标注数据管理

如果是通用图像分类,选中图像后单击右上角 提交任务包,直至标注完所有素材。具体操作,请参见 通用分类使用iTAG进行打标视频教程。如果是通用检测,选择左上方的矩形工具,在图中找到目标,框选后选择对应的标签(如果图中包含多个目标,...

DashVector+DashScope升级多模态检索

ONE-PEACE是一个图文音三模态通用表征模型,在语义分割、音文检索、音频分类和视觉定位几个任务都达到了新SOTA表现,在视频分类、图像分类图文检索、以及多模态经典benchmark也都取得了比较领先的结果。模型相关的环境依赖如下:说明 需要...

表格识别

Web前端直接调用 小程序场景下直接调用 Android端直接调用 iOS端直接调用 输入限制 图像格式:JPEG、JPG、PNG、BMP、GIF。图像大小:不超过3 MB。图像分辨率:不限制图片分辨率,但图片分辨率太高可能会导致API识别超时,超时时间为5秒。...

DashVector+DashScope升级多模态检索

ONE-PEACE是一个图文音三模态通用表征模型,在语义分割、音文检索、音频分类和视觉定位几个任务都达到了新SOTA表现,在视频分类、图像分类图文检索、以及多模态经典benchmark也都取得了比较领先的结果。模型相关的环境依赖如下:说明 需要...

AI写真:Java SDK使用说明

Image decode error.2 图像无法下载或者解码。Number of face is not 1.3 人脸数量不为1。Image detect error.4 人脸检测出错。Image encoding error.5 人脸编码为特征向量出错。原因一般是无法检测到人脸。This photo is not the same ...
共有115条 < 1 2 3 4 ... 115 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
图像搜索 视觉智能开放平台 智能视觉 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用