文本生成图像API详情

通义万相 说明 支持的领域/任务:aigc/文生图 通义万相-文本生成图像是基于自研的Composer组合生成框架的AI绘画创作大模型,能够根据用户输入的文字内容,生成符合语义描述的多样化风格的图像。通过知识重组与可变维度扩散模型,加速收敛并...

面向AIGC文生图模型的Prompt自动化生成

其中,Stable Diffusion文生图模型是一种开源且流行的跨模态生成模型,旨在生成与给定文本相对应的图像。在Stable Diffusion中,编写Prompt是生成高质量图像的关键。BeautifulPrompt插件利用定制化的大语言模型(LLM)自动实现Prompt的扩写...

基于PAI产品的虚拟上装解决方案

目前PAI端到端虚拟上装解决方案提供以下两种使用方式:方式一:使用Lora进行服饰训练和可控生成 Lora(Low-Rank Adaptive Relational Attention)是一种在图像生成领域广泛应用的算法。该算法可以通过添加少量的可微调参数和使用少量的数据...

EAS使用案例汇总

5分钟使用EAS一键部署Stable Diffusion实现文生图能力 介绍如何使用EAS一键部署Stable Diffusion的AI-Web应用,并启动WebUI来验证AI生成图像等功能。5分钟使用EAS部署Stable Diffusion API服务 介绍如何使用 EAS 部署SD API服务,以及如何...

Cosplay动漫人物生成API详情

Cosplay动漫人物生成 说明 支持的领域/任务:aigc/Cosplay动漫人物生成 通义万相-Cosplay动漫人物生成通过输入人像图片和卡通形象图片,可快速生成人物卡通写真。目前支持3D卡通形象风格。关于该接口功能的示例图如下:3D卡通形象图(左侧...

文本生成图像API详情

通义万相 说明 支持的领域/任务:aigc/文生图 通义万相-文本生成图像是基于自研的Composer组合生成框架的AI绘画创作大模型,能够根据用户输入的文字内容,生成符合语义描述的不同风格的图像。通过知识重组与可变维度扩散模型,加速收敛并...

AnyText图文融合API详情

任务状态:PENDING:排队中 RUNNING:处理中 SUCCEEDED:成功 FAILED:失败 UNKNOWN:作业不存在或状态未知 output.result_url List 如果作业成功,包含模型生成的结果图像的 URL的列表,可以在 24 小时之内随时下载。result_url":[...

文字纹理生成API详情

文字纹理生成 说明 支持的领域/任务:aigc/创意文字生成 WordArt锦书-文字纹理生成可以对输入的文字内容或文字图片进行创意设计,根据提示词内容对文字添加材质和纹理,实现立体材质、场景融合、光影特效等效果,生成效果精美、风格多样的...

文字纹理生成API详情

文字纹理生成 说明 支持的领域/任务:aigc/创意文字生成,可支持深度合成算法备案工作。WordArt锦书-文字纹理生成可以对输入的文字内容或文字图片进行创意设计,根据提示词内容对文字添加材质和纹理,实现立体材质、场景融合、光影特效等...

涂鸦作画API详情

parameters":{"size":"768*768","n":2,"style":"<watercolor>","sketch_extraction":False,"sketch_color":[[0,0,0],[123,123,123]]} parameters.size String 否 生成图像的分辨率,默认为768*768像素,可选值为"768*768"parameters.style...

涂鸦作画API详情

parameters":{"size":"768*768","n":2,"style":"<watercolor>","sketch_extraction":False,"sketch_color":[[0,0,0],[123,123,123]]} parameters.size String 否 生成图像的分辨率,默认为768*768像素,可选值为"768*768"parameters.style...

PAI图像分类(多标签分类)训练

本文为您介绍如何使用PAI命令基于图片数据生成图像多标签分类模型。图像分类训练 您可以使用 SQL脚本 组件进行PAI命令调用,也可以使用MaxCompute客户端或DataWorks的开发节点进行PAI命令调用,详情请参见 使用本地客户端(odpscmd)连接 ...

视频理解计费介绍

例如:如果使用物体检测和视频封面两个能力,需要同时购买图像类预付费资源包和视频类预付费资源包。价格费用计算详情请参见 计费方式。如果您因业务需求希望更快地获取查询结果,请通过 咨询服务 联系我们。镜头解析 镜头解析 能力支持 ...

API详情

yellow cat parameters.size String 否 生成图像的分辨率,stable-difussion-v1.5的size固定为512*512,stable-difussion-xl的值可支持长宽在512和1024之间以128步长取值的任意组合,如512*1024,1024*768等,默认1024*1024 512*512 ...

API详情

yellow cat parameters.size String 否 生成图像的分辨率,stable-difussion-v1.5的size固定为512*512,stable-difussion-xl的值可支持长宽在512和1024之间以128步长取值的任意组合,如512*1024,1024*768等,默认1024*1024 512*512 ...

文字变形API详情

文字变形 说明 支持的领域/任务:aigc/创意文字生成 WordArt锦书-文字变形可以对输入的文字边缘轮廓进行创意变形,根据提示词内容进行边缘变化,实现一种字体的更多种创意用法,返回带有文字内容的黑底白色蒙版图。输入内容&效果示意 输入...

通义万相系列

通义万相是基于自研的Composer组合生成框架的AI绘画创作大模型,可以根据用户输入的文字内容生成符合语义描述的不同风格的图像,结果自然、细节丰富。并同时提供了图像背景生成和人像风格重绘模型。开发者可以通过以下链接,了解如何通过大...

鹿班介绍

基于图像智能生成技术,鹿班可以改变传统的设计模式,使其在短时间内完成大量banner图、海报图和会场图的设计,提高工作效率。用户只需任意输入想达成的风格、尺寸,鹿班就能代替人工完成素材分析、抠图、配色等耗时耗力的设计项目,实时...

2023年

2023-02-02 华东2(上海)口罩人脸比对1:1 图像生产 生成图像卡通化 输入一张图像,选择想要生成的卡通化风格,即可生成与输入图像相同分辨率、特定风格的卡通化图像。2023-02-08 华东2(上海)生成图像卡通化 生成图像超分 对图像...

生成图像超分

应用场景 生成模型更多细节:采用生成大模型,能够对图像生成更多细节纹理,对各类图像带来显著的画质提升。4倍放大:最高支持4倍放大,使低清图像变为高清图像。特色优势 印刷画质提升:对待出版印刷的图像内容进行高清化处理,使图像素材...

PAI ArtLab高清修复的三种方式

在进行文生图创作流程时,为了适应GPU内存限制并加快迭代速度,用户通常会选择较低分辨率设置批量生成候选图像。当最终找到满意的设计构图后,却发现图像缺乏精细度和足够的分辨率。针对这一问题,我们可以利用AI upscaler、SD upscale,...

图像背景生成API详情

图像背景生成 说明 支持的领域/任务:aigc/图像背景生成 通义万相-图像背景生成可以基于输入的前景图像素材拓展生成背景信息,实现自然的光影融合效果,与细腻的写实画面生成。支持文本描述、图像引导等多种方式,同时支持对生成图像智能...

图像背景生成API详情

图像背景生成 说明 支持的领域/任务:aigc/图像背景生成 通义万相-图像背景生成可以基于输入的前景图像素材拓展生成背景信息,实现自然的光影融合效果,与细腻的写实画面生成。支持文本描述、图像引导等多种方式,同时支持对生成图像智能...

标注模板说明

Vision-LLM主要用于处理与语言和视觉相关的任务,如图像描述生成、视觉问答和视觉推理等。与传统的NLP模型只关注文本特征不同,Vision-LLM能够同时捕捉到图像和文本之间的联系,从而在视觉理解和语言理解方面有更好的表现。Vision-LLM有着...

图像上传

本文介绍如何将图像上传到图像搜索服务。说明 如需了解更多产品详情和获取技术支持,请单击 在线咨询 或通过钉钉群(35035130)联系我们。背景信息 图像搜索提供两种方式上传图片,一种是通过图像搜索产品API或者SDK,另一种方式是通过借助...

Stable Diffusion AIACC加速版部署文档

通过逐步扩散(Diffusion),逐步处理图像,使得图像生成质量更高。通过本文,客户可以搭建一个stable diffusion的webui框架,并使用aiacctorch加速图片生成速度。在512x512分辨率下,AIACC加速能将推理时间从1.91s降低至0.88s,性能提升...

人像风格重绘API详情

人像风格重绘 说明 支持的领域/任务:aigc/人像风格化 通义万相-人像风格重绘可以将输入的人物图像进行多种风格化的重绘生成,使新生成图像在兼顾原始人物相貌的同时,带来不同风格的绘画效果。当前支持的风格有:复古漫画、3D童话、...

人像风格重绘API详情

人像风格重绘 说明 支持的领域/任务:aigc/人像风格化 通义万相-人像风格重绘可以将输入的人物图像进行多种风格化的重绘生成,使新生成图像在兼顾原始人物相貌的同时,带来不同风格的绘画效果。当前支持的风格有:复古漫画、3D童话、...

批量操作

请确保开通的OSS服务与已购买图像搜索服务在同一地域,否则将无法使用批量操作功能。将图片导入到OSS中 导入图片,具体操作请参见 上传文件。说明 图片存放路径可以自定义,只需要在创建批量任务时设置图片路径即可。新建increment.meta...

服务节点地址及内网(VPC)调用方式

VPC内网访问:仅限同区域ECS上的访问,例如您购买图像搜索实例是华东1(杭州),那么您的ECS或资源也必须在华东1(杭州)才能通过内网VPC地址访问图搜服务,否则会调用不通。VPC内网地址:使用内网服务入口访问时不会消耗ECS公网流量,...

AI写真:Python SDK使用说明

Image decode error 2 无法下载或解码图像。Number of face is not 1 3 人脸数量不为1。Image detect error 4 人脸检测异常。Image encoding error 5 将人脸编码为特征向量时出错,表示无法检测到人脸。This photo is not the same person ...

SAM自动图片分割和预标注

背景信息 Grounded SAM模型是一个最强的零样本视觉应用,它可以通过文本输入,检测、分割和生成任何图像。它是由IDEA领衔的中国专业团队打造的,基于Meta的SAM模型和其他三个强大的零样本模型。Grounded SAM模型主要由Grounding DINO和SAM...

EAS快速部署AI绘画SDWebUI

使用该应用进行模型推理,实现基于给定文本生成相应图像的功能。背景信息 AIGC是指通过人工智能技术自动生成内容的生产方式,已经成为继互联网时代的下一个产业时代风口。其中Stable Diffusion文生图模型是开源流行的跨模态生成模型,旨在...

AI视频生成-ComfyUI镜像部署

EAS提供了极简部署方式,您只需配置几个参数,即可一键部署基于ComfyUI和Stable Video Diffusion模型的AI视频生成服务,帮助您完成社交平台短视频内容生成、动画制作等任务。本文为您介绍如何基于ComfyUI镜像部署服务和几种常用的调用方式...

ASP协议

先进的压缩算法 云电脑内的屏幕内容往往是混合型的,既包含计算机生成图像(例如网页上的文字),也可能包含摄像头拍摄的图像(例如网页上的照片和视频)。对于这两种特点不同的图像,单纯的图片编码和视频流编码往往无法兼顾不同屏幕...

动态与公告

通义万相 通义万相系列模型商业化,服务免费额度用完后开始收费,收费标准参照:计量计费 2023-09-01 计量计费 新增模型 通义万相-人像风格重绘 通义万相-人像风格重绘可以将输入的人物图像进行多种风格化的重绘生成,使新生成图像在兼顾...

FaceChain社区版服务实例部署文档

最后再使用人脸识别模型计算生成的写真图像与模板人脸的相似度,以此对写真图像进行排序,并输出排名靠前的个人写真图像作为最终输出结果。总结 简单几步,即可在计算巢中生成一套属于自己的数字形象,如此简单、便捷的方案,快来计算巢一...

视频截图

多张截图:按照设置的间隔时间,均匀的截取对应视频的多帧图像,每帧图像都是一个图片文件。也叫批量截图、序列截图。平均截图:按照设定的截图张数,均匀地对视频进行切分并截取指定数量的图像。截图间隔时间(秒)多张截图时必选 在文本...

视频生产计费介绍

例如:如果使用物体检测和视频SDR调色两个能力,需要同时购买图像类预付费资源包和视频类预付费资源包。价格费用计算详情请参见 计费方式。如果您因业务需求希望更快地获取查询结果,请通过 咨询服务 联系我们。视频校色 视频校色 能力支持...

创建工作流

生成Webvtt索引文件 多张截图、平均截图时可选 单击 开关按钮,表示需要生成webVTT格式的索引文件。设为封面 非必选 单击 开关按钮,此节点截取的图片会自动设置为媒体库中该媒体的封面,当有多张截图时,默认第一张设为封面。关键帧 非必...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
图像搜索 智能视觉 检索分析服务 Elasticsearch版 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用