基于函数计算一键部署Stable Diffusion进行AI绘画创作

Stable Diffusion是一个可通过文本生成图像的扩散模型,基于CLIP模型从文字中提取隐变量,并通过UNet模型生成图片;最后通过逐步扩散、逐步处理图像,优化图像质量。本文为您介绍如何基于函数计算快速部署Stable Diffusion文生图模型,并...

产品介绍

宜搭渠道申请 宜搭渠道申请 钉钉群 常见咨询类问题 当您需要咨询关于短视频相关问题以及日常使用中遇到的问题,可以咨询阿里云视频云专门为短视频SDK打造的智能机器人 智能客服。相关文档 获取短视频SDK License SDK下载 Android短视频SDK ...

基于AIACC加速器快速实现AIGC绘画

使用Controlnet插件 ControlNet是一个用于控制AI图像生成的插件,它可以利用输入图片中的边缘特征、深度特征或人体姿势的骨架特征,与文字提示一起精准地控制AI图像的生成,以获得更好的视觉效果。Canny是ControlNet中一个常见的模型,用于...

时间属性配置说明

重跑说明 用于定义节点生成的实例是否可以重跑,即从数据幂等性考虑,任务是否可以重跑,或者在什么情况下可以重跑。生效日期 用于定义节点正常自动调度运行的时间范围,该时间范围外,节点将不再自动调度。使用说明 调度任务的时间属性...

基于函数计算快速部署可切换模型的Stable Diffusion

本文介绍如何通过函数计算搭建可切换模型的Stable Diffusion,实现更高质量的图像生成。背景信息 AIGC(Artificial Intelligence Generated Content)是指人工智能生成内容。Stable Diffusion是一个可通过文本生成图像的扩散模型,基于CLIP...

使用Copilot生成SQL

常见问题 Q:在对Copilot生成的SQL较为满意的情况下,为什么需要给SQL点赞?A:点赞操作可以触发Copilot保存SQL。后续提出相似的问题,能够大大提高回复的准确率。Q:当Copilot生成的SQL与提问不符时,为什么需要补充用户反馈?A:补充用户...

静态手势识别

抗模糊:在手部快速运动导致的图像一定程度模糊的情况下,依然可以部分识别手势。接入指引 1.注册阿里云账号:打开 阿里云官网,在阿里云官网右上角,单击 立即注册,按照操作提示完成账号注册。2.开通能力:请确保您已开通 人脸人体服务...

证件照质量审核

证件照质量审核可以自动识别证件图像质量问题,减少人力审核投入。登记注册:在线下登记注册操作时,需要拍摄证件电子档照片,但拍摄条件水平不一,部分照片质量存在问题。通过证件照质量审核可以筛选有质量问题的照片,以免使用和识别...

AI写真:Python SDK使用说明

使用以下命令,进行环境初始化:from ai_service_python_sdk.client.api_client import ApiClient client=ApiClient('<HOST>','<YOUR-APPID>','<YOUR-TOKEN>')您需要根据实际情况,替换以下参数值。参数 描述服务端地址:...

计量计费

模型名称 计费单价 文字纹理生成API wordart-texture 0.08元/张 文字变形API wordart-semantic 0.24元/张 免费额度 模型服务 免费额度 文字纹理生成API 开通灵积模型服务后,单个账号(含子账号)对模型提供首次使用 500张图像 生成免费...

模板视频人脸融合

对于多人脸视频场景,系统会自动识别整个视频中的不同人物ID,建议视频中的人物不要出现角度过大的转动以及明显遮挡的情况,否则识别的人物ID个数可能不准确。推荐图像示例:不推荐图像示例:调用步骤 该能力为异步能力,需分两步进行...

创建工作流

视频DNA 用来唯一标记一个视频,实现对视频中的图像、音频等指纹特征的提取和比对,解决重复视频查找、视频片段查源、原创识别等问题。智能封面 通过对视频内容的理解,结合画面和海量用户行为数据,基于算法选出最优的关键帧或关键片段...

计量计费

模型名称 计费单价 文字纹理生成API wordart-texture 0.08元/张 文字变形API wordart-semantic 0.24元/张 免费额度 模型服务 免费额度 文字纹理生成API 开通阿里云百炼服务后,单个账号(含子账号)对模型提供首次使用 500张图像 生成免费...

图像人体擦除

自动生成填充被人体遮挡的背景:基于深度学习算法,图像人体擦除可以推理还原被人体遮挡的背景内容,真实而没有违和感。接入指引 1.注册阿里云账号:打开 阿里云官网,在阿里云官网右上角,单击 立即注册,按照操作提示完成账号注册。2....

可观测概述

可观测性是一个包含各种级别的系统特征,必须结合应用程序的指标采集、网络的指标采集、以及基础设施(例如数据库存储等)来筛选存储大量的数据,以便在发生不可预测的情况时拼凑一个完整的视图。Service Mesh在可观测性方面可以有效提升...

EAS一键部署AI视频生成应用

新增功能/规格 通过EAS一键部署基于ComfyUI和Stable Video Diffusion模型的AI视频生成Web应用,快速实现文本生成视频以及图像生成视频的AI生成解决方案,帮助短视频直播平台、游戏互娱、动画制作等类型的客户快速实践AIGC。产品文档 5分钟...

常见问题

本文为您整合了使用Proxima CE过程中的常见问题。Proxima CE用的是哪里的资源?用户所在MaxCompute Project下的资源。输入表中的vector可以直接使用MaxCompute的Binary类型吗?目前不支持,Proxima CE当前版本构建索引的处理方法是将doc表...

人群筛选概述

人群筛选是生成人群的主要途径。什么是人群?Quick Audience中的人群本质上是指定多用户的列表,列表中包含用户的QAID。人群文件中将保存用户数据导入Quick Audience时,Quick Audience对用户生成的QAID。在后续使用人群时,Quick Audience...

图像隐形文字水印

本文介绍图像生产(imageenhan)类目下的图像隐形文字水印ImageBlindCharacterWatermark语法及示例。功能描述 图像隐形文字水印能力可以为图片添加或者解析指定文字水印。关于该接口功能的示例图如下:说明 您可以进入 在线咨询 获取在线...

JVM监控内存详情说明

Java进程占用内存分布 Java进程在运行期间,内存分布的大致情况如下图所示:说明 JVM的运行机制比较复杂,此图仅列了主要的内存分布区域。ARMS获取JVM内存详情的原理 ARMS应用监控探针通过JDK提供的MemoryMXBean获取JVM运行期间内存详情...

FaceChain人物写真生成

FaceChain基于扩散模型的图像生成能力,结合LoRA训练实现人像和风格融合,并叠加一系列后处理能力,实现兼具相似度、真实感、美观度的写真生成。开发者可以通过以下链接,了解如何通过大模型服务平台调用FaceChain人物写真API。快速开始 ...

人物动漫化

功能描述 人物动漫化能力可以将一张人物图像进行转换处理,生成卡通形象,并返回动漫化后的结果图像。支持风格:国画(NEW)、港漫(NEW)、漫画风(NEW)、动画3D(NEW)、日漫、3D、手绘、铅笔画和艺术特效9个风格。多人照片:可转换多人...

图像隐形图片水印

本文介绍图像生产(imageenhan)类目下的图像隐形图片水印ImageBlindPicWatermark的语法及示例。功能描述 图像隐形图片水印能力可以为图像添加或解析图片水印。例如您有一张图A,调用encode_pic参数添加图片盲水印后得到图B。或者您也可以...

5分钟使用EAS一键部署Stable Diffusion实现文生图能力

Stable Diffusion文生图模型是开源流行的跨模态生成模型,能够根据文字描述生成相应的图像。EAS提供的Stable-Diffusion-WebUI在其基础上进行封装,提供更加简洁易操作的UI。通过EAS,您可以在5分钟内使用GPU类型的实例规格,一键部署Stable...

组件参考:所有组件汇总

Split Word(生成模型)该组件基于AliWS(Alibaba Word Segmenter)词法分析系统,根据参数和自定义词典生成分词模型。词频统计 该组件是指输入一些字符串(手动输入或者从指定的文件读取),用程序来统计这些字符串中总共有多少个单词,每...

高清人体分割

输出图像在原始图像的3通道基础上增加alpha通道生成四通道PNG图像作为输出,无压缩,图像尺寸保持不变,图像体积会变大。说明 该URL地址为临时地址,有效期为30分钟,过期后将无法访问。若需要长时间或者永久保存文件,请在30分钟内访问URL...

直播转点播常见问题

本文介绍直播转点播过程中可能遇到的常见问题及处理建议。录制时会生成多少点播视频?在直播进行时,每到达一个录制周期,都会生成一个点播视频。同时,直播默认断流超过3分钟,会认为本次直播结束,也会生成一个点播视频。如:录制周期...

通用分割

特点优势 自动主体识别:自动识别出图像中的主体物体,不需要额外指定。适用多个场景:适用于人、动物、食物、物品、家居等抠图场景,不适用于卡通图。接入指引 1.注册阿里云账号:打开 阿里云官网,在阿里云官网右上角,单击 立即注册,...

人体检测

特色优势 支持多角度检测:针对正面,侧面,高角度等拍摄的图像,都可以准确检测人体。抗遮挡能力强:对于人体被少部分遮挡的场景,仍可以准确检测人体。接入指引 1.注册阿里云账号:打开 阿里云官网,在阿里云官网右上角,单击 立即...

公众人物识别

特色优势 能够准确识别出图像中的一个或多个公众人物信息。接入指引 1.注册阿里云账号:打开 阿里云官网,在阿里云官网右上角,单击 立即注册,按照操作提示完成账号注册。2.开通能力:请确保您已开通 人脸人体服务,若未开通服务请 立即...

服饰分割

关于该接口功能的示例图如下:输入原图(左)和输出结果图(右)识别服饰类别为:tops(上衣)、skirt(裙装)、shoes(鞋子)识别服饰类别为:tops(上衣)、pants(裤装)、shoes(鞋子)、bag(包类)识别服饰类别为:hat(帽子)...

人脸修复增强

特色优势 细节增强:可增强原图细节,在原片质量不足的情况下,依然能恢复部分细节,提升照片质量。人像一致性:在提升细节的同时,保留与原始人像的一致性与真实感。接入指引 1.注册阿里云账号:打开 阿里云官网,在阿里云官网右上角,...

换脸鉴别

特色优势 反制AI技术滥用:换脸鉴别基于达摩院人脸图像算法和Deepfake鉴别技术,提供对图像中的人脸特征进行全方位分析,利用AI技术反制换脸、合成脸、人脸特征编辑生成这类AI技术的滥用,保护用户合法权益、维护社会公共安全。领先鉴别...

风格识别

本文介绍图像识别(imagerecog)类目下的风格识别RecognizeImageStyle的语法及示例。功能描述 风格识别能力可以对输入图像的风格类型进行分析,识别可能的风格与语意标签。可以识别的风格包括:chinese(中国风)、watercolor(水彩)、...

API详情

通义千问VL 说明 支持的领域/任务:aigc 通义千问VL是阿里云研发的大规模视觉语言模型(Large Vision Language Model,LVLM),可以以图像、文本、检测框作为输入,并以文本和检测框作为输出,支持中文多模态对话及多图对话,并具有更好的...

插件调用详细说明

choices List[]当result_format为message 输出choices choices[i].finish_reason String 有三种情况:正在生成时为null,生成结束时如果由于停止token导致则为stop,生成结束时如果因为生成长度过长导致则为length。当result_format为...

视频AI概述

视频DNA服务实现对视频中的图像、音频等指纹特征的提取和比对,解决重复视频查找、视频片段查源、原创识别等问题。产品信息:视频DNA 配置文档:视频DNA 智能标签 智能标签服务通过分析视频中视觉、文字、语音、行为等信息,结合多模态信息...

商品分割

应用场景 商品海报图制作:从拍摄的商品实物照片中分割目标商品,再进行后续平面设计,制作商品宣传图片。优势特点 自动识别商品:能够自动识别图片中的主体商品,并进行商品主体与背景的精准分割。适合多商品、复杂背景场景:适合多...

Prompt最佳实践

Prompt 工程简介 Prompt(提示词)是一个指令、问题或者语句,能被 用来引导或指示一个语言模型生成特定的文本输出。Prompt是用户与语言模型交互的起始点,它告诉模型用户的意图,并且期望模型能以有意义且相关的方式回应。通过精心设计的...

人体分割

特色优势 发丝级精细分割:在细碎部位提供更高的分割精度,细到发丝都能被精确分割,使结果图像没有违和感,难以被觉察经过处理。适应复杂背景:即使人物处于复杂背景环境,依然可以将人体准确地从背景中分割出来。接入指引 1.注册阿里云...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
图像搜索 视觉智能开放平台 检索分析服务 Elasticsearch版 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用