Transformer 和扩散模型的生成式 AI 实用指南(预览版)

Transformer 和扩散模型的生成式 AI 实用指南(预览版)

原文:Hands-On Generative AI with Transformers and Diffusion Models 译者:飞龙 协议:CC BY-NC-SA 4.0 第一章:扩散模型 在 2020 年末,一个名为扩散模型的鲜为人知的模型类别开始在机器学习领域引起轰动。研究人员找出了如何...

大模型落地实战指南:从选择到训练,深度解析显卡选型、模型训练技、模型选择巧及AI未来展望---打造AI应用新篇章

大模型落地实战指南:从选择到训练,深度解析显卡选型、模型训练技、模型选择巧及AI未来展望---打造AI应用新篇章

大模型落地实战指南:从选择到训练,深度解析显卡选型、模型训练技、模型选择巧及AI未来展望---打造AI应用新篇章 0.前言大模型发展史 早期阶段(1950s~1980s) 在1950年代初期,人们开始尝试使用计算机处理自然语言文本。然而,由于当时的计算机处理能力非常有限,很难处理自然语言中的复杂语法...

AI情绪鼓励师模型微调实操教学

1 课时 |
135 人已学 |
免费

跨越N次元 一键变身AI漫画人

1 课时 |
277 人已学 |
免费

AI人像动漫画实操教学

1 课时 |
205 人已学 |
免费
开发者课程背景图
LeCun视觉世界模型论文,揭示AI学习物理世界的关键

LeCun视觉世界模型论文,揭示AI学习物理世界的关键

这篇名为《在视觉表征学习中学习和利用世界模型》的论文探讨了在视觉表示学习中学习和利用世界模型的方法,尤其是提出了一种名为“图像世界模型”(Image World Models,IWM)的新方法。该方法超越了传统的遮蔽图像建模,学习在潜在空间中预测全局光度变换的影响。研究者通过实验证明,通过微调学习到...

文生视频Sora模型发布,是否引爆AI芯片热潮

文生视频Sora模型发布,是否引爆AI芯片热潮

文生视频Sora模型发布,是否引爆AI芯片热潮 1. 引言 在人工智能的历史长河中,每一次技术的飞跃都伴随着社会生产力的巨大变革。自2015年以来,深度学习技术的突破性进展,尤其是在自然语言处理、图像识别和机器学习等领域的成功应用,已经彻底改变了我们对机器智能的认识和期待。这些技术的进步不仅仅是理论...

无人机视角yolo多模态、模型剪枝、国产AI芯片部署

无人机视角yolo多模态、模型剪枝、国产AI芯片部署

无人机视角、多模态、模型剪枝、国产AI芯片部署是当前无人机技术领域的重要研究方向,其原理和应用价值在以下几个方面进行详细讲述。 一、无人机视角: 无人机视角是指在无人机上搭载摄像头等设备,通过航拍图像获取环境信息,并进行图像处理和分析。 这种技术可以提供高分辨率、大范围的图像数据,为农业、森林防火、...

OpenAI推出模型sora, 是要颠覆AI视频行业吗?

什么是OpenAI Sora? OpenAI Sora是一种结合了Diffusion模型和Transformer模型的技术。 通过将视频压缩网络将原始视频压缩到一个低维的潜在空间,并将这些表示分解为时空补丁,类似于Transformer的tokens,这样的表示使得模型能够有效地训练在不同分辨率、持...

生成模型不适合处理视频,AI得在抽象空间中进行预测

生成模型不适合处理视频,AI得在抽象空间中进行预测

生成模型在处理视频方面面临着不小的挑战。这个领域的新发展方向需要在抽象表征空间中进行预测,以更好地理解视频数据。这不仅仅是技术上的挑战,更是对AI研究者们思维方式的一次转变。只有通过在抽象层面上的深度理解,人工智能才能真正在视频处理领域取得更为卓越的成就。 首先,生成模型在处理视频时面临的挑战在于视...

智库观察丨超拟人大模型和个性化场景化的AI服务

智库观察丨超拟人大模型和个性化场景化的AI服务

《云栖战略参考》由阿里云与钛媒体联合策划,呈现云计算与人工智能领域的最新技术战略观点与业务实践探索,希望这些内容能让您有所启发。 自1950年艾伦·图灵推出著名的图灵测试到2022年ChatGPT的火爆,人类从未停止对AI对话智能的探索。 在大模型问世之前,聆心智能便已经致力于使用算法和AI技术,让...

训练数据集污染与模型算法攻击将成为AI新的棘手问题

训练数据集污染与模型算法攻击将成为AI新的棘手问题

AI的迅猛发展给各行各业带来了巨大的改变,然而,随着技术的进步,我们也面临着一些新的挑战。其中,训练数据集污染和模型算法攻击成为了AI领域的新难题,它们以一种不可忽视的方式影响着模型的性能和社会的公正性。 首先,训练数据集污染是一种恶意手段,通过操纵用于训练模型的数据,攻击者可以影响模型的输出结果。...

函数计算FC如何对github上开源的的文本生成视频的模型进行AI推理并且集成api?

函数计算FC如何对github上开源的的文本生成视频的模型,或者是modelscope上的模型(damo/text-to-video-synthesis)进行AI推理并且集成api?以供后端直接调用接口使用

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云机器学习平台PAI
阿里云机器学习平台PAI
阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。
2435+人已加入
加入
相关电子书
更多
Lindorm一站式AI数据平台实战
ModelScope助力语音AI模型创新与应用
AI模型训练解决方案V1.4
立即下载 立即下载 立即下载