[帮助文档] 部署vLLM推理应用

vLLM(Vectorized Large Language Model)是一个高性能的大型语言模型推理库,支持多种模型格式和后端加速,适用于大规模语言模型的推理服务部署。本文以Qwen-7B-Chat-Int8模型、GPU类型为V100卡为例,演示如何部署一个vLLM推理服务。

[帮助文档] 基于AnalyticDB PostgreSQL图搜API构建图搜应用

本文介绍基于云原生数据仓库 AnalyticDB PostgreSQL 版的图搜API,实现向量化检索图片的整体流程。

云原生可观测最佳实践

1 课时 |
39 人已学 |
免费

阿里云云原生助理工程师认证(ACA)课程

66 课时 |
214 人已学 |
免费

高校精品课-华东师范大学-云原生数据库

13 课时 |
277 人已学 |
免费
开发者课程背景图

[帮助文档] 如何通过Java SDK提交Spark作业、查询Spark作业的状态和日志信息、结束Spark作业以及查询Spark历史作业

AnalyticDB MySQL湖仓版(3.0)集群支持通过Java SDK开发Spark应用和Spark SQL作业。本文介绍通过Java SDK提交Spark作业、查询Spark作业的状态和日志信息、结束Spark作业以及查询Spark历史作业的操作步骤。

[帮助文档] 基于OpenAPI构建RAG应用

本文介绍如何利用AnalyticDB PostgreSQL版的OpenAPI快速构建Retrieval Augmentation Generation(RAG)应用。

[帮助文档] 实现应用Pod与缓存数据之间的亲和性调度

通过Fluid提供的数据缓存亲和性调度优化能力,您可以设置应用Pod上的亲和性配置,让应用Pod优先访问同节点、同可用区节点或同地域节点的缓存数据,从而提高应用Pod访问数据的效率。

应用纳管和灰度发布:谐云基于 KubeVela 的企业级云原生实践

应用纳管和灰度发布:谐云基于 KubeVela 的企业级云原生实践

以下文章来源于谐云科技 ,作者陈炜舜在 OAM 最早推出时,谐云就参与其中,并基于社区中 oam-kubernetes-runtime 项目二次开发,以满足容器云产品中 OAM 应用模型的功能需求。该功能是将应用划分为多个 Kubernetes 资源 —— 组件(Component)、配置...

DataFlux:实时数据应用的新选择——企业级云原生数据库介绍

DataFlux:实时数据应用的新选择——企业级云原生数据库介绍

(一)数据库的发展——业务视角 数据库诞生之初主要专注于事务性的处理,也就是现在我们常见的OLTP数据库,它是一种结构化数据库,以高性能和高可用为特点,在电商交易中由着广泛应用,比如MySQL、Oracle是属于这类数据库;随着互联网的发展,OLTP比较难以解决高并发的问题,于是NoSQL数据库及专...

DataFlux:实时数据应用的新选择——企业级云原生数据库介绍

DataFlux:实时数据应用的新选择——企业级云原生数据库介绍

【MVP时间】线上峰会,一键收藏 《DataFlux--开启全新实时数据应用方式》精彩直播 查看文章,《DataFlux--开启全新实时数据应用方式》 (一)数据库的发展——业务视角 数据库诞生之初主要专注于事务性的处理,也就是现在我们常见的OLTP数据库,它是一种结构化数据库,以高性能和高可用为特...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云云原生
阿里云云原生
关注云原生中间件、微服务、Serverless、容器、Service Mesh等技术领域、聚焦云原生技术趋势、云原生大规模的落地实践
9163+人已加入
加入
相关电子书
更多
从技术到架构,云原生全面加速应用现代化
为创新提速,打造智算时代的云原生应用平台
开源混部系统Koordinator,助力云原生应用性能提升
立即下载 立即下载 立即下载