[帮助文档] 部署vLLM推理应用

vLLM(Vectorized Large Language Model)是一个高性能的大型语言模型推理库,支持多种模型格式和后端加速,适用于大规模语言模型的推理服务部署。本文以Qwen-7B-Chat-Int8模型、GPU类型为V100卡为例,演示如何部署一个vLLM推理服务。

[帮助文档] 基于AnalyticDB PostgreSQL图搜API构建图搜应用

本文介绍基于云原生数据仓库 AnalyticDB PostgreSQL 版的图搜API,实现向量化检索图片的整体流程。

云原生可观测最佳实践

1 课时 |
39 人已学 |
免费

阿里云云原生助理工程师认证(ACA)课程

66 课时 |
214 人已学 |
免费

高校精品课-华东师范大学-云原生数据库

13 课时 |
277 人已学 |
免费
开发者课程背景图

[帮助文档] 如何通过Java SDK提交Spark作业、查询Spark作业的状态和日志信息、结束Spark作业以及查询Spark历史作业

AnalyticDB MySQL湖仓版(3.0)集群支持通过Java SDK开发Spark应用和Spark SQL作业。本文介绍通过Java SDK提交Spark作业、查询Spark作业的状态和日志信息、结束Spark作业以及查询Spark历史作业的操作步骤。

构建未来应用:云原生架构在现代企业中的实践与挑战

在当今快节奏的商业环境中,企业需要快速响应市场变化,灵活地开发和部署应用。传统的IT架构由于其僵化和缺乏灵活性,难以满足这些需求。云原生架构应运而生,旨在利用云计算的优势,通过一系列最佳实践和技术,提供更加动态和自动化的解决方案。 云原生架构的核心在于容器化技术,它允许应用与底层基础设施解耦...

构建未来应用:云原生架构的演进与实践

随着云计算技术的成熟和企业对敏捷开发的不断追求,云原生(Cloud Native)作为一种新兴的软件开发模式,正逐渐成为行业焦点。云原生架构强调在公共云、私有云及混合云环境中构建和运行可弹性扩展的应用。它不仅代表了一种技术趋势,更是一种文化和组织变革。 一、云原生概念解析 云原生的概念最早由Pivo...

[帮助文档] 基于OpenAPI构建RAG应用

本文介绍如何利用AnalyticDB PostgreSQL版的OpenAPI快速构建Retrieval Augmentation Generation(RAG)应用。

[帮助文档] 实现应用Pod与缓存数据之间的亲和性调度

通过Fluid提供的数据缓存亲和性调度优化能力,您可以设置应用Pod上的亲和性配置,让应用Pod优先访问同节点、同可用区节点或同地域节点的缓存数据,从而提高应用Pod访问数据的效率。

应用纳管和灰度发布:谐云基于 KubeVela 的企业级云原生实践

应用纳管和灰度发布:谐云基于 KubeVela 的企业级云原生实践

以下文章来源于谐云科技 ,作者陈炜舜在 OAM 最早推出时,谐云就参与其中,并基于社区中 oam-kubernetes-runtime 项目二次开发,以满足容器云产品中 OAM 应用模型的功能需求。该功能是将应用划分为多个 Kubernetes 资源 —— 组件(Component)、配置...

eBPF技术应用云原生网络实践系列之基于socket的service | 龙蜥技术

eBPF技术应用云原生网络实践系列之基于socket的service | 龙蜥技术

相关阅读:《eBPF技术应用云原生网络实践系列之kubernetes网络》背景介绍Kubernetes 中的网络功能,主要包括 POD 网络,service 网络和网络策略组成。其中 POD 网络和网络策略,都是规定了模型,没有提供默认实现。而 service 网络作为 Kubernetes 的特色...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云云原生
阿里云云原生
关注云原生中间件、微服务、Serverless、容器、Service Mesh等技术领域、聚焦云原生技术趋势、云原生大规模的落地实践
9151+人已加入
加入
相关电子书
更多
从技术到架构,云原生全面加速应用现代化
为创新提速,打造智算时代的云原生应用平台
开源混部系统Koordinator,助力云原生应用性能提升
立即下载 立即下载 立即下载