LLM引擎-阿里云

备案控制台

[帮助文档] 大语言模型（ LLM）推理引擎DeepGPU-LLM

DeepGPU-LLM是阿里云研发的基于GPU云服务器的大语言模型（Large Language Model，LLM）推理引擎，在处理大语言模型任务中，该推理引擎可以为您提供高性能的大模型推理服务。

OpenPPL-LLM | OpenPPL之大语言模型推理引擎来啦

OpenPPL-LLM | OpenPPL之大语言模型推理引擎来啦

自 OpenAI 发布 ChatGPT 以来，基于 Transformer 架构的大语言模型(LLM)在全球范围内引发了深度的技术关注和广泛的实践应用。其强大的理解和生成能力，正在深刻改变我们对人工智能的认知和应用。然而大语言模型的推理应用成本过高，高昂的成本大大阻碍了技术落地。OpenPPL 一直...

LLM推理提速2.8倍，CMU清华姚班校友提出「投机式推理」引擎SpecInfer，小模型撬动大模型高效推理

LLM推理提速2.8倍，CMU清华姚班校友提出「投机式推理」引擎SpecInfer，小模型撬动大模型高效推理

近日，来自卡耐基梅隆大学（CMU）的 Catalyst Group 团队发布了一款「投机式推理」引擎 SpecInfer，可以借助轻量化的小模型来帮助大模型，在完全不影响生成内容准确度的情况下，实现两到三倍的推理加速。随着 ChatGPT 的出现，大规模语言模型（LLM）...

神奇LLM引擎上线：帮你把GPT-3直接调成ChatGPT

神奇LLM引擎上线：帮你把GPT-3直接调成ChatGPT

OpenAI 花几个月完成的事，现在用它直接给你自动化了。最近一段时间，不论大公司还是开发者都在造大语言模型（LLM），但有人认为，大模型应用的速度有点落后。为了构建能实际使用的 AI 工具，我们需要基于基础模型构建定制化模型，中间的过程包含微调（Fine-tuning&...

共有4条

< 1 >

跳转至： GO

更新时间 2024-05-09 19:14:59

本页面内关键词为智能算法引擎基于机器学习所生成，如有任何问题，可在页面下方点击"联系我们"与我们沟通。

产品推荐

相关电子书

更多

PAI灵骏智算构建全链路LLM服务的最佳实践

PAI灵骏智算构建全链路LLM服务的最佳实践

立即下载

最佳实践

数据库

大模型结合Tair构建企业级专属Chatbot

本服务基于开源的langchain-ChatGLM实现，借助Tair的高性能内存引擎和向量索引能力，实现了“企业私域数据”的理解问答，以帮助企业快速构建专属Chatbot服务；并实现了对用户长Session聊天历史记录缓存，以摆脱LLM的Token数限制。

专有网络 VPC 云服务器ECS 云速搭云原生内存数据库Tair

一键部署

相关实验场景

更多

相关视频

PolarDB-PG + LLM 构建专属 Chatbot 技术解析 baphsqca3imha 7588播放

LLM引擎相关内容

引擎LLM

LLM您可能感兴趣