开源ChatGPT-阿里云

马斯克将在本周，开源类ChatGPT产品Grok

科技界，开源文化一直被视为推动创新和技术进步的重要力量。近日，埃隆·马斯克宣布其公司xAI将开源一款名为Grok的AI产品，这一消息在业界引起了广泛关注。Grok作为一款类ChatGPT的生成式AI，其性能在某些方面超越了现有的大型语言模型，如GPT-3.5和LLaMA 2 70B，虽然与GPT-4...

SolidUI社区-从开源社区角度思考苹果下架多款ChatGPT应用

背景随着文本生成图像的语言模型兴起，SolidUI想帮人们快速构建可视化工具，可视化内容包括2D,3D,3D场景，从而快速构三维数据演示场景。SolidUI 是一个创新的项目，旨在将自然语言处理（NLP）与计算机图形学相结合，实现文生图功能。通过构建自研的文生图语言模型，SolidUI 利用 RL...

开源中文医疗大模型华佗GPT来了，真人医生盲测效果优于ChatGPT

香港中文大学（深圳）和深圳市大数据研究院所在的王本友教授团队训练并开源了一个新的医疗大模型 ——HuatuoGPT（华佗GPT），以使语言模型具备像医生一样的诊断能力和提供有用信息的能力。基于医生回复和 ChatGPT 回复，让语言模型成为医生提供丰富且准确的问诊。在医疗领域，大规模语言模型...

世界首款真开源类ChatGPT大模型Dolly 2.0，可随意修改商用

我们鼓励员工手搓了一个数据集，训练 LLM 还把它开源。众所周知，在 ChatGPT 的问题上 OpenAI 并不 Open，从 Meta 那里开源的羊驼系列模型也因为数据集等问题「仅限于学术研究类应用」，在人们还在因为寻找绕过限制方法的时候，主打 100% 开源的大模型来了。4 月 12 日，Da...

微软开源DeepSpeed Chat，人人可快速训练百亿、千亿级ChatGPT大模型（33）

有效吞吐量和可扩展性分析(I) 有效吞吐量分析。在 RLHF 训练的第 3 阶段，DeepSpeed-HE 的有效吞吐量取决于它在生成和 RL 训练阶段所实现的吞吐量。在我们的 RLHF （详见 benchmarking setting）中，生成阶段占总计算的约 20%，而 RL 训练阶段占剩余的 ...

微软开源DeepSpeed Chat，人人可快速训练百亿、千亿级ChatGPT大模型（2）

DeepSpeed Hybrid Engine统一的高效混合引擎为 RLHF 训练提供动力并进行优化DeepSpeed-Chat 流程的前两步与大型模型的常规微调相似，得益于基于 ZeRO 的内存管理优化和 DeepSpeed 训练中的并行策略灵活组合，实现了规模和速度的提升。然而，流程的第三步在性...

微软开源DeepSpeed Chat，人人可快速训练百亿、千亿级ChatGPT大模型（1）

微软开源DeepSpeed Chat，人人可快速训练百亿、千亿级ChatGPT大模型机器之心 2023-04-13 13:07 发表于北京机器之心专栏微软DeepSpeed组昨日，微软开源的 DeepSpeed Chat 引起了AI社区的广泛关注。它让我们能够以更低的成本、更快的速度训练类...

Meta开源的ChatGPT平替到底好不好用？测试结果、加料改装方法已出炉，2天5.2k星

Meta 开源的大模型系列 LLaMA 评测出炉，对比结果显示，和 ChatGPT 还是有差距的。ChatGPT 的持续爆火，早已让各大科技公司坐不住了。就在刚刚过去的一周，Meta「开源」了一个新的大模型系列 ——LLaMA（Large Language Model Meta AI），参数量从 7...