2023年

2023年01月 类目名称 能力名称 功能描述 发布时间 发布地域 相关文档 图像生产 文生图 依托达摩院自研文生图大模型,通过知识重组与可变维度扩散模型加速收敛并提升最终生成图片,输入描述文本,即可返回符合文本描述的2D图像,支持中英双语...

基本概念

支持中英双语。智能纪要 包含关键词提取、待办事项提取、场景类型识别和重点内容提取四个AI能力。在转写完成后进行处理。PPT抽取和总结 将视频中,演示的PPT进行抽取,并对每页PPT讲解的内容进行摘要总结,解决了无法索要PPT的问题,同时...

快速开始

基于Transformer结构,在大约1.2万亿tokens上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。在标准的中文和英文权威benchmark(C-EVAL/MMLU)上均取得同尺寸最好的效果。快速开始 前提条件 已开通服务并获得API-KEY:获取API-...

快速开始

基于Transformer结构,在大约1.2万亿tokens上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。在标准的中文和英文权威benchmark(C-EVAL/MMLU)上均取得同尺寸最好的效果。快速开始 前提条件 已开通服务并获得API-KEY:开通...

快速开始

悟道·天鹰(Aquila)语言大模型是首个具备中英双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型,具有以下特征:Aquila系列模型在中英文高质量语料基础上从 0 开始训练,中文语料约占 40%,保证模型在预训练阶段就开始积累...

使用基于英特尔CPU的c8i实例部署ChatGLM2-6B

背景 信息 ChatGLM2-6B 中英对话 大模型 ChatGLM2-6B是开源中英双语对话模型ChatGLM-6B的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础上,ChatGLM2-6B具有更强大的性能、更长的上下文、更高效的推理等特性。...

快速开始

此外InternLM系列模型还具有如下优势:多语:InternLM 具备多种语言的理解和表达能力,尤其能熟练使用中英双语,在中文和英文的多种客观评测上都强于社区开源模型。推理:通过在不同来源的数据以及精选高质量数据上进行训练,InternLM 在...

快速开始

多语言对话模型:天然支持英文、中文等多语言对话,端到端支持图片里中英双语的长文本识别;多图交错对话:支持多图输入和比较,指定图片问答,多图文学创作等;首个支持中文开放域定位的通用模型:通过中文开放域语言表达进行检测框标注;...

LLM+ADB快速构建企业专属Chatbot

服务介绍 向量数据库(企业知识库)+大语言模型基于ChatGLM-6B,是由清华大学团队开发的是一个开源的、支持中英双语的对话语言模型,基于General Language Model(GLM)架构,具有62亿参数。本文介绍如何通过计算巢快速完成从0到1部署,在...

功能发布记录

新增 SDK和API概览 新增 16k 识别能力 中英自由说(混合识别)、粤语(繁体)、葡萄牙语、土耳其语、希腊语、爪哇语、孟加拉语、捷克语、乌尔都语、尼泊尔语、蒙古语(外蒙)、乌兹别克语、僧伽罗语、马拉地语、泰卢固语、旁遮普语、瑞典语...

快速使用

MOSS是一个支持中英双语和多种插件的开源对话语言模型,MOSS-MOON系列模型具有160亿参数,在FP16精度下可在单张A100/A800或两张3090显卡运行,在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练...

文生图

功能描述 依托达摩院自研文生图大模型,通过知识重组与可变维度扩散模型加速收敛并提升最终生成图片,输入描述文本,即可返回符合文本描述的2D图像,支持中英双语输入,您可以通过API实现服务调用。说明 阿里云视觉智能开放平台视觉AI能力...

轻量微调和推理ChatGLM模型实践

ChatGLM-6B是一个开源的、支持中英双语的对话语言模型,基于General Language Model(GLM)架构,具有62亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署,从而实现更智能、交互性更强的人机对话体验。准备环境和资源 创建...

PDF识别

多语种识别:可识别中、英、中英混合等多语种内容。接入指引 1.注册阿里云账号:打开 阿里云官网,在阿里云官网右上角,单击 立即注册,按照操作提示完成账号注册。2.开通能力:请确保您已开通 文字识别服务,若未开通服务请 立即开通。3....

CreateTask-创建听悟任务

支持中英日。string 否 翻译功能开启时设置的目标语言。支持以下取值:cn:中文 en:英文 ja:日文 en OutputLevel integer 否 设置实时语言翻译识别结果返回等级。默认值是 1。1:识别出完整句子时返回识别结果;2:识别出中间结果及完整...

接口与实现

支持设置多语言识别:中文、英文、粤语、日语、韩语、中英自由说(长段中英混)。支持设置开启翻译:支持中、英、日、韩语间的双向互译,中英自由说翻译目标语言可为中文、英文或中文&英文,支持会议中开启或关闭。支持设置同步音频转码:...

API详情

基于Transformer结构,在大约1.2万亿tokens上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。在标准的中文和英文权威benchmark(C-EVAL/MMLU)上均取得同尺寸最好的效果。模型概览 模型名 模型简介 baichuan-7b-v1 百川模型,仅...

API详情

基于Transformer结构,在大约1.2万亿tokens上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。在标准的中文和英文权威benchmark(C-EVAL/MMLU)上均取得同尺寸最好的效果。模型概览 模型名 模型简介 baichuan-7b-v1 百川模型,仅...

API详情

MOSS是一个支持中英双语和多种插件的开源对话语言模型,MOSS-MOON系列模型具有160亿参数,在FP16精度下可在单张A100/A800或两张3090显卡运行,在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练...

面向大语言模型的文本审核PLUS服务

增加对诱导AI生成违规、偏见歧视、个人隐私内容的识别 特定的模型输入指令支持检索并返回知识库中的标准回答 兼容中英文本,侧重识别底线违规类和负面内容 增加对诱导AI生成违规内容的识别 标签体系 支持返回10个类型的60+个细分标签,和...

使用文本审核增强版识别文本违规风险

AIGC类文字检测 ai_art_detection AI文生图的文字指令等 兼容中英文本,侧重识别底线违规类(涉黄、涉政、涉暴等)和负面内容。大语言模型输入文字检测 llm_query_moderation 大语言模型的用户输入内容 支持对底线类违规(涉黄、涉政、涉暴...

功能特性

文本审核增强版业务场景 AIGC类文字审核 AIGC的文字指令、聊天机器人等,兼容中英文本,侧重识别底违规类和负面内容。文本审核增强版业务场景 大语言模型输入文字审核 支持对底线类违规、不良诱导信息的检测,可支持对部分诱导性敏感话题的...

功能特性

是 标准版 知冰_多情感 zhibing_emo 多种情感男声 通用场景 中文及中英文混合场景 8K/16K/24K 是 是 标准版 知妙_多情感 zhimiao_emo 多种情感女声 中英场景 中文及英文场景 8K/16K 是 是 标准版 知米_多情感 zhimi_emo 多种情感女声 通用...

5分钟使用EAS一键部署ChatGLM及LangChain应用

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于General Language Model(GLM)架构,具有62亿参数。ChatGLM-6B使用了和ChatGPT相似的技术,针对中文问答和对话进行了优化。经过约1T Token的中英双语训练,辅以监督微调、反馈...

音视频文件离线转写

支持设置多种语言识别:中文、英文、粤语、中英自由说(长段中英混)、日语、韩语,详见 音视频文件服务参数表。对于API维度的QPS(Queries Per Second)限制如下:CreateTask-创建听悟任务 用户级别QPS限制为20。GetTaskInfo-查询任务状态...

接口说明

通用场景 中文及中英文混合场景 8K/16K/24K 是 是 标准版 知妙_多情感 zhimiao_emo 多种情感女声 中英场景 中文及英文场景 8K/16K 是 是 标准版 知米_多情感 zhimi_emo 多种情感女声 通用场景 中文及中英文混合场景 8K/16K 是 否 标准版 知...

接口说明

新零售领域识别模型,出行领域识别模型 16k 支持 支持 支持 支持 支持 中英自由说 16k 支持 支持 支持 支持 不支持 识音石 V1-端到端模型 8k 支持 支持 支持 支持 支持 就近地域智能接入 一句话识别支持就近地域智能接入,域名为 nls-...

接口说明

新零售领域识别模型,出行领域识别模型 16k 支持 支持 支持 支持 支持 中英自由说 16k 支持 支持 支持 支持 不支持 识音石 V1-端到端模型 8k 支持 支持 支持 支持 支持 就近地域智能接入 实时语音识别支持就近地域智能接入,域名为 nls-...

接口说明

通用场景 中文及中英文混合场景 8K/16K/24K 是 是 标准版 知妙_多情感 zhimiao_emo 多种情感女声 中英场景 中文及英文场景 8K/16K 是 是 标准版 知米_多情感 zhimi_emo 多种情感女声 通用场景 中文及中英文混合场景 8K/16K 是 否 标准版 知...

接口说明

通用场景 中文及中英文混合场景 8K/16K/24K 是 是 标准版 知妙_多情感 zhimiao_emo 多种情感女声 中英场景 中文及英文场景 8K/16K 是 是 标准版 知米_多情感 zhimi_emo 多种情感女声 通用场景 中文及中英文混合场景 8K/16K 是 否 标准版 知...

语音识别FAQ

本文汇总了您在使用语音识别服务时的常见问题。语音识别类常见问题主要分为以下几类:功能类 实时转写说话有停顿,但是语音识别不断句怎么办?语音识别能自动断开多句话吗?语音识别服务支持离线功能吗?语音识别支持哪些模型?...

接口说明

通用场景 中文及中英文混合场景 8K/16K/24K 是 是 标准版 知妙_多情感 zhimiao_emo 多种情感女声 中英场景 中文及英文场景 8K/16K 是 是 标准版 知米_多情感 zhimi_emo 多种情感女声 通用场景 中文及中英文混合场景 8K/16K 是 否 标准版 知...

图像背景生成API详情

http://abc.com/b.jpg input.ref_prompt String 引导文本提示词,支持中英双语,不超过70个单词。在沙漠的地面上,远处有植物和落日,丰富的细节,柔和的光线 input.neg_ref_prompt String 否 负向提示词,不希望出现的内容。大部分情况下...

图像背景生成API详情

http://abc.com/b.jpg input.ref_prompt String 引导文本提示词,支持中英双语,不超过70个单词。在沙漠的地面上,远处有植物和落日,丰富的细节,柔和的光线 input.neg_ref_prompt String 否 负向提示词,不希望出现的内容。大部分情况下...

API详情

多语言对话模型:天然支持英文、中文等多语言对话,端到端支持图片里中英双语的长文本识别;多图交错对话:支持多图输入和比较,指定图片问答,多图文学创作等;首个支持中文开放域定位的通用模型:通过中文开放域语言表达进行检测框标注;...

接口说明

名称 voice参数值 类型 适用场景 支持语言 支持采样率(Hz)支持时间戳(字级别音素边界)接口 支持儿化音 声音品质 知妙_多情感 zhimiao_emo 多种情感女声 中英场景 中文及英文场景 8K/16K 是 是 标准版 知米_多情感 zhimi_emo 多种情感...

接口说明

识音石 V1-端到端模型,教育内容分析,医疗内容分析,新闻媒体内容分析,娱乐视频内容分析,音视频离线转写(升级版),新零售领域识别模型,出行领域识别模型 16k 支持 支持 支持 支持 支持 中英自由说 16k 支持 支持 支持 支持 不支持 识...

接口说明

识音石 V1-端到端模型,教育内容分析,医疗内容分析,新闻媒体内容分析,娱乐视频内容分析,音视频离线转写(升级版),新零售领域识别模型,出行领域识别模型 16k 支持 支持 支持 支持 支持 中英自由说 16k 支持 支持 支持 支持 不支持 识...

接口说明

识音石 V1-端到端模型,教育内容分析,医疗内容分析,新闻媒体内容分析,娱乐视频内容分析,音视频离线转写(升级版),新零售领域识别模型,出行领域识别模型 16k 支持 支持 支持 支持 支持 中英自由说 16k 支持 支持 支持 支持 不支持 识...

新功能发布记录

本文为您提供OpenSearch-召回引擎版的重要功能发布信息。发布记录 时间 特性 类别 描述 2024-01-08 产品新功能迭代 新增 支持为单个doc配置多向量 新增文本转向量模型,新模型支持128、512、1024token长度的中英文文本进行向量化自动处理 ...
共有10条 < 1 2 3 4 ... 10 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储 物联网平台
新人特惠 爆款特惠 最新活动 免费试用