中英-中英文档介绍内容-阿里云

2023年

2023年01月类目名称能力名称功能描述发布时间发布地域相关文档图像生产文生图依托达摩院自研文生图大模型，通过知识重组与可变维度扩散模型加速收敛并提升最终生成图片,输入描述文本，即可返回符合文本描述的2D图像，支持中英双语...

基本概念

支持中英双语。智能纪要包含关键词提取、待办事项提取、场景类型识别和重点内容提取四个AI能力。在转写完成后进行处理。PPT抽取和总结将视频中，演示的PPT进行抽取，并对每页PPT讲解的内容进行摘要总结，解决了无法索要PPT的问题，同时...

快速开始

基于Transformer结构，在大约1.2万亿tokens上训练的70亿参数模型，支持中英双语，上下文窗口长度为4096。在标准的中文和英文权威benchmark（C-EVAL/MMLU）上均取得同尺寸最好的效果。快速开始前提条件已开通服务并获得API-KEY：获取API-...

快速开始

基于Transformer结构，在大约1.2万亿tokens上训练的70亿参数模型，支持中英双语，上下文窗口长度为4096。在标准的中文和英文权威benchmark（C-EVAL/MMLU）上均取得同尺寸最好的效果。快速开始前提条件已开通服务并获得API-KEY：开通...

快速开始

悟道·天鹰（Aquila）语言大模型是首个具备中英双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型，具有以下特征：Aquila系列模型在中英文高质量语料基础上从 0 开始训练，中文语料约占 40%，保证模型在预训练阶段就开始积累...

使用基于英特尔CPU的c8i实例部署ChatGLM2-6B

背景信息 ChatGLM2-6B 中英对话大模型 ChatGLM2-6B是开源中英双语对话模型ChatGLM-6B的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础上，ChatGLM2-6B具有更强大的性能、更长的上下文、更高效的推理等特性。...

快速开始

此外InternLM系列模型还具有如下优势：多语：InternLM 具备多种语言的理解和表达能力，尤其能熟练使用中英双语，在中文和英文的多种客观评测上都强于社区开源模型。推理：通过在不同来源的数据以及精选高质量数据上进行训练，InternLM 在...

快速开始

多语言对话模型：天然支持英文、中文等多语言对话，端到端支持图片里中英双语的长文本识别；多图交错对话：支持多图输入和比较，指定图片问答，多图文学创作等；首个支持中文开放域定位的通用模型：通过中文开放域语言表达进行检测框标注；...

LLM+ADB快速构建企业专属Chatbot

服务介绍向量数据库（企业知识库）+大语言模型基于ChatGLM-6B，是由清华大学团队开发的是一个开源的、支持中英双语的对话语言模型，基于General Language Model（GLM）架构，具有62亿参数。本文介绍如何通过计算巢快速完成从0到1部署，在...

功能发布记录

新增 SDK和API概览新增 16k 识别能力中英自由说（混合识别）、粤语（繁体）、葡萄牙语、土耳其语、希腊语、爪哇语、孟加拉语、捷克语、乌尔都语、尼泊尔语、蒙古语（外蒙）、乌兹别克语、僧伽罗语、马拉地语、泰卢固语、旁遮普语、瑞典语...

快速使用

MOSS是一个支持中英双语和多种插件的开源对话语言模型，MOSS-MOON系列模型具有160亿参数，在FP16精度下可在单张A100/A800或两张3090显卡运行，在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练...

文生图

功能描述依托达摩院自研文生图大模型，通过知识重组与可变维度扩散模型加速收敛并提升最终生成图片,输入描述文本，即可返回符合文本描述的2D图像，支持中英双语输入，您可以通过API实现服务调用。说明阿里云视觉智能开放平台视觉AI能力...

轻量微调和推理ChatGLM模型实践

ChatGLM-6B是一个开源的、支持中英双语的对话语言模型，基于General Language Model(GLM)架构，具有62亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署，从而实现更智能、交互性更强的人机对话体验。准备环境和资源创建...

PDF识别

多语种识别：可识别中、英、中英混合等多语种内容。接入指引 1.注册阿里云账号：打开阿里云官网，在阿里云官网右上角，单击立即注册，按照操作提示完成账号注册。2.开通能力：请确保您已开通文字识别服务，若未开通服务请立即开通。3....

CreateTask-创建听悟任务

支持中英日。string 否翻译功能开启时设置的目标语言。支持以下取值：cn：中文 en：英文 ja：日文 en OutputLevel integer 否设置实时语言翻译识别结果返回等级。默认值是 1。1：识别出完整句子时返回识别结果；2：识别出中间结果及完整...

接口与实现

支持设置多语言识别：中文、英文、粤语、日语、韩语、中英自由说（长段中英混）。支持设置开启翻译：支持中、英、日、韩语间的双向互译，中英自由说翻译目标语言可为中文、英文或中文&英文，支持会议中开启或关闭。支持设置同步音频转码：...

API详情

基于Transformer结构，在大约1.2万亿tokens上训练的70亿参数模型，支持中英双语，上下文窗口长度为4096。在标准的中文和英文权威benchmark（C-EVAL/MMLU）上均取得同尺寸最好的效果。模型概览模型名模型简介 baichuan-7b-v1 百川模型，仅...

API详情

基于Transformer结构，在大约1.2万亿tokens上训练的70亿参数模型，支持中英双语，上下文窗口长度为4096。在标准的中文和英文权威benchmark（C-EVAL/MMLU）上均取得同尺寸最好的效果。模型概览模型名模型简介 baichuan-7b-v1 百川模型，仅...

API详情

MOSS是一个支持中英双语和多种插件的开源对话语言模型，MOSS-MOON系列模型具有160亿参数，在FP16精度下可在单张A100/A800或两张3090显卡运行，在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练...

面向大语言模型的文本审核PLUS服务

增加对诱导AI生成违规、偏见歧视、个人隐私内容的识别特定的模型输入指令支持检索并返回知识库中的标准回答兼容中英文本，侧重识别底线违规类和负面内容增加对诱导AI生成违规内容的识别标签体系支持返回10个类型的60+个细分标签，和...

使用文本审核增强版识别文本违规风险

AIGC类文字检测 ai_art_detection AI文生图的文字指令等兼容中英文本，侧重识别底线违规类（涉黄、涉政、涉暴等）和负面内容。大语言模型输入文字检测 llm_query_moderation 大语言模型的用户输入内容支持对底线类违规（涉黄、涉政、涉暴...

功能特性

文本审核增强版业务场景 AIGC类文字审核 AIGC的文字指令、聊天机器人等，兼容中英文本，侧重识别底违规类和负面内容。文本审核增强版业务场景大语言模型输入文字审核支持对底线类违规、不良诱导信息的检测，可支持对部分诱导性敏感话题的...

功能特性

是标准版知冰_多情感 zhibing_emo 多种情感男声通用场景中文及中英文混合场景 8K/16K/24K 是是标准版知妙_多情感 zhimiao_emo 多种情感女声中英场景中文及英文场景 8K/16K 是是标准版知米_多情感 zhimi_emo 多种情感女声通用...

5分钟使用EAS一键部署ChatGLM及LangChain应用

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于General Language Model（GLM）架构，具有62亿参数。ChatGLM-6B使用了和ChatGPT相似的技术，针对中文问答和对话进行了优化。经过约1T Token的中英双语训练，辅以监督微调、反馈...

音视频文件离线转写

支持设置多种语言识别：中文、英文、粤语、中英自由说（长段中英混）、日语、韩语，详见音视频文件服务参数表。对于API维度的QPS（Queries Per Second）限制如下：CreateTask-创建听悟任务用户级别QPS限制为20。GetTaskInfo-查询任务状态...

接口说明

通用场景中文及中英文混合场景 8K/16K/24K 是是标准版知妙_多情感 zhimiao_emo 多种情感女声中英场景中文及英文场景 8K/16K 是是标准版知米_多情感 zhimi_emo 多种情感女声通用场景中文及中英文混合场景 8K/16K 是否标准版知...

接口说明

新零售领域识别模型，出行领域识别模型 16k 支持支持支持支持支持中英自由说 16k 支持支持支持支持不支持识音石 V1-端到端模型 8k 支持支持支持支持支持就近地域智能接入一句话识别支持就近地域智能接入，域名为 nls-...

接口说明

新零售领域识别模型，出行领域识别模型 16k 支持支持支持支持支持中英自由说 16k 支持支持支持支持不支持识音石 V1-端到端模型 8k 支持支持支持支持支持就近地域智能接入实时语音识别支持就近地域智能接入，域名为 nls-...

接口说明

通用场景中文及中英文混合场景 8K/16K/24K 是是标准版知妙_多情感 zhimiao_emo 多种情感女声中英场景中文及英文场景 8K/16K 是是标准版知米_多情感 zhimi_emo 多种情感女声通用场景中文及中英文混合场景 8K/16K 是否标准版知...

接口说明

通用场景中文及中英文混合场景 8K/16K/24K 是是标准版知妙_多情感 zhimiao_emo 多种情感女声中英场景中文及英文场景 8K/16K 是是标准版知米_多情感 zhimi_emo 多种情感女声通用场景中文及中英文混合场景 8K/16K 是否标准版知...

语音识别FAQ

本文汇总了您在使用语音识别服务时的常见问题。语音识别类常见问题主要分为以下几类：功能类实时转写说话有停顿，但是语音识别不断句怎么办？语音识别能自动断开多句话吗？语音识别服务支持离线功能吗？语音识别支持哪些模型？...

接口说明

通用场景中文及中英文混合场景 8K/16K/24K 是是标准版知妙_多情感 zhimiao_emo 多种情感女声中英场景中文及英文场景 8K/16K 是是标准版知米_多情感 zhimi_emo 多种情感女声通用场景中文及中英文混合场景 8K/16K 是否标准版知...

图像背景生成API详情

http://abc.com/b.jpg input.ref_prompt String 引导文本提示词，支持中英双语，不超过70个单词。在沙漠的地面上，远处有植物和落日，丰富的细节，柔和的光线 input.neg_ref_prompt String 否负向提示词，不希望出现的内容。大部分情况下...

图像背景生成API详情

http://abc.com/b.jpg input.ref_prompt String 引导文本提示词，支持中英双语，不超过70个单词。在沙漠的地面上，远处有植物和落日，丰富的细节，柔和的光线 input.neg_ref_prompt String 否负向提示词，不希望出现的内容。大部分情况下...

API详情

多语言对话模型：天然支持英文、中文等多语言对话，端到端支持图片里中英双语的长文本识别；多图交错对话：支持多图输入和比较，指定图片问答，多图文学创作等；首个支持中文开放域定位的通用模型：通过中文开放域语言表达进行检测框标注；...

接口说明

名称 voice参数值类型适用场景支持语言支持采样率（Hz）支持时间戳（字级别音素边界）接口支持儿化音声音品质知妙_多情感 zhimiao_emo 多种情感女声中英场景中文及英文场景 8K/16K 是是标准版知米_多情感 zhimi_emo 多种情感...

接口说明

识音石 V1-端到端模型，教育内容分析，医疗内容分析，新闻媒体内容分析，娱乐视频内容分析，音视频离线转写（升级版），新零售领域识别模型，出行领域识别模型 16k 支持支持支持支持支持中英自由说 16k 支持支持支持支持不支持识...

接口说明

识音石 V1-端到端模型，教育内容分析，医疗内容分析，新闻媒体内容分析，娱乐视频内容分析，音视频离线转写（升级版），新零售领域识别模型，出行领域识别模型 16k 支持支持支持支持支持中英自由说 16k 支持支持支持支持不支持识...

接口说明

识音石 V1-端到端模型，教育内容分析，医疗内容分析，新闻媒体内容分析，娱乐视频内容分析，音视频离线转写（升级版），新零售领域识别模型，出行领域识别模型 16k 支持支持支持支持支持中英自由说 16k 支持支持支持支持不支持识...

新功能发布记录

本文为您提供OpenSearch-召回引擎版的重要功能发布信息。发布记录时间特性类别描述 2024-01-08 产品新功能迭代新增支持为单个doc配置多向量新增文本转向量模型，新模型支持128、512、1024token长度的中英文文本进行向量化自动处理 ...

中英

新品推荐