安装Proxima CE包

量化使用 使用向量检索后会自动生成一个输出表,存储在MaxCompute表中,您无需创建,在运行Proxima CE代码的-output_table 参数后面指定表名即可使用。生成的输出表格式请参考下文的 输出表格式说明。输出表格式说明 运行向量检索后会自动...

量化使用

性能说明 向量量化一般是有损的,量化后的召回率通常会下降1~2个百分点。实际测试里(例如:2000万规模的doc/query 512 float 向量数据的检索),使用量化后的召回率与正常情况相比,大约会由99.0%下降至98.2%。但是量化通常会带来一定的...

向量计算概述

Hologres支持向量计算,可以使用向量数据表示非结构化数据的特征,通过高性能向量检索实现对非结构化数据的快速查询。本文为您介绍Hologres中向量计算的特点及优势。背景信息 Proxima是一款来自于阿里达摩院的实现向量近邻搜索的高性能软件...

DashVector x 通义千问大模型:打造基于专属知识的...

本教程演示如何使用向量检索服务(DashVector),结合LLM大模型等能力,来打造基于垂直领域专属知识等问答服务。其中LLM大模型能力,以及文本向量生成等能力,这里基于 灵积模型服务 上的通义千问 API以及Embedding API来接入。背景及实现...

Proxima向量计算

本文为您介绍在Hologres中如何使用向量计算功能。背景信息 Proxima是一款来自于阿里达摩院的实现向量近邻搜索的高性能软件库,相比于Faiss等开源的同类产品,Proxima在稳定性、性能等方面都要更为出色,能够提供业内性能和效果领先的基础...

向量计算使用指南

向量在Hologres中一般FLOAT4数组表示,创建向量表的语法如下。说明 仅列存、行列共存表支持向量索引,行存表不支持。定义向量时,数组维度仅支持定义为 1,即 array_ndims、array_length 的第二入参都必须设置为 1。Hologres V2.0.11版本...

AimeRead

向量服务:为向量对应维度的向量向量维度间','分割,多个向量用';'分割。x2i example.&trigger_list=trigger_key:1,trigger_key2:1.5&.向量 example.&trigger_list=-0.5430353283882141,-0.0292476424574852,-0.3608616292476654;0....

量化聚类(Quantized Clustering)配置

QcBuilder 参数名 类型 默认值 说明 qc.builder.train_sample_count uint32 0 指定训练数据量,如果为0则使用全部数据 qc.builder.thread_count uint32 0 构建时开启线程数量,设置为0时为cpu核数 qc.builder.centroid_count string 可选 ...

Proxima Builder

LinearBuilder 参数名 类型 默认值 说明 proxima.linear.builder.column_major_order string false 构建的时候特征行排(false)/列排(true)QcBuilder 参数名 类型 默认值 说明 proxima.qc.builder.train_sample_count uint32 0 指定...

向量检索

本文主要介绍向量检索功能以及如何创建并使用向量索引。前提条件 集群的内核版本需为3.1.4.0及以上版本。说明 内核版本为3.1.5.16、3.1.6.8、3.1.8.6及以上版本的集群向量索引功能相对稳定。若您的集群不是上述列举的稳定版本,建议您先将...

BeRead

向量召回:为向量对应维度的向量向量维度间','分割,多个向量用';'分割。多路召回:对于多路召回,触发trigger的参数名为${recall_name}_trigger_list。例如多路召回中,x2i召回的召回名为x2i_recall,trigger列表参数为x2i_recall_...

电商行业模板-多路搜索

配置 电商行业模板,行业模板配置完成后检查是否配置了对应的向量索引(这里的是“向量-电商向量通用”):2.创建查询分析,增加一个“文本向量化”功能,并配置上1中设置的向量索引:3.设置排序策略,电商行业模板默认会创建两个排序...

ModifyVectorConfiguration-修改实例向量引擎优化配置

对于使用向量分析引擎用于 AIGC、向量检索等场景用户,建议 开启向量引擎优化。enabled 返回参数 名称 类型 描述 示例值 object Schema of Response RequestId string 请求 ID。107BE202-D1A2-479E-98E0-A8*Status boolean API 执行状态。...

多路召回实战

方案架构 该文档主要介绍如何通过召回引擎版实现文本、向量多路召回。该实践可用于有大模型算法的团队实现对话式搜索服务,方案架构如下(比较简略,后期会优化的):以上就是对话式搜索的简易架构,召回引擎版在整个架构中类似于向量检索...

QueryCollectionData-召回向量数据

召回向量数据。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中使用,用来...

量化聚类(Quantized Clustering)配置

QcBuilder 参数名 类型 默认值 说明 qc.builder.train_sample_count uint32 0 指定训练数据量,如果为0则使用全部数据 qc.builder.thread_count uint32 0 构建时开启线程数量,设置为0时为cpu核数 qc.builder.centroid_count string 可选 ...

DashVector x 通义千问大模型:打造基于专属知识的...

本教程演示如何使用 向量检索服务(DashVector),结合LLM大模型等能力,来打造基于垂直领域专属知识等问答服务。其中LLM大模型能力,以及文本向量生成等能力,这里基于 灵积模型服务 上的通义千问 API以及Embedding API来接入。背景及实现...

文档修订记录

向量计算使用指南 2023.12.27 新增向量计算概述 新说明 Hologres支持向量计算,可以使用向量数据表示非结构化数据的特征,通过高性能向量检索实现对非结构化数据的快速查询。本文为您介绍Hologres中向量计算的特点及优势。向量计算概述 ...

额外特性

出现在右手向量中的位置被使用左手向量中提到的最大位置进行偏移,这样结果几乎等于在两个原始文档字符串的连接上执行 to_tsvector 的结果(这种等价不是完全的,因为从左手参数的尾端移除的任何停用词将会影响结果,而如果文本连接被使用...

搜索增强

tips:若希望不使用向量召回(仅文本相关性召回)设置为0%,当前版本不支持仅向量召回(不建议设置成100%)。精排DOC数量 名词解释:进入精排计算的最大文档数量。推荐值:200-500。功能描述:query在召回所有相关文本后,会基于召回的...

索引结构

默认多值和STRING类型选择uniq,单值数值类型是equal 说明 使用向量检索,在定义字段时有位置要求,需要按照主键字段、标签字段(非必要)、向量字段的顺序创建。(如上图所示)如果开启了属性压缩,建议前往「部署管理-数据节点-在线表...

多轮对话搜索

列表长度取决于向量化模型的输出维度 在索引构建阶段,向量化只对TEXT类型字段生效 如果选择多个TEXT字段向量化,算法模型将自动将多个字段拼接计算向量结果 分析器 在索引构建过程中,分析器(OR 分词器)是用于将文本数据分割成词的工具。...

未来规划

结构化与非结构化数据如何融合异构处理,比如如何用向量处理引擎把非结构化数据变成结构化数据,高维向量、多源异构数据处理的技术。数据处理与分析:海量数据分析在线化(实时在线交互式分析)。如何对海量数据进行在线分析和计算,支持...

CreateDBInstance-创建实例

对于使用向量分析引擎用于 AIGC、向量检索等场景用户,建议 开启向量引擎优化。enabled MasterCU integer 否 Master 资源,取值如下:2 CU 4 CU 8 CU 16 CU 32 CU 说明 8CU 以上的 master 资源会产生费用。8 CU SrcDbInstanceName string ...

使用向量检索插件(aliyun-knn)

原理 阿里云Elasticsearch向量检索功能基于Elasticsearch插件扩展机制实现,能够完全兼容原生Elasticsearch版本,您无需额外的学习成本即可使用向量检索引擎。向量索引除了支持实时增量写入、近实时(Near Real Time,简称NRT)搜索查询,...

2023年

新说明 MaxFrame是由阿里云自研的分布式科学计算框架,是对历史相关产品功能(PyODPS、Mars)的重大升级,在MaxCompute之上提供一套完全兼容Pandas接口的API,让用户更为熟悉、更符合Python社群习惯的方式使用MaxCompute。本文为您介绍...

动态与公告

2024-01-17 杭州 文本向量生成 图片向量生成 多模态向量生成 新增功能 新增“向量动态量化”能力 2024-01-23 杭州 向量动态量化 2023年12月 公告类型 公告描述 发布时间 发布地域 相关文档 商业化发布 向量检索服务DashVector正式商业化...

新建Collection

FLOAT extra_params body object 否 可选参数:quantize_type:量化策略,详情参考 向量动态量化 auto_id:自动生成主键,默认开启 说明 创建Collection时预先定义Fields的收益见 Schema Free 量化策略详情可参考 向量动态量化 出参描述 ...

新建Collection

Schema Free 量化策略详情可参考 向量动态量化 出参描述 说明 返回结果为DashVectorResponse对象,DashVectorResponse对象中可获取本次操作结果信息,如下表所示。字段 类型 描述 示例 code int 返回值,参考 返回状态码说明 0 message str...

新建Collection

cosine 时,datatype 必须为 FLOAT extraParams(Map,String>params)否-可选参数:quantize_type:量化策略,详情参考 向量动态量化 timeout(Interger timeout)否-timeout=null:接口开启同步,待Collection 创建成功后返回 timeout=-1:...

向量动态量化

quantize_type 当前可选值如下:DT_VECTOR_INT8:将Float32向量量化为INT8类型 性能和召回率参考 基于1百万768维数据集 DashVector规格:P.large 度量方式:cosine topk:100 量化策略 索引比 QPS 召回率 无 100%495.6 99.05%DT_VECTOR_INT...

什么是向量

本文主要介绍向量的基本概念,包括向量维度、距离度量方式、数据类型等,通过基本概念快速了解什么是向量,以及如何更好地使用向量检索服务。向量的基本概念 在AI领域,向量是描述对象特征的抽象表达。以DashScope上 通用文本向量 模型为例...

关键词感知检索

建立关键词和原始语料的映射关系,常见的方法有倒排索引、TF-IDF、BM25等方法,其中TF-IDF、BM25通常 稀疏向量(Sparse Vector)来表示词频。检索时,对检索语句进行关键词抽取,并通过步骤2中建立的映射关系召回关联度最高的TopK原始...

向量检索服务关联角色

背景信息 向量检索服务关联角色(AliyunServiceRoleForDashVector)是访问控制提供的一种服务关联角色,用于授权向量检索服务访问专有网络资源的权限,使用该权限查询专有网络、安全组和可用区信息,以便完成内网访问。更多关于服务关联...

向量检索服务RAM授权

AddCollectionVector 向量新增 FetchDoc 主键ID向量查询 UpdateCollectionVector 向量更新 DeleteCollectionVector 向量删除 ListPartition Partition列表 GetPartitionNumber 获取Partition数量 DeletePartition 删除Partition ...

安装DashVector SDK

Python SDK 说明 需要提前安装Python3.7及以上版本,请确保相应的Python版本 执行如下命令,通过pip安装SDK,即可使用向量检索服务。以当前 最新版本 为例:Shell pip3 install dashvector 如需升级至最新版本SDK,可执行如下命令。Shell ...

升配Cluster

本文主要介绍如何通过向量检索服务控制台升配Cluster。操作步骤 登录 向量检索服务控制台。在左侧导航栏单击 Cluster列表,移动鼠标至需要升配Cluster...单击 管理控制台 跳转至控制台概览页,Cluster创建成功后,即可正常使用向量检索服务。

开通服务

本文主要介绍如何开通向量检索服务。前提条件 完成注册阿里云账号,如未注册,请单击 注册阿里云账号 进行注册。完成个人或企业实名认证,如未认证,请单击 实名认证 进行认证。操作步骤 登录 阿里云官网。进入 向量检索服务产品详情页,...

创建Cluster

本文主要介绍如何通过向量检索服务控制台创建 Cluster。创建Cluster 登录 向量检索服务控制台。在左侧导航栏单击 Cluster列表,单击 创建Cluster。选择Cluster 实例类型、实例规格、副本数,填写 Cluster名称,单击 立即购买。参数说明 ...

DashVector+ModelScope 玩转多模态检索

本教程演示如何使用向量检索服务(DashVector),结合 ModelScope 上的 中文CLIP 多模态检索模型,构建实时的“文本搜图片”的多模态检索能力。作为示例,我们采用 多模态牧歌数据集 作为图片语料库,用户通过输入文本来跨模态检索最相似的...
共有86条 < 1 2 3 4 ... 86 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
智能开放搜索 OpenSearch 人工智能平台 PAI 数据库自治服务 内容安全 智能语音交互 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用