全文检索

但对于中文,词语是最小语素单位,书写时并不像英语会在词之间空格分开,这就导致如果使用PostgreSQL的默认全文检索引擎,难以得到符合中文语义的分词结果。例如,使用PostgreSQL tsvector默认方法分词中文语句,得到的结果明显无法满足...

向量索引通用配置

向量分隔符 可自定义 向量检索时各维度使用的分隔符(如vector:'1.05066,0.15610,0.156145.' 其中分隔符为逗号)线性构建的阈值 默认为5000 表示数据量在5000以内线性 忽略有问题的向量数据 true false 当向量维度不正常,向量数据为空时...

记录检索

概述 记录检索:云解析DNS提供解析记录的高级检索功能,对于拥有大量解析记录的用户,可以通过 记录类型、主机记录、解析线路、记录值、状态 快速检索出指定的解析记录。使用方法 登录 云解析DNS控制台。在 域名解析 页面,权威域名 页签下...

单doc多向量检索

一个字段里存3个向量可以:检索使用正常的检索方式,检索128维的向量即可,被检索的doc中命中其中一个向量该doc就会被召回。在排序算分阶段,如果一个doc中的多个向量均被命中,则以多个向量中最优(欧式距离是分数越小越相关,内积距离...

分组向量检索

本文介绍如何在向量检索时将结果按照字段值进行分组返回。背景介绍 在向量检索的实际应用中,有些场景需要将向量检索的结果分组返回。例如:在RAG中,一篇文档往往需要拆分为多个段落,每个段落生成一个向量存入DashVector。在向量检索时,...

向量检索服务关联角色

背景信息 向量检索服务关联角色(AliyunServiceRoleForDashVector)是访问控制提供的一种服务关联角色,用于授权向量检索服务访问专有网络资源的权限,使用该权限查询专有网络、安全组和可用区信息,以便完成内网访问。更多关于服务关联...

DashVector+ModelScope 玩转多模态检索

本教程演示如何使用向量检索服务(DashVector),结合 ModelScope 上的 中文CLIP 多模态检索模型,构建实时的“文本搜图片”的多模态检索能力。作为示例,我们采用 多模态牧歌数据集 作为图片语料库,用户通过输入文本来跨模态检索最相似的...

使用向量检索插件(aliyun-knn)

向量检索插件是阿里云Elasticsearch团队自主开发的向量检索引擎插件,基于阿里巴巴达摩院proxima向量检索库实现,能够帮助您快速实现图像搜索、视频指纹采样、人脸识别、语音识别和商品推荐等向量检索场景的需求。本文介绍如何使用向量检索...

DashVector+DashScope升级多模态检索

本教程在前述教程(DashVector+ModelScope玩转多模态检索)的基础之上,基于DashScope上新推出的ONE-PEACE 通用多模态表征模型 结合向量检索服务DashVector来对多模态检索进行升级,接下来我们将展示更丰富的多模态检索能力。DashVector+...

安装DashVector SDK

Python SDK 说明 需要提前安装Python3.7及以上版本,请确保相应的Python版本 执行如下命令,通过pip安装SDK,即可使用向量检索服务。以当前 最新版本 为例:Shell pip3 install dashvector 如需升级至最新版本SDK,可执行如下命令。Shell ...

升配Cluster

本文主要介绍如何通过向量检索服务控制台升配Cluster。操作步骤 登录 向量检索服务控制台。在左侧导航栏单击 Cluster列表,移动鼠标至需要升配Cluster...单击 管理控制台 跳转至控制台概览页,Cluster创建成功后,即可正常使用向量检索服务。

向量检索服务RAM授权

权限策略名称 说明 AliyunDashvectorFullAccess 管理向量检索服务(DashVector)的权限 AliyunDashvectorReadOnlyAccess 只读访问向量检索服务(DashVector)的权限 自定义策略:从 权限策略名称 列表,选择需要的权限。关于如何创建自定义...

开通服务

本文主要介绍如何开通向量检索服务。前提条件 完成注册阿里云账号,如未注册,请单击 注册阿里云账号 进行注册。完成个人或企业实名认证,如未认证,请单击 实名认证 进行认证。操作步骤 登录 阿里云官网。进入 向量检索服务产品详情页,...

创建Cluster

本文主要介绍如何通过向量检索服务控制台创建 Cluster。创建Cluster 登录 向量检索服务控制台。在左侧导航栏单击 Cluster列表,单击 创建Cluster。选择Cluster 实例类型、实例规格、副本数,填写 Cluster名称,单击 立即购买。参数说明 ...

公网白名单配置

说明 公网访问开启后,会自动生成 公网域名,后续在访问向量检索版实例时需要公网域名 添加白名单:手动填入IP地址,多个IP使用逗号分隔,如图:用户可通过公网提供的IP地址查询获取本机IP。验证白名单添加成功:可以登录已添加白名单的...

使用Elasticsearch的向量近邻检索(kNN)功能

Elasticsearch 8.0及以上版本新增向量近邻检索k-nearest neighbor(kNN)search功能,能够帮助您快速实现图像搜索、视频指纹采样、人脸识别、语音识别和商品推荐等向量检索场景的需求。本文介绍如何使用kNN search功能。背景信息 关于...

使用apack插件的物理复制功能

本文仅介绍物理复制功能的使用方法,向量检索功能的使用方法请参见 使用向量检索插件(aliyun-knn)。背景信息 物理复制功能的基本原理为:阿里云Elasticsearch中索引的主分片和副本分片(以下简称主副分片)之间的同步原理默认与原生...

消息检索

当 云消息队列 Kafka 版 控制台提供的按位点查询和按时间查询消息的功能无法满足您搜索消息的需求时,您可以使用 云消息队列 Kafka 版 消息检索功能。消息检索支持按Topic分区、位点范围、时间范围以及消息Key和Value关键字检索。本文介绍...

参考:Proxima CE全量参数说明

重要 创建的表名不能使用半角点号.,这是MaxCompute的特殊字符,会导致MaxCompute表解析失败,引用其他工程的表名可以 project_name.table_name 的方式。doc_table_partition 底库表的MaxCompute分区。query_table 输入查询表...

监控报警服务RAM授权

使用RAM,您可以创建、管理RAM用户(例如员工、系统或应用程序),并可以控制这些RAM用户对资源的操作权限。当您的企业存在多用户协同操作资源时,使用RAM可以让您避免与其他用户共享云账号密钥,按需为用户分配最小权限,从而降低企业信息...

开启或关闭向量检索引擎优化

云原生数据仓库AnalyticDB PostgreSQL版 向量数据库针对向量数据库场景做了大量的内核参数优化,您需要先在控制台开启该功能才能使用向量检索引擎优化,本文介绍如何开启或关闭向量检索引擎优化。使用场景 如果实例用于向量分析,例如AIGC...

模型推理

rrfK 指定混合检索使用的RRF算法中的常量K(仅在模型创建时混合检索功能打开时生效),取值范围为[1,100]。默认值为60。verbose 是否返回详细信息。取值如下:true:是。false:否。基础问答 无 无。检索问答 topK 检索时返回最相似的...

SELECT

rrfK 指定混合检索使用的RRF算法中的常量K(仅在模型创建时混合检索功能打开时生效),取值范围为[1,100]。默认值为60。verbose 是否返回详细信息。取值如下:true:是。false:否。基础问答 无 无。检索问答 topK 检索时返回最相似的...

常见问题

对于使用者而言:列(column)影响build阶段,列越多,每列索引大小降低,单列构建检索速度提高,加速build阶段,但使用的集群机器资源变多。行(row)影响seek阶段,行越多,每行检索的query变少,单行检索速度提升,加速seek阶段,同样...

混合查询最佳实践

在向量检索版中,您可以使用稀疏-稠密向量进行混合检索。对比传统的 文本+向量 多路召回,向量检索版中的稀疏-稠密向量是将稠密向量和稀疏向量嵌入组合为单个向量,而其中的稀疏向量是将文本向量化成稀疏向量,稠密向量是传统的向量。稀疏...

向量检索使用指南

本文介绍了向量检索的概念,以及以示例的形式来介绍如何使用向量检索功能。向量检索概念 向量检索(Vector Search)是一种基于向量空间模型的搜索技术,它利用机器学习(尤其是深度学习)生成的向量来表示文本、图片、视频或任何类型的数据...

PictureSearchPicture

调用该接口启动以图搜图应用实例,进行图片检索使用限制 单个阿里云账号调用该接口的每秒请求数(QPS)最大限制为100。说明 RAM用户共享阿里云账号配额。请提前为待检索图片,配置URL地址。说明 当前仅支持JPG格式的图片,且图片URL中不...

产品简介

数据源 提供数据的源点,会根据这些数据来构建私域知识库,用于后续的检索、知识问答 大模型 大规模预训练语言模型是指使用海量文本数据进行预训练的语言模型。它通过学习大量的语言知识和语境信息,能够生成高质量的文本或提供语义理解。...

语义检索

IMM语义检索是采用向量检索方式,根据特定内容语义对多媒体数据进行搜索的过程,本文介绍如何使用语义检索。功能简介 传统的标量检索是根据文件携带的元数据信息进行检索,例如文件名称、文件创建时间、文件格式等。与标量检索不同的是,...

DashVector+DashScope升级多模态检索

本教程在 DashVector+ModelScope玩转多模态检索 教程的基础之上,基于DashScope上新推出的ONE-PEACE 通用多模态表征模型 结合 向量检索服务DashVector 来对多模态检索进行升级,接下来我们将展示更丰富的多模态检索能力。DashVector+...

什么是向量

本文主要介绍向量的基本概念,包括向量维度、距离度量方式、数据类型等,通过基本概念快速了解什么是向量,以及如何更好地使用向量检索服务。向量的基本概念 在AI领域,向量是描述对象特征的抽象表达。以DashScope上 通用文本向量 模型为例...

LookupEvents-检索详细事件

接口说明 使用限制:调用 LookupEvents 接口检索事件时,每秒钟最多调用两次。说明 请勿频繁调用该接口。您可以创建跟踪,将事件投递到日志服务 SLS,通过 SLS 的实时消费功能来近实时地检索事件。具体操作,请参见 创建单账号跟踪、创建多...

Proxima Searcher

该值越大,扫描doc数越多,召回率越高 proxima.hnsw.searcher.max_scan_ratio float 0.1f 检索时,控制最多扫描文档的比例。例如如果当前索引中有100w doc,如果此值为0.1,则最多扫描10w。如果ef值提前收敛,则不会扫描到10w proxima....

快速开始

本文将介绍如何快速上手使用向量检索服务DashVector。前提条件 已创建Cluster:创建Cluster。已获得API-KEY:API-KEY管理。已安装最新版SDK:安装DashVector SDK。说明 需要使用您的api-key替换示例中的YOUR_API_KEY、您的Cluster Endpoint...

常见报错

当您在使用阿里云Elasticsearch集群遇到问题时,可能在集群日志、客户端日志、命令执行结果等数据中看到各种报错信息。本文介绍常见的报错,以及产生报错的原因和解决方法。写入Elasticsearch异常:HTTP/1.1 413 Request Entity Too Large ...

向量检索

本文主要介绍向量检索功能以及如何创建并使用向量索引。前提条件 集群的内核版本需为3.1.4.0及以上版本。说明 内核版本为3.1.5.16、3.1.6.8、3.1.8.6及以上版本的集群向量索引功能相对稳定。若您的集群不是上述列举的稳定版本,建议您先将...

安装Proxima CE包

量化使用 使用向量检索后会自动生成一个输出表,存储在MaxCompute表中,您无需创建,在运行Proxima CE代码的-output_table 参数后面指定表名即可使用。生成的输出表格式请参考下文的 输出表格式说明。输出表格式说明 运行向量检索后会自动...

向量索引最佳实践

本文将介绍如何在已有的向量检索版实例中配置向量索引,并简单演示使用SDK方式通过向量查询检索版实例数据。前置条件 成功 注册阿里云账号 并通过 实名认证。开通阿里云账号并登录控制台时,会提示先创建access key才能继续使用。创建及...

端到端图搜解决方案

本文将介绍企业在没有向量数据的情况下,如何通过 Ope nSearch向量检索版,快速搭建图像...语法说明 图片预测查询 主键查询 filter表达式 SDK中使用向量检索 查询数据(通过SDK进行向量、主键查询)更新数据(通过SDK进行add、delete记录)

结构化文档推送Demo

适用客户:开箱即,适合有高性能检索诉求的中小企业及开发者向量检索版版本特性:大规模分布式高性能公有云向量检索解决方案,支持多种检索算法,实现精度和性能之间的平衡,支持索引流式构建、即增即查。img src=\...
共有108条 < 1 2 3 4 ... 108 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
智能媒体管理 云数据库HBase版 OpenAPI Explorer 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用