文本向量化检索最佳实践

vector_modal:向量类型,文本向量 vector_source_field:需要文本向量化的字段,本文中为vector_source_text 重要 属性和字段内容压缩:属性字段可以选择是否压缩,默认为不压缩,选择file_compressor表示开启压缩 字段内容可以选择是否...

DeleteVectorIndex-删除向量索引

删除向量索引。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中使用,用来...

向量计算(Proxima CE)概述

Proxima CE 是基于Proxima2.x内核提供的超大规模离线向量检索引擎,用于支持批量离线向量检索任务,包括基础的向量检索、多类目检索及百万TopK检索等功能。本文为您介绍 在MaxCompute中如何使用向量计算功能。背景信息 Proxima CE是一款...

向量检索版召回结果解析

本文将介绍向量检索版两种二进制数据召回结果的处理方式(protobuf和flatbuffers)。项目代码可 点击此处 进行参考。protobuf格式 Maven依赖<properties><grpc.version>1.6.1</grpc.version><protobuf.version>3.21.5</protobuf.version></...

开启或关闭向量检索引擎优化

云原生数据仓库AnalyticDB PostgreSQL版 向量数据库针对向量数据库场景做了大量的内核参数优化,您需要先在控制台开启该功能才能使用向量检索引擎优化,本文介绍如何开启或关闭向量检索引擎优化。使用场景 如果实例用于向量分析,例如AIGC...

ONE-PEACE多模态向量表征

ONE-PEACE是一个通用的图文音多模态向量表征模型,支持将图像,语音等多模态数据高效转换成Embedding向量。在语义分割、音文检索、音频分类和视觉定位几个任务都达到了新SOTA表现,在视频分类、图像分类图文检索、以及多模态经典benchmark...

DeleteCollectionData-删除向量数据

删除向量数据。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中使用,用来...

购买OpenSearch向量检索版实例

您需要购买OpenSearch向量检索版服务,才可以使用搜索引擎相关功能。本文为您介绍如何购买OpenSearch向量检索版实例。前置条件 成功 注册阿里云账号 并通过 实名认证。开通阿里云账号并登录控制台时,会提示先创建access key才能继续使用。...

CreateCollection-创建向量数据集

创建向量数据集。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中使用,...

ListCollections-查询向量集列表

查询向量集列表。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中使用,...

支持向量回归算法(SVR)

本文介绍了支持向量回归算法(Support Vector Regression,以下简称SVR)的相关内容。简介 SVR是支持向量机(SVM)的重要应用分支。通过SVR算法,可以找到一个回归平面并使得一个集合中的所有数据距离该平面的距离最短。使用场景 SVR是一个...

高维向量相似度搜索(pgvector)

RDS PostgreSQL支持pgvector插件,提供了一个新的数据类型,能够方便快捷地对高维向量进行检索,是一款功能强大的向量相似度匹配搜索插件。背景 RDS PostgreSQL支持pgvector插件,能够存储向量类型数据,并实现向量相似度匹配,为AI产品...

DescribeCollection-查询向量集信息

查询向量集信息。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中使用,...

向量检索版支持RAG方案

假设用户已经购买向量检索版实例,则只需购买一个智能问答版实例,这两个实例的具体作用如下:向量检索版实例负责:存储用户原始文档数据,向量数据 召回用户原始文档数据,向量数据 智能问答版实例负责:对用户原始文档进行切片和向量化...

SplitDoc-文本切片及向量

描述:进行文本切分和切块向量化 请求语法 POST/v3/openapi/apps/{app_group_identity}/actions/knowledge-split 注:app_group_identity表示应用名称。请求参数 SplitDoc 参数名 参数类型 描述 备注 title String 数据标题 选填 content ...

向量生成(rds_embedding)

您需要在数据库中直接将文本转化为向量时,RDS PostgreSQL的rds_embedding插件为您提供了自定义模型配置和模型调用能力,使文本到向量的转换变得简单快捷,从而满足特定的数据处理需求。背景 嵌入(embedding)是指将高维数据映射为低维...

基于向量分析的个性化推荐系统

然后,利用分析型数据库MySQL版向量内置的文本转换为向量函数,将从新闻标题和新闻内容中提取出的关键词转换为新闻向量导入分析型数据库MySQL版向量数据库中,用于用户新闻推荐,具体实现流程如下图所示。整个新闻推荐系统由以下两个步骤...

通过实时计算Flink集成向量数据

云原生数据仓库AnalyticDB PostgreSQL版 支持通过flink-adbpg-connector集成向量化数据。本文以将Kafka数据导入至 AnalyticDB PostgreSQL版 为例,介绍如何将向量数据导入 AnalyticDB PostgreSQL版。前提条件 已创建 AnalyticDB PostgreSQL...

基于向量检索服务与TextEmbedding实现语义搜索

本教程演示如何使用向量检索服务(DashVector),结合 灵积模型服务 上的 Embedding API,来从0到1构建基于文本索引的构建+向量检索基础上的语义搜索能力。具体来说,我们将基于QQ 浏览器搜索标题语料库(QBQTC:QQ Browser Query Title ...

使用float2类型压缩存储向量

float2表数据的压缩和解压的性能比较 当前系统提供了两个函数来进行float2与float4相互的转换:array_f16_to_f32将float2类型的向量转化成float4类型的向量,array_f32_to_f16将float4类型的向量转化成float2的向量。当前每个向量的长度是...

使用向量检索插件(aliyun-knn)

向量检索插件是阿里云Elasticsearch团队自主开发的向量检索引擎插件,基于阿里巴巴达摩院proxima向量检索库实现,能够帮助您快速实现图像搜索、视频指纹采样、人脸识别、语音识别和商品推荐等向量检索场景的需求。本文介绍如何使用向量检索...

InitVectorDatabase-初始化向量数据库

初始化向量检索数据库。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中...

通过实时计算Flink集成向量数据

云原生数据仓库AnalyticDB PostgreSQL版 支持通过flink-adbpg-connector集成向量化数据。本文以将Kafka数据导入至 AnalyticDB PostgreSQL版 为例,介绍如何将向量数据导入 AnalyticDB PostgreSQL版。前提条件 已创建 AnalyticDB PostgreSQL...

基于向量检索版+LLM构建对话式搜索

搜索问答在线服务 实现搜索功能后,结合Top N搜索结果,基于LLM问答模型返回搜索问答结果 步骤1:将终端用户输入的query输入文本向量化模型,得到向量形式的用户query 步骤2:将向量形式的用户query输入OpenSearch向量检索版 步骤3:使用...

基于向量检索版+LLM构建对话式搜索

搜索问答在线服务 实现搜索功能后,结合Top N搜索结果,基于LLM问答模型返回搜索问答结果 步骤1:将终端用户输入的query输入文本向量化模型,得到向量形式的用户query 步骤2:将向量形式的用户query输入OpenSearch向量检索版 步骤3:使用...

UpsertCollectionDataAsync-异步上传向量数据

使用本地文件或公网可免密访问的文件链接异步上传向量数据,最大支持200MB。接口说明 此接口为 UpsertCollectionData 对应的异步接口。UpsertCollectionData 接口的请求最大只支持 10MB,此接口最大支持 200MB。说明 相关接口 通过 ...

OpenSearch-向量检索版服务关联角色

本文为您介绍OpenSearch-向量检索版服务关联角色(AliyunServiceRoleForSearchEngine)的应用场景以及如何删除服务关联角色。背景信息 OpenSearch-向量检索版服务关联角色(AliyunServiceRoleForSearchEngine)是在某些情况下,为了完成...

Embedding-输入内容向量

latency double 请求处理耗时,单位ms result.embeddings List<String>input内容对应的向量化结果,顺序和input一一对应 响应体示例:{"request_id":"613cd5cd-6818-48ce-8719-f50670fee284","status":"OK","latency":10.05241,"result":{...

OpenSearch-向量检索版服务关联角色

背景信息 OpenSearch-向量检索版服务关联角色(AliyunServiceRoleForSearchEngine)是在某些情况下,为了完成OpenSearch-向量检索版自身的某个功能,需要获取其他云服务的访问权限,而提供的RAM角色。更多关于服务关联角色的信息请参见 ...

端到端图搜解决方案(图片向量化)

本文将介绍企业在没有向量数据的情况下,如何通过OpenSearch召回引擎版,快速搭建图像搜索服务。用户可以直接导入图片源数据,在OpenSearch内部便捷完成图片向量化、向量搜索等步骤,实现以图搜图、以文搜图等多种图像检索能力。方案架构 ...

基于向量检索服务与TextEmbedding实现语义搜索

本教程为您介绍如何从零开始,借助 向量检索服务 以及 灵积模型服务 中的 Embedding API,构建基于文本索引和向量检索技术的语义搜索能力。通过实际案例演示,利用QQ浏览器搜索标题语料库(QBQTC),实现对文本的实时语义解析与匹配,从而...

ModifyVectorConfiguration-修改实例向量引擎优化配置

修改实例向量引擎优化配置。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素...

通过阿里云灵积服务实现文本数据向量

阿里云DashScope灵积模型服务通过标准化的API提供模型推理、模型微调训练等多种模型服务,本文通过调用DashScope中的通用文本向量模型,将业务数据向量化并在阿里云Elasticsearch(简称ES)中使用kNN实现检索。前提条件 创建阿里云ES实例,...

使用Elasticsearch的向量近邻检索(kNN)功能

Elasticsearch 8.0及以上版本新增向量近邻检索k-nearest neighbor(kNN)search功能,能够帮助您快速实现图像搜索、视频指纹采样、人脸识别、语音识别和商品推荐等向量检索场景的需求。本文介绍如何使用kNN search功能。背景信息 关于...

向量数据导入

向量的数据导入和普通的堆表数据导入相同,可以采用 INSERT 语法,也可以采用 COPY 语法。本文以 INSERT 语法为例进行介绍。说明 向量列支持两种表达方式。向量列采用ARRAY[]的方式表示 INSERT INTO chunks values(default,'xxx','2023-05-...

向量检索语法

dynamic_params:[["16%230.1%2c0.2%2c0.98%2c0.6%3b1512%230.3%2c0.4%2c0.98%2c0.6%26n%3d200"]]注:index_name为向量索引名,kvpair中的dynamic_params是要查询的向量 注:dynamic_params内容需要做urlencode 注:区分类目的情况下,参数...

GetUpsertCollectionDataJob-获取异步上传向量数据...

通过JobId获取异步上传向量数据的任务的进度和结果。接口说明 此接口为 UpsertCollectionDataAsync 的相关接口。可通过 UpsertCollectionDataAsync 创建一个上传任务,并得到一个 JobId,然后通过此接口查看 Job 的执行信息。说明 使用建议...

CancelUpsertCollectionDataJob-取消异步上传向量数据...

通过JobId取消异步上传向量数据的任务。接口说明 此接口为 UpsertCollectionDataAsync 的相关接口。用于取消上传任务。说明 当任务已经处理成功、失败、已取消时,不能再次调用取消接口。调用取消接口仅中断上传任务,已经写的数据,需要...

向量检索版简化操作流程、支持OSS数据源

客户仅需5步即可完成向量版实例配置,并支持将OSS作为全量数据源使用。优化内容 1、操作流程简化:简化升级后的产品更专注于向量检索场景,仅需5步即可完成相关配置,极大简化操作,帮助客户快速上手。2、OSS数据源:支持将OSS作为全量数据...

UpdateCollectionDataMetadata-更新向量数据中的...

更新向量数据中的Metadata数据。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action ...
共有29条 < 1 2 3 4 ... 29 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储 物联网平台
新人特惠 爆款特惠 最新活动 免费试用