全文检索

全文检索不仅可以查找文本中是否包含某个词,还可以在短语、词组的基础上做进一步分析。PostgreSQL的全文检索tsquery方法,支持短语搜索符,其中N为整数,表示指定词语之间的距离。例如,想要查找文本是否存在 cat 后跟随 jump 的短语,则...

全文检索

使用匹配查询(TEXT_MATCH)或者短语匹配查询(TEXT_MATCH_PHRASE)条件作为SELECT语句中的WHERE子句,您可以查询表中匹配指定字符串的数据,实现全文检索功能。前提条件 已创建多元索引并为要匹配的列设置了分词。具体操作,请参见 创建...

全文检索

本文介绍如何通过全文索引函数 match()against()、match()fuzzy()、match()phrase()进行全文检索以及如何高亮全文检索关键词。前提条件 已创建全文索引。如何创建,请参见 创建全文索引。示例数据 本文所有示例均基于示例表tbl_fulltext_...

全文检索语法

需要说明的是,HybridDB for MySQL的全文检索能力和SQL中的like是有区别的,这里的全文检索是指在SQL中需要分词的搜索需求,而SQL中的like是模糊匹配的需求,只需要字符串列建索引就可以。目前HybridDB for MySQL的全文检索性能可以达到亿...

高速全文检索(RUM)

RDS PostgreSQL提供RUM插件,实现高速全文检索。前提条件 RDS PostgreSQL实例为10或以上版本。说明 RDS PostgreSQL 14和15需要内核版本在20221030及以上。如何查看和升级内核小版本,请参见 升级内核小版本。背景信息 GIN索引(通用倒排...

RDS MySQL全文检索相关问题及处理

全文检索 全文检索本身是按词进行匹配,因此返回的结果会和like的方式有所区别,如下图所示。ft_query_expansion_limit参数作用 MySQL全文检索支持扩展检索,具体请参考 带查询扩展的全文检索。ft_query_expansion_limit参数的作用是指定...

全文检索(2.0版)

AnalyticDB MySQL版 2.0 支持通过SQL语法进行全文检索,本文介绍如何在已经创建全文索引的 col_name 列中检索关键词。语法 SELECT[[ALL|DISTINCT]|select_expr[AS output_name][,.]][FROM table_reference[,.]][WHERE match(column_name[,...

全文检索最佳实践(2.0版)

AnalyticDB MySQL版2.0除了支持 基本的全文检索方式,还支持以下方式:按近似度排序 结果集过滤 多列查询 短语查询、精确匹配 逻辑操作符AND OR NOT 结构化、非结构化联合检索 高级SQL语法:结构化、非结构化GROUP BY,JOIN,UNION 按近似度...

AnalyticDB PostgreSQL助力彩数实现全文检索加工及...

本文以彩数业务场景展示 云原生数据仓库AnalyticDB PostgreSQL版 如何实现一站式全文检索实时分析业务。背景信息 彩数(上海)商务咨询有限公司是韩国三星集团旗下第一企划公司全资控股中国子公司,上海市专精特新企业,主要业务是从社交...

准备工作

本文介绍使用全文检索功能的前提条件,以及配置基本参数等准备工作。前提条件 已创建阿里云ElasticSearch实例,创建方法请参见 创建阿里云Elasticsearch实例。说明 购买版本在7.4及以上,建议优先选择7.4版本。在设置账号密码时,不要带有&...

创建全文索引

本文介绍了使用 云原生数据仓库AnalyticDB MySQL版 进行全文检索创建全文索引的方法。前提条件 集群内核版本需为3.1.4.9及以上版本。说明 推荐使用内核版本为3.1.4.17及以上的AnalyticDB MySQL集群。如何查看集群的内核版本,请参见 如何...

使用Zhparser支持中文分词

AnalyticDB PostgreSQL版 数据库安装Zhparser插件后可以实现全文检索时的中文分词。重要 全文检索功能仅支持 AnalyticDB PostgreSQL 6.0版。V6.3.8.9及以后版本,安装或升级插件需要 ...全文检索函数和操作符,请参见 文本检索函数和操作符。

创建文档库

定义全文检索字段 在使用全文检索前,首先需指定哪些字段用于全文检索的数据源,文档库的接口已经默认使用content字段,您还可以指定其它的Metadata自定义字段。分词 创建文档库时可以指定Parser字段作为分词器,一般场景下,使用默认的...

使用pg_jieba插件进行中文分词

云原生数据仓库AnalyticDB PostgreSQL版 支持使用pg_jieba插件对中文文本进行分词,从而实现高效的中文全文检索。pg_jieba简介 Jieba(结巴)是目前比较流行的中文分词库之一,能够...全文检索函数和操作符,请参见 文本检索函数和操作符。

服务介绍

Solr是构建在Apache Lucene上的企业级搜索平台,是分布式全文检索的最佳实践之一,支持各种复杂的条件查询和全文检索,具有广泛的用户基础。通过深度融合HBase与Solr,我们推出了既能满足大数据海量存储,又可以支持复杂多维查询和全文检索...

全文索引服务

Solr是构建在Apache Lucene上的企业级搜索平台,是分布式全文检索的最佳实践之一,支持各种复杂的条件查询和全文检索,具有广泛的用户基础。通过深度融合HBase与Solr,我们推出了既能满足大数据海量存储,又可以支持复杂多维查询和全文检索...

TairVector混合检索实践

本文介绍基于Tair向量检索(Vector)实现条件过滤、向量检索全文检索融合的混合检索方案。背景信息 大语言模型(Large Language Model,LLM)的发展使得文本、图片、音视频等非结构化数据都可以通过向量来表示其语义信息,基于向量的KNN...

混合检索使用指南

当结构化数据与非结构化数据需要同时检索时,您可以使用 AnalyticDB PostgreSQL版 向量数据库的混合查询,既支持结构化字段过滤,也支持半结构化字段过滤,同时支持和文本字段的全文检索一起进行双路召回。混合检索简介 ANNS(Approximate ...

PC端、Web端版本更新说明(2023年9月)

更新内容 搜索功能优化:企业版新增全文搜索功能,可以基于文档内容进行关键字快速检索,并进行了搜索功能优化。SAML协议登录:支持用户使用Microsoft Azure AD的账号通过SAML协议登录网盘与相册服务。团队管理:新增通过手机号/邮箱进行...

概述

检索能力:向量检索全文检索、精排。前提条件 已注册阿里云账号(主账号)。具体操作,请参见 注册阿里云账号。已创建阿里云账号的访问密钥AccessKey并获取AccessKey Secret。具体操作,请参见 创建AccessKey。快速开始 创建实例。创建...

QueryCollectionData-召回向量数据

testpassword Content string 否 用于全文检索的内容。即此值为空时,仅使用向量检索;不为空时,使用向量和全文双路检索。说明 和 Vector 参数不能同时为空。hello_world Filter string 否 过滤器。response>200 TopK long 是 设置返回 ...

文档检索和LLM集成

use_full_text_retrieval:是否使用全文检索,取值说明如下:true:使用全文检索。false(默认):不使用全文检索。返回的检索结果列表包含以下信息:Id:切分后的Chunk对应的UUID。FileName:文档名称。Content:检索的内容,即切分后的一...

多元索引介绍

多元索引基于倒排索引和列式存储,可以解决大数据的复杂查询难题,包括非主键列查询、全文检索、前缀查询、模糊查询、多字段自由组合查询、嵌套查询、地理位置查询、统计聚合(max、min、count、sum)等功能。多元索引在车联网场景中主要...

Serverless应用指南

实战指南 实战场景 相关文档 对Serverless应用中的数据进行全文检索、多语言检索、地理位置查询。在Kibana中对Serverless应用中的数据进行检索、查询 对Serverless应用中的数据进行搜索、分析、交互和可视化。使用Kibana通过可视化交互分析...

应用场景

全文检索 提取DOC文档中的文字并按页输出,基于文字提取的结果,按文档对应页构建全文索引,实现按页的全文检索。图片社交分析场景 在图片社交、电商网站、图库等应用中,使用智能媒体管理提供的图片标准型项目,可以快速实现如下场景:...

应用场景

相对于传统关系型数据库,Elasticsearch拥有强大的全文检索能力,并提供了简单易用的RESTful API 和各种语言客户端。只需要几毫秒的时间,即可在PB级结构化和非结构化的数据中找到匹配信息。您可以使用阿里云Elasticsearch的高可用性和易用...

概述

云原生数据仓库AnalyticDB PostgreSQL版 向量数据库本身既支持向量索引也支持全文索引,因此它可以通过向量检索与全文检索实现双路召回,极大地提高向量数据的召回准确性。数据实时更新和实时查询。云原生数据仓库AnalyticDB PostgreSQL版 ...

PolarDB-X(DRDS)同步方案选取指南

当您在使用PolarDB-X(DRDS),需要进行全文检索和语义分析时,可将PolarDB-X中的数据同步至阿里云Elasticsearch进行查询分析。阿里云Elasticsearch是一个基于Lucene的实时分布式的搜索与分析引擎,可近乎于准实时地存储、查询和分析超大...

OpenSearch产品选型

支持RDS、MaxCompute、PolarDB阿里云系统一键对接、支持API/SDK接入自建数据库 提供多种查询方式,支持组合查询,含强大的全文检索、前后中缀模糊查询 支持一键扩缩容,无需担心底层集群,无运维成本,可灵活应对业务场景 向量检索版 有...

文件搜索功能

全文检索 支持通过文档内容进行关键字搜索。支持的文档格式 文字文件 表格文件 演示文件 doc,docx,txt,pdf xls,xlsx ppt,pptx 文档大小限制 仅支持搜索不超过2MB的纯文本内容。搜索内容限制 支持中文及简单的英文文本场景,不支持日语...

简要介绍

业务方保持以前使用ES的方式不变,有全文检索的需求直接访问ES即可。图数据库GDB深度融合Elasticsearch(ES),使得GDB具备了分词检索、模糊匹配、正则表达式查询的能力,且GDB内核集成了数据增量同步至ES中的服务,保证GDB与ES数据的强...

索引、属性、字段作用详解

(这里属性的作用,是OpenSearch特有的)也可以理解为表里面的属性的名称 索引、属性、字段的作用 索引:在OpenSearch中索引的作用是用于召回文档,而召回文档又依赖于文档(注:这里的文档可以看做需要用于全文检索的一个字段)内容本身的...

阿里云ES机器学习

通过ES机器学习实现对乱码的文本识别 通过ES机器学习实现智能问答 text embedding在ES中的应用 检索是ES的核心功能之一,全文搜索和分析均依赖底层的检索能力,能够快速精确的从海量数据中搜索出所需信息。ES提供了多种内置的文本分析器和...

QueryContent-查询文档内容

2 UseFullTextRetrieval boolean 否 是否使用全文检索(双路召回)。默认为 false,仅采用向量检索。true Metrics string 否 检索时的相似度算法。此值为空时则采用创建知识库时指定的算法,建议如无特殊需求不需设置。说明 取值说明:l2:...

倒排索引介绍

什么是倒排索引 倒排索引也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。通过倒排索引,可以快速定位单词所在...

倒排索引介绍

什么是倒排索引 倒排索引也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。通过倒排索引,可以快速定位单词所在...

快速入门

通过各个组件 及服务 的结合,阿里云Elasticsearch可以应用于实时日志处理、全文搜索和数据分析等领域。更多产品相关信息,请参见 什么是阿里云Elasticsearch。产品使用 Elasticsearch Elasticsearch作为实时分布式搜索和分析引擎,可以...

什么是阿里云Logstash

在阿里云ELK(Elasticsearch、Logstash、Kibana)生态下,Elasticsearch作为实时分布式搜索和分析引擎,Logstash提供了数据采集、转换、优化和输出的能力,Kibana提供了强大的可视化界面,可以被广泛应用于实时日志处理、全文搜索和数据...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
图像搜索 检索分析服务 Elasticsearch版 智能开放搜索 OpenSearch 云数据库HBase版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用