行业算法版表结构

应用结构 数据推送到行业算法版后会先保存到离线数据表中,在此阶段,为了方便用户推送数据,数据表允许用户根据实际业务场景定义多个表(需要指定关联字段),并提供了数据处理的插件。数据处理完毕后会join成一张索引表,这种索引表主要...

配置路由算法

本文介绍路由算法配置的格式,及如何为逻辑表配置路由算法。背景信息 路由算法是减少路由时开销的一种算法,逻辑表配置了路由算法后,带路由字段则可以快速查询指定物理表,免去人为计算、切换物理库表的操作。路由算法的更多信息,请参见 ...

RDS/PolarDB 数据源配置库分表

本文介绍如何在OpenSearch行业算法版和高性能检索版实例中配置库分表的数据源。一般用户的库分表两种情况:单库多表:database1 table1、table2、table3、table4.多库多表:database1 database2 database3.table1、table2、table3、...

CreateDocumentCollection-创建文档库

clip-vit-b-16:CLIP ViT-B/16 模型,512 维,图片向量化算法 clip-vit-l-14:CLIP ViT-L/14 模型,768 维,图片向量化算法 clip-vit-l-14-336px:CLIP ViT-L/14@336px 模型,768 维,图片向量化算法 clip-rn50:CLIP RN50 模型,1024 维,图片向量...

MaxCompute(原ODPS)数据源配置

开放数据处理服务MaxCompute(原ODPS)是一个开放的计算平台,如果您要导入到OpenSearch-行业算法版的数据是由MaxCompute平台计算而产生的,则可以在应用中配置MaxCompute源信息,在触发应用索引重建任务后,系统会自动去获取 MaxCompute ...

名词解释

基础排序表达式 对搜索结果进行第一轮的海选,按照表达式对文档进行算,并按照算结果进行排序。业务排序表达式 对第一轮的排序结果选取前N个按照业务排序表达式进行第轮更细节的分值计算,按照分值进行最终的排序。结果摘要 文本内容...

Model

描述 opensearch 应用算法模型 示例 {"id":113023,"groupId":"100297752","groupName":"appGroupName","type":"pop","name":"pop_1212","trainTarget":"ctr","cron":"15 0*/2*","cronEnabled":true,"behaviorEnabled":true,...

拒绝推断

拒绝推断(Reject Inference)是一种在金融场景经常和评分卡模型一起使用的数据增强方法,可以用来解决样本偏差问题。本文为您介绍拒绝推断组件的配置方法。算法简介 以信贷场景为例,评分卡模型对用户的偿还、违约情况进行建模时只用到...

sort子句

举例:查找用户搜索的外婆家,并按照距离由近及远排序:query=default:'外婆家'&sort=distance(lon,lat,"120.34256","30.56982")tag_match:用于对查询语句和文档做标签匹配,使用匹配结果对文档进行算加权 举例:(详细案例可点击上方...

类目预测功能使用

然后在排序配置中,选中算特征下的category_score()并配置搜索字段以及该算特征的权重,并保存配置。以下为应用到业务排序中的流程:进入创建流程后填写策略名称,首先选择业务排序(第轮精排),选择类型(目前控制台配置仅支持表达...

搜索处理

系统提供了丰富的搜索语法以满足用户各种场景下的搜索需求。URL/v3/openapi/apps/$app_name/search?fetch_fields=name&query=config=format:fulljson&query=name:'zhangsan'&sort=id$app_name:表示应用名(高级版/标准版是多应用版本类型...

CREATE MODEL

否 retrieval_num_shards INTEGER 向量索引使用的片个数,向量数据和结构化数据进行融合检索时,每个索引表片会先根据向量的相似查询获取topK数据,再基于合并后的topK数据进行结构化数据过滤。默认值为4。否 text_analyzer VARCHAR 此...

Model

描述 opensearch 应用算法模型 示例 {"id":113023,"groupId":"100297752","groupName":"appGroupName","type":"pop","name":"pop_1212","trainTarget":"ctr","cron":"15 0*/2*","cronEnabled":true,"behaviorEnabled":true,...

模型创建

否 retrieval_num_shards INTEGER 向量索引使用的片个数,向量数据和结构化数据进行融合检索时,每个索引表片会先根据向量的相似查询获取topK数据,再基于合并后的topK数据进行结构化数据过滤。默认值为4。否 text_analyzer VARCHAR 此...

RDS/PolarRDB 数据源配置库分表

本文介绍如何在OpenSearch行业算法版和高性能检索版实例中配置库分表的数据源。一般用户的库分表两种情况:单库多表:database1 table1、table2、table3、table4.多库多表:database1 database2 database3.table1、table2、table3、...

distinct子句

dist_count和dist_times说明 以下样例用来解释和说明dist_count和dist_times的用法及含义:假设有6篇文档,id为主键,name为需要做打散的字段:doc1:id:11 name:a doc2:id:22 name:a doc3:id:33 name:a doc4:id:44 name:b doc5:id:55 name:...

多路召回实战

该实践可用于有大模型算法的团队实现对话式搜索服务,方案架构如下(比较简略,后期会优化的):以上就是对话式搜索的简易架构,召回引擎版在整个架构中类似于向量检索数据库,支持用户通过向量和文本进行多路召回,同时支持丰富的排序函数...

模型配置

前提条件 算法模型需要依赖行为数据集、商品标签数据集作为训练数据,经算法引擎学习后生成可用的模型。算法模型的优劣依赖于训练数据,数据质量越高,数据量越大,算法效果越好。算法模型使用的行为数据集、商品标签数据集的数据要求与...

搜索Demo

如果您使用的是RAM用户的AccessKey,请确保主账号已授权AliyunServiceRoleForOpenSearch服务关联角色,请参考 OpenSearch-行业算法版服务关联角色,相关文档参考 访问鉴权规则。请不要将AccessKey ID和AccessKey Secret保存到工程代码里,...

图像关键点训练

算法简介 关键点检测模块提供主流的自上而下(Top-Down)的算法,主要包含两个部分:目标检测和单人人体关键点检测。人体关键点定位依赖于检测算法提出的Proposals,目前已经支持的模型包括HRNet和Lite-HRNet。图像关键点训练组件位于组件...

文档更新动态(2022年)

API搜索框支持通过API名称或API_ID进行搜索。支持前端水印。支持Hologres数据源。支持在Select区域参数参与计算。更新说明 配置网络、数据服务概述 2022年10月25日 逻辑表功能优化及SQL任务升级 逻辑表DML支持部分字段insert和动态分区。...

GBDT分类预测V2

GBDT分类预测V2组件提供了针对GBDT分类V2组件的预测功能,使用梯度提升决策树(Gradient Boosting Decision Trees)算法,对数据进行分类问题的预测。本文介绍GBDT分类预测V2组件的配置方法。支持计算资源 支持的计算引擎为...

多媒体分析概述

多媒体分析为您提供多媒体领域内的算法识别服务,包括基础模型服务和高级模型服务,为您提供开箱即算法服务能力。本文为您介绍多媒体分析相关计费说明和使用指导。背景信息 多媒体分析支持的算法服务如下:基础模型服务:提供图像领域...

MLP分类/MLP多分类/MLP回归

在训练过程中,利用反向传播算法(Backpropagation)和梯度下降算法(Gradient Descent)优化模型参数,以最小化训练集中样本类别之间的差异性。在分类问题中,多层感知机将输入特征映射到一个二元分类输出,即预测样本属于正例或负例...

AutoML工作原理

您设定好超参数的值域、搜索算法、停止条件配置后,AutoML将其作为一次实验(experiment)传入到后端进行处理。一次实验会根据配置的算法生成超参组合,而每个超参组合会对应一个trial。说明 您可以设置多个trials并发,以提升速度,但是...

线性支持向量机

使用限制 线性支持向量机算法组件仅支持分类场景。组件配置 您可以使用以下任意一种方式,配置线性支持向量机组件参数。方式一:可视化方式 输入框 线性支持向量机算法组件仅一个输入桩,需要接入读数据表组件,为必选项。在工作流页面...

产品简介

产品简介 阿里巴巴通义实验室千寻搜索算法,基于达摩院长期积累的自然语言处理技术,专注企业统一搜索场景,提供精准的多源异构搜索,以PaaS服务形式提供离线数据处理和搜索服务API。同时支持公有云、专有云、基于云原生的基础架构下混合云...

自动机器学习(AutoML)

AutoML使用限制及规格 AutoML的使用限制以及规格,包括当前支持的地域,支持的搜索算法TPE、GridSearch(网络搜索)、Random(随机搜索)、Evolution(演化算法)、GP(贝叶斯优化)、PBT(异步优化算法),以及对应的应用场景。...

实体识别干预词典

操作步骤:在控制台>搜索算法中心>召回配置>词典管理,创建 实体识别词典:填写 名称,词典类型选择 实体识别,分析类型选择 系统内置分析器/自定分析器(根据查询分析中配置的分析器类型选择),关联分析器中会自动过滤出符合条件的分析器...

横向逻辑回归分类

一、组件说明 横向逻辑回归通过将线性回归...例如,本项目中有成功建模的任务名为“1_横向虚拟关联_train算法”,其中有建模组件名字为“横向逻辑回归分类”,则模型名字为“1_横向虚拟关联_train算法_横向逻辑回归分类”,如下图所示:

创建安全联邦学习任务(任务模式)

包括 等频箱、等距箱、卡方箱。处理类型选择箱处理后,则不能再选择其他处理类型。每个字段只能选择一种箱处理。数据编码:仅支持用于字符类型。包括 One-hot编码、Binary编码、WOE编码。单击 提交,完成任务的创建。步骤三:...

PGVector

IVFFLAT是一种基于倒排索引的近似最近邻搜索算法,可以用于高效地查询向量之间的相似度。它将向量空间分为若干个划分区域,每个区域都包含一些向量,并创建倒排索引,用于快速地查找与给定向量相似的向量。IVFFLAT是IVFADC算法的简化版本,...

PGVector

IVFFLAT是一种基于倒排索引的近似最近邻搜索算法,可以用于高效地查询向量之间的相似度。它将向量空间分为若干个划分区域,每个区域都包含一些向量,并创建倒排索引,用于快速地查找与给定向量相似的向量。IVFFLAT是IVFADC算法的简化版本,...

PGVector

IVFFLAT是一种基于倒排索引的近似最近邻搜索算法,可以用于高效地查询向量之间的相似度。它将向量空间分为若干个划分区域,每个区域都包含一些向量,并创建倒排索引,用于快速地查找与给定向量相似的向量。IVFFLAT是IVFADC算法的简化版本,...

DeepFM算法

本文介绍了DeepFM算法相关内容。简介 DeepFM将深度学习模型(DNN)和因子分解机(FM)模型结合,同时支持学习低阶显式特征组合和高阶隐式特征组合,不需要人工做特征工程,常用于推荐系统或广告系统。输入通常有以下两类特征:类别特征...

MaxCompute K均值聚类最佳实践

本文为您介绍如何通过提交一个使用MaxCompute计算资源的超参数调优实验,运行K均值聚类和聚类模型评估组件,以获取K均值聚类组件算法的较优超参数组合。步骤一:准备数据 您可以参考 聚类模型评估 中的示例准备测试数据和评估数据。本...

产品计费

千寻搜索算法产品有 千寻搜索算法 和 千寻搜索算法文档解析包 两个商品。千寻搜索算法商品包括 基础离线服务、基础在线服务 两部分,以 包年包月 方式计费,例如您选择购买时长一个月为期限,则在此期限内可享受购买时选配服务。服务开通后...

设置预分区

NUMREGIONS 表示地域的个数,一般按照每个地域使用6~8 GB的存储量计算地域数量。如果集群规模大,地域数量可以设置多。SPLITALGO 表示Rowkey分割的算法。云数据库HBase自带了三种分隔算法,每个分割算法的适用场景如下描述:...

DLC MNIST训练最佳实践

实验根据配置的搜索算法和最大搜索次数自动创建3个Trial。单击Trial列表,您可以在该页面查看该实验自动生成的所有Trial列表,以及每个Trial的执行状态、最终指标和超参数组合。根据配置的优化方向(越大越好),从上图可以看出,最终指标...

梯度提升决策树算法(GBDT)

本文介绍了梯度提升决策树算法(Gradient Boosting Decision Tree,下文简称GBDT)相关内容。简介 GBDT是一款基于梯度提升的决策树算法。可解释性强,预测速度快。同时,GBDT算法相比于其它算法需要更少的特征工程,可以不用做特征标准化,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
智能开放搜索 OpenSearch 风险识别 地址标准化 加密服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用