稀疏备份

本文介绍配置稀疏备份的方法。常规备份与稀疏备份的区别 对比项 常规备份 稀疏备份 备份集保留策略 按照已设置的备份保留策略进行保留,每周需保留2~7个备份集。例如,设置每周一和周日分别保留一个备份集,保留365天。支持更灵活地设置...

偏最小二乘回归

计算逻辑原理 偏最小二乘用于查找两个矩阵(X 和 Y)的基本关系,即一个在这两个空间对协方差结构建模的隐变量方法。偏最小二乘模型将试图找到 X 空间的多维方向来解释 Y 空间方差最大的多维方向。偏最小二乘回归特别适合当预测矩阵比观测...

ST_HMTAsArray

将热力图瓦片转换为基于数组矩阵的表示方法,方便进行查看。语法 float8[][]ST_HMTAsArray(bytea hmt);返回值 返回一个二维的float8数组,每一个值代表热力图的统计值。参数 参数名称 描述 hmt 基于protobuf表示的HMT二进制。描述 将热力图...

ST_HMTAsArray

将热力图瓦片转换为基于数组矩阵的表示方法,方便进行查看。语法 float8[][]ST_HMTAsArray(bytea hmt);返回值 返回一个二维的float8数组,每一个值代表热力图的统计值。参数 参数名称 描述 hmt 基于protobuf表示的HMT二进制。描述 将热力图...

ST_HMTAsArray

将热力图瓦片转换为基于数组矩阵的表示方法,方便进行查看。语法 float8[][]ST_HMTAsArray(bytea hmt);返回值 返回一个二维的float8数组,每一个值代表热力图的统计值。参数 参数名称 描述 hmt 基于protobuf表示的HMT二进制。描述 将热力图...

相关系数矩阵

相关系数算法用于计算一个矩阵中每列之间的相关系数,取值范围为[-1,1]。系统计算时,count数按两列间同时非空的元素个数计算,两两列之间可能不同。组件配置 您可以使用以下任意一种方式,配置相关系数矩阵组件参数。方式一:可视化方式 ...

Contextual Bandit 算法

算法伪代码(single-play bandit algorithm):与传统方法的区别:每个候选商品学习一个独立的模型,避免传统大一统模型的样本分布不平衡问题 传统方法采用贪心策略,尽最大可能利用已学到的知识,易因马太效应陷入信息茧房;Bandit算法有...

岭回归预测

岭回归预测组件支持稀疏、稠密两种数据格式。您可以使用岭回归预测组件做数值型变量的预测,包括房价预测、销售量预测、湿度预测等。本文为您介绍岭回归预测组件的配置方法。使用限制 支持的计算引擎为MaxCompute、Flink或DLC。算法原理 岭...

Lasso回归预测

Lasso回归预测组件支持稀疏、稠密两种数据格式。您可以使用该组件做一些数值型变量的预测,比如贷款额度预测、温度预测等。本文为您介绍Lasso回归预测组件的配置方法。使用限制 支持的计算引擎为MaxCompute、Flink或DLC。算法原理 Lasso...

混合查询最佳实践

对比传统的 文本+向量 多路召回,向量检索版中的稀疏-稠密向量是将稠密向量和稀疏向量嵌入组合为单个向量,而其中的稀疏向量是将文本向量化成稀疏向量,稠密向量是传统的向量。稀疏向量和稠密向量代表不同类型的信息并支持不同类型的搜索。...

基于对象特征的推荐

本文为您介绍如何基于对象特征进行商品推荐。...在 混淆矩阵-1 区域的 混淆矩阵 页签,查看预测评估指标。在线部署模型。如果模型效果达到预期,则可以单击画布上方的 模型列表,将其部署为在线服务。具体操作,请参见 单模型部署在线服务。

安装DashText SDK

DashText,是向量检索服务DashVector推荐使用的稀疏向量编码器(Sparse Vector Encoder),DashText可通过BM25算法将原始文本转换为稀疏向量(Sparse Vector)表达,通过DashText可大幅度简化使用DashVector 关键词感知检索 能力。...

GMM聚类

是 完全协方差矩阵 完全协方差矩阵 相同完全协方差矩阵 对角协方差矩阵 球面协方差矩阵 EM 迭代停止阈值 EM迭代停止阈值,当下限平均增益低于此阈值时,EM迭代将停止。是 0.001[0,99999999]协方差对角非负正则化 协方差对角非负正则化,...

线性支持向量机

本文介绍线性支持向量机算法组件的配置方法及使用示例。背景信息 本文中的线性支持向量机算法不通过核函数方式实现,具体实现理论请参见 算法原理 中的Trust Region Method for L2-SVM部分。使用限制 线性支持向量机算法组件仅支持二分类...

特征离散

特征离散算法组件是将连续特征按照一定的规则进行离散化。功能介绍 离散模块的功能如下:支持稠密数值类特征离散。支持等频离散和等距离离散等无监督离散。说明 无监督离散的特征离散默认为等距离离散。支持基于Gini增益离散和基于熵增益...

朴素贝叶斯

朴素贝叶斯是一种基于独立假设的贝叶斯定理的概率分类算法。使用Designer(原Studio)的朴素贝叶斯组件,您能有效处理多样的分类问题。本文为您介绍朴素贝叶斯组件的配置方法。使用限制 支持的计算引擎为MaxCompute。组件配置 您可以使用...

表格存储建表注意事项

放开表个数的需求一般有以下几种情况:数据量大、访问性能要求高 不同于传统的SQL数据库(例如MySQL)解决海量数据访问需求的方法是分库分表,表格存储作为分布式实现方式很好地解决了数据量及访问延迟的瓶颈。您可以将结构化或半结构化的...

常用错误码ErrorCode

检查NODE节点数设置-9004 连续未能发现更优解的节点数超过限制 求解失败,检查问题模型,或联系我们-9011 您选择的优化算法当前不支持 检查求解方法设置、License授权范围,检查新版本,或联系我们-9012 求解器不支持求解输入的问题 检查...

逻辑回归二分类

经典逻辑回归是一个二分类算法,支持稀疏及稠密数据格式。组件配置 您可以使用以下任意一种方式,配置逻辑回归二分类组件参数。方式一:可视化方式 在 Designer 工作流页面配置组件参数。页签 参数 描述 字段设置 训练特征列 输入数据源中...

定义维度与构建总线矩阵

根据阿里巴巴OneData方法论,明确每个主题域中有哪些业务过程后,您需要开始定义维度,并基于维度构建总线矩阵。定义维度 在划分主题域、构建总线矩阵时,需要结合对业务过程的分析定义维度。本教程中,以A电商公司的营销业务板块为例,在...

模型训练

本文为您详细介绍GDB Automl模型训练的方法。背景信息 对数据进行预处理后,就可以选择模型训练工具,进行自动化模型训练和调优。GDB Automl支持运行自动机器学习,批量训练支持的模型,您也可以选择具体的单个模型设置参数进行训练。运行...

黄牛账号识别之GraphCompute解决方案

首先从离线算法出发:探索的路线从图传播算法——>图聚类算法——>图表征算法,挖掘更大范围,更深层次的风险。最开始使用图传播算法,可以快速地挖掘出少量风险实例且较高的准确率效果,但是半监督的图传播算法只能从局部出发,挖掘出已知...

求解器用户手册

同时进行两个方法的优化,耗费的内存更多-更鲁棒-在求解新类别问题的时候,建议先用本方法来尝试求解,帮助分辨Simplex或IPM方法哪种更合适,辅助后续算法选取 计算设备需求 不同问题可能有明显差异,请以实测为准。以下实验室的测试值供...

K近邻

K近邻算法进行分类的原理是针对预测表的每行数据,从训练表中选择与其距离最近的K条记录,将这K条记录中类别数量最多的类,作为该行的类别。组件配置 您可以使用以下任意一种方式,配置K近邻组件参数。方式一:可视化方式 在 Designer 工作...

过滤式特征选择

根据您使用的不同特征选择方法,从所有稀疏或稠密格式的特征数据中选择并过滤出TopN的特征数据,同时保存为特征重要性表,实现了降低模型训练的难度和提高训练模型的精确度。本文为您介绍 Designer 提供的过滤式特征选择组件的参数配置和...

数据视图

该组件支持稀疏和稠密数据格式。本文为您介绍 Designer 提供的数据视图算法的参数配置方式及使用示例。组件配置 您可以使用以下任意一种方式,配置数据视图组件参数。方式一:可视化方式 在 Designer 工作流页面配置组件参数。页签 参数 ...

逻辑回归多分类

经典逻辑回归是一个二分类算法,PAI提供的逻辑回归可以支持多分类,且支持稀疏及稠密数据格式。组件配置 您可以使用以下任意一种方式,配置逻辑回归多分类组件参数。方式一:可视化方式 在 Designer 工作流页面配置组件参数。页签 参数 ...

关键词感知检索

建立关键词和原始语料的映射关系,常见的方法有倒排索引、TF-IDF、BM25等方法,其中TF-IDF、BM25通常用 稀疏向量(Sparse Vector)来表示词频。检索时,对检索语句进行关键词抽取,并通过步骤2中建立的映射关系召回关联度最高的TopK原始...

DeepFM算法

本文介绍了DeepFM算法相关内容。简介 DeepFM将深度学习模型(DNN)和因子分解机(FM)模型结合,同时支持学习低阶显式特征组合和高阶隐式特征组合,不需要人工做特征工程,常用于推荐系统或广告系统。输入通常有以下两类特征:类别特征...

索引优化

每一种索引类型都使用一种不同的算法,它们最适合的查询类型也不同。B-Tree索引适合于最常见的情况并且是默认的索引类型。说明 AnalyticDB PostgreSQL版 Serverless实例仅支持创建B-Tree类型索引。在大部分传统的TP型数据库中,索引可以极...

发电场输出电力预测

本文为您介绍如何使用 Designer 预置的工作流模板,快速构建发电场输出电力预测模型。背景信息 本工作流基于综合循环发电场的...右键单击画布中的 回归模型评估,在快捷菜单,单击 查看数据>输出,根据输出结果来评估回归算法模型的优劣性。

数据建模

进行数据建模 完成简单的探索性分析之后,即可开始选择合适的算法模型进行数据建模。通过 拆分 组件,将数据分为训练集和测试集。在左侧组件列表,将 数据预处理 下的 拆分 组件拖入画布中。通过连线,将 拆分-1 节点作为 data4ml 节点的...

新功能发布记录

RDS MySQL稀疏备份 RDS SQL Server稀疏备份 RDS PostgreSQL稀疏备份 PolarDB MySQL版稀疏备份 AnalyticDB PostgreSQL版 备份恢复 AnalyticDB PostgreSQL版 7.0版本实例支持备份恢复功能。数据备份 数据恢复 2023年7月 RDS MySQL、RDS ...

支持向量回归算法(SVR)

本文介绍了支持向量回归算法(Support Vector Regression,以下简称SVR)回归算法相关内容。简介 SVR是支持向量机(SVM)的重要应用分支。通过SVR算法,可以找到一个回归平面并使得一个集合中的所有数据距离该平面的距离最短。使用场景 SVR...

进阶使用

前置知识 BM25简介 BM25算法(Best Matching 25)是一种广泛用于信息检索领域的排名函数,用于在给定查询(Query)时对一组文档(Document)进行评分和排序。BM25在计算Query和Document之间的相似度时,本质上是依次计算Query中每个单词和...

混合检索

使用内积时,只返回大于scoreThreshold的结果 默认不过滤 float 否 sort 排序表达式""string 否 SparseData 参数名称 描述 默认值 类型 是否必须 count 每个稀疏向量中包含的元素个数 只有一个稀疏向量时默认为indices长度 list[int]否 ...

向量介绍

相较于第k-1层图,第k层图包含的节点更加稀疏,节点之间的距离更长,这使得第k层图游走时的步长更大,迭代更快。参数调优:HNSW(Hierarchical Navigable Small World)配置 向量距离类型 向量检索的过程是通过计算向量之间的相似度,最后...

线性回归

是否稀疏格式 使用KV格式表示稀疏格式。kv对间分隔符 默认使用英文逗号(,)分隔。key与value分隔符 默认使用英文冒号(:)分隔。参数设置 最大迭代轮数 算法进行的最大迭代次数。最小似然误差 如果两次迭代间的Log Likelihood之差小于该值...

PS-SMART二分类训练

参数服务器PS(Parameter Server)致力于解决大规模的离线及在线训练任务,SMART(Scalable Multiple Additive Regression Tree)是GBDT(Gradient Boosting Decision Tree)基于PS实现的迭代算法。PS-SMART支持百亿样本及几十万特征的训练...

检索Doc

方法 必填 默认值 描述 vector(Vector vector)否-向量数据 sparseVector(Map(Integer,Float))否-稀疏向量 id(String id)否-主键,表示根据主键对应的向量进行相似性检索 topk(int topk)否 10 返回topk相似性结果 filter(String filter)否-...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
加密服务 风险识别 智能开放搜索 OpenSearch 媒体处理 地址标准化 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用