GROUP BY子句

除此之外,GROUP BY 子句还支持的功能:正则表达式。示例 按单个tag对查询结果进行分组 SELECT MEAN("water_level")FROM"h2o_feet"GROUP BY"location"name:h2o_feet tags:location=coyote_creek time mean-1970-01-01T00:00:00Z5....

评分卡训练

可以通过如下三个参数指定线性变换关系:scaledValue:给出一个分数的基准点。odds:在给定的分数基准点处的odds值。pdo(Point Double Odds):表示分数增长多少分时,odds 值增长到双倍。例如,scaledValue=800,odds=50,pdo=25,...

横向MLP二分类/MLP多分类/MLP回归

多层感知机是一种前馈神经网络,通过多个神经元的组合对输入特征进行非线性变换和特征提取,最终输出一个连续的预测结果。在训练过程中,利用反向传播算法(Backpropagation)和梯度下降算法(Gradient Descent)来优化模型参数,以最小化...

函数概览

本文列举的函数与运算符可以被用在 SLS 的 SQL 或 SPL 两种语言中。函数与运算符 说明 您可以根据具体使用的功能、语言,在本文中查看具体的函数、运算符用法。下表中,√表示支持,×表示不支持。SQL 是一种广泛使用的查询、分析语言,...

单波段拉伸

说明 Gamma校正是一种用于调整图像亮度和对比度的非线性变换技术,可以纠正由于显示设备的不一致性而导致的图像亮度失真问题。后期效果 辉光 强度:设置辉光的强度值,范围为0~5。半径:设置辉光的半径大小,范围为0~1。阈值:设置辉光的...

MLP二分类/MLP多分类/MLP回归

多层感知机是一种前馈神经网络,通过多个神经元的组合对输入特征进行非线性变换和特征提取,最终输出一个连续的预测结果。在训练过程中,利用反向传播算法(Backpropagation)和梯度下降算法(Gradient Descent)来优化模型参数,以最小化...

组件参考:所有组件汇总

特征尺度变换可以通过该组件对稠密或稀疏的数值类特征进行常见的尺度变换。特征离散 该组件是将连续特征按照一定的规则进行离散化。特征异常平滑 该组件可以将输入特征中包含异常的数据平滑到一定区间,支持稀疏和稠密数据格式。奇异值...

MaxCompute安全白皮书

如果是为了控制数据在不同项目空间之间的流动,则可以将项目空间设置为受保护状态(ProjectProtection)。设置之后,只允许用户在项目空间内访问数据,这样可以有效防止数据流出项目空间。项目空间中的LabelSecurity安全机制默认是关闭的,...

调用链采样配置最佳实践

需要综合评估业务场景、观测需求和费用成本,因地制宜配置最适合的采样策略,例如核心应用、核心链路需要尽可能多采集,特别是对于异常链路的命中率,对于一些旁路服务或边缘应用则可以从成本考虑少采集甚至不采集。除了日常监控运维场景外...

Collection

CollectionExpr中包含针对二维数据集的列操作、筛选、变换等大量操作。前提条件 您需要提前完成以下步骤,用于操作本文中的示例:准备示例表 pyodps_iris,详情请参见 Dataframe数据处理。创建DataFrame,详情请参见 从MaxCompute表创建...

HTAP中的行列混存查询优化

例如 Selectivity(a=1)=1/COUNT(DISTINCT a),unique key和foreign key则可以在计算equal join时对结果进行修正,例如SQL语句:SELECT COUNT(*)FROM t1,t2 WHERE t1.a=t2.a;其中,t1.a 是t1上的unique key,且 t1.a 是 t2.a 的外键,对于t2...

灯的App免开发解决方案2.0

如功能定义中,同时添加了 Brightness、ColorTemperature、HSVColor、LightMode,满足5路灯的属性,则可以添加6种场景模式的任意一种。但是最终App用户使用灯时不一定是5路灯,根据设备上报 lightType 动态决定是几路灯,最终App侧会根据 ...

评分卡预测

线性模型中特征值和模型权重值直接相乘相加的结果,对应到评分卡模型中,如果模型进行了分数转换,该分数输出转换后的得分。prediction_prob DOUBLE 二分类场景中预测得到的例概率值,原始得分(未经分数转换)经过Sigmoid变换后得到该...

线性回归

但是,线性回归模型对于离群点、噪声数据和非线性关系的数据比较敏感,需要进行特征标准化和正则化处理。组件截图 二、参数说明 字段设置 参数名称 参数说明 标签字段 用于训练的标签字段,数值类型,单选。特征字段 用于预测的特征字段,...

线性回归

模型地址 字符 算法参数 参数名 参数描述 是否必填 参数默认值 参数范围 是否使用截距 选择模型训练时是否使用截距 是 是 是 否 特征变量是否正则化 选择模型训练前是否对数据正则化 是 否 是 否 测试集比例 测试模型的数据占总输入数据的...

线性回归算法(Linear Regression)

本文介绍了线性回归算法(Linear Regression,以下简称LR)相关内容。简介 LR是利用线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。使用场景 LR是一个回归模型,主要用于拟合数值。该模型简单,可...

逻辑回归二分类

正则化项 penalty 权重衰减项为L1正则或L2正则。安全设置 在联邦学习中,线性回归会通过半同态加密的方式保护各自数据的隐私。参数名称 参数说明 半同态加密算法 可选Paillier或Okamoto-Uchiyama两种加密算法制式。加密算法安全强度 强度越...

线性规划-专题多篇

线性回归通常可以线性函数 y=,x>+b 来描述,我们可以估计出 a 和 b 的值。本地版Python代码>|C/S版C++代码>6.机器学习:带有L1正则项的SVM多分类问题 分类是机器学习领域中最基本的任务之一。其目的是建立输入向量x与分类变量y之间的映射...

XGBOOST回归

它通过改进传统梯度提升决策树的方式,加入正则化项、特征子采样和并行化等优化技术。XGBoost的优点是能够自动处理缺失值、异常值和噪声数据,同时具有较高的预测准确率和泛化能力。在回归问题中,XGBoost每个决策树都是一个回归模型,它...

XGBOOST多分类

它通过改进传统梯度提升决策树的方式,加入正则化项、特征子采样和并行化等优化技术。XGBoost的优点是能够自动处理缺失值、异常值和噪声数据,同时具有较高的预测准确率和泛化能力。在多分类问题中,XGBoost将输入数据特征映射到多元分类...

XGBOOST二分类

它通过改进传统梯度提升决策树的方式,加入正则化项、特征子采样和并行化等优化技术。XGBoost的优点是能够自动处理缺失值、异常值和噪声数据,同时具有较高的预测准确率和泛化能力。在二分类问题中,XGBoost将输入数据特征映射到一个二元...

PS线性回归

线性回归(Linear Regression)是分析因变量和多个自变量之间的线性关系模型,参数服务器PS(Parameter Server)致力于解决大规模的离线及在线训练任务。PS线性回归支持千亿样本、十亿特征的大规模线性训练任务。组件配置 您可以使用以下...

逻辑回归

模型地址 字符 算法参数 参数名 参数描述 是否必填 参数默认值 参数范围 惩罚类型 用于指定惩罚中使用的规范 否 L2 L2 无惩罚 正则强度的倒数 必须为浮点数,与支持向量机一样,较小的值指定更强的正则化 否 1.0[0,99999999]是否使用截距...

分段多项式回归

是 是 是 否 是否正则化 选择模型训练前是否对数据正则化。是 否 是 否 是否自动分段:是 参数名 参数描述 是否必填 参数默认值 参数范围 分段数 自动分段的数量。否 3[1,99999999]是否自动分段:否 参数名 参数描述 是否必填 参数默认值 ...

FM算法

0.01 lambda 否 使用英文逗号(,)分隔的三个浮点数,分别表示0次项、线性项及二次项的正则化系数。0.01,0.01,0.01 initStdev 否 参数初始化标准差。0.05 FM预测 predResultColName 否 预测结果列名。prediction_result predScoreColName ...

数据归一化

计算逻辑原理 min-max归一化:将数据进行一次线性变换,将数据映射到[0,1]区间。其公式为:若x的值相同,归一化输出0.5。Z-score归一化:经过处理后的数据符合态分布。其公式为:若x的值相同,归一化输出0。其中x是原始数据,min是...

横向逻辑回归二分类

一、组件说明 横向逻辑回归通过将线性回归模型的输出通过Sigmoid函数进行映射,将连续的预测值转换为概率值。Sigmoid函数具有“S”形状,可以将任意实数值映射为0和1之间的概率值,表示样本属于例的概率。横向逻辑回归的训练过程是利用...

岭回归训练

岭回归(Tikhonov regularization)算法是对不适定问题进行回归分析时,最常用的正则化方法。岭回归训练组件基于该算法,支持稀疏、稠密两种数据格式,且支持带权重样本的训练。本文为您介绍岭回归训练组件的配置方法。使用限制 支持的计算...

线性回归

线性回归(Linear Regression)是分析因变量和多个自变量之间的线性关系模型。组件配置 您可以使用以下任意一种方式,配置线性回归组件参数。方式一:可视化方式 在 Designer 工作流页面配置组件参数。页签 参数 描述 字段设置 选择特征列 ...

条件随机场

条件随机场可用于不同的预测问题,主要应用于标注问题中,其中最典型的是线性链(linear chain)。详情请参见 wiki。组件配置 您可以使用以下任意一种方式,配置条件随机场组件参数。方式一:可视化方式 在 Designer 工作流页面配置组件...

MySQL分库分表同步至Hologres(方案2.0)

将分表数据写入目标单表:将源表满足 t_order.*正则表达式的表数据写入到Hologres名为 t_order 的表中,所有满足 t_user.*正则表达式的表数据写入到Hologres名为 t_user 的表中。为表加上统一前缀:在目标名前统一加上 cdo_前缀。schema:...

Lasso回归训练

输出桩 输出桩(从左到右)数据类型 下游组件 模型 回归模型 Lasso回归预测 模型信息 无 无 特征重要性 无 无 线性模型权重系数 无 无 通过代码方式配置组件 您可以将以下代码复制到 PyAlink脚本 组件中,使PyAlink脚本组件实现与该组件...

视频生产介绍

视频画幅变换 可以对输入视频进行智能裁剪和填充,输出任意分辨率的视频。视频人脸融合 可以将视频中某个指定的人脸,融合进另一个人的人脸特征,达到换脸的感官效果。模板视频人脸融合 可以将视频中检测到的最大人脸,融合进另一个人的...

LightGBM算法

LightGBM可以减少数据对内存的使用、减少通信代价以及提升多机并行时的效率,在数据计算上实现线性加速。使用场景 LightGBM是一个算法框架,包括GBDT模型、随机森林和逻辑回归等模型。通常应用于二分类、多分类和排序等场景。例如:在个性...

归一化

计算逻辑原理 min-max归一化:将数据进行一次线性变换,将数据映射到[0,1]区间。其公式为:Z-score归一化:经过处理后的数据符合态分布。其公式为:说明 公式中x是原始数据,min是数据的最小值,max是数据的最大值,mean是数据的平均值,...

向量计算函数

向量缩放函数 vector_scale(array(double)vector1,double alpha)vector_scale(varchar vector1,double alpha)结合向量的加减法和向量的缩放,可以做任何线性变换。cosine_similarity 函数 计算 x 的余弦相似度。使用示例 查询和分析语句*|...

Logtail限制说明

正则默认最大处理能力为20 MB/s(与正则表达式的复杂度有关)。分隔符日志最大处理能力为40 MB/s。JSON日志最大处理能力为30 MB/s。通过启动参数 process_thread_count 设置多个处理线程,可提升1.5~3倍性能。最大监控目录及文件数 与内存...

DescribeProtectionModuleRules-查询WAF防护功能规则...

可选值:eq(精准匹配)、prefix-match(前缀匹配)、regex(正则匹配)。url:String 类型|必选|路径关键字,必须以斜杠(/)开头。keyType:String 类型|必选|情报库类型,包含 IP 库(ip)、指纹库(ua)两种类型。RuleId:Integer ...

Logtail

正则默认最大处理能力为20 MB/s(与正则表达式的复杂度有关)。分隔符日志最大处理能力为40 MB/s。JSON日志最大处理能力为30 MB/s。通过启动参数 process_thread_count 设置多个处理线程,可提升1.5~3倍性能。最大监控目录及文件数 与内存...

机器学习开发示例

数据展示%pyspark#数据展示 ml_data.show()ML算法数据打印 步骤四:建立模型、运行线性回归模 说明 在本部分中,您将使用不同的正则化参数运行两个不同的线性回归模型,以基于人口(features)确定这两个模型中的任何一个对销售价格(label...
共有19条 < 1 2 3 4 ... 19 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储 物联网平台
新人特惠 爆款特惠 最新活动 免费试用