过滤式特征选择

根据您使用的不同特征选择方法,从所有稀疏或稠密格式的特征数据中选择并过滤出TopN的特征数据,同时保存为特征重要性表,实现了降低模型训练的难度和提高训练模型的精确度。本文为您介绍 Designer 提供的过滤式特征选择组件的参数配置和...

基于MSE云原生网关实现同城多活

云原生网关默认采用多可用区部署,提供了地域级的、跨可用区的全局流量管理能力。在同城多活的场景下,能够确保对跨可用区的多个业务集群的请求实现...可以看到MSE在I可用区的集群挂掉后,可实现秒级切流,切流过程中仅有不到1%的流量损失。

评分卡训练

评分卡是信用风险评估领域常用的建模工具,其原理是通过分箱输入将原始变量离散化后再使用线性模型(逻辑回归或线性回归等)进行模型训练,其中包含特征选择及分数转换等功能。同时也支持在训练过程中为变量添加约束条件。说明 如果未指定...

随机森林

均方误差:父节点和子节点之间的均方误差的差额将被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化L2损失。平均绝对误差:它使用叶节点的中值来最小化 L1 损失。否 均方误差 均方误差 平均绝对误差 其他参数 参数名 参数...

决策树

均方误差:父节点和子节点之间的均方误差的差额将被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化L2损失。费尔德曼均方误差:它使用费尔德曼均方误差,这种指标使用费尔德曼针对潜在分枝中的问题改进后的均方误差。平均...

评分卡预测

页签 参数 描述 字段设置 特征选择用于预测的原始特征列,默认选择全部。原样添加到结果表 选择不进行任何处理,直接附加到预测结果表中的列。例如ID列和目标列等。输出变量分 是否输出每个特征变量所对应的分数,最终的预测总得分为...

基本对象概念

重载方法 在对象类型中,允许定义两个或多个具有相同类型(这是存储过程或函数)但具有不同特征的同名方法。此类方法称为重载方法方法特征由形参的数量、数据类型及其顺序组成。icmsDocProps={'productMethod':'created','language':'...

条件随机场

Dlifecycle=28-DcoreNum=10 参数名称 是否必选 描述 默认值 inputTableName 是 输入特征数据表 无 inputTablePartitions 否 输入特征选择的分区 全表 featureColNames 否 输入表选择特征列 默认选择全部,自动排除label列。...

随机森林特征重要性

您可以使用原始数据和随机森林模型,计算特征重要性。组件配置 您可以使用以下任意一种方式,配置随机森林特征重要性组件参数。方式一:可视化方式 在 Designer 工作流页面配置组件参数。页签 参数 描述 字段设置 选择特征列 输入表中,...

运行失败

在seek阶段M-R1-R2的R1到R2的过程,会将这些数据交给同样的Reducer去执行,导致数据倾斜,造成某个Reduce Job挂掉。小类目检索准备阶段GetSmallCategoryDocNum为空 报错信息 解决方法 该问题的主要原因是表当中某些字段的值为空,比如 ...

财务规划

计费方式选型和组合模型 企业可以根据自身业务特征选择合理的计费方式组合,从而实现云上成本更优。以下列举几项对成本管理较为相关的计费方式。企业使用按量付费的方式购买产品,企业只需按实际使用量付费而不用提前采购,有助于保持资源...

开通和配置Bot管理

防护目标类型 选择 APP,表示对使用基于iOS或Android原生开发的App(不包括App中使用的H5页面)进行防护。APP SDK集成 WAF提供基于Native App(Android/iOS)的SDK用以提升该场景下的防护效果。SDK集成后将会采集客户端的风险特征并生成...

模型配置

在复购预测中,需要先完成模型配置,当且仅当模型执行成功后,可基于模型进行复购预测。模型训练成功后,您可以查看训练中前10个最重要的特征,并通过模型验证了解该模型的准确率、召回率预期。前提条件 算法模型需要依赖行为数据集作为...

配置App防爬场景化规则

报错 原因 解决方法 未查询到任何有效测试请求,您可以查看帮助文档或咨询我们以分析可能的原因。实际测试请求没有发送成功,或者没有发送到WAF。确认测试请求已经成功发送到WAF解析的地址。实际测试请求的字段内容与防爬规则中定义的 防护...

配置浏览器访问网页的防爬场景化规则

报错 原因 解决方法 未查询到任何有效测试请求,您可以查看帮助文档或咨询我们以分析可能的原因。实际测试请求没有发送成功,或者没有发送到WAF。确认测试请求已经成功发送到WAF解析的地址。实际测试请求的字段内容与防爬规则中定义的 防护...

创建数据脱敏规则

DataWorks支持多种脱敏场景,您需根据需要选择合适场景创建相应数据脱敏规则。本文为您介绍如何创建脱敏规则,并在DataWorks中进行脱敏查询。背景信息 DataWorks的脱敏场景分为静态脱敏和动态脱敏:动态脱敏:包括 数据开发/数据地图展示...

WAF安全报表

我们将基于您购买的不同地域WAF实例所对应的管控平面,向您进行图表和信息展示。登录 Web应用防火墙控制台,在顶部菜单栏,选择WAF实例的资源组和地域(中国内地、非中国内地)。在左侧导航栏,选择 安全运营>安全报表。在 安全报表 页面,...

检测响应常见问题

基于MD5和路径加白 云产品威胁检测 支持在控制台配置加白规则 进程异常行为 基于命令行加白 持久化后门 基于文件MD5和特征加白 敏感文件篡改 基于文件路径加白 应用入侵事件 基于命令行加白 Web应用威胁检测 基于域名或URL加白 异常网络...

云数据库Redis版产品选型必读

选择容灾方案 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。选择大版本 推荐使用更新的大版本...

使用ETL分析实时订单

实时计算场景:对业务侧产生的流数据实时清洗处理,形成特征值、标签支持在线业务计算模型(画像、风控、推荐等)或实时大屏等流计算场景。案例背景 本案例将为您演示如何使用流式ETL功能,将实时交易数据(订单号、客户ID、产品/商品编码...

混合云应用双活容灾最佳实践

越来越多的企业在数字化转型和上云进程中选择混合云的形态(云+自建IDC或云+其他厂商云)来进行容灾建设,一方面不会过度依赖单一云厂商,另一方面还能充分利用已有的线下IDC资源。MSHA云原生多活容灾解决方案,支持混合云多活容灾产品能力...

K近邻

基于邻居的方法被称为非泛化机器学习方法,因为它们只是“记住”其所有训练数据。参数说明 IN端口 参数名 参数描述 是否必填 输入数据类型 数据源类型 特征变量 配置模型特征列 是 整数或浮点数 说明 若存在非数值数据,则会抛出异常。CSV...

箱线图

选择枚举类型特征 选择枚举类型的特征。说明 在 Designer 中仅支持选择一个字段;在 Designer 中支持选择多个字段。分层样本采用数 分层样本的采用数。方式二:PAI命令方式 使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI...

特征离散

特征离散算法组件是将连续特征按照一定的规则进行离散化。功能介绍 离散模块的功能如下:支持稠密...离散特征选择 nr_employed,离散方法选择 等距离散,离散区间个数配置为 5。运行结果 nr_employed 4.0 3.0 1.0 3.0 2.0 4.0 3.0 3.0 2.0 3.0

基于对象特征的推荐

实验运行结束后,右键单击画布中的 逻辑回归二分类-1,在快捷菜单,单击 模型选项>导出PMML,即可导出训练完成的基于对象特征的推荐模型。右键单击画布中的 预测,在快捷菜单,单击 查看数据>预测结果输出,即可查看模型预测结果。查看模型...

特征管理

特征管理介绍 OpenSearch推出了定制排序模型功能,特征管理可用于为定制排序模型添加所需的特征表,并支持创建、编辑特征名称、特征类型以及来源字段。添加特征表 创建 行业模板 之后,进入开放搜索 控制台 页面,左侧导航栏选择:...

异常检测

背景信息 异常检测的方法包括箱型图(Box-plot)和AVF(Attribute Value Frequency):箱型图用于检测连续值类特征的数据,根据箱线图最大值和最小值检测异常特征。AVF用于检测枚举值类特征的数据,根据枚举特征的取值频率及阈值检测异常...

通用联邦学习模板

一、模板说明 通过提供通用机器学习模板,展示完整的数据收集、特征工程、模型选择和训练、模型评估、模型部署和应用以及模型复用的一系列算子的使用方法,使用户能够高效构建准确的联邦学习模型。二、使用步骤 通过提供通用机器学习模板,...

新建注册上指标

您可以将物理表中的指标字段上至汇总逻辑表进行数据分析。本文为您介绍如何为汇总逻辑表新建注册上标签。前提条件 完成派生指标的创建,详情请参见 创建派生指标。操作步骤 在Dataphin首页,单击顶部菜单栏的 研发。默认进入数据 开发 ...

新建注册上指标

您可以将物理表中的指标字段上至汇总逻辑表进行数据分析。本文为您介绍如何为汇总逻辑表新建注册上标签。前提条件 完成派生指标的创建,详情请参见 创建派生指标。操作步骤 登录 Dataphin控制台。在Dataphin控制台页面,选择工作区地域...

创建单物理表服务单元

物理数据表 依次选择数据源类型、数据源(基于选择的模式,展示可以选择到的数据源类型)和物理数据表。您也可以单击 新增数据源 引入新的业务数据源,以便基于新的业务数据源创建服务单元。如何新增数据源,请参见 创建数据源。服务单元...

常见报错

本文介绍配置任务和任务运行时系统返回的报错信息(如重试信息或错误码)以及解决方法。说明 本文以正则表达式((.*)?的形式表示报错信息中的变量。若报错无法解决,您可以 通过钉钉(钉钉通讯客户端下载地址)进入到DTS客户交流钉钉群...

组件参考:所有组件汇总

过滤式特征选择 该组件将根据您使用的不同特征选择方法,从所有稀疏或稠密格式的特征数据中选择并过滤出TopN的特征数据。特征编码 该组件是将非线性特征通过GBDT编码成线性特征。one-hot编码 您可以通过该组件后数据会变成稀疏,输出结果也...

缺失值填充

组件截图 二、参数说明 对于字符型特征和数值型特征,分别对应不同的填充方法。可以只选择其中一种,而另外一种选择不填。字符类型填充参数 参数名称 参数说明 字符类型-选择填充字段 选择需要填充值的字段列。字符类型-原值 选择需要被...

在GPU实例上使用RAPIDS加速图像搜索任务

您可以选择一种方法设置GPU显存参数:方法1:依据运行需求进行显存分配。config.gpu_options.allow_growth=True 方法2:设定可以使用的GPU显存比例。本案例中使用方法2,并且GPU显存比例默认设置为0.3,即Tensorflow可以使用整块GPU显存的...

线性支持向量机

支持向量机SVM(Support Vector Machine)是基于统计学习理论的一种机器学习方法,通过寻求结构风险最小化,提高学习机泛化能力,从而实现经验风险和置信范围最小化。本文介绍线性支持向量机算法组件的配置方法及使用示例。背景信息 本文中...

Cost-based SQL诊断引擎

能力测试集构建的基本思想,首先通过特征化实现测试案例基于特征的形式化描述,形成测试案例形式化特征库,并具备足够的完备性。在阿里巴巴集团内部,我们已经对数据库实例上全部SQL进行实时采集和存储,借助阿里巴巴这个大平台业务的丰富...

FeatureStore Python SDK

特征视图定义了数据从哪里来(DataSource)、需要进行哪些预处理或转换操作(如特征工程/Transformation)、特征的数据结构(包含特征名称和类型在内的特征schema)、数据存储的位置(OnlineStore/OfflineStore),并提供特征元信息管理,...

离线分析

根据离线发生的时间区间、设备的未重连时长来统计离线设备的特征,帮助您全面了解、分析设备离线的原因。前提条件 设备已接入阿里云物联网平台。具体操作,请参见 设备接入。已开启设备诊断服务。具体操作,请参见 开启和关闭设备诊断。...

案例:搭建以图搜图系统

您可以选择适合当前使用场景的方法,提取图像的特征,生成特征向量。向量检索 向量检索又称为最近邻(Nearest Neighbor Search,NNS)检索,主要负责在海量特征向量中快速地查找与查询向量距离最近的k个记录。虽然可以通过遍历的方法,依次...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 Web应用防火墙 对象存储 轻量应用服务器 云服务器 ECS 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用