创建工程

输入项目信息 项目名字,给这个项目起个名字 工作区路径,工作区路径即为源码路径(注:此目录名称必须为连续的英文字符)选择硬件类型,即选择在哪块开发板上运行这套示例程序,如HaaS100等 选择解决方案,即选择什么功能的示例程序,如...

条件随机场

Dlifecycle=28-DcoreNum=10 参数名称 是否必选 描述 默认值 inputTableName 是 输入特征数据表 无 inputTablePartitions 否 输入特征选择的分区 全表 featureColNames 否 输入表选择特征列 默认选择全部,自动排除label列。...

组件参考:所有组件汇总

过滤式特征选择 该组件将根据您使用的不同特征选择方法,从所有稀疏或稠密格式的特征数据中选择并过滤出TopN的特征数据。特征编码 该组件是将非线性特征通过GBDT编码成线性特征。one-hot编码 您可以通过该组件后数据会变成稀疏,输出结果也...

数据视图

通过数据视图组件,您可以可视化地了解特征与标签列的分布情况及特征特点,以便后续进行数据分析。该组件支持稀疏和稠密数据格式。本文为您介绍 Designer 提供的数据视图算法的参数配置方式及使用示例。组件配置 您可以使用以下任意一种...

附录:选择云服务和IP地址

更多无法选择实例的可能原因及处理方法,请参见 备案时为什么选择不了服务器。选择云服务方法二 如果您的ICP备案服务器不在当前登录的阿里云账号下,您可以先申请好ICP备案服务码,并使用备案服务码进行备案。说明 如果您购买的是阿里云的...

过滤式特征选择

根据您使用的不同特征选择方法,从所有稀疏或稠密格式的特征数据中选择并过滤出TopN的特征数据,同时保存为特征重要性表,实现了降低模型训练的难度和提高训练模型的精确度。本文为您介绍 Designer 提供的过滤式特征选择组件的参数配置和...

评分卡训练

评分卡是信用风险评估领域常用的建模工具,其原理是通过分箱输入将原始变量离散化后再使用线性模型(逻辑回归或线性回归等)进行模型训练,其中包含特征选择及分数转换等功能。同时也支持在训练过程中为变量添加约束条件。说明 如果未指定...

特征稳定性PSI

PSI也可以用于进行特征选择,选取在不同时间段或不同数据集中分布稳定的特征,避免使用不稳定的特征对模型性能造成负面影响。在联邦学习任务中,PSI是通过联邦建模来实现的,可以保证数据的安全前提下,计算对应两方数据的PSI值。在PSI计算...

特征离散

页签 参数 描述 字段设置 离散的特征 选择需要离散的特征。标签列 如果您设置了该字段,则可以通过可视化方式查看特征到目标变量的 x-y 分布直方图。参数设置 离散方法 离散方法。取值如下:Isometric Discretization(等距离散)...

特征分组统计

一、组件说明 在联邦学习任务中,对于数值类特征,用户通常会关注特征的分组统计值,【特征数值统计】组件主要用于数值类特征的分组统计分析。在分组统计计算完成后,用户可以右键组件,选择【查看节点数据报告】,来查看数据的分组统计...

特征数值统计

一、组件说明 在联邦学习任务中,对于数值类特征,用户通常会关注一些统计类特征,例如最大值、最小值、平均值等,【特征数值统计】组件主要用于数值类特征的分析。在数值统计计算完成后,用户可以右键组件,选择【查看节点数据报告】,来...

配置FeatureStore项目

FeatureStore 项目会对应一个离线数据源和在线...参数 说明 选择特征 选择当前离线视图中的特征,并配置特征别名。Label表名称 选择已创建的Label表名称。导出表名 提交后,后续会在MaxCompute中自动创建一张 train set 表,用于离线训练。

决策树

均方误差:父节点和子节点之间的均方误差的差额将被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化L2损失。费尔德曼均方误差:它使用费尔德曼均方误差,这种指标使用费尔德曼针对潜在分枝中的问题改进后的均方误差。平均...

随机森林

均方误差:父节点和子节点之间的均方误差的差额将被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化L2损失。平均绝对误差:它使用叶节点的中值来最小化 L1 损失。否 均方误差 均方误差 平均绝对误差 其他参数 参数名 参数...

GBDT二分类V2

两个组件当前的功能和参数支持情况,见下表:PS-SMART二分类参数 对应本组件的参数 是否稀疏格式 是否为稀疏向量格式 选择特征选择特征选择标签列 选择标签列 选择权重列 选择权重列 评估指标类型 不适用,默认为 AUC 指标,可以在 ...

特征异常平滑

nr_employed 5228.1 5195.8 4991.6 5099.1 5076.2 5228.1 5099.1 5099.1 5076.2 5099.1 参数配置 平滑特征 选择 nr_employed,参数设置 中 平滑方法 选择 阈值平滑,阈值下限 为 5000,阈值上限 为 6000,如下图所示。运行结果 nr_employed...

PS线性回归

页签 参数 描述 字段设置 选择特征列 输入数据源中,参与训练的特征列。选择标签列 支持DOUBLE及BIGINT类型。是否稀疏格式 使用KV格式表示稀疏格式。kv间的分隔符 默认使用空格分隔。key与value分隔符 默认使用半角冒号(:)分隔。参数设置...

新建及管理数据分类

识别特征 选择识别特征,多个识别特征之间为或的关系,最多选择不超过20个。如需创建识别特征,请参见 添加识别特征。高级配置 支持选择 按内容扫描、按字段名称扫描、按字段描述扫描、按数据类型扫描、按表名扫描、按表中文名扫描。按内容...

随机森林特征重要性

页签 参数 描述 字段设置 选择特征列 输入表中,用于训练的特征列。默认选中除Label外的所有列,为可选项。选择目标列 该参数为必选项。单击 图标,在 选择字段 对话框中,输入关键字搜索列,选中后单击 确定。参数设置 并行计算核数 并行...

条件随机场预测

选择特征列 要进行标注的单词,以及该单词对应的特征。请选择目标列 选择目标列。预测结果列列名 预测结果列的名称,默认值为prediction_result。预测分数列列名 预测分数列的名称,默认值为prediction_score。预测详细列列名 预测详细列...

线性模型特征重要性

线性模型特征重要性组件用于计算线性模型的特征重要性,包括线性回归和二分类逻辑回归,支持稀疏和稠密数据格式。本文为您介绍该组件的配置方法。使用限制 支持的计算引擎为MaxCompute。组件配置 您可以使用以下任意一种方式,配置线性模型...

PS-SMART二分类训练

特征重要性类型 支持以下几种类型:模型中,该特征做为分裂特征的次数 模型中,该特征带来的信息增益(默认值)模型中,该特征在分裂节点覆盖的样本数 执行调优 计算核心数 默认为系统自动分配。每个核内存大小 单个核心使用的内存,单位为...

PS-SMART回归

特征重要性类型 支持以下类型:模型中,该特征做为分裂特征的次数 模型中,该特征带来的信息增益(默认值)模型中,该特征在分裂节点覆盖的样本数 执行调优 核心数 默认为系统自动分配。每个核的内存大小 单个核心使用的内存,单位为MB。...

PS-SMART多分类

特征重要性类型 支持 模型中,该特征做为分裂特征的次数、模型中,该特征带来的信息增益 及 模型中,该特征在分裂节点覆盖的样本数 类型。执行调优 核心数 默认为系统自动分配。每个核的内存大小 单个核心使用的内存,单位为MB。通常无需...

朴素贝叶斯

排除列 不参与训练的列,不能与 选择特征列 同时使用。强制转换列 解析规则如下:STRING、BOOLEAN及DATETIME类型的列,解析为离散类型。DOUBLE和BIGINT类型的列,解析为连续类型。说明 如果需要将BIGINT类型的列解析为CATEGORICAL,则必须...

案例:搭建以图搜图系统

modified_lines=io.StringIO(''.join(list(process_file(features_file_path))))cursor.copy_expert(copy_command,modified_lines)connection.commit()选择特征向量文件中的一张图片对应的向量,进行搜索。例如,搜索ID为4999的图片。def ...

创建实例

如果您选择的付费模式是包年包月,请选择购买时长,并设置是否自动续费。为了避免实例到期资源释放,建议您勾选到期自动续费。关于实例到期的影响以及续费说明,请参见 到期和欠费说明 和 开通自动续费。重要 如果您使用RAM用户购买Lindorm...

常见坐席工作台问题

6.坐席工作台中自动选择外呼号码的选择逻辑是什么?答:自动选择外呼号码,规则如下:选择自动选择外呼号码后,先匹配和外呼号码相同归属地的主叫号码进行外呼,当可用的外呼号码列表中没有相同归属地的号码时,降级匹配同省的主叫号码,...

补数据

补数据功能说明 为什么小时分钟任务补数据选择了并行但实际不生效?为什么补数据选择业务时间后不运行,实例显示黄色,实例状态显示等待时间?为什么补数据选择业务时间昨天和今天,也会出现等待时间的情况?为什么补数据选择补0点~1点生成...

Quick BI中指标拆解树的子节点百分比是什么意思

概述 Quick BI中指标拆解树的子节点百分比是什么意思?详细信息 在图表的所有类型中可以选择到指标拆解树图表。默认条件下子节点百分占比的意思为:以子节点的所有数据中最大的一个数据作为分母,来计算其他各个数据所占的百分比。在样式-...

什么是SmartMetrics?

更多信息,请参见 为什么只支持选择一个指标?配置模型参数。成功创建预测任务后,SmartMetrics 将在后台学习指标的特征,并对未来一段时间内指标正常变化范围做出预测,生成上下边界。并且,SmartMetrics 会自动更新模型,根据指标的变化...

执行补数据并查看补数据实例

代码中若使用调度参数,则该参数将根据补数据选择的业务时间自动替换为具体值,结合业务代码将对应时间数据写入对应分区。具体写入的分区与执行的代码逻辑,与任务定义的代码有关。本文为您介绍如何补数据并管理补数据实例。背景信息 周期...

使用公网流量分析

例如:当视角选择中国,地域选择杭州时,此时如果不选择省份,则表示查看全国其他城市与杭州之间的网络质量;如果选择四川省,则表示查看杭州地域到四川省的网络质量。当视角选择全球,地域选择杭州时,此时如果不选择国家,则表示查看杭州...

新建特征

本文介绍在蚂蚁隐私计算服务平台新建特征组的方法。操作步骤 登录 蚂蚁隐私计算服务平台。在左侧导航栏,选择 我的资源>数据资产。在 数据资产管理 页面,单击 特征组 页签,然后单击 新建特征组。在 新建特征组 面板中,单击 新增特征,...

评分卡预测

页签 参数 描述 字段设置 特征选择用于预测的原始特征列,默认选择全部。原样添加到结果表 选择不进行任何处理,直接附加到预测结果表中的列。例如ID列和目标列等。输出变量分 是否输出每个特征变量所对应的分数,最终的预测总得分为...

全域分析

特征分布 选择受众后,单击 特征分布 页签,单击 选择标签,在弹窗中选择一个或多个全域标签,页面将展示当前受众的特征分布情况。交叉分析 交叉分析用于分析两个全域标签的不同标签值组合在受众中的分布。选择受众后,单击 交叉分析 页签...

异常检测

异常检测用于检测连续值和枚举值类特征的数据,帮助您挖掘数据中的异常点。背景信息 异常检测的方法包括箱型图(Box-plot)和AVF(Attribute Value Frequency):箱型图用于检测连续值类特征的数据,根据箱线图最大值和最小值检测异常特征...

特征尺度变换

选择标签列 如果您设置了该字段,则可以通过可视化方式查看特征到目标变量的 x-y 分布直方图。是否K:V,K:V稀疏特征 训练数据是否为稀疏格式。当数据以稀疏格式存储时,通常所有数据存储在一个字段里,而不是每个数据单独存储在一个字段里。...

语音号码FAQ

提示“号码拨打的次数限制”是什么意思?针对同一个被叫号码有相关频次限制,超过这个频次就会触发流控限制。语音通知和语音验证码:同一个模板或语音文件,同一个被叫。流控规则:1次/分钟、5次/小时、20次/24小时。流控规则计时从第一次...

数据转换模块

页签 参数 描述 字段设置 输入表选择特征列 输入的特征列,默认选择全表。不进行转换的数据列 选中的列会原样输出,可以在此指定Label。数据转换的类型 支持的转换类型包括 归一化、离散化、转换为WOE值 及 Index。默认WOE值 仅当 数据...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
Web应用防火墙 对象存储 云数据库专属集群 云原生数据仓库 AnalyticDB PostgreSQL版 云服务器 ECS 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用