查看及管理任务相关对象

查看输入表 当前任务引用读取的表。即任务计算逻辑中被查询的表。区域 描述 ① 搜索及筛选区 搜索及筛选区支持根据输入表类型及输入表名称来筛选关联的输入表。表类型包括维度逻辑表、事实逻辑表、汇总逻辑表及物理表。若当前未展示当前...

查看及管理任务相关对象

查看输入表 当前任务引用读取的表。即任务计算逻辑中被查询的表。区域 描述 ① 搜索及筛选区 搜索及筛选区支持根据输入表类型及输入表名称来筛选关联的输入表。表类型包括维度逻辑表、事实逻辑表、汇总逻辑表及物理表。若当前未展示当前...

配置脚本模式输入组件

脚本模式组件用于配置系统组件不支持的配置项,以满足业务场景。操作步骤 请参见 离线管道组件...column:输入表的输入字段,字段至少有Name和Type。parameter:组件参数请参见对应组件的说明。单击 确认,完成 脚本模式 输入组件的属性配置。

配置脚本模式输入组件

column:输入表的输入字段,字段至少有Name和Type。parameter:组件参数请参见对应组件的说明。单击 确认,完成 脚本模式 输入组件的属性配置。后续步骤 完成输入组件的配置后,即可配置下游组件,以实现数据同步。具体操作,请参见 配置离...

配置脚本模式组件

{"table":"tableName","columnMapping":[{"sourceColName":"","dstColName":""}],"parameter":{ } } 其中:table:输出组件的单输入表和多输入表。多输入表的key值为tables,单输入表的key值为table。如果组件不涉及表,则没有该参数。...

配置脚本模式组件

{"table":"tableName","columnMapping":[{"sourceColName":"","dstColName":""}],"parameter":{ } } 其中:table:输出组件的单输入表和多输入表。多输入表的key值为tables,单输入表的key值为table。如果组件不涉及表,则没有该参数。...

线性模型特征重要性

参数 是否必选 描述 默认值 inputTableName 是 输入表的表名。无 outputTableName 是 输出表的表名。无 labelColName 是 输入表的标签列名。无 modelName 是 输入的模型名称。无 featureColNames 否 输入表选择的特征列。除Label外的所有列...

过滤与映射

过滤与映射组件可以对数据按照过滤表达式进行筛选,...输入表对应的输入分区,选中全表则为None。inputTableName 是 输入表的名称 filter 否 通过where条件实现数据过滤,与SQL类似,例如 age>40。说明 仅支持以下操作符:=!

随机森林特征重要性

页签 参数 描述 字段设置 选择特征列 输入表中,用于训练的特征列。默认选中除Label外的所有列,为可选项。选择目标列 该参数为必选项。单击 图标,在 选择字段 对话框中,输入关键字搜索列,选中后单击 确定。参数设置 并行计算核数 并行...

语义向量距离

默认为空,即输入表中的所有向量参与计算。输入端口2的 id列表 格式为一列,每一行一个ID。例如:1 2 4 6 8 向量的列名列表 如f1,f2。参数设置 输出的距离最近的向量的数目 默认值为5。距离的计算方式 支持如下计算方式:euclidean cosine...

协方差

参数名称 是否必须 描述 默认值 inputTableName 是 输入表的名称。无 inputTablePartitions 否 输入表中,参与训练的分区。系统支持以下格式:Partition_name=value name1=value1/name2=value2:多级分区 说明 指定多个分区时,分区之间...

步骤三:配置节点运行配置

完成输入和输出参数配置后,单击 手动设置血缘 开关,在 血缘配置 对话框中,单击输出表待配置的目标字段后的 图标,下拉选择对应的一个或者多个输入表以及输入表的字段。说明 对能自动解析输入和输出参数的SQL类节点类型,系统会自动匹配...

步骤三:配置节点运行配置

完成输入和输出参数配置后,单击 手动设置血缘 开关,在 血缘配置 对话框中,单击输出表待配置的目标字段后的 图标,下拉选择对应的一个或者多个输入表以及输入表的字段。说明 对能自动解析输入和输出参数的SQL类节点类型,系统会自动匹配...

句子拆分

输入表中指定参与计算的分区 输入表的所有分区 outputTableName 是 输出表名 无 docIdCol 是 标识文章ID的列名 无 docContent 是 标识文章内容的列名,仅可指定一列。无 delimiter 否 句子的间隔字符集合。lifecycle 否 输入出表的生命周期...

输入与输出

接受多表输入,且输入表的Schema可以不同。在Map函数中,您可以获取当前Record对应的Table信息。输入可以为空,不支持视图(View)作为输入。Reduce接受多路输出,可以输出到不同表,或者同一张表的不同分区。不同输出的Schema可以不同。...

按线上场景关联

第二种情况:如果A场景任意场景节点的输出表是B场景任意场景节点的输入表,C场景任意场景节点的输出表是B场景任意场景节点的输入表,那么C场景和A场景就是B场景的依赖场景。工作组若有创建数据标准、数据源和全局变量,不区分创建方式,...

回归模型评估

参数 是否必选 参数描述 默认值 inputTableName 是 输入表的名称。无 inputTablePartitions 否 输入表中,参与计算的分区。全表 yColName 是 输入表中,原始因变量的列名,支持数值类型。无 predictionColName 是 预测结果中,因变量的列名...

PLDA

STRING 输入表的所有分区 selectedColNames 否 输入表中用于LDA的列名。STRING 输入表中所有的列名 topicNum 是 Topic的数量,取值范围为[2,500]。正整数 无 kvDelimiter 否 Key和Value间的分隔符。取值:空格 英文逗号(,)英文冒号(:)...

奇异值分解

无 tol 否 收敛误差 1.0e-06 enableSparse 否 输入数据是否为稀疏格式:true false false itemDelimiter 否 指当输入表数据为稀疏格式时,kv间的分隔符。空格 kvDelimiter 否 指当输入表数据为稀疏格式时,key和value的分隔符。冒号 ...

定义SQL组件

过程体用于定义组件功能的实现代码,在过程体中,通过@{变量名} 格式,将可变的输入表或输入字符串抽象为组件的输入参数,将可变的输出表抽象为组件的输出参数,实现SQL代码的复用。说明 一个组件可配置多个输入参数和输出参数,具体请根据...

线性支持向量机

英文逗号(,)kvDelimiter 否 当输入表数据为稀疏格式时,key 和 value 之间的分隔符。英文冒号(:)coreNum 否 计算的核心数,取值范围为正整数。系统自动分配 memSizePerCore 否 每个核心的内存,取值范围为1 MB~65536 MB。系统自动分配 ...

增加序号列

参数名称 是否必选 参数描述 默认值 inputTableName 是 输入表的表名。无 selectedColNames 否 输入表中,参与训练的列。列名以英文逗号(,)分隔,支持INT和DOUBLE类型。如果输入为稀疏格式,则支持STRING类型的列。所有列 ...

协同过滤etrec

无 inputTablePartitions 否 输入表中,参与训练的分区名称。全表 outputTableName 是 输出表的名称。无 outputTablePartition 否 输出表的Partition。无 similarityType 否 相似度类型。取值范围为 {wbcosine,asymcosine,jaccard}。...

逻辑回归多分类

var_rate"-DgoodValue="1"-DinputTableName="bank_data"参数名称 是否必选 参数描述 默认值 inputTableName 是 输入表的表名。无 featureColNames 否 输入表中,用于训练的特征列名。说明 特征数量不能超过两千万。所有数值列 labelColName...

预测

无 featureColNames 否 输入表中,参与预测的特征列,多个列以英文逗号(,)分隔。所有列 appendColNames 否 输入表中,附加至输出表的预测列。无 inputTablePartitions 否 输入表中,参与训练的分区。支持以下格式:Partition_name=value ...

合并列

参数名称 是否必选 参数描述 默认值 inputTableNames 是 输入表的表名,两个表以逗号(,)分隔。无 outputTableName 是 输出表的名称 无 selectedColNamesList 否 与输入表对应的已选中的列名列表:同一个表的各列按半角逗号(,)分隔。...

特征尺度变换

参数名称 是否必选 参数描述 默认值 inputTable 是 输入表的表名称。无 inputTablePartitions 否 输入表中指定参与训练的分区,格式为 Partition_name=value。如果是多级分区,格式为 name1=value1/name2=value2;如果指定多个分区,则需要...

数据视图

无 mapTable 是 输出映射表,数据视图对String类字符串会做一个统计,映射成数字(转换成Int方便机器学习识别和训练)无 selectedCols 是 输入表选择列名类型。无 labelCol 否 标签列。无 categoryCols 否 把Int或者Double字段当做枚举特征...

配置参数说明

完成输入和输出参数配置后,单击 手动设置血缘 开关,在 血缘配置 对话框中,单击输出表待配置的目标字段后的 图标,下拉选择对应的一个或者多个输入表以及输入表的字段。说明 对能自动解析输入和输出参数的SQL类节点类型,系统会自动匹配...

特征离散

参数名称 是否必选 参数描述 默认值 inputTable 是 输入表的表名称。无 inputTablePartitions 否 输入表中指定参与训练的分区,格式为 Partition_name=value。如果是多级分区,格式为 name1=value1/name2=value2;如果指定多个分区,则需要...

计算节点配置说明

完成输入和输出参数配置后,单击 字段血缘配置,在 血缘配置 对话框中,单击输出表待配置的目标字段后的 图标,下拉选择对应的一个或者多个输入表以及输入表的字段。说明 对能自动解析输入和输出参数的SQL类节点类型,系统会自动匹配输入表...

逻辑回归二分类

var_rate"-DgoodValue="1"-DinputTableName="bank_data"参数名称 是否必选 参数描述 默认值 inputTableName 是 输入表的表名。无 featureColNames 否 输入表中,用于训练的特征列名。说明 特征数量不能超过两千万。所有数值列 labelColName...

洛伦兹曲线

参数名称 是否必选 描述 默认值 inputTableName 是 输入表的名称。无 outputTableName 是 输出表名称列表。无 ColName 否 输入表选择列名称。支持选择多列,列之间使用英文逗号(,)分隔。无 N 否 分位数。100 inputTablePartitions 否 ...

计算节点配置说明

完成输入和输出参数配置后,单击 字段血缘配置,在 血缘配置 对话框中,单击输出表待配置的目标字段后的 图标,下拉选择对应的一个或者多个输入表以及输入表的字段。说明 对能自动解析输入和输出参数的SQL类节点类型,系统会自动匹配输入表...

安装Proxima CE包

输入表格式要求 表名 输入表的表名不能包含 tmp_字符串,否则会导致任务运行失败。输入表的表名和分区名的字符长度不能超过64,否则会导致任务运行失败。字段 固定字段 字段说明 字段数据类型 pk 查询时的pk值字段。默认为STRING类型。对于...

拆分

参数名称 是否必选 参数描述 默认值 inputTableName 是 输入表的表名。无 inputTablePartitions 否 输入表中,参与训练的分区。支持以下格式:Partition_name=value name1=value1/name2=value2:多级格式 说明 如果指定多个分区,则使用...

离散值特征分析

稀疏矩阵 当输入表数据为稀疏格式时,需要设置KV格式的特征。方式二:PAI命令方式 使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI命令调用,详情请参见 SQL脚本。PAI-name enum_feature_selection-project algo_public-...

聚类模型评估

无 selectedColNames 否 输入表中,参与评估的列名,多个列以英文逗号(,)分隔。该参数必须与模型存储的特征列保持一致。所有列 inputTablePartitions 否 输入表中,参与训练的分区。支持以下格式:Partition_name=value name1=value1/...

自定义SQL

本文介绍自定义SQL算子的使用方法...示例中的${table}在运行时将会自动替换为上游输入表的真实表名。输出字段 配置该算子的输出字段,可手动编辑也可通过解析sql语句自动生成。自动解析的sql格式如图所示:这两个行将解析出如下两个字段信息:

最佳实践:SQL组件

已在 ODPS SQL 节点中创建好输入表和输出表,建表语句请参见 附录:表结构说明。步骤一:定义组件 您需先参考 定义SQL组件 创建 get_top_n 组件,组件配置详情如下。组件参数配置 参数分类 参数名称 参数类型 参数描述 参数定义 输入参数 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储 物联网平台
新人特惠 爆款特惠 最新活动 免费试用