逻辑表的相关对象,指关联维度引用了当前表的其他逻辑表、当前表引用读取的表及引用了当前表的计算/集成任务(当前表是此任务的输入表)/逻辑表。本文为您介绍如何查看及管理逻辑表的相关对象。逻辑表相关对象入口 请参见 数据开发入口,...
逻辑表的相关对象,指关联维度引用了当前表的其他逻辑表、当前表引用读取的表及引用了当前表的计算/集成任务(当前表是此任务的输入表)/逻辑表。本文为您介绍如何查看及管理逻辑表的相关对象。逻辑表相关对象入口 请参见 数据开发入口,...
区域 描述 ① 搜索及筛选区 搜索及筛选区支持根据输入表类型及输入表名称来筛选关联的输入表。表类型包括维度逻辑表、事实逻辑表、汇总逻辑表及物理表。若当前未展示当前任务相关输入表,您可尝试单击 刷新当前任务输入表列表。② 任务输入...
区域 描述 ① 搜索及筛选区 搜索及筛选区支持根据输入表类型及输入表名称来筛选关联的输入表。表类型包括维度逻辑表、事实逻辑表、汇总逻辑表及物理表。若当前未展示当前任务相关输入表,您可尝试单击 刷新当前任务输入表列表。② 任务输入...
在 配置文件 区域,{"table":"tableName",/"tables":["tableName"]"column":[{"name":"","type":""}],"parameter":{} } 其中:table和tables:输入组件的单输入表和多输入表。多输入表的key值为tables,单输入表的key值为table。如果组件不...
在 配置文件 区域,{"table":"tableName",/"tables":["tableName"]"column":[{"name":"","type":""}],"parameter":{} } 其中:table和tables:输入组件的单输入表和多输入表。多输入表的key值为tables,单输入表的key值为table。如果组件不...
{"table":"tableName","columnMapping":[{"sourceColName":"","dstColName":""}],"parameter":{ } } 其中:table:输出组件的单输入表和多输入表。多输入表的key值为tables,单输入表的key值为table。如果组件不涉及表,则没有该参数。...
{"table":"tableName","columnMapping":[{"sourceColName":"","dstColName":""}],"parameter":{ } } 其中:table:输出组件的单输入表和多输入表。多输入表的key值为tables,单输入表的key值为table。如果组件不涉及表,则没有该参数。...
页签 参数 描述 字段设置 输入表中句子所在的列 输入表中句子所在列字段。词袋中词所在的列名 选择词袋中词所在的列名。输入的count结果表的words列 输入的count结果表的words列。输入的count结果表的count列 输入的count结果表的count列。...
概述 本文主要介绍Dataphin管道任务输入组件是否能配置逻辑表。详细信息 管道任务可以配置逻辑表。在组件库中选择LogicalTable组件。适用于 Dataphin
页签 参数 描述 字段设置 选择特征列 输入表中,用于训练的特征列。默认选中除标签列(例如Label)外的所有列,为可选项。选择目标列 该参数为必选项。单击 选择字段,选择标签列。输入表数据是否为稀疏格式 可选项。执行调优 计算核心数 ...
参数名称 是否必选 参数描述 outputTableName 是 输出表的名称 inputPartitions 否 训练输入表分区。输入表对应的输入分区,选中全表则为None。inputTableName 是 输入表的名称 filter 否 通过where条件实现数据过滤,与SQL类似,例如 age>...
BERT模型离线推理组件主要用于BERT模型的离线推理,利用已经训练完的BERT分类模型,对输入表中的文本进行分类。使用限制 仅支持DLC计算引擎。算法简介 BERT是一种基于Transformer的自然语言处理预训练模型。它通过在大量文本数据上预训练,...
参数名称 是否必须 描述 默认值 inputTableName 是 输入表的名称。无 inputTablePartitions 否 输入表中,参与训练的分区。系统支持以下格式:Partition_name=value name1=value1/name2=value2:多级分区 说明 指定多个分区时,分区之间...
页签 参数 描述 字段设置 选择特征列 输入表中,用于训练的特征列。默认选中除Label外的所有列,为可选项。选择目标列 该参数为必选项。单击 图标,在 选择字段 对话框中,输入关键字搜索列,选中后单击 确定。参数设置 并行计算核数 并行...
例如:输入表1选择table A的a字段,输入表2选择table B的b字段,输出表选择table C的c,d字段,则会生成以下血缘关系:表级血缘:table A->table C;table B->table C。字段级血缘:table A.a->table C.c;table B.b->table C.c;table A.a->...
例如:输入表1选择table A的a字段,输入表2选择table B的b字段,输出表选择table C的c,d字段,则会生成以下血缘关系:表级血缘:table A->table C;table B->table C。字段级血缘:table A.a->table C.c;table B.b->table C.c;table A.a->...
默认为空,即输入表中的所有向量参与计算。输入端口2的 id列表 格式为一列,每一行一个ID。例如:1 2 4 6 8 向量的列名列表 如f1,f2。参数设置 输出的距离最近的向量的数目 默认值为5。距离的计算方式 支持如下计算方式:euclidean cosine...
参数 描述 是否必选 inputTable 输入表名。是 inputTablePartitions 系统默认选择所有分区。指定输入表的分区:指定单个分区,格式为 partition_name=value。指定多个分区,格式为 name1=value1,name2=value2。说明 多个分区之间用英文逗号...
无 如果输入表为普通表非分区表,不建议设置 coreNum 和 memSizePerCore,由算法自动计算。在资源有限的情况下,您可以使用如下代码计算:def CalcCoreNumAndMem(row,centerCount,kOneCoreDataSize=1024):"""计算节点个数和单个节点内存。...
输入表中指定参与计算的分区 输入表的所有分区 outputTableName 是 输出表名 无 docIdCol 是 标识文章ID的列名 无 docContent 是 标识文章内容的列名,仅可指定一列。无 delimiter 否 句子的间隔字符集合。lifecycle 否 输入出表的生命周期...
第二种情况:如果A场景任意场景节点的输出表是B场景任意场景节点的输入表,C场景任意场景节点的输出表是B场景任意场景节点的输入表,那么C场景和A场景就是B场景的依赖场景。工作组若有创建数据标准、数据源和全局变量,不区分创建方式,...
问题描述 Quick BI交叉表配置的数据填报事件无法输入数据。问题原因 事件配置了字段关系映射。解决方案 取消字段关系映射配置。适用于 Quick BI 公共云
组件介绍 在实际业务实践中,存在大量类似的SQL代码过程,过程中输入表和输出表的结构一致或结构类型兼容,仅名称不同。此时,组件的开发者可将该SQL过程抽象为一个SQL组件节点,将可变的输入表抽象为输入参数,可变的输出表抽象为输出参数...
停用词过滤算法组件的两个输入桩为输入表和停用词表。输入表为需要过滤停用词的表。停用词表的格式为一列,每行对应一个停用词。Designer 支持通过可视化或PAI命令方式,配置停用词过滤算法组件相关参数。组件配置 您可以使用以下任意一种...
参数 是否必选 参数描述 默认值 inputTableName 是 输入表的名称。无 inputTablePartitions 否 输入表中,参与计算的分区。全表 yColName 是 输入表中,原始因变量的列名,支持数值类型。无 predictionColName 是 预测结果中,因变量的列名...
完成输入和输出参数配置后,单击 手动设置血缘 开关,在 血缘配置 对话框中,单击输出表待配置的目标字段后的 图标,下拉选择对应的一个或者多个输入表以及输入表的字段。说明 对能自动解析输入和输出参数的SQL类节点类型,系统会自动匹配...
完成输入和输出参数配置后,单击 手动设置血缘 开关,在 血缘配置 对话框中,单击输出表待配置的目标字段后的 图标,下拉选择对应的一个或者多个输入表以及输入表的字段。说明 对能自动解析输入和输出参数的SQL类节点类型,系统会自动匹配...
STRING 输入表的所有分区 selectedColNames 否 输入表中用于LDA的列名。STRING 输入表中所有的列名 topicNum 是 Topic的数量,取值范围为[2,500]。正整数 无 kvDelimiter 否 Key和Value间的分隔符。取值:空格 英文逗号(,)英文冒号(:)...
接受多表输入,且输入表的Schema可以不同。在Map函数中,您可以获取当前Record对应的Table信息。输入可以为空,不支持视图(View)作为输入。Reduce接受多路输出,可以输出到不同表,或者同一张表的不同分区。不同输出的Schema可以不同。...
无 tol 否 收敛误差 1.0e-06 enableSparse 否 输入数据是否为稀疏格式:true false false itemDelimiter 否 指当输入表数据为稀疏格式时,kv间的分隔符。空格 kvDelimiter 否 指当输入表数据为稀疏格式时,key和value的分隔符。冒号 ...
分区 如果输入表为分区表,您可以选中 分区 复选框,并配置 参数,按分区来查询数据。说明 如果该组件下游接入SQL脚本组件,则该分区过滤条件不生效,您需要在 SQL脚本 组件中配置过滤条件。参数 分区参数,通过该参数来过滤分区表数据。...
机器学习中,皮尔森系数用于计算输入表或分区两列(数值列)的Pearson相关系数,计算结果输出至输出表。组件配置 您可以使用以下任意一种方式,配置皮尔森系数组件参数。方式一:可视化方式 在 Designer 工作流页面配置组件参数。页签 参数...
自动计算 示例 以TF-IDF组件实例中的输出表作为TF-IDF组件的输入表,对应的参数设置如下:选择文档ID列:id 选择单词列:word 选择单词计数列:count 输出表有9列:docid、word、word_count(当前word在当前doc中出现次数)、total_word_...
输入表数据是稀疏格式 使用 KV 格式表示稀疏数据。kv间的分隔符 默认为英文逗号(,)。key和value的分隔符 默认为英文冒号(:)。参数设置 近邻个数 默认值为100。执行调优 核心数 默认系统自动分配。内存数 默认系统自动分配。方式二:PAI...
参数名称 是否必选 参数描述 默认值 inputTableName 是 输入表的表名。无 selectedColNames 否 输入表中,参与训练的列。列名以英文逗号(,)分隔,支持INT和DOUBLE类型。如果输入为稀疏格式,则支持STRING类型的列。所有列 ...
无 featureColNames 否 输入表中,用于训练的特征列名。说明 特征数量不能超过两千万。所有数值列 labelColName 是 输入表的标签列名。无 inputTablePartitions 否 输入表中,参与训练的分区。系统支持的格式包括:partition_name=value ...
通过该形式,告知组件使用者,在使用组件时需为输入参数配置与输入表结构参数个数相同,类型兼容的输入表。防止配置的输入表和组件定义的输入表字段个数不一致、字段类型不兼容,导致组件运行时出错。说明 该定义仅为参考,为您提供输出...
可对云计算资源中物理表进行查询,了解物理表基础信息、字段内容分布等情况。本文介绍如何进行物理表查询。...选中MaxCompute类型下的云计算资源,在关键字搜索框输入表名 ods_base_yhkh。选中输出表表名 ods_base_yhkh,查看物理表数据预览。
页签 参数 描述 字段设置 选择特征列 输入表中用于分析的列名称。附加列 附加在降维数据表后的列。参数设置 信息量比例 降维后数据信息占原来的比例。特征分解方式 分解特征的方式,取值如下:CORR COVAR_SAMP COVAR_POP 数据转换方式 转换...