pe输入表-pe输入表文档介绍内容-阿里云

查看及管理逻辑表相关对象

逻辑表的相关对象，指关联维度引用了当前表的其他逻辑表、当前表引用读取的表及引用了当前表的计算/集成任务（当前表是此任务的输入表）/逻辑表。本文为您介绍如何查看及管理逻辑表的相关对象。逻辑表相关对象入口请参见数据开发入口，...

查看及管理逻辑表相关对象

逻辑表的相关对象，指关联维度引用了当前表的其他逻辑表、当前表引用读取的表及引用了当前表的计算/集成任务（当前表是此任务的输入表）/逻辑表。本文为您介绍如何查看及管理逻辑表的相关对象。逻辑表相关对象入口请参见数据开发入口，...

查看及管理任务相关对象

区域描述 ① 搜索及筛选区搜索及筛选区支持根据输入表类型及输入表名称来筛选关联的输入表。表类型包括维度逻辑表、事实逻辑表、汇总逻辑表及物理表。若当前未展示当前任务相关输入表，您可尝试单击刷新当前任务输入表列表。② 任务输入...

查看及管理任务相关对象

区域描述 ① 搜索及筛选区搜索及筛选区支持根据输入表类型及输入表名称来筛选关联的输入表。表类型包括维度逻辑表、事实逻辑表、汇总逻辑表及物理表。若当前未展示当前任务相关输入表，您可尝试单击刷新当前任务输入表列表。② 任务输入...

配置脚本模式输入组件

在配置文件区域，{"table":"tableName",/"tables":["tableName"]"column":[{"name":"","type":""}],"parameter":{} } 其中：table和tables：输入组件的单输入表和多输入表。多输入表的key值为tables，单输入表的key值为table。如果组件不...

配置脚本模式输入组件

在配置文件区域，{"table":"tableName",/"tables":["tableName"]"column":[{"name":"","type":""}],"parameter":{} } 其中：table和tables：输入组件的单输入表和多输入表。多输入表的key值为tables，单输入表的key值为table。如果组件不...

配置脚本模式组件

{"table":"tableName","columnMapping":[{"sourceColName":"","dstColName":""}],"parameter":{ } } 其中：table：输出组件的单输入表和多输入表。多输入表的key值为tables，单输入表的key值为table。如果组件不涉及表，则没有该参数。...

配置脚本模式组件

{"table":"tableName","columnMapping":[{"sourceColName":"","dstColName":""}],"parameter":{ } } 其中：table：输出组件的单输入表和多输入表。多输入表的key值为tables，单输入表的key值为table。如果组件不涉及表，则没有该参数。...

ngram-count

页签参数描述字段设置 输入表中句子所在的列 输入表中句子所在列字段。词袋中词所在的列名选择词袋中词所在的列名。输入的count结果表的words列输入的count结果表的words列。输入的count结果表的count列输入的count结果表的count列。...

Dataphin管道任务输入组件是否能配置逻辑表

概述本文主要介绍Dataphin管道任务输入组件是否能配置逻辑表。详细信息管道任务可以配置逻辑表。在组件库中选择LogicalTable组件。适用于 Dataphin

线性模型特征重要性

页签参数描述字段设置选择特征列 输入表中，用于训练的特征列。默认选中除标签列（例如Label）外的所有列，为可选项。选择目标列该参数为必选项。单击选择字段，选择标签列。输入表数据是否为稀疏格式可选项。执行调优计算核心数 ...

过滤与映射

参数名称是否必选参数描述 outputTableName 是输出表的名称 inputPartitions 否训练输入表分区。输入表对应的输入分区，选中全表则为None。inputTableName 是 输入表的名称 filter 否通过where条件实现数据过滤，与SQL类似，例如 age>...

BERT模型离线推理

BERT模型离线推理组件主要用于BERT模型的离线推理，利用已经训练完的BERT分类模型，对输入表中的文本进行分类。使用限制仅支持DLC计算引擎。算法简介 BERT是一种基于Transformer的自然语言处理预训练模型。它通过在大量文本数据上预训练，...

协方差

参数名称是否必须描述默认值 inputTableName 是 输入表的名称。无 inputTablePartitions 否 输入表中，参与训练的分区。系统支持以下格式：Partition_name=value name1=value1/name2=value2：多级分区说明指定多个分区时，分区之间...

随机森林特征重要性

页签参数描述字段设置选择特征列 输入表中，用于训练的特征列。默认选中除Label外的所有列，为可选项。选择目标列该参数为必选项。单击图标，在选择字段对话框中，输入关键字搜索列，选中后单击确定。参数设置并行计算核数并行...

自定义血缘配置

例如：输入表1选择table A的a字段，输入表2选择table B的b字段，输出表选择table C的c,d字段，则会生成以下血缘关系：表级血缘：table A->table C;table B->table C。字段级血缘：table A.a->table C.c;table B.b->table C.c;table A.a->...

自定义血缘配置

例如：输入表1选择table A的a字段，输入表2选择table B的b字段，输出表选择table C的c,d字段，则会生成以下血缘关系：表级血缘：table A->table C;table B->table C。字段级血缘：table A.a->table C.c;table B.b->table C.c;table A.a->...

语义向量距离

默认为空，即输入表中的所有向量参与计算。输入端口2的 id列表格式为一列，每一行一个ID。例如：1 2 4 6 8 向量的列名列表如f1，f2。参数设置输出的距离最近的向量的数目默认值为5。距离的计算方式支持如下计算方式：euclidean cosine...

特征重要性过滤

参数描述是否必选 inputTable 输入表名。是 inputTablePartitions 系统默认选择所有分区。指定输入表的分区：指定单个分区，格式为 partition_name=value。指定多个分区，格式为 name1=value1,name2=value2。说明多个分区之间用英文逗号...

双样本T检验

无如果输入表为普通表非分区表，不建议设置 coreNum 和 memSizePerCore，由算法自动计算。在资源有限的情况下，您可以使用如下代码计算：def CalcCoreNumAndMem(row,centerCount,kOneCoreDataSize=1024):"""计算节点个数和单个节点内存。...

句子拆分

输入表中指定参与计算的分区 输入表的所有分区 outputTableName 是输出表名无 docIdCol 是标识文章ID的列名无 docContent 是标识文章内容的列名，仅可指定一列。无 delimiter 否句子的间隔字符集合。lifecycle 否输入出表的生命周期...

按线上场景关联

第二种情况：如果A场景任意场景节点的输出表是B场景任意场景节点的输入表，C场景任意场景节点的输出表是B场景任意场景节点的输入表，那么C场景和A场景就是B场景的依赖场景。工作组若有创建数据标准、数据源和全局变量，不区分创建方式，...

Quick BI交叉表配置的数据填报事件无法输入数据

问题描述 Quick BI交叉表配置的数据填报事件无法输入数据。问题原因事件配置了字段关系映射。解决方案取消字段关系映射配置。适用于 Quick BI 公共云

SQL组件概述

组件介绍在实际业务实践中，存在大量类似的SQL代码过程，过程中输入表和输出表的结构一致或结构类型兼容，仅名称不同。此时，组件的开发者可将该SQL过程抽象为一个SQL组件节点，将可变的输入表抽象为输入参数，可变的输出表抽象为输出参数...

停用词过滤

停用词过滤算法组件的两个输入桩为输入表和停用词表。输入表为需要过滤停用词的表。停用词表的格式为一列，每行对应一个停用词。Designer 支持通过可视化或PAI命令方式，配置停用词过滤算法组件相关参数。组件配置您可以使用以下任意一种...

回归模型评估

参数是否必选参数描述默认值 inputTableName 是 输入表的名称。无 inputTablePartitions 否 输入表中，参与计算的分区。全表 yColName 是 输入表中，原始因变量的列名，支持数值类型。无 predictionColName 是预测结果中，因变量的列名...

步骤三：配置节点运行配置

完成输入和输出参数配置后，单击手动设置血缘开关，在血缘配置对话框中，单击输出表待配置的目标字段后的图标，下拉选择对应的一个或者多个输入表以及输入表的字段。说明对能自动解析输入和输出参数的SQL类节点类型，系统会自动匹配...

步骤三：配置节点运行配置

完成输入和输出参数配置后，单击手动设置血缘开关，在血缘配置对话框中，单击输出表待配置的目标字段后的图标，下拉选择对应的一个或者多个输入表以及输入表的字段。说明对能自动解析输入和输出参数的SQL类节点类型，系统会自动匹配...

PLDA

STRING 输入表的所有分区 selectedColNames 否 输入表中用于LDA的列名。STRING 输入表中所有的列名 topicNum 是 Topic的数量，取值范围为[2,500]。正整数无 kvDelimiter 否 Key和Value间的分隔符。取值：空格英文逗号（,）英文冒号（:）...

输入与输出

接受多表输入，且输入表的Schema可以不同。在Map函数中，您可以获取当前Record对应的Table信息。输入可以为空，不支持视图（View）作为输入。Reduce接受多路输出，可以输出到不同表，或者同一张表的不同分区。不同输出的Schema可以不同。...

奇异值分解

无 tol 否收敛误差 1.0e-06 enableSparse 否输入数据是否为稀疏格式：true false false itemDelimiter 否指当输入表数据为稀疏格式时，kv间的分隔符。空格 kvDelimiter 否指当输入表数据为稀疏格式时，key和value的分隔符。冒号 ...

读数据表

分区如果输入表为分区表，您可以选中分区复选框，并配置参数，按分区来查询数据。说明如果该组件下游接入SQL脚本组件，则该分区过滤条件不生效，您需要在 SQL脚本组件中配置过滤条件。参数分区参数，通过该参数来过滤分区表数据。...

皮尔森系数

机器学习中，皮尔森系数用于计算输入表或分区两列（数值列）的Pearson相关系数，计算结果输出至输出表。组件配置您可以使用以下任意一种方式，配置皮尔森系数组件参数。方式一：可视化方式在 Designer 工作流页面配置组件参数。页签参数...

TF-IDF

自动计算示例以TF-IDF组件实例中的输出表作为TF-IDF组件的输入表，对应的参数设置如下：选择文档ID列：id 选择单词列：word 选择单词计数列：count 输出表有9列：docid、word、word_count（当前word在当前doc中出现次数）、total_word_...

K近邻

输入表数据是稀疏格式使用 KV 格式表示稀疏数据。kv间的分隔符默认为英文逗号（,）。key和value的分隔符默认为英文冒号（:）。参数设置近邻个数默认值为100。执行调优核心数默认系统自动分配。内存数默认系统自动分配。方式二：PAI...

增加序号列

参数名称是否必选参数描述默认值 inputTableName 是 输入表的表名。无 selectedColNames 否 输入表中，参与训练的列。列名以英文逗号（,）分隔，支持INT和DOUBLE类型。如果输入为稀疏格式，则支持STRING类型的列。所有列 ...

逻辑回归多分类

无 featureColNames 否 输入表中，用于训练的特征列名。说明特征数量不能超过两千万。所有数值列 labelColName 是 输入表的标签列名。无 inputTablePartitions 否 输入表中，参与训练的分区。系统支持的格式包括：partition_name=value ...

定义SQL组件

通过该形式，告知组件使用者，在使用组件时需为输入参数配置与输入表结构参数个数相同，类型兼容的输入表。防止配置的输入表和组件定义的输入表字段个数不一致、字段类型不兼容，导致组件运行时出错。说明该定义仅为参考，为您提供输出...

物理表查询

可对云计算资源中物理表进行查询，了解物理表基础信息、字段内容分布等情况。本文介绍如何进行物理表查询。...选中MaxCompute类型下的云计算资源，在关键字搜索框输入表名 ods_base_yhkh。选中输出表表名 ods_base_yhkh，查看物理表数据预览。

主成分分析

页签参数描述字段设置选择特征列 输入表中用于分析的列名称。附加列附加在降维数据表后的列。参数设置信息量比例降维后数据信息占原来的比例。特征分解方式分解特征的方式，取值如下：CORR COVAR_SAMP COVAR_POP 数据转换方式转换...

pe输入表

新品推荐