分区表输入示例

本文为您介绍MapReduce的分区表输入示例。示例一:public static void main(String[]args)throws Exception { JobConf job=new JobConf();LinkedHashMap,String>input=new LinkedHashMap,String>();input.put("pt","123456");InputUtils....

输入

public static class MyVertex extends Vertex,LongWritable,LongWritable,LongWritable>{/*将vertex的边,按照输入表的格式再写到结果表。输入表与输出表的格式和数据都相同。param context*运行时上下文。param messages*输入消息。...

输入

public static class MyVertex extends Vertex,LongWritable,LongWritable,LongWritable>{/*将vertex的边,按照输入表的格式再写到结果表。输入表与输出表的格式和数据都相同。param context*运行时上下文。param messages*输入消息。...

Quick BI斜线表头输入文字方法

概述 Quick BI斜线表头输入文字方法。详细信息 在画斜线的方格内输入两个值,用英文逗号隔开(比如 a,b),再去配置斜线单元格。适用于 Quick BI

Dataphin管道任务里SQL Server输入组件清单下拉为空...

问题描述 Dataphin管道任务里SQL Server输入组件清单下拉为空,但是在数据库工具相同账号可以正常连接加载。问题原因 数据源中配置JDBC URL关键字不正确。解决方案 按照标准格式为:jdbc:sqlserver:/地址:端口;databaseName=数据库名称 ...

Dataphin集成任务输入中有数据,任务同步成功,...

问题描述 Dataphin集成任务输入中有数据,任务同步成功,输出源数据查询为空。2021-11-08 17:03:06.479[job-1239184]INFO DlinkTransBase-任务启动时刻:2021-11-08 17:03:04 任务结束时刻:2021-11-08 17:03:06 任务总计耗时:1s 任务...

线性模型特征重要性

参数 是否必选 描述 默认值 inputTableName 输入表的表名。无 outputTableName 是 输出表的表名。无 labelColName 输入表的标签列名。无 modelName 是 输入的模型名称。无 featureColNames 否 输入表选择的特征列。除Label外的所有列...

过滤与映射

过滤与映射组件可以对数据按照过滤表达式进行筛选,并且您可以修改输出字段名称。...inputTableName 输入表的名称 filter 否 通过where条件实现数据过滤,与SQL类似,例如 age>40。说明 仅支持以下操作符:=!

协方差

参数名称 是否必须 描述 默认值 inputTableName 输入表的名称。无 inputTablePartitions 否 输入表中,参与训练的分区。系统支持以下格式:Partition_name=value name1=value1/name2=value2:多级分区 说明 指定多个分区时,分区之间...

随机森林特征重要性

参数名称 是否必选 描述 默认值 inputTableName 输入表的名称。无 outputTableName 是 输出表的名称。无 labelColName 输入表的标签列名。无 modelName 是 输入的模型名称。无 featureColNames 否 输入表选择的特征列。除Label外的...

语义向量距离

输入表名。无 inputTablePartitions 否 输入表中指定参与计算的分区。输入表的所有分区 outputTableName 是 输出表名。无 idTableName 否 需要计算相近向量的ID的列表所在表名。格式为一列,每一行一个ID。默认为空,即输入表中的所有向量...

句子拆分

PAI-name SplitSentences-project algo_public-DinputTableName="test_input"-DoutputTableName="test_output"-DdocIdCol="doc_id"-DdocContent="content"-Dlifecycle=30 参数名称 是否必选 描述 默认值 inputTableName 输入表名 无 ...

双样本T检验

所有分区 xColName 输入表x中参与T检验的列,只能为DOUBLE或INT类型。无 yTableName 输入表名称y。无 yTablePartitions 否 输入表y中参与检验的分区。系统支持以下格式:Partition_name=value name1=value1/name2=value2:多级分区 ...

回归模型评估

参数 是否必选 参数描述 默认值 inputTableName 输入表的名称。无 inputTablePartitions 否 输入表中,参与计算的分区。全表 yColName 输入表中,原始因变量的列名,支持数值类型。无 predictionColName 是 预测结果中,因变量的列名...

PLDA

参数名称 是否必选 描述 类型 默认值 inputTableName 输入表的名称。STRING 无 inputTablePartitions 否 输入表中,参与训练的分区。系统支持以下格式:Partition_name=value name1=value1/name2=value2:多级分区 说明 指定多个分区时...

线性支持向量机

参数名称 是否必选 描述 默认值 inputTableName 输入表的名称。无 inputTableParitions 否 输入表中,参与训练的分区。系统支持以下格式:Partition_name=value name1=value1/name2=value2:多级分区 说明 指定多个分区时,分区之间使用...

Table2KV

参数名称 是否必选 参数描述 默认值 inputTableName 输入表的表名称。无 inputTablePartitions 否 输入表中指定参与训练的分区,格式为 Partition_name=value。如果是多级分区,格式为 name1=value1/name2=value2;如果指定多个分区,则...

TF-IDF

参数名称 是否必选 描述 默认值 inputTableName 输入表名称。无 inputTablePartitions 否 输入表中,参与训练的分区。格式为 partition_name=value。如果是多级格式为 name1=value1/name2=value2。如果是指定多个分区,中间用英文逗号...

增加序号列

参数名称 是否必选 参数描述 默认值 inputTableName 输入表的表名。无 selectedColNames 否 输入表中,参与训练的列。列名以英文逗号(,)分隔,支持INT和DOUBLE类型。如果输入为稀疏格式,则支持STRING类型的列。所有列 ...

逻辑回归多分类

所有数值列 labelColName 输入表的标签列名。无 inputTablePartitions 否 输入表中,参与训练的分区。系统支持的格式包括:partition_name=value name1=value1/name2=value2:多级分区 说明 指定多个分区时,分区间使用英文逗号(,)...

主成分分析

无 selectedColNames 输入表中用于分析的列名称。使用逗号分隔,支持INT和DOUBLE类型。无 eigOutputTableName 是 特征向量与特征值的输出表。无 princompOutputTableName 是 进行主成分降维降噪后的结果输出表。无 transType 否 转换原...

字符串相似度-topN

参数名称 是否必选 描述 默认值 inputTableName 输入表的名称。无 mapTableName 是 映射表的名称。无 是 输出表的名称。无 inputSelectedColName1 否 在相似度计算中,左表的列名。表中第一个STRING类型的列名 inputSelectedColName2 否...

协同过滤etrec

无 userColName 输入表中的 user 列名。无 itemColName 输入表中的 item 列名。无 inputTablePartitions 否 输入表中,参与训练的分区名称。全表 outputTableName 是 输出表的名称。无 outputTablePartition 否 输出表的Partition。...

数据视图

无 mapTable 是 输出映射表,数据视图对String类字符串会做一个统计,映射成数字(转换成Int方便机器学习识别和训练)无 selectedCols 输入表选择列名类型。无 labelCol 否 标签列。无 categoryCols 否 把Int或者Double字段当做枚举特征...

预测

参数 是否必选 描述 默认值 inputTableName 输入表的名称。无 featureColNames 否 输入表中,参与预测的特征列,多个列以英文逗号(,)分隔。所有列 appendColNames 否 输入表中,附加至输出表的预测列。无 inputTablePartitions 否 ...

特征尺度变换

参数名称 是否必选 参数描述 默认值 inputTable 输入表的表名称。无 inputTablePartitions 否 输入表中指定参与训练的分区,格式为 Partition_name=value。如果是多级分区,格式为 name1=value1/name2=value2;如果指定多个分区,则需要...

文本摘要

参数名称 是否必选 描述 默认值 inputTableName 输入表名。无 inputTablePartitions 否 输入表中指定参与计算的分区。输入表所有分区 outputTableName 是 输出表名。无 docIdCol 是 标识文章ID的列名。无 sentenceCol 是 句子列,仅可...

特征离散

参数名称 是否必选 参数描述 默认值 inputTable 输入表的表名称。无 inputTablePartitions 否 输入表中指定参与训练的分区,格式为 Partition_name=value。如果是多级分区,格式为 name1=value1/name2=value2;如果指定多个分区,则需要...

逻辑回归二分类

所有数值列 labelColName 输入表的标签列名。无 inputTablePartitions 否 输入表中,参与训练的分区。系统支持的格式包括:partition_name=value name1=value1/name2=value2:多级分区 说明 指定多个分区时,分区间使用英文逗号(,)...

合并列

参数名称 是否必选 参数描述 默认值 inputTableNames 输入表的表名,两个表以逗号(,)分隔。无 outputTableName 是 输出表的名称 无 selectedColNamesList 否 与输入表对应的已选中的列名列表:同一个表的各列按半角逗号(,)分隔。...

洛伦兹曲线

参数名称 是否必选 描述 默认值 inputTableName 输入表的名称。无 outputTableName 是 输出表名称列表。无 ColName 否 输入表选择列名称。支持选择多列,列之间使用英文逗号(,)分隔。无 N 否 分位数。100 inputTablePartitions 否 ...

Split Word

所有分区 selectedColNames 输入表中用于分词的列名。如果指定多列,用英文逗号(,)分隔。无 dictTableName 否 是否使用自定义词典表。自定义词典表只有一列,每一行是一个词。无 tokenizer 否 过滤器类型。取值为TAOBAO_CHN或INTERNET...

随机采样

参数名称 是否必选 参数描述 默认值 inputTableName 输入表的名称 无 inputTablePartitions 否 输入表中,参与训练的分区。支持以下格式:Partition_name=value name1=value1/name2=value2:多级格式 说明 如果指定多个分区,则使用半角...

拆分

参数名称 是否必选 参数描述 默认值 inputTableName 输入表的表名。无 inputTablePartitions 否 输入表中,参与训练的分区。支持以下格式:Partition_name=value name1=value1/name2=value2:多级格式 说明 如果指定多个分区,则使用...

离散值特征分析

参数名称 是否必选 描述 默认值 inputTableName 输入表的名称。无 inputTablePartitions 否 输入表中,参与训练的分区。系统支持以下格式:Partition_name=value name1=value1/name2=value2:多级分区 说明 指定多个分区时,分区之间...

GBDT二分类V2

否 选择特征列 输入表中用于训练的特征列名数组。非稀疏向量格式时,支持类型double/bigint/string;稀疏向量格式时,支持string类型,并且只能选择1列。无 选择类别型特征列 否 非稀疏向量格式,选择作为类别型特征(categorical ...

聚类模型评估

参数 是否必选 描述 默认值 inputTableName 输入表的名称。无 selectedColNames 否 输入表中,参与评估的列名,多个列以英文逗号(,)分隔。该参数必须与模型存储的特征列保持一致。所有列 inputTablePartitions 否 输入表中,参与训练...

词频统计

是否必选 描述 默认值 inputTableName 输入表名称。无 docId 是 标识文档ID的列名,仅可指定一列。无 docContent 是 标识文档内容的列名,仅可指定一列。无 outputTableNameMulti 是 输出保序词语表名。无 outputTableNameTriple 否 ...

模型预测

可视化配置参数 输入桩 输入桩(从左到右)建议上游组件 对应PAI命令参数 是否必选 输入模型 数据类型:OSS存储的模型 支持的组件:模型训练 saved_model_dir 输入表 数据类型:MaxCompute表 支持的组件:SQL脚本、读数据表 input_table...

one-hot编码

参数名称 是否必选 描述 默认值 inputTable 输入表的名称 无 inputTablePartitions 否 输入表选择的分区名称 输入表的所有分区 binaryCols 是 one-hot编码字段,必须是枚举类特征,字段可以是任意类型。无 reserveCols 否 勾选的字段...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库Cassandra版 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 物联网平台
新人特惠 爆款特惠 最新活动 免费试用