拆分

ID列(ID列相同的不会被拆分)ID列中,内容相同的行数据不会被拆分,会被全量随机分配到 输出表1 或 输出表2 中。说明 勾选 高级选项 时展示,仅支持选择单列。阈值列 选择某个列名,对该列内容按阈值拆分,不支持String列。阈值 参考 阈值...

PLDA

主题模型用于在一系列文档中发现抽象主题...输出:输出依次为:topic-word频率贡献表、单词|主题输出表、主题|单词输出表、文档|主题输出表、主题|文档输出表、主题输出表。topic-word频率贡献表的输出格式如 输出格式 所示。图 2.输出格式

预测

输出结果列名 输出表的结果列。输出分数列名 输出i表的分数列。输出详细列名 输出表的详细列。稀疏矩阵 使用KV格式表示稀疏数据。key与value分隔符 默认为英文冒号(:)。kv对间的分隔符 默认为英文逗号(,)。执行调优 核心数 与参数 每个...

协同过滤etrec

输出表中item之间的分隔符 配置输出表中物品之间的分隔符,默认分隔符为空格。输出表中KV之间的分隔符 配置输出表中键值对(KV)之间的分隔符,默认为半角冒号(:),不支持使用空格。参数设置 相似度类型 支持 wbcosine、asymcosine 及 ...

自定义血缘配置

例如:输入表1选择table A的a字段,输入表2选择table B的b字段,输出表选择table C的c,d字段,则会生成以下血缘关系:表级血缘:table A->table C;table B->table C。字段级血缘:table A.a->table C.c;table B.b->table C.c;table A.a->...

自定义血缘配置

例如:输入表1选择table A的a字段,输入表2选择table B的b字段,输出表选择table C的c,d字段,则会生成以下血缘关系:表级血缘:table A->table C;table B->table C。字段级血缘:table A.a->table C.c;table B.b->table C.c;table A.a->...

回归模型评估

系统自动设置 组件输出 回归指标输出表的输出结果为JSON格式,包括以下参数。参数 描述 SST 总平方和 SSE 误差平方和 SSR 回归平方和 R2 判定系数 R 多重相关系数 MSE 均方误差 RMSE 均方根误差 MAE 平均绝对误差 MAD 平均误差 MAPE 平均...

定义SQL组件

通过该形式,告知组件使用者,在使用组件时需为输出参数配置与输出表结构参数个数相同,类型兼容的输出表。防止配置的输出表和组件定义的输出表字段个数不一致、字段类型不兼容,导致组件运行时出错。说明 该定义仅为参考,为您提供输出...

词频统计

本端口输出表按词语在文档中出现的顺序依次输出,没有统计词语的出现次数,因此同一文档中某个词汇可能出现多条记录。该输出表格式主要用于兼容Word2Vec组件。常见问题 参数 outputTableNameMulti 指定的表是 docId 列及docId列对应的文档...

安装Proxima CE包

输出表格式说明 运行向量检索后会自动生成一个输出表,并存储在MaxCompute表中,生成的输出表格式如下。表名:即您在运行Proxima CE的代码中所指定的输出表的表名。输出表的表名不能使用半角点号.,其为MaxCompute的特殊字符,会导致...

Dataphin集成任务MaxCompute输出组件输出表存在多级...

概述 Dataphin集成任务MaxCompute输出组件输出表存在多级分区时如何填写分区配置。MaxCompute数据源如果建表时存在多级分区,同步数据到该表时分区配置应该如何填写?详细信息 支持配置多级分区,分区之间用逗号相隔。适用于 Dataphin

特征重要性过滤

否 weightTable 特征重要性的权重表(即线性特征重要性、GBDT特征重要性、随机森林特征重要性的输出表)。是 outputTable 过滤出TopN特征的输出表。是 modelTable 特征过滤产出的模型文件。是 selectedCols 默认输入表的所有字段列名。否 ...

步骤三:配置节点运行配置

完成输入和输出参数配置后,单击 手动设置血缘 开关,在 血缘配置 对话框中,单击输出表待配置的目标字段后的 图标,下拉选择对应的一个或者多个输入表以及输入表的字段。说明 对能自动解析输入和输出参数的SQL类节点类型,系统会自动匹配...

步骤三:配置节点运行配置

完成输入和输出参数配置后,单击 手动设置血缘 开关,在 血缘配置 对话框中,单击输出表待配置的目标字段后的 图标,下拉选择对应的一个或者多个输入表以及输入表的字段。说明 对能自动解析输入和输出参数的SQL类节点类型,系统会自动匹配...

文章相似度

输出表中相似度列的列名 指定输出表中相似度列的列名,默认值为output。说明 列名中不能有特殊字符,只能用英文的a-z,A-Z及数字和下划线_,且以字母开头,名称的长度不超过128字节。参数设置 相似度计算方法 指定相似度计算方法类型。取值...

自定义SQL

适用场景 计算链路 计算引擎 是否支持 离线 MaxCompute 是 Hive 是 HiveStorage 是 RDS/MySQL 是 使用说明 输入节点 上游节点的输出表信息,包括“表名标识符”和“字段名称”。表名标识符 表名标识符在sql中作为占位符使用,在运行时此...

字符串相似度

页签 参数 描述 字段设置 输出表追加的列名 指定输出表中追加的列名。相似度计算中第一列的列名 默认为表中第一个STRING类型的列名。相似度计算中第二列的列名 默认为表中第二个STRING类型的列名。输出表中相似度列的列名 指定输出表中相似...

配置SQL赋值节点

行 所有行:输出表的所有行。指定行:输出表的指定行。列 所有列:输出表的所有列。指定列:输出表的指定列。连接符 如果您选择了所有行或所有列,您需要输入一个连接符来拼接多个值,拼接起来的字符串会赋值给该变量。说明 不能同时选中...

主成分分析

特征分解方式 分解特征的方式,取值如下:CORR COVAR_SAMP COVAR_POP 数据转换方式 转换为新数据的处理方式,取值如下:Simple Sub-Mean Normalization 执行调优 生命周期 指定输出表的生命周期,取值为正整数。节点个数 与 单个节点内存...

TF-IDF

自动计算 示例 以TF-IDF组件实例中的输出表作为TF-IDF组件的输入表,对应的参数设置如下:选择文档ID列:id 选择单词列:word 选择单词计数列:count 输出表有9列:docid、word、word_count(当前word在当前doc中出现次数)、total_word_...

ngram-count

countTableName 否 无 ngram-count以往的输出表,最终结果将合并这张表。countWordColName 否 选择第二列 count表中词所在的列名。countCountColName 否 选择第三列 count表中count所在的列。countTablePartitions 否 无 count表指定分区。...

奇异值分解

生命周期 指定输出表的生命周期。方式二:PAI命令方式 使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI命令调用,详情请参见 SQL脚本。PAI-name svd-project algo_public-DinputTableName=bank_data-DselectedColNames=col...

Table2KV

本文为您介绍如何使用Table2KV...输出说明 输出表 test_output rowid kv 0 0:1,1:1.1,2:2 1 0:0,1:1.2,2:3 2 0:1,1:2.3,2:4 3 0:1,1:0,2:5 输出表 test_key_map col_name col_index col_datatype col0 0 bigint col1 1 double col2 2 bigint

合并列

无 outputTableName 是 输出表的名称 无 selectedColNamesList 否 与输入表对应的已选中的列名列表:同一个表的各列按半角逗号(,)分隔。不同表的各列按照半角分号;分隔。说明 如果选择两张表所有的列,整个参数内容需用半角引号("")括...

K近邻

与 predictFeatureColNames 相同 outputTablePartition 否 输出表的分区。全表 k 否 最近邻的数量。取值范围为1~1000。100 enableSparse 否 输入表数据是否为稀疏格式。取值范围为 {true,false}。false itemDelimiter 否 如果输入表数据为...

Dataphin“数据集成”输入和输出字段间无法建立映射...

产品名称 Dataphin 产品模块 数据集成 概述 提供数据集成中输入表字段和输出表字段映射不上问题的排查思路 问题描述 管道集成时,字段映射有问题,有些字段可以映射上、有些映射不上,不管是同名映射还是同行映射都会出现:问题原因 表字段...

模型预测

0 输出桩 输出桩(从左到右)数据类型 对应PAI命令参数 输出表 MaxCompute表 output_table PAI命令及说明 PAI-project algo_public-name easy_rec_ext-Darn="acs:ram:xxx:role/aliyunodpspaidefaultrole"-Dbatch_size="1024"-Dbuckets="oss...

预测

选择输出表中的可展示字段。若需对模型进行评估,需要将标签列原样输出。可选。特征字段 用于预测的特征字段,数值类型,多选。注意:正常情况下请检查,在特征字段中不要勾选标签字段。输入特征为KV格式 目前DataTrust支持KV格式的特征...

基础向量检索

query_table query_table_float_smoke-输入 query 表-query_table_partition 20221111-输入 query 表 partition-output_table output_table_float_smoke-输出表-output_table_partition 20221111-输出表 partition-data_type float-向量...

开始模型训练

您在同一个画布中发起多个任务时,新任务产生的输出表将覆盖旧任务的输出表。如需保存指定任务的输出表,可在 任务列表 中,单击任务后的 点击保存,保存指定任务。说明 只能保存最新的一条任务,且该任务必须已执行成功。如果任务已被覆盖...

皮尔森系数

机器学习中,皮尔森系数用于计算输入表或分区两列(数值列)的Pearson相关系数,计算结果输出至输出表。组件配置 您可以使用以下任意一种方式,配置皮尔森系数组件参数。方式一:可视化方式 在 Designer 工作流页面配置组件参数。页签 参数...

停用词过滤

所有分区 outputTableName 是 输出表的名称。无 selectedColNames 是 指定待过滤的列,多列以英文逗号(,)分隔。无 lifecycle 否 输出表的生命周期。取值范围为正整数。无 coreNum 否 计算的核心数。系统自动分配 memSizePerCore 否 每个...

句子拆分

lifecycle 否 输入出表的生命周期 无 coreNum 否 参与计算的核心数 系统自动计算 memSizePerCore 否 每个核心需要的内存 系统自动计算 示例 输出表为两列,分别是doc_id和sentence。doc_id sentence 1000894 早在2008年,上交所便发布了...

协方差

输入表的所有分区 outputTableName 是 输出表名称。无 selectedColNames 否 输入表选择列名类型。选择全部列 lifecycle 否 指定输出表的生命周期。无 coreNum 否 计算的核心数,取值范围为正整数。取值范围[1,9999]。默认自动计算 ...

内积和余弦距离

table_xx-输入 query 表-query_table_partition 20210706-输入 query 表 partition-output_table output_table_xx-输出表-output_table_partition 20210706-输出表 partition-data_type float-向量数据类型-dimension 8-向量维度-oss_...

安全联合分析TrustDA/MPCSQL

一、什么是联合分析?功能介绍:在原始数据不可见的前提下,提供SQL模式对多方数据进行联合分析。...当前,暂不支持在【控制台】直接查看输出结果,需要使用INSERT OVERWRITE TABLE 语句将输出结果写在了输出表中,在输出表中查看统计结果。

向量召回评估

上述命令展示了u2i召回计算hitrate的例子,该命令指定按照内积方式计算向量相似度(距离),不要求距离计算的严格性,按批次计算,每次计算1024个true_seq_table里的内容,指定了1个worker,内存是20 GB,输出表hitrate_details和total_...

混淆矩阵

参数 是否必选 描述 默认值 inputTableName 是 输入表的名称,即预测输出表。无 inputTablePartition 否 输入表的分区。全表 outputTableName 是 输出表的名称,用于存储混淆矩阵。无 labelColName 是 原始标签列的名称。无 ...

创建ID安全匹配任务

数据输出 结果输出表可输出给双方或其中一方。求交结果表:指用于隐私计算结果输出的表。如果原表有数据,则将被覆盖。数据分区:分区分为动态分区和静态分区,动态分区按照日、小时调度,可点击数据分区后的图标查看参数说明。结果字段...

新建Flink Vvr SQL类型的公共节点

(条件必选)如果代码中存在输入、输出表或者节点变量,则需要手动添加节点的输入、输出和节点变量,或通过单击编辑页面的 图标,自动解析公共节点的输入、输出和节点变量。这里以解析为例介绍,详细参数如下表所示。单击编辑页面的 图标,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库Cassandra版 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储
新人特惠 爆款特惠 最新活动 免费试用