Label Encoder

例如,一个有三个取值的离散变量“颜色”(红色、绿色、蓝色),使用Label Encoder可以将其转换为整数变量(0、1、2)。在Label Encoder中,对于每个离散变量,将其所有取值按照字典序排序,然后将每个取值映射到一个整数。Label Encoder的...

横向LabelEncoder

例如,一个有三个取值的离散变量“颜色”(红色、绿色、蓝色),使用Label Encoder可以将其转换为整数变量(0、1、2)。在Label Encoder中,对于每个离散变量,将其所有取值按照字典序排序,然后将每个取值映射到一个整数。Label Encoder的...

PMI

背景信息 互信息(Mutual Information)是信息论里一种有用的信息度量,它可以看成是一个随机变量中包含的另一个随机变量的信息量,或者说是一个随机变量由于已知另一个随机变量而减少的不确定。PMI用来量化两个词之间的相关,定义为:...

相关性分析

相关分析组件支持对历史数据进行相关分析,计算出指定变量之间的相关系数,并绘制出相关图表。相关分析是指对两个或多个具备相关变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关的元素之间需要存在一定的联系或者...

特征离散

应用场景:例如:一组数据需做离散化处理,分段间隔为0.5,对数据【2.2,2.9,1,1.4,1.6,2.7】做离散化处理后为【2.0,3.0,1.0,1.5,1.5,2.5】计算逻辑原理 特征离散化:有效的离散化能减少算法的时间和空间开销,提高系统对样本的分类聚类能力...

条件随机

条件随机场CRF(conditional random field)是给定一组输入随机变量条件下,另一组输出随机变量条件的概率分布模型,其特点是假设输出随机变量构成马尔可夫随机场。条件随机场可用于不同的预测问题,主要应用于标注问题中,其中最典型的是...

归一化

参数说明 IN端口-输入参数 参数名 参数描述 是否必填 输入数据类型 数据源类型 IN 需要归一化处理的变量 整数或浮点数 说明 若存在非数值数据,则会抛出异常。不限 PARAM端口-输入参数 参数名 参数描述 是否必填 参数默认值 参数范围 ...

声明

简介 在一个块中使用的所有变量必须在该块的声明小节中声明(唯一的例外是在一个整数范围上迭代的 FOR 循环变量会被自动声明为一个整数变量,并且相似地在一个游标结果上迭代的 FOR 循环变量会被自动地声明为一个记录变量)。PL/SQL变量...

数据归一化

在很多项目中,数据来源不同,量纲及量纲单位不同,为了让它们具备可比,需要采用标准化方法消除由此带来的偏差。归一化的方法包括:min-max和z-score两种方法。计算逻辑原理 min-max归一化:将数据进行一次线性变换,将数据映射到[0,1]...

稳态数据挑选

否 滑动窗口检验 滑动窗口检验 组合统计检验 变量维度:多变量-多变量组合 参数名 参数描述 是否必填 参数默认值 参数范围 显著水平1/否 0.01[0,1]显著水平2/否 0.01[0,1]稳态提取方法:滑动窗口检验 参数名 参数描述 是否必填 参数...

卡方分布拟合

其定义为:若 个独立的随机变量,且均符合标准正态分布,则这 个随机变量的平方和 为服从自由度为 的卡方分布,记为 也可以记为:卡方分布的期望和方差分别为:其中,为卡方分布的自由度。KS检验:KS检验可以用于检验数据是否符合某种分布...

包规格

declaration 可以是以下任意内容:变量声明 记录声明 集合声明 REF CURSOR 和游标变量声明 TYPE 定义(对于记录、集合和 REF CURSOR)异常 对象变量声明 proc_name 公共过程的名称。argname 参数的名称。参数在函数或过程正文中通过此名称...

切流与效果观察

在切入正式流量前需要注意以下几点:1、保证切流的随机性;2、避免其他流量的掺杂,控制变量对比效果。3、由于推荐返回的结果是根据某个user_id的感兴趣程度从高到低返回,所以不要推荐结果做重排序等操作。4、预留QPS及 弹性计费说明。5、...

评分卡训练

评分卡是信用风险评估领域常用的建模工具,其原理是通过分箱输入将原始变量离散化后再使用线性模型(逻辑回归或线性回归等)进行模型训练,其中包含特征选择及分数转换等功能。同时也支持在训练过程中为变量添加约束条件。说明 如果未指定...

协方差

期望值分别为E(X)=μ与E(Y)=ν的两个实数,其随机变量X与Y之间的协方差定义为:cov(X,Y)=E((X-μ)(Y-ν))。组件配置 您可以使用以下任意一种方式,配置协方差组件参数。方式一:可视化方式 在 Designer 工作流页面配置组件参数。页签 参数 ...

语音审核增强版接入指南

常见获取环境变量方式:#获取RAM用户AccessKey ID:os.environ['ALIBABA_CLOUD_ACCESS_KEY_ID']#获取RAM用户AccessKey Secret:os.environ['ALIBABA_CLOUD_ACCESS_KEY_SECRET']access_key_id='建议从环境变量中获取RAM用户AccessKey ID',...

高斯分布拟合

计算逻辑原理 高斯分布:若随机变量 服从一个位置参数、尺度参数为 的概率分布,且其概率密度函数为:则这个随机变量就服从正态分布,记作。正态分布有两个参数,即期望 和方差,当 时,就称为标准正态分布。KS检验:KS检验可以用于检验...

产品简介

数据管理 变量 自定义数据变量,重复使用,支持定制化变量脚本 设备数据点变量、http变量、告警变量、固定值变量、数据库变量、MQTT变量、虚拟变量、文件变量、Nats变量、kafka变量、动态变量 导入导出 固定值变量 提供固定数值的变量,...

比值控制

参数说明 MV端口-输入参数 参数名 参数描述 是否必填 输入数据类型 数据源类型 操作变量 需要控制的操作变量 整数或浮点数 说明 若存在非数值类型数据,则会抛出异常。不限 DV端口-输入参数 参数名 参数描述 是否必填 输入数据类型 数据...

CADT模板及模板变量介绍

说明 模板变量仅适合使用CADT的API方式创建应用时使用,目前CADT支持两种类型的模板变量,分别是:局部模板变量:局部变量是绑定一个资源的具体属性的变量,例如:定义ECS的资源名为变量,定义RDS的付费方式为变量。全局模板变量:全局变量...

通过环境变量配置API-KEY

环境变量是操作系统中用于存储有关系统环境的信息的变量。您可以通过环境变量来配置API-KEY,这样即使您的代码库被公开,API-KEY也不会泄漏。您可以根据您的操作系统与使用场景来确定添加API-KEY到环境变量中的方法。Linux系统 当您使用...

组件参考:所有组件汇总

条件随机场 条件随机场CRF(conditional random field)是给定一组输入随机变量条件下,另一组输出随机变量条件的概率分布模型,其特点是假设输出随机变量构成马尔可夫随机场。文章相似度 文章相似度是在字符串相似度的基础上,基于词,...

特征离散

取值如下:Isometric Discretization(等距离散)Isofrequecy Discretization(等频离散)Gini-gain-based Discretization(基于Gini增益离散)Entropy-gain-based Discretization(基于熵增益离散离散区间个数 离散区间的个数。...

变量

变量介绍 变量是任务流中动态的值,分为系统变量、时间变量、非时间变量,均可以在节点中以${varName} 的形式动态引用。系统变量 系统预定义的变量。例如当前任务流ID、任务流的运行时间等。说明 除系统变量外,其他变量统称为自定义变量,...

数据采样

随机采样 随机采样 平均采样 固定间隔行数采样 固定时间周期采样 固定区域采样 随机采样、固定区域采样 参数名 参数描述 是否必填 参数默认值 参数范围 采样数量获取方式 按行数:按指定的行数进行采样。按比例:按指定的比例进行采样。...

积分统计

参数说明 IN端口-输入参数 参数名 参数描述 是否必填 输入数据类型 数据源类型 积分变量 需要进行统计的变量 整数或浮点数 说明 若存在非数值类型数据,则会抛出异常。不限 OUT端口-输出参数 参数名 参数描述 输出数据类型 变量累积值 ...

新建全局变量

Dataphin提供全局变量设置能力,将频繁使用的变量设置为全局变量,可以避免在任务代码中重复定义,减少后期维护成本。同时,全局变量包含权限管控和代码审核,提高变量使用的安全。本文为您介绍如何新建变量组和全局变量。新建变量组 ...

新建变量组及全局变量

Dataphin提供全局变量设置能力,将频繁使用的变量设置为全局变量,可以避免在任务代码中重复定义,减少后期维护成本。同时,全局变量包含权限管控和代码审核,提高变量使用的安全。本文为您介绍如何新建变量组和全局变量。新建变量组 ...

变量

变量是一个非数字符号,代表某个数据。它提供了数据定义、运算、传递功能,支持用于下发数据、数据源等配置中。1.创建变量 步骤一:点击左侧变量按钮,然后选择一个分组,点击加号。步骤二:配置 按照规则填入配置变量的名称、描述,引用...

配置do-while节点

{dag.loopTimes} 变量是系统的保留变量,代表当前的循环次数,从1开始,do-while的内部节点可以直接引用该变量。更多内置变量请参见 内置变量 和 取值案例。Shell节点中的代码修改后请务必保存,提交时不会进行提示。如果未保存,最新的...

游标

声明游标变量 所有在PL/SQL中对游标的访问都会通过游标变量,它总是特殊的数据类型 refcursor。创建游标变量的一种方法是把它声明为一个类型为 refcursor 的变量。另外一种方法是使用游标声明语法,通常是:name[[NO]SCROLL]CURSOR[...

线性回归

功能说明 线性回归(Linear Regression)是分析因变量和多个自变量之间的线性关系模型。计算逻辑原理 回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中...

数据对齐

偏移变量 需要移动的变量 不限 csv组件。igateoffline组件。平台上其他数据处理组件。按照平台组件开发的自定义组件。OUT端口-输出参数 参数名 参数描述 输出数据类型 输出 输出包含时间变量、保留变量和偏移变量。与输入数据类型一致 ...

数据聚合

待聚合变量 需要聚合处理的变量 整数或浮点数 说明 若存在非数值数据,则会置为NaN。CSV组件。IGateInOffline组件。平台上其他数据处理组件。按照平台规范开发的自定义组件。OUT端口-输出参数 参数名 参数描述 输出数据类型 输出 输出...

分段多项式预测

分段多项式具有可拟合成任意形状的曲线和点的随机性所产生的影响"局部化"的优点。参数说明 IN端口-输入参数 参数名 参数描述 是否 必填 输入数据类型 模型应用 选择模型类型与具体模型,再配置模型输入数据(仅支持分段多项式回归模型)。...

保障离线在线一致的CTR预估方案

离散型特征:PAI使用独热编码组件处理。最后将两类特征融合成一个向量,并使用FM算法训练模型并推理。运行工作流并查看输出结果。单击画布上方的 运行。工作流运行结束后,右键单击画布中的 二分类评估-1,在快捷菜单,单击 可视化分析,或...

皮尔森相关系数CORR

一、组件说明 皮尔森相关系数是一种用于衡量两个变量之间线性相关关系的统计量,可用于衡量两个变量之间的相关,通常用符号r表示。该系数的取值范围为-1到1之间,0表示两个变量之间不存在线性关系,1表示两个变量之间存在完全正相关,-1...

窗口聚合

聚合变量 需要窗口聚合处理的变量 整数或浮点数 说明 若存在非数值数据,则会置为NaN。CSV组件。IGateInOffline组件。平台上其他数据处理组件。按照平台规范开发的自定义组件。时间变量 窗口处理的时间变量。说明 算法支持的输入时间...

分段多项式回归

分段多项式具有可拟合成任意形状的曲线和点的随机性所产生的影响"局部化"的优点。按照分段规则、特征指数进行分段多项式建模。参数说明 IN端口 参数名 参数描述 是否必填 输入数据类型 数据源类型 特征变量 配置模型特征列 是 整数或浮点数...

全局设置

说明 系统将按照您配置的变量,从表格中自动 随机取值 来补充模板,以提高预览仿真度。自动生成回复模板 点击“自动生成回复模板”按钮,系统算法根据已有表格内容进行模板推荐,根据实际需求选择是否添加有关推荐模板。输入问题生成回复...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
轻量应用服务器 对象存储 弹性公网IP 云服务器 ECS 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用