管理问题数据

唯一值个数与总行的比率与一个固定值进行比较。空值 空值个数,固定值。取该字段的空值与固定值进行比较。说明 是否为空值,是通过转换为SQL的is null进行判断。系统生成的问题数据表会保留字段值为空的问题数据,即所有空值均为问题...

人工神经网络

人工神经网络(Artificial Neural Network,缩写ANN),简称神经网络或类神经网络,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。人工神经网络有多层和单层之分...

QuickAudience透视分析时无法选择字段

如果枚举值小于等于50,还不能做透视分析,需要进入数据集编辑页查看配置信息:进入数据集列表页,搜索到该数据集 点击右侧编辑按钮,进入数据集编辑页,查看是否用于透视字段,如果需要透视需要修改为“是”(只有枚举值个数小于50的才...

奇异分解

其中,m 为数据表的行,sgNum 为计算出的奇异值个数。无 outputSTableName 是 S矩阵的输出表,维度是 sgNum*sgNum。其中,sgNum 为计算出的奇异值个数。无 outputVTableName 是 V矩阵的输出表,维度是 n*sgNum。其中,n 是矩阵的列,...

查看内置规则模板

去重后的count与1天、1周和1月前的样本(字段为一值个数)比较进行比较,即固定值校检。空值个数,固定值。取该字段的空值与固定值进行比较。说明 是否为空值,是通过转换为SQL的is null进行判断。空值个数/总行,固定值。空值的...

V3.3.41版本说明

标签筛选、标签多分支组件,文本型、多值型标签的标签值选择方式优化:当标签值个数大于3000时,下拉框展示返回的前3000值,支持通过搜索选择3000之外的标签值。营销动作组件配置界面,新增提示组件支持的ID类型。任意页面右上角新增...

数据建模

唯一率 对应分区,字段的唯一值个数与总行的比率与一个固定值进行比较,符合规则则通过。比较方式包括:>、、>=、、=和!重复值 对应分区,总行减去重后的个数,即字段重复值的个数。重复值个数与期望的固定值进行比较,符合规则则通过...

UDAF和UDTF动态参数说明

由于聚合函数的返回值个数固定是1,所以这功能对UDAF来说并无意义。UDTF示例 import com.aliyun.odps.udf.UDFException;import com.aliyun.odps.udf.UDTF;import com.aliyun.odps.udf.annotation.Resolve;import org.json.JSONException;...

聚合函数

示例 统计所有设备的温度的值个数。SELECT COUNT(temperature)AS temperature FROM sensor;统计sensor表中device_id为F07A1260的行。SELECT COUNT(*)FROM sensor WHERE region='F07A1260';统计sensor表的行。SELECT COUNT(*)FROM ...

分箱

通过分箱组件可以进行特征离散化,即将连续的数据进行分段,使其变为多离散化区间。分箱组件支持等频分箱、等宽分箱及自动分箱。配置组件 您可以使用以下任意一种方式,配置分箱组件参数。方式一:可视化方式 在 Designer 工作流页面配置...

GBDT二分类V2

特征数量 特征数量 全局偏置项 全局偏置项 随机产生器种子 随机产生器种子 特征重要性类型 不适用,当前默认为信息增益。计算核心 节点:不能直接使用相同数值,推荐先试用系统自动分配,然后进行细调。每核内存大小 每节点内存...

标签筛选

为保证您的计算性能,在一条筛选条件中选择的标签值个数不得超过2000。批量输入 支持批量输入标签值,操作方法:鼠标移动到标签值文本框上方,单击出现的 图标,将弹出批量输入窗口。在窗口中一行输入一个标签值,最多输入2000行,每行最...

pg_stats

如果小于零,是可区分值个数除以行的负值(当 ANALYZE 认为可区分值的数量会随着表增长而增加时采用负值的形式,而如果认为列具有固定数量的可选值时采用正值的形式)。例如,-1表示一个唯一列,即其中可区分值的个数等于行。most_...

pg_stats

如果小于零,是可区分值个数除以行的负值(当 ANALYZE 认为可区分值的数量会随着表增长而增加时采用负值的形式,而如果认为列具有固定数量的可选值时采用正值的形式)。例如,-1表示一个唯一列,即其中可区分值的个数等于行。most_...

质量规则模板类型

字段重复值个数校验 用于对单个字段重复且多余的数据进行校验。及时性 时间函数比较 用于对单字段和业务日期之间的及时性的对比。单表时间字段比较 用于对同一表的两列的时间差进行比较。两表时间字段比较 用于对不同表的两列的时间差进行...

质量规则模板类型

字段重复值个数校验 用于对单个字段重复且多余的数据进行校验。及时性 时间函数比较 用于对单字段和业务日期之间的及时性的对比。单表时间字段比较 用于对同一表的两列的时间差进行比较。两表时间字段比较 用于对不同表的两列的时间差进行...

标签筛选

为保证您的计算性能,在一条筛选条件中选择的标签值个数不得超过200。筛选条件支持 精确匹配、包含、不匹配、不包含、开头是、结尾是、非开头是、非结尾是、为空、不为空。其中,精确匹配 支持批量录入标签值:单击右上角 批量录入,在新...

ListQualityResultsByEntity

CheckResultStatus Integer 0 校验结果状态参数与产品界面中的状态信息一致,取值有以下几种:0:正常 1:橙色告警 2:红色告警 TemplateName String 字段唯一值个数期望值校验 使用的校验模板的名称。CheckerName String fulx 校验器的...

Python 3 UDTF读取MaxCompute资源示例

由于聚合函数的返回值个数固定是1,所以这功能对UDAF来说并无意义。UDTF代码示例 读取MaxCompute资源代码示例。from odps.udf import annotate from odps.udf import BaseUDTF from odps.distcache import get_cache_file from odps....

ListQualityResultsByRule

'type2'","BeginTime":1600704000000,"CheckResultStatus":2,"MatchExpression":"ds=$[yyyymmdd]","UpperValue":22200,"IsPrediction":false,"CheckResult":2,"TemplateName":"字段唯一值个数期望值校验","TimeCost":10,"FixedCheck":false...

实时同步任务延迟解决方案

由于在Flush间隔内待写入MaxCompute表的数据实际是在实时同步任务的一组队列中保存,每队列会缓存一个MaxCompute的写入数据,队列的默认最大个数是5,如果对应于MaxCompute表分区列的源端列在配置的Flush间隔内可枚举值个数超过了缓存...

ListTagValues-查询指定标签键对应的标签

caeba0bbb2be03f84eb48b699f0a*PageSize integer 否 分页时每页显示的标签值个数。最大值:1000。默认值:50。50 ResourceType string 否 资源类型,用于查询的过滤条件。格式:ALIYUN:${ProductCode}:${ResourceType},全部大写。...

即席分析表格中的操作

根据选中的维值个数,可进行的操作会略有不同。隐藏 维值支持隐藏,适用于暂时不想查看部分干扰数据的场景,可以恢复。隐藏后在被隐藏处有蓝色线条标记,悬浮在蓝色线条处提示 有xx行/列隐藏数据,单击展示,单击线条可以展开隐藏的数据。...

Python 3 UDAF

由于聚合函数的返回值个数固定是1,所以这功能对UDAF来说并无意义。UDAF示例 from odps.udf import annotate from odps.udf import BaseUDAF@annotate('bigint,*->string')class MultiColSum(BaseUDAF):def new_buffer(self):return[0]...

one-hot编码

编码字段列中,离散值个数可以支持至千万量级。当训练的模型作为下次编码使用的模型时,由于 dropLast、ignoreNull 和 reserveCols 编码参数的效果已封装到模型中,无法进行调整。如果您需要调整,则必须重新训练。建议输出表使用kv格式。...

Partial Result Cache(PTRC)

ndv 表示PTRC的key的唯一值的个数,即所有相关性参数组合值的唯一值个数。当估算的 hit_rate 小于 partial_result_cache_low_hit_rate 参数值时,该算子就不会考虑使用PTRC。但在MySQL已有的代价模型中,它的统计信息依赖于表的索引或直方...

新建和管理标准代码(码表)

码值:校验代码值/代码名称是否完整、代码值/代码名称/代码英文名/代码描述是否符合输入规范、代码值是否重复、代码值个数是否超过系统限制。参数 描述 导入结果 可查看导入进度、导入结果、执行时间。异常记录 为您展示校验不通过而无法...

新建和管理标准代码(码表)

码值:校验代码值/代码名称是否完整、代码值/代码名称/代码英文名/代码描述是否符合输入规范、代码值是否重复、代码值个数是否超过系统限制。参数 描述 导入结果 可查看导入进度、导入结果、执行时间。异常记录 为您展示校验不通过而无法...

数据类型转换

本文为您介绍数据类型转换组件。功能说明 数据类型转换组件是将输入数据的数据...为NaN:当出现转换失败的时,会将该值置为NaN。当需要转换类型的数据中存在无法解析的数据时,会按照当前参数配置来处理。是 引发异常 引发异常 为NaN

模型创建

TFT TFT(Temporal Fusion Transformer)算法是基于Transformer机制的深度神经网络算法,详细信息,请参见 TFT论文。时序异常检测 esd 达摩院自研算法,适用于尖刺型异常(例如监控曲线出现尖刺的现象),对于数据点中有少量显著离群点的...

CREATE MODEL

TFT TFT(Temporal Fusion Transformer)算法是基于Transformer机制的深度神经网络算法,详细信息,请参见 TFT论文。时序异常检测 TIME_SERIES_ANOMALY_DETECTION esd 达摩院自研算法,适用于尖刺型异常(例如监控曲线出现尖刺的现象),...

LLM-敏感词过滤(DLC)

预置敏感词文件 执行调优 多进程个数 否 设置进程。8 选择资源组 公共资源组 否 选择节点规格(CPU或GPU实例规格)、节点数量、专有网络。无 专有资源组 否 选择CPU核数、内存、共享内存、GPU卡、节点数量。无 最大运行时长 否 组件...

离线同步任务调优

分布式执行任务的情况下,任务并发数量资源组下机器个数需要小于等于资源组单机规格支持的最大并发。跨云、跨区域同步数据时,建议网络打通后走内网进行同步,网络连通解决方案详情请参见:配置资源组与网络连通。检查数据库负载情况...

内容行业

3、单条内容标签不能超过100,标签池总个数建议不超过50000。4、如果标签属于业务敏感数据,建议映射到数字脱敏上报。数字化,人工智能,AI author string 建议填写 作者 用户自填 1、多作者使用英文逗号分隔,单条内容作者不能...

新闻行业

3、单条新闻标签不能超过100,标签池总个数建议不超过50000。4、如果标签属于业务敏感数据,建议映射到数字脱敏上报。数字化,人工智能,AI author string 建议填写 作者。用户自填 1、多作者使用英文逗号分隔,单条内容作者不能...

Hive连接器

此配置方式对于Presto与每DataNode并的安装很有用,可以提升并安装的效率。默认为false。hive.respect-table-format 新分区应使用现有的表格式还是Presto的格式。取值如下:true(默认):使用现有的表格式。false:使用Presto的...

创建压测场景

就是对系统并发的压力呈现阶梯性增加的过程,每时间段并发都要增加一个数量,最终达到一个预期并发,然后保持该并发,持续运行一段时间。对应的 压力预估图 是阶梯形式的曲线图。固定压力:并发是固定的。对应的 压力预估图 ...

指标趋势图

指标趋势图可以展示多指标最新日期的数据或阶段汇总数据,以及指标在某一段时间内的变化趋势。本文为您介绍如何为指标趋势图添加数据并配置样式。前提条件 已创建仪表板,请参见 新建仪表板。图表概述 使用场景 多用于某时间段指标数据及...

压测Dubbo微服务

就是对系统施压的虚拟用户呈现阶梯性增加的过程,每时间段虚拟用户都要增加一个数量,最终达到一个预期的虚拟用户,然后保持该虚拟用户,持续运行一段时间。对应的 压力预估图 是阶梯形式的曲线图。固定压力:虚拟用户是...

LLM-文章相似度去重(DLC)

无 执行调优 多进程个数 否 设置进程。8 选择资源组 公共资源组 否 选择节点规格(CPU或GPU实例规格)、节点数量、专有网络。无 专有资源组 否 选择CPU核数、内存、共享内存、GPU卡、节点数量。无 最大运行时长 否 组件最大运行时长,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
高速通道 共享流量包 弹性公网IP 负载均衡 NAT网关 短信服务
新人特惠 爆款特惠 最新活动 免费试用