范围类型

例如,numeric 类型之上的一个范围就是连续的,timestamp 上的范围也是(尽管 timestamp 具有有限的精度,并且在理论上可以被当做离散的,最好认为它是连续的,因为通常并不关心它的步长)。另一种考虑离散范围类型的方法是对每一个元素值...

组件参考:所有组件汇总

组件类型 组件 描述 自定义组件 自定义组件 支持在AI资产管理中创建自定义组件,自定义组件创建成功后,您可以在Designer中将该组件与官方组件串联使用进行模型训练。源/目标 读OSS数据 该组件用来读取对象存储OSS Bucket路径下的文件或...

基本概念

为便于您更好的理解视频点播产品,您可以在使用前了解视频格式、视频编码、视频转码等基本概念。文件格式 操作系统中的文件名都有后缀,即扩展名,例如1.doc,2.jpg,3.avi等。设置扩展名的目的是让系统中的应用程序来识别并关联这些文件,...

基于组件化EasyRec框架快速搭建深度推荐算法模型

可以为主网络配置一个可选的 MLP 模块。案例2:DeepFM 模型 配置文件:deepfm_backbone_on_movielens.config 这个Case重点关注下两个特殊的 block,一个使用了 lambda 表达式配置了一个自定义函数;另一个的加载了一个内置的keras layer ...

常用时序函数

MAX函数 查询时序数据表中Field列的最大值。FIRST函数 获取时序数据表中Field列的第一个值。LAST函数 获取时序数据表中Field列的最后一个值。PERCENTILE函数 计算时序数据表中与Field列关联的第P个百分位字段值。RATE函数 计算时序数据表中...

特征离散

取值如下:Isometric Discretization(等距离散)Isofrequecy Discretization(等频离散)Gini-gain-based Discretization(基于Gini增益离散)Entropy-gain-based Discretization(基于增益离散离散区间个数 离散区间的个数。...

EMR Flink写入OSS-HDFS服务

注入可以匹配写入路径的一段特定字符串,用一段随机的字符串进行替换,以削弱所谓片区效应,提高写入效率。当写入场景为OSS-HDFS时,需要完成下列配置。oss.entropy.key=<user-defined-key>oss.entropy.length=写入新文件时,路径中与...

开源Flink写入OSS-HDFS服务

注入可以匹配写入路径的一段特定字符串,用一段随机的字符串进行替换,以削弱所谓片区效应,提高写入效率。当写入场景为OSS-HDFS时,需要完成下列配置。oss.entropy.key=<user-defined-key>oss.entropy.length=写入新文件时,路径中与...

交互分析管理

当选择 离散可以自定义设置步长。SQL参数命名 参数显示名称 自定义设置参数名。SQL参数名称 设置数值选择器的参数名称。说明 以SQL名称的方式将参数添加到查询中,参数的值可以通过调整数值选择器的值来实时更改。最小值参数名 设置数值...

One-Hot编码

一、组件说明 One-Hot编码是一种将离散特征转换成连续特征的方法。它将一个有m个取值的离散特征转换为m个0/1特征,每个特征表示原离散特征是否等于该取值。例如,假设原始数据集有一个表示“颜色”的特征,包含三个不同的取值:红色、绿色...

横向One-Hot编码

一、组件说明 横向One-Hot编码是一种将离散特征转换成连续特征的方法,用于横向场景。它将一个有m个取值的离散特征转换为m个0/1特征,每个特征表示原离散特征是否等于该取值。例如,假设原始数据集有一个表示“颜色”的特征,包含三个不同...

列存索引如何实现高效数据过滤

当进行数据查询时,minmax索引可以根据查询范围的最小值和最大值快速定位数据块,从而减少对不相关数据的访问。以下图为例,A、B列包含3个DataPack,条件 A>15 and B结合minmax索引,最终RowGroup2与RowGroup3可跳过,只需访问RowGroup1,...

我是系统集成商

对于未预先定义模板的技术属性,可以单击离散属性下的 添加属性:除了单个资产模型外,可以选择导入资产模型的方式一次性用Excel文件方式批量创建资产模型。可以下载资产模板的Excel模板文件,在文件中编辑资产模型内容,然后上传Excel文件...

分箱

例如,可以设置卡方统计量的最大值或者分箱的最大数量。对于分箱后的每个分箱,可以计算其WOE(Weight of Evidence)和IV(Information Value)等指标,作为离散化特征的衡量标准。卡方分箱能够自动选择最优的分箱数量和分箱方法,同时能够...

横向分箱

例如,可以设置卡方统计量的最大值或者分箱的最大数量。对于分箱后的每个分箱,可以计算其WOE(Weight of Evidence)和IV(Information Value)等指标,作为离散化特征的衡量标准。卡方分箱能够自动选择最优的分箱数量和分箱方法,同时能够...

分区合并

场景 1:目标分区是不含二级分区的一级分区 对于离散分区(list/list column策略),合并多个分区后,新分区的values取合并前多个分区的values的合集;对于连续空间的分区(range/range column/hash/key),合并多个相邻分区后,新分区的...

特征离散

分段间隔为0.5,对数据【2.2,2.9,1,1.4,1.6,2.7】做离散化处理后为【2.0,3.0,1.0,1.5,1.5,2.5】计算逻辑原理 特征离散化:有效的离散化能减少算法的时间和空间开销,提高系统对样本的分类聚类能力和抗噪声能力,并且可以有效的克服数据中...

无监督聚类函数

通过配置eps,可以决定归属于同一个类别的任意两个样本点之间的最大距离,决定聚类簇的密度。减少同一个类别的任意两个样本点之间的最大距离,可以使得同一类别内的样本点更相似,聚类簇的密度更高。本示例中配置eps为0.2,将尽可能多的...

MaxCompute安全白皮书

阿里云在现有技术的基础上尽最大努力提供相应的介绍及操作指引,但阿里云在此明确声明对本文档内容的准确性、完整性、适用性、可靠性等不作任何明示或暗示的保证。任何单位、公司或个人因为下载、使用或信赖本文档而发生任何差错或经济损失...

配置规则:按模板(批量)

说明 平均值、汇总值、最小值和最大值仅对数值型字段生效。规则名称 规则名称系统会自动生成,您可以按需调整名称后缀。描述 对配置的监控规则进行简单描述。配置监控规则的详细属性。参数 描述 强弱 设置强规则或弱规则:如果设置强规则,...

蓝牙Mesh本地定时统一协议

设备对时请求失败后重试最大间隔:5分钟,采用了时间离散方式,第一次对时请求失败间隔1分钟,第二次对时请求失败间隔3分钟,第三次对时请求失败间隔5分钟。设备对时请求失败重试次数:3次。注意事项 在无精灵音箱/网关在线的情况下,APP...

eRDMA概述

最大的发送SGE数目max_send_sge 6 单个send wr支持的离散地址数目。最大的接收SGE数目max_recv_sge 1 单个recv wr支持的离散地址数目。SRQ 不支持 无。QP类型 RC(Reliable Connected)无。建链方式 RDMA_CM 无。RDMA CQ的基本规格 规格...

基础统计分析

KV字段:选择为KV类型的字段(如:对用户偏好品类的描述,数码:0.9,家装:0.6,鞋服:0.3,……),会对key的数量以及value的分布进行分析,如若没有可以不选择。KV字段分隔符:指定每组KV数据的分隔符(如:,)。Text字段:选择Text类型的...

转换Log为Metric

如果您需要监控Log中某字段的指标变化趋势,可以使用日志服务数据加工函数e_to_metric将Log字段转换为Metric,通过时序库查看该指标的变化趋势。本文以Nginx访问日志为例说明如何将Log转化为Metric。前提条件 已采集到日志数据。更多信息,...

one-hot编码

编码字段列中,离散值个数可以支持至千万量级。当训练的模型作为下次编码使用的模型时,由于 dropLast、ignoreNull 和 reserveCols 编码参数的效果已封装到模型中,无法进行调整。如果您需要调整,则必须重新训练。建议输出表使用kv格式。...

数据视图

通过数据视图组件,您可以可视化地了解特征与标签列的分布情况及特征的特点,以便后续进行数据分析。该组件支持稀疏和稠密数据格式。本文为您介绍 Designer 提供的数据视图算法的参数配置方式及使用示例。组件配置 您可以使用以下任意一种...

评分卡训练

评分卡是信用风险评估领域常用的建模工具,其原理是通过分箱输入将原始变量离散化后再使用线性模型(逻辑回归或线性回归等)进行模型训练,其中包含特征选择及分数转换等功能。同时也支持在训练过程中为变量添加约束条件。说明 如果未指定...

ModifyInstanceAttribute-修改一台实例的部分信息

如果是突发性能实例,还可以切换性能突发模式。接口说明 查询 ECS 实例信息时,如果返回数据中包含 {"OperationLocks":{"LockReason":"security"}},则禁止一切操作。调用该接口完成以下操作时,您需要注意:修改主机名(HostName):重启...

聚集函数

No max(see text)→same as input type 计算非空输入值的最大值。适用于任何数字、字符串、日期/时间或enum类型,以及 inet,interval,money,oid,pg_lsn,tid 和任何这些类型的数组。Yes min(see text)→same as input type 计算非空输入值的...

GBDT二分类V2

梯度提升决策树(Gradient Boosting Decision Trees)二分类,是经典的基于梯度提升(Gradient Boosting)的有监督学习模型,可以用来解决二分类问题。支持计算资源 支持的计算引擎为MaxCompute。算法简介 梯度提升决策树(Gradient Boosting ...

联邦预处理

离散离散化是对特征进行离散化处理,目前仅支持等宽分桶。函数路径 fascia.biz.preprocessing.discretize 函数定义 def discretize(fed_df:HDataFrame,columns:List[str]=None,n_bins=5,strategy='uniform',discretizer:...

基于TairRoaring实现人群圈选方案

可以通过 云原生内存数据库Tair 的TairRoaring数据结构快速搭建高性能的目标用户筛选服务。TairRoaring简介 用户标签筛选场景往往应用于个性化推荐、精准营销等具体业务场景,通过不同的标签辅以不同的运营营销,从而实现资源投放方的...

使用ping命令丢包或不通时的链路测试方法

当客户端访问目标服务器或负载均衡,使用ping命令测试出现丢包或网络不通时,可以通过链路测试工具进行链路测试来判断问题来源。本文介绍如何使用链路测试工具进行链路测试。链路测试流程 通常情况下,链路测试流程如下图所示。链路测试...

朴素贝叶斯

朴素贝叶斯是一种基于独立假设的贝叶斯定理的概率分类算法。使用Designer(原Studio)的朴素贝叶斯组件,您能有效处理多样的分类问题。本文为您介绍朴素贝叶斯组件的配置方法。使用限制 支持的计算引擎为MaxCompute。组件配置 您可以使用...

通过消费组拉取指标数据进行智能巡检

如果您不确定特征项的取值范围,可以不设置特征数据的最大值和最小值。更多信息,请参见 如何设置数据特征中的最小值和最大值。在 算法配置 区域,完成以下配置,然后在 数据采样 中,选择一个实体,单击 预览采样数据,验证您所配置的参数...

使用EasyRec构建推荐模型

EasyRec可以帮助您快速构建推荐模型。本文以读取MaxCompute表数据为例,介绍如何使用EasyRec进行模型训练、配置任务例行化及部署模型。前提条件 开通OSS,并创建Bucket,详情请参见 开通OSS服务 和 控制台创建存储空间。重要 创建Bucket时...

创建压测场景

请求响应时间:您需要关注99、95、90、80等一些关键分位的指标是否符合预期,相对来说平均响应时间对您没有太大的参考意义,因为压测需要保证绝大部分用户的体验,在不清楚离散程度的情况下,平均值容易导致误判。系统吞吐量:是衡量系统能...

查看内置规则模板

计算说明 计算波动率:您可以根据波动率计算公式(波动率=(样本-基准值)/基准值)计算结果。样本 当天采集的具体的样本的值。例如对于SQL任务表行数,1天波动检测,则样本是当天分区的表行数。基准值 历史样本的对比值:如果规则是SQL...

高维向量相似度搜索(pgvector)

在机器学习和自然语言处理中,嵌入通常用于将离散的符号或对象表示为连续的向量空间中的点。在自然语言处理中,词嵌入(word embedding)是一种常见的技术,它将单词映射到实数向量,以便计算机可以更好地理解和处理文本。通过词嵌入,单词...

通过SQL聚合指标数据进行智能巡检

如果您不确定特征项的取值范围,可以不设置特征数据的最大值和最小值。更多信息,请参见 如何设置数据特征中的最小值和最大值。在 创建智能巡检作业 配置向导的 算法配置 区域,完成以下操作。在 算法配置 区域,完成以下配置,然后在 数据...
共有6条 < 1 2 3 4 ... 6 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储 物联网平台
新人特惠 爆款特惠 最新活动 免费试用