评分卡预测

页签 参数 描述 字段设置 特征选择用于预测的原始特征列,默认选择全部。原样添加到结果表 选择不进行任何处理,直接附加到预测结果表中的列。例如ID列和目标列等。输出变量分 是否输出每个特征变量所对应的分数,最终的预测总得分为...

特征异常平滑

nr_employed 5228.1 5195.8 4991.6 5099.1 5076.2 5228.1 5099.1 5099.1 5076.2 5099.1 参数配置 平滑特征 选择 nr_employed,参数设置 中 平滑方法 选择 阈值平滑,阈值下限 为 5000,阈值上限 为 6000,如下图所示。运行结果 nr_employed...

全域分析

特征分布 选择受众后,单击 特征分布 页签,单击 选择标签,在弹窗中选择一个或多个全域标签,页面将展示当前受众的特征分布情况。交叉分析 交叉分析用于分析两个全域标签的不同标签值组合在受众中的分布。选择受众后,单击 交叉分析 页签...

异常检测

页签 参数 描述 字段设置 特征选择需要分析的字段。异常检测方法 选择检测的方法。箱型图用于检测连续类特征。AVF用于检测枚举类特征。方式二:PAI命令方式 使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI命令调用,...

特征尺度变换

选择标签列 如果您设置了该字段,则可以通过可视化方式查看特征到目标变量的 x-y 分布直方图。是否K:V,K:V稀疏特征 训练数据是否为稀疏格式。当数据以稀疏格式存储时,通常所有数据存储在一个字段里,而不是每个数据单独存储在一个字段里。...

数据转换模块

页签 参数 描述 字段设置 输入表选择特征列 输入的特征列,默认选择全表。不进行转换的数据列 选中的列会原样输出,可以在此指定Label。数据转换的类型 支持的转换类型包括 归一化、离散化、转换为WOE值 及 Index。默认WOE值 仅当 数据...

基于分箱组件实现连续特征离散化

页签 参数 描述 字段设置 特征选择 f1、f2、f3 及 f4 列。参数设置 分箱个数 配置为 10,表示将连续特征离散化至10个区间中。分箱方式 支持 等频、等宽 及 自动分箱。使用 自动分箱 时,数据源必须包含 label 字段,且为二分类场景。...

离线调度

页签 参数 描述 字段设置 训练特征选择 age、sex、duration 及 place 列。目标列 选择 ctr 列。单击画布中的 预测 组件,在右侧面板,配置参数(仅配置如下参数,其他参数使用默认值即可)。页签 参数 描述 字段设置 特征选择 age、...

FeatureStore最佳实践

选择特征 选择已创建的user特征视图和item特征视图。Label表名称 选择已创建的Label表 rec_sln_demo_label_table。单击 提交,完成模型特征创建。在模型特征列表页面,单击已创建模型右侧的 详情。在弹出的 模型特征详情 页面的 基本信息 ...

在推荐系统中应用FeatureStore管理特征

选择特征 选择已创建的user特征视图和item特征视图。Label表名称 选择已创建的Label表 rec_sln_demo_label_table。单击 提交,完成模型特征创建。在模型特征列表页面,单击已创建模型右侧的 详情。在弹出的 模型特征详情 页面的 基本信息 ...

OAM 产品模板

组件添加成功后,单击 添加运维特征选择运维特征(CafeService/Strategy)并配置容器信息,单击 提交。版本号:必填。为该产品模板定义一个版本号,如 v1.0.1,方便后期进行版本维护。描述:可选。输入该该产品模板的备注信息。单击 提交...

特征管理

本文介绍了在PolarDB for AI中,特征管理的适用场景,以及创建特征、更新特征、查看特征状态、查看特征列表以及删除特征的语法及其示例内容。适用场景 从原始数据直接构建机器学习模型往往比较困难。机器学习模型的输入一般会先对原始数据...

排序模型部署的时候如何设置从MaxCompute读取数据

特征选择已准备的用户表 rec_sln_demo_user_table_preprocess_all_feature_v1。特征字段 勾选user_id主键。同步在线特征表 是 特征实体 user 特征生命周期(秒)保持默认。单击 提交。单击 新建特征视图,在弹出的页面中配置item特征...

FeatureStore Go SDK

本文介绍如何使用Go SDK读取FeatureStore在线数据源的数据(离线特征、实时特征、序列特征等)。前提条件 已创建FeatureStore项目(Project)、特征实体(FeatureEntity)、特征视图(FeatureView)和模型特征(ModelFeature),并完成数据...

使用FeatureStore Python SDK搭建推荐系统

特征视图定义了数据从哪里来(DataSource)、需要进行哪些预处理或转换操作(如特征工程/Transformation)、特征的数据结构(包含特征名称和类型在内的特征schema)、数据存储的位置(OnlineStore/OfflineStore),并提供特征元信息管理,...

DMP数据管理平台使用手册

并集:人群具有多个已选选标签的任意一个特征,例如选择兴趣爱好下的金融理财标签和购物标签为并集,则表示目标人群对理财、购物的其中一项感兴趣。当人群来源选择为 APP使用人群 时:选择APP:在左侧 全部APP 列表选中本人群包需要使用的...

配置特征映射模板

在线特征名称:选择一个在线特征,在线特征来源于当前特征组中的特征。导入离线字段 单击 导入离线字段,选择一个表结构模板后单击 确定。表结构模板来源于 数据资产 菜单中 数据表 页签下的数据表列表。手动配置离线数据映射的在线特征,...

一致性检查

传入的上下文特征没有,或者在线服务没有构造出相关特征 特征值不匹配,在线的特征值的处理逻辑或者方法与离线的构造不一致 模型的特征处理逻辑有误,processor在打分之前,如果需要对特征的处理,比如EasyRec,这块特征处理涉及特征加载、...

配置识别模板

模型规则配置 识别特征 在下拉列表中选择模型使用的识别特征。可选择内置识别特征和自定义识别特征。支持选择多个识别特征,多个识别特征之间以或关系生效。识别范围 在下拉列表中选择该模型生效的资产类型。支持选择多种资产,多种资产...

分箱

是否保留没有在“特征列”中选择的字段 使用自定义分箱时,如果该参数选择 是,则未在 特征列 中选择的字段会原样保留,否则会删除未选择的字段。上传分箱和约束Json 当 选择分箱的参数来源 取值为 手动分箱或自定义Json 时,该参数生效。...

添加识别特征

识别特征用于统一管理内置识别表达式,如手机号、身份证号等,本文为您介绍系统内置特征和自定义识别特征。权限说明 安全管理员支持新建及管理识别特征。自定义识别特征 在Dataphin首页,单击顶部菜单栏的 资产。按照下图操作指引,进入 ...

添加识别特征

识别特征用于统一管理内置识别表达式,如手机号、身份证号等,本文为您介绍系统内置特征和自定义识别特征。权限说明 安全管理员支持新建及管理识别特征。自定义识别特征 在Dataphin首页,单击顶部菜单栏的 资产。按照下图操作指引,进入 ...

系统内置基础特征

基础特征 结构示意图 基础特征类型介绍 基础特征总体分为两大类:item和user item:字段特征:首先选择需要处理的特征字段,默认支持当前应用下的所有字段。然后选择具体的处理方式,如对于文本类型可以选择分词、向量化等,对于数值类型,...

K近邻

页签 参数 描述 字段设置 选择训练表特征列 用于训练的特征列。选择训练表的标签列 训练的目标列。选择预测表特征列 如果未配置该参数,则表示其与训练表特征列相同。产出表附加ID列 用于标识该列的身份,从而获得某列对应的预测值。系统...

One-Hot编码

剪枝方式可以选择以下两种:按特征次数保留 按特征频率保留 tips:也可以选择【不剪枝】保留次数大于阈值的特征【按特征次数保留】专有。选择统计个数大于阈值的特征值保留,正整数值。保留比例大于阈值的特征,百分比【按特征频率保留】...

横向One-Hot编码

剪枝方式可以选择以下两种:按特征次数保留 按特征频率保留 tips:也可以选择【不剪枝】保留次数大于阈值的特征【按特征次数保留】专有。选择统计个数大于阈值的特征值保留,正整数值。保留比例大于阈值的特征,百分比【按特征频率保留】...

PAI-REC推荐算法定制的最佳实践文档

阅读指引:为方便用户快捷体验PAI-REC产品,本文提供了一份公开数据集,用户可按照文档说明按步体验PAI-REC推荐算法定制的召回、特征工程、精排等关键功能的配置,生成代码并部署到 DataWorks 相应的业务流程中。1.克隆公开数据集 我们在可...

离散值特征分析

默认选择全表 featureColNames 否 输入表中,用于训练的特征列名。无 labelColName 否 输入表中,标签列的名称。无 enableSparse 否 输入数据是否为稀疏格式,取值范围为 {true,false}。false kvFeatureColNames 否 KV格式的特征。默认选择...

解析应答特征分析

在 DNS流量分析 页面选择 解析应答特征分析。条件查询 时间条件查询 支持最长90天内的任意时间段查询,对查询时间段内的数据进行聚合展示,对域名解析应答状态占比进行统计,同时对否定应答的域名按照解析请求量由高到低/由低到高进行展示...

Pearson相关系数

通常,Pearson相关系数用于判断机器学习模型中两个特征之间的线性关系,如果两个特征相关度较强,则表明这两个特征有重复的嫌疑,您可以根据具体的情况选择丢弃一个特征,以保证模型的有效性。语法 CREATE FEATURE feature_name WITH...

分箱

只可选择数值类特征,可多选。标签列 选择用户分箱用的参考标签列。主要用于最优分箱类策略和woe、iv值的计算评估。正例值 正样本标签的原值或编码值,如:>50K。分箱方式 可选等频分箱、等距分箱、卡方分箱、自定义分箱。【等距分箱】是将...

横向分箱

只可选择数值类特征,可多选。标签列 选择用户分箱用的参考标签列。主要用于最优分箱类策略和woe、iv值的计算评估。正例值 正样本标签的原值或编码值,如:>50K。分箱方式 可选等频分箱、等距分箱、卡方分箱、自定义分箱。【等距分箱】是将...

选型指导

定向运营(流量调控+黑白名单+item封禁、定坑)1000元/月 若开发者使用的算法服务为行业标准配置、或者自行完成算法组装,将无需支付额外的费用。若需要根据场景定制,设计链路配置,模型选型,按照效果交付调优等,则需进行商务洽谈后支付...

排序策略配置

内置特征函数 OpenSearch提供了丰富的 内置特征函数,如LBS类、文本类、时效类等,可以用在排序表达式中,相互组合实现强大的相关性排序效果。Cava插件 Cava是OpenSearch引擎团队基于llvm实现的一门高效的编程语言,它的语法和Java类似,...

推荐算法定制概述

在推荐场景中,深度学习具有很多优点,包括可以处理大规模的数据和复杂的模型,能够捕捉更高层次的特征信息,同时能够自动化特征工程和模型选择等过程,从而提高推荐效果和用户满意度。PAI在Designer中将EasyRec的核心功能封装成了可拖拽...

如何合理选择数据特征

您在配置数据特征时,可选择数据类型为指标化数据或非指标化数据,两者的数据特征配置不同。针对指标化数据,模型采用消费组方式提取指标,对指标进行智能巡检。针对非指标化数据,模型通过您自定义的查询和分析语句提取指标,对指标进行...

发布特征

正式 当您选择正式接口时,您需要在发布特征前完成特征服务开发。此处需要填写接口的 URL 地址,还需要对接口进行验证。关于如何验证接口,请参见 验证接口。接口 URL 节点调用特征接口的 URL 地址。仅当 接口用途 选择 正式 时,需要配置...

发布模型

在发布模型阶段,您开发的多方安全模型将完成在线特征映射,并被加载到预测节点中,用于线上特征预测。前提条件 确保在模型开发阶段已成功提交模型。确保 在线特征 中已加入模型部署所需的特征组。操作步骤 登录多方安全建模控制台。在左侧...

社交行业

根据帖子的特征值与 用户特性-用户画像,把匹配的用户写入到推送的表之中。此块根据不同的业务,可能涉及的逻辑比较复杂,比如加入位置的因素、权重、好友关注的列表、把不活跃的客户剔除。会形成一张帖子推荐表,数据量比较大,大约1T到...

频次控制

频次控制用于抑制某一类特征的请求访问,例如同一个客户端IP在某一段时间内高频访问您的站点,您希望在超过某个阈值后使用滑块控制其访问频次或拉黑一段时间,即可使用频次控制功能。配置频次控制规则 登录 DCDN控制台。在左侧导航栏,单击...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数知地球 AI Earth Web应用防火墙 对象存储 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用