模型可视化

特征模式挖掘 该数据是模型根据训练数据的特征做分组,并展示每个分组的置信度、支持度和特征个数,以及分组中每个特征下的特征贡献度、特征中值和平均值。模型通常可以挖掘几十个模式,且每个模式有以下两个指标。置信度:符合该模式样本...

步骤

使用场景 当页面存在复杂任务或先后关系时,您可以使用 步骤 组件将其分解成一系列步骤,从而简化任务。使用说明 在某个容器内或整个页面内支持拖入 步骤 组件,步骤数据绑定动态值时,您需要绑定一个类型为List类型的变量,其中Structure...

特征稳定性PSI

一、组件说明 特征稳定性PSI(Population Stability Index)是一种用于比较两个不同时间段或数据集之间特征分布差异的指标。PSI通常用于评估模型在不同时间段或不同数据集上特征分布的稳定性,以确保模型的预测结果在不同环境下的一致性。...

IV算法

在机器学习的分类问题中,IV值(Information Value)主要用于对输入特征变量进行编码,同时评估特征变量的预测能力。特征变量IV值的大小即表示该特征变量预测能力的强弱。本文介绍了IV算法相关的内容。使用场景 IV值一般用于在风控场景中...

模型特征配置

在配置特征之前,建议阅读一下这篇文章:《在生产环境的推荐系统中部署Contextual bandit(LinUCB)算法的经验和陷阱》,文章介绍了哑变量陷阱,以及超参数调参经验。在以下所有类型的特征中,expression 是必选项(除lookup feature外),...

使用Grafana进行异常检测算法调优

如果您的数据带有较强的周期性,比如每天或每周在相对固定的时刻出现峰值或者谷值,那么推荐您优先尝试分解类算法(ostl-esd和istl-esd),参数调优请参见 分解类算法参数调优。如果您的数据通常通过阈值即可判断异常,那么推荐您优先尝试...

数据探索函数

时序分解函数 获取时序数据中的趋势信息与周期信息。极大值检测函数 找到序列数据的局部极大值。均匀分布或指数分布的检验函数 只支持华东2(上海)地域。分布检验函数支持的最大数据量为500万行。用于离线调度的分布检验函数。通过...

FeatureStore Python SDK

特征视图定义了数据从哪里来(DataSource)、需要进行哪些预处理或转换操作(如特征工程/Transformation)、特征的数据结构(包含特征名称和类型在内的特征schema)、数据存储的位置(OnlineStore/OfflineStore),并提供特征元信息管理,...

API概览

ListFeatureConsistencyCheckJobFeatureReports 获取特征一致性检查任务的特征报表 获取特征一致性检查任务的特征报表。ListFeatureConsistencyCheckJobScoreReports 获取特征一致性检查任务分数报表 获取特征一致性检查任务分数报表。...

发布模型

在发布模型阶段,您开发的多方安全模型将完成在线特征映射,并被加载到预测节点中,用于线上特征预测。前提条件 确保在模型开发阶段已成功提交模型。确保 在线特征 中已加入模型部署所需的特征组。操作步骤 登录多方安全建模控制台。在左侧...

基本概念

特征特征组包含特征列表和特征服务的配置信息,一个特征组可复用于多个项目的多个模型中。特征列表 特征列表为某一类特征服务支持的特征字段集合。这些特征服务的服务地址不同,但有相同的协议、出参和入参。特征映射 将模型训练中的入...

配置识别模板

识别特征 识别特征支持基于内容识别、元数据(Meta数据)识别以及词典识别的模式,结合正则表达式、包含、不包含等运算符进行敏感数据特征检测,从而形成识别规则。识别特征支持多个规则间通过“AND”、“OR”逻辑运算符进行关联,形成复杂...

GBDT二分类V2

输入为多列特征时,可以选择多个Double、Bigint和String的列,包括了数值型特征(numerical feature)与类别型特征(categorical feature)。对于数值型特征,算法会对数据进行分箱操作;对于类别型特征,不需要提前进行OneHot预处理,算法...

在FeatureStore中使用自动特征工程(AutoFE)

本文介绍在FeatureStore如何运用自动特征工程技术(AutoFE)生成新特征,为用户提供一些参考建议与启示。通过AutoFE生成的pipeline模型,对训练集和测试集执行特征转换操作,从而提升机器学习或深度学习模型的效果。什么是AutoFE AutoFE...

特征分组统计

一、组件说明 在联邦学习任务中,对于数值类特征,用户通常会关注特征的分组统计值,【特征数值统计】组件主要用于数值类特征的分组统计分析。在分组统计计算完成后,用户可以右键组件,选择【查看节点数据报告】,来查看数据的分组统计...

FeatureStore Go SDK

本文介绍如何使用Go SDK读取FeatureStore在线数据源的数据(离线特征、实时特征、序列特征等)。前提条件 已创建FeatureStore项目(Project)、特征实体(FeatureEntity)、特征视图(FeatureView)和模型特征(ModelFeature),并完成数据...

特征离散

特征离散算法组件是将连续特征按照一定的规则进行离散化。功能介绍 离散模块的功能如下:支持稠密数值类特征离散。支持等频离散和等距离离散等无监督离散。说明 无监督离散的特征离散默认为等距离离散。支持基于Gini增益离散和基于熵增益...

特征数值统计

一、组件说明 在联邦学习任务中,对于数值类特征,用户通常会关注一些统计类特征,例如最大值、最小值、平均值等,【特征数值统计】组件主要用于数值类特征的分析。在数值统计计算完成后,用户可以右键组件,选择【查看节点数据报告】,来...

功能特性

生物特征检测 生物特征防伪检测 客户传入对应生物特征,通过算法识别生物特征是否伪造。实人认证售卖版本 ID Verification 实人认证(ID Verification)是精准可靠的远程身份认证服务,支持实名身份验证、真人活体检测、人证一致性验证、...

ST_Degeneralize

将低层级网格分解成高层级网格。语法 geomgrid[]ST_Degeneralize(geomgrid gridcode,integer precision);geomgrid[]ST_Degeneralize(geomgrid[]gridarray,integer precision);返回值 地理网格数组。参数 参数名称 描述 gridcode 地理网格...

ST_Degeneralize

将低层级网格分解成高层级网格。语法 geomgrid[]ST_Degeneralize(geomgrid gridcode,integer precision);geomgrid[]ST_Degeneralize(geomgrid[]gridarray,integer precision);返回值 地理网格数组。参数 参数名称 描述 gridcode 地理网格...

异常检测

异常检测用于检测连续值和枚举值类特征的数据,帮助您挖掘数据中的异常点。背景信息 异常检测的方法包括箱型图(Box-plot)和AVF(Attribute Value Frequency):箱型图用于检测连续值类特征的数据,根据箱线图最大值和最小值检测异常特征...

人脸特征管理

两种方案流程的对比:其中特征下发主要涉及3方面:项目算法配置 底库特征管理 底库下发管理(API参考 增加人脸权限)兼容性说明 本文档描述的特征管理方案需要基于物联网应用服务平台使用。单个项目使用的设备必须用同一个算法版本,或者...

PS-SMART多分类

特征重要性类型 支持 模型中,该特征做为分裂特征的次数、模型中,该特征带来的信息增益 及 模型中,该特征在分裂节点覆盖的样本数 类型。执行调优 核心数 默认为系统自动分配。每个核的内存大小 单个核心使用的内存,单位为MB。通常无需...

PS-SMART回归

特征重要性类型 支持以下类型:模型中,该特征做为分裂特征的次数 模型中,该特征带来的信息增益(默认值)模型中,该特征在分裂节点覆盖的样本数 执行调优 核心数 默认为系统自动分配。每个核的内存大小 单个核心使用的内存,单位为MB。...

ST_Degeneralize

将低层级网格分解成高层级网格。语法 geomgrid[]ST_Degeneralize(geomgrid gridcode,integer precision);geomgrid[]ST_Degeneralize(geomgrid[]gridarray,integer precision);返回值 地理网格数组。参数 参数名称 描述 gridcode 地理网格...

特征工程

通过推荐算法定制生成的特征工程,对原始数据集(包括用户表、物料表和行为表等)进行处理,并生成新的特征表,以供后续的召回和排序使用。前提条件 已开通PAI(Designer),并创建默认工作空间。具体操作,请参见 开通PAI并创建默认工作...

XGBoost

是 随机 随机 头部 尾部 特征重要性展示特征数 模型特征重要性展示时,实际展示的特征个数。只展示最重要的n个特征,默认10。若设置的展示数小于实际特征数,则展示实际特征数。是 10[1,20]其他参数 参数名 参数描述 模型结果 查看模型训练...

PS-SMART二分类训练

特征重要性类型 支持以下几种类型:模型中,该特征做为分裂特征的次数 模型中,该特征带来的信息增益(默认值)模型中,该特征在分裂节点覆盖的样本数 执行调优 计算核心数 默认为系统自动分配。每个核内存大小 单个核心使用的内存,单位为...

基于对象特征的推荐

本文为您介绍如何基于对象特征进行商品推荐。前提条件 已创建工作空间,详情请参见 创建工作空间。背景信息 该工作流首先对一份真实电商的4月份和5月份数据进行模型训练并生成预测模型,然后通过6月份的购物数据对该预测模型进行评估,最终...

特征编码

特征编码是将非线性特征通过GBDT编码成线性特征。功能介绍 特征编码由决策树和Ensemble算法挖掘新特征的一种策略,特征来自一个或多个特征组成的决策树叶子结点的one-hot结果。例如,下图有三棵树,共有12个叶子结点。根据树的顺序依次编码...

决策树

是 随机 随机 头部 尾部 特征重要性展示特征数 模型特征重要性展示时,实际展示的特征个数。只展示最重要的n个特征,默认10。若设置的展示数小于实际特征数,则展示实际特征数。是 10[1,20]建模类型:分类 参数名 参数描述 是否必填 参数...

FeatureStore最佳实践

本文为您介绍在不使用阿里云其他产品的场景下,如何在推荐系统中应用特征平台FeatureStore SDK管理特征。背景信息 推荐系统是一种能够根据用户的兴趣和偏好,向用户推荐个性化的内容或产品的系统。在推荐系统中,提取和配置用户或物品的...

配置 MPC 项目

配置在线特征 在多方安全模型的在线预测过程中需要使用在线特征,如果需要在项目中使用在线特征,需要将发布的在线特征授权到 MPC 项目内。在 资源配置 面板,单击 数据配置。在 在线特征 区域的测试环境中,单击 添加特征接口授权。在 ...

工程架构

架构图 冷启动链路的整体框架如下图所示:冷启动链路流程 App请求推荐服务,获取推荐内容列表 推荐服务调用 冷启动召回模块,获取匹配上的候选物品 推荐服务调用 冷启动算法打分EAS服务,传递参数:待打分候选物品列表,用户/物品特征,...

RefreshFeatureTable-刷新特征

刷新特征表,根据特征表源更新特征表,刷新策略为以用户源表为准。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出...

线性模型特征重要性

线性模型特征重要性组件用于计算线性模型的特征重要性,包括线性回归和二分类逻辑回归,支持稀疏和稠密数据格式。本文为您介绍该组件的配置方法。使用限制 支持的计算引擎为MaxCompute。组件配置 您可以使用以下任意一种方式,配置线性模型...

创建安全联邦学习任务(任务模式)

特征切分(纵向切分):指两边数据特征不一样,特征分在了两边。数据切分(横向切分):指两边数据结构一致,只是拥有的数据。特征分布 支持使用方【X1+Y】+加持方【X2】和使用方【Y】+加持方【X2】。使用方【X1+Y】+加持方【X2】:指两方...

定制排序模型

并 添加排序模型特征(需填写 排序模型特征名称,选择 排序模型特征类型 和 选择特征,参考:特征管理),点击 确定 即可:说明 排序模型特征类型参考:定制排序模型特征配置规范 选择特征参考:系统内置基础特征 创建模型描述流程 创建 独...

随机森林特征重要性

您可以使用原始数据和随机森林模型,计算特征重要性。组件配置 您可以使用以下任意一种方式,配置随机森林特征重要性组件参数。方式一:可视化方式 在 Designer 工作流页面配置组件参数。页签 参数 描述 字段设置 选择特征列 输入表中,...
共有48条 < 1 2 3 4 ... 48 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数知地球 AI Earth Web应用防火墙 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用