基于特征映射方法可以干啥-基于特征映射方法可以干啥文档介绍内容-阿里云

基本概念

特征映射 将模型训练中的入模数据表字段与线上的特征服务形成关联的过程，称为特征映射。项目在隐私计算的数据应用中，以项目的形式对成员、权限、节点或数据等要素进行隔离。根据不同的应用类别，项目分为不同的类型。虚拟宽表结合两组...

XGBOOST多分类

在多分类问题中，XGBoost将输入数据特征映射到多元分类输出，即预测样本所属的多个类别的概率。XGBoost的多分类算法采用Softmax函数作为损失函数，通过最小化交叉熵损失，学习每个类别的权重，并将样本预测概率归一化为概率分布。组件截图 ...

XGBOOST二分类

在二分类问题中，XGBoost将输入数据特征映射到一个二元分类输出，即预测样本属于正例或负例的概率。组件截图二、参数说明字段设置参数名称参数说明标签字段用于训练的标签字段，数值类型，单选。正样本标签值正样本标签的原值或编码...

蚂蚁隐私计算服务平台的审计事件

GetAntppcScimngProjectResourceFeatureMapping 查询特征映射。GetAntppcScqlRuleBaseinfo 获取规则详情。GetAntppcScqlScript 查看脚本内容。GetAntppcScqlScriptResult 查询执行结果。GetAntppcScqlScriptSubtaskData 查询子任务结果数据...

Cost-based SQL诊断引擎

能力测试集构建的基本思想，首先通过特征化实现测试案例基于特征的形式化描述，形成测试案例形式化特征库，并具备足够的完备性。在阿里巴巴集团内部，我们已经对数据库实例上全部SQL进行实时采集和存储，借助阿里巴巴这个大平台业务的丰富...

组件参考：所有组件汇总

特征尺度变换您可以通过该组件对稠密或稀疏的数值类特征进行常见的尺度变换。特征离散该组件是将连续特征按照一定的规则进行离散化。特征异常平滑该组件可以将输入特征中包含异常的数据平滑到一定区间，支持稀疏和稠密数据格式。奇异值...

基于回归算法实现农业贷款发放预测

线性回归是数理统计中的回归分析方法，可以确定两种或两种以上变量之间相互依赖的定量关系。Designer预置了线性回归算法模板，便于您通过农业贷款的历史发放情况，快速实现贷款发放预测。本文为您介绍Designer线性回归算法预置模板的具体...

XGBOOST回归

一、组件说明 XGBoost是一种基于梯度提升决策树（Gradient Boosting Decision Tree）的机器学习算法。它通过改进传统梯度提升决策树的方式，加入正则化项、特征子采样和并行化等优化技术。XGBoost的优点是能够自动处理缺失值、异常值和噪声...

用户画像分析概述

行业背景与痛点画像分析是指基于沉淀用户的自然属性、行为属性、偏好属性等属性挖掘用户兴趣点、分析群体特征的过程。用户画像是刻画出用户个体或者用户群体全方位特征的重要手段，能为运营分析人员提供用户的偏好、行为等信息进而优化...

关键词感知检索

建立关键词和原始语料的映射关系，常见的方法有倒排索引、TF-IDF、BM25等方法，其中TF-IDF、BM25通常用稀疏向量（Sparse Vector）来表示词频。检索时，对检索语句进行关键词抽取，并通过步骤2中建立的映射关系召回关联度最高的TopK原始...

评分卡信用评分

② 分箱组件类似于One-Hot编码，可以根据数据分布将数据映射为高维度特征。以 age 字段为例，分箱组件可以根据数据在不同区间的分布进行分箱操作。工作流运行完成后，您可以右键单击分箱-1 组件，选择我要分箱。在分箱-1 配置面板中...

基于文本分析算法实现新闻分类

仅针对业务场景介绍文本分析算法的使用方法，未对数据集进行特征工程处理及细节调优。因为本工作流模板已为过滤与映射配置了过滤条件，所以您可以直接查看 append_id 为115、292、248及166的新闻。如果需要查看其它新闻，则可以参见如下...

分箱

一、组件说明分箱（Binning）是一种数据预处理方法，用于将连续数据转化为离散数据。分箱的目的是为了减少异常值的影响和简化模型的复杂度，同时提高模型的稳定性和可解释性。分箱的基本思路是将一段连续的数据划分为几个区间或者桶，然后...

标注模板说明

iTAG官方模板提供了多种RLHF模板，如多模态RLHF标注、对话排序、对话改写、图生文模板，您可以基于系统提供的这些模板修改为符合自己业务需求的模板，然后再创建对应的标注任务并进行处理，从而提高您的模型训练效果。进入智能标注 iTAG-...

模型配置

在复购预测中，需要先完成模型配置，当且仅当模型执行成功后，可基于模型进行复购预测。模型训练成功后，您可以查看训练中前10个最重要的特征，并通过模型验证了解该模型的准确率、召回率预期。前提条件算法模型需要依赖行为数据集作为...

基础概念

倒排索引也常被称为反向索引、置入档案或反向档案，是一种索引方法，被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。倒排索引可以为我们做什么？通过倒排索引，可以快速...

逻辑回归二分类

在二分类问题中，逻辑回归将输入数据特征映射到一个二元分类输出，即预测样本属于正例或负例的概率。组件截图二、参数说明字段设置参数名称参数说明标签字段用于训练的标签字段，数值类型，单选。正样本标签值正样本标签的原值或...

线性回归

一、组件说明线性回归模型通过找到一条最佳拟合直线（或超平面），将输入特征映射到一个连续数值输出。在模型训练过程中，采用最小二乘法（least squares）估计模型参数，即最小化输出结果与预测值之间的误差平方和。线性回归模型具有简单...

横向逻辑回归二分类

在二分类问题中，横向逻辑回归将输入数据特征映射到一个二元分类输出，即预测样本属于正例或负例的概率。组件截图二、参数说明字段设置参数名称参数说明标签字段用于训练的标签字段，数值类型，单选。正样本标签值正样本标签的原值...

配置从HTTP到Dubbo协议转换

方法映射说明方法映射指一个Dubbo方法的映射规则，通过单击+方法映射您可以配置多条方法映射，方法映射包含以下配置项。Dubbo方法名 Dubbo方法的完整名称。HTTP方法设置HTTP请求中的Method参数。方法匹配路径匹配Path参数，需要在 ...

基于对象特征的推荐

本文为您介绍如何基于对象特征进行商品推荐。前提条件已创建工作空间，详情请参见创建工作空间。背景信息该工作流首先对一份真实电商的4月份和5月份数据进行模型训练并生成预测模型，然后通过6月份的购物数据对该预测模型进行评估，最终...

快速入门

设备映射服务的SDK已经内置于系统应用及其他SDK（如：OTA SDK）中，租户不需要单独集成。账号映射服务的SDK介绍见下文。二、账号映射服务的SDK使用场景账号映射服务的SDK可以让客户应用非常方便集成三方账号平台或厂商自有账号平台的登录...

配置从HTTP到Dubbo协议转换

方法映射说明方法映射指一个Dubbo方法的映射规则，通过单击+方法映射您可以配置多条方法映射，方法映射包含以下配置项。Dubbo方法名 Dubbo方法的完整名称。HTTP方法设置HTTP请求中的Method参数。方法匹配路径匹配Path参数，需要在 ...

形状映射器使用说明

形状映射器用于映射组件中数据值和图形之间的内容映射，图形包括矢量和图标两种。本文以配置基础平面地图 3.0 组件中的矢量散点层内的散点形状为例，为您介绍如何使用形状映射器实现数据与图形之间的映射匹配。配置地图子组件内散点...

字段映射

使用字段映射可以管理不同账号系统和 IDaaS 账户/组织的对应关系。本文档介绍字段映射的基本概念和操作。基本概念通过【字段映射】能力，您可以在两个层面实现 IDaaS 账户与外部账号的一致性：账户层面：通过账户绑定关系将账户的状态 ...

在FeatureStore中使用自动特征工程（AutoFE）

模型训练 基于特征分析生成配置和数据，对pipeline流程进行训练，生成模型用于离在线均可使用的模型。特征转换加载pipeline模型，对训练和测试数据进行特征转换，生成对应的特征工程结果。计费说明 AutoFE本身不收费，但在进行预处理、...

One-Hot编码

一、组件说明 One-Hot编码是一种将离散特征转换成连续特征的方法。它将一个有m个取值的离散特征转换为m个0/1特征，每个特征表示原离散特征是否等于该取值。例如，假设原始数据集有一个表示“颜色”的特征，包含三个不同的取值：红色、绿色...

横向One-Hot编码

一、组件说明横向One-Hot编码是一种将离散特征转换成连续特征的方法，用于横向场景。它将一个有m个取值的离散特征转换为m个0/1特征，每个特征表示原离散特征是否等于该取值。例如，假设原始数据集有一个表示“颜色”的特征，包含三个不同...

通用联邦学习模板

这种方法可以有效地评估模型的泛化能力，并减少因样本随机性带来的影响。混淆矩阵：评估分类模型性能的一种重要工具，可以用来计算模型的准确率、精确率、召回率、F1得分等性能指标。其中，准确率指模型正确预测的样本数占总体样本数的比例...

使用SQL访问HBase表

说明宽表引擎版本2.5.1及以上版本支持对Rowkey的映射，映射方法与其他Qualifier相同。映射对象固定为ROW且ROW关键字需要用反引号（``）引用。如果使用其他语言，您可以参考Java类org.apache.hadoop.hbase.util.Bytes中的toBytes方法对数据...

使用SQL访问HBase表

说明宽表引擎版本2.5.1及以上版本支持对Rowkey的映射，映射方法与其他Qualifier相同。映射对象固定为ROW且ROW关键字需要用反引号（``）引用。如果使用其他语言，您可以参考Java类org.apache.hadoop.hbase.util.Bytes中的toBytes方法对数据...

JDBC

数据库产品名到特定名称（即databaseId）的映射关系，即便数据库的产品名因数据库版本变化而发生改变，也可以映射到相同的名称。在MyBatis的XML映射文件中，可以为SQL语句指定databaseId属性，说明该SQL仅能够在该databaseId对应的数据库...

启用cgroup writeback功能

即memcg和blkcg的映射关系可以是一对一或多对一，不可以是一对多或多对多。例如，存在进程A和B，对它们进行Buffered I/O限速，需要遵循以下约束。如果A和B分属不同的memcg，它们可以映射到不同的blkcg，只需各自一一对应。例如：A属于 ...

Designer使用案例汇总

基于对象特征的推荐介绍如何基于对象特征进行商品推荐。使用FM-Embedding实现推荐召回介绍如何使用FM算法和Embedding提取算法，快速生成User和Item的特征向量。基于Alink框架的FM推荐介绍如何通过 Designer 预置的FM算法模板，快速构建...

案例：搭建以图搜图系统

您可以选择适合当前使用场景的方法，提取图像的特征，生成特征向量。向量检索向量检索又称为最近邻(Nearest Neighbor Search，NNS)检索，主要负责在海量特征向量中快速地查找与查询向量距离最近的k个记录。虽然可以通过遍历的方法，依次...

BI分析模式数据面板功能介绍

字段数据的条件逻辑配置完后，您可以为该字段数据改变包括尺寸、颜色和形状等，各个数据映射通道的样式配置，每个组件在数据条件系列面板内的映射样式配置都不同，您也可以通过组件默认样式配置面板中的方法或视觉映射的方法去配置。...

计量图（Pro版本）

值映射参数说明值映射您可以使用单词或图标替换计量图中的值。例如设置值为 200，映射类型为文本，映射值为成功。则计量图中的 200 将被替换为成功。变量替换参数说明变量替换变量替换相当于为单个统计图表添加变量类型的...

特征离散

特征离散算法组件是将连续特征按照一定的规则进行离散化。功能介绍离散模块的功能如下：支持稠密数值类特征离散。支持等频离散和等距离离散等无监督离散。说明无监督离散的特征离散默认为等距离离散。支持基于Gini增益离散和基于熵增益...

全域分析

全域分析功能结合全域标签能力，对存量用户提供丰富、灵活的洞察分析能力，可实现全量用户、细分用户多维度、多形态的分析方法，满足业务人员对用户的全方位理解。用户概览页面上方展示：累计已接入用户资产：即存量用户数，是当前空间下...

模块开发

模块详情页面模板示例中的 Parameters 部分会基于参数属性生成，一方面可以保证参数设置的正确性，另一方面可以展示模板优化界面效果。建议支持多语言，包括 Description、Label 等。Mappings（可选）与模板要求一致，更多信息，请参见 ...

基于特征映射方法可以干啥

新品推荐