横向聚类评估

一、组件说明 横向聚类模型的评估任务,可以输出轮廓系数、Calinski Harabaz等指标。支持使用单方或多方联合数据,评估横向聚类模型。组件截图 二、参数说明 参数名称 参数说明 预测结果列 预测回归值predict_result,整型输出。

聚类标注方法介绍

在进行 标注前,可通过分析判断待标注内容的特性采取对应的标注策略,即 分场景标注;...沉浸式标注 若同一聚类问法组的用户问法数量较多,可 收起聚类问法组、点击全屏、使用快捷键 进行沉浸式标注,提高标注效率。具体操作可参考下图:

QueryLocationDateClusters-查询时空聚类

查询时空聚类列表信息,支持多种条件,详情请参考请求参数。接口说明 请确保在使用该接口前,已充分了解智能媒体管理产品的收费方式和 价格。调用该接口前,请先通过 CreateLocationDateClusteringTask 接口进行时空聚类。调试 您可以在...

规格计算器

QC:基于量化聚类的向量检索算法,召回结果正确率极高,占用资源较少,性能较好,在低维度向量数据集上有更好表现,内存及储存占用一般只有Linear和HNSW的1/4,适用于对召回率没有严苛要求的大数据量检索场景。Linear:线性检索,即暴力检索...

index

2048 log_reduce_white_list array 日志聚类聚类字段过滤白名单,仅当日志聚类开启时有效。string 白名单字段。name log_reduce_black_list array 日志聚类聚类字段过滤黑名单,仅当日志聚类开启时有效。string 黑名单字段。time line ...

XGBoost

功能说明 XGBoost组件支持使用xgboost算法对分类或回归问题进行建模。XGBoost(Extreme Gradient Boosting),是一种高效的Gradient Boosting算法,集成算法的思路是迭代产生多个弱的学习器,然后将每个学习器的预测结果相加得到最终的预测...

PS-SMART多分类

注意事项 使用PS-SMART多分类组件时,需要注意以下事宜:虽然PS-SMART多分类组件支持数十万特征任务,但是消耗资源大且运行速度慢,可以使用GBDT类算法进行训练。GBDT类算法适合直接使用连续特征进行训练,除需要对类别特征进行One-Hot编码...

LightGBM

功能说明 LightGBM组件支持使用lightgbm算法对分类或回归问题进行建模。lightgbm是一个梯度Boosting框架,使用基于决策树的学习算法。它可以说是分布式的,高效的,有以下优势:更快的训练效率 低内存使用 更高的准确率 支持并行化学习 ...

CreateLocationDateClusteringTask-创建时空聚类任务

时空聚类功能,可以将您已索引到数据集内的图片、视频等携带了拍摄时间、拍摄地点信息等文件,按照时间、地理位置进行分类。这些分类可以理解为用户的一次旅行所拍摄的内容(它们时间接近、地点接近),也可以理解为用户在不同生活、工作地...

PS-SMART回归

注意事项 使用PS-SMART回归组件时,您需要注意以下事宜:虽然PS-SMART回归组件支持数十万特征任务,但是消耗资源大且运行速度慢,可以使用GBDT类算法进行训练。GBDT类算法适合直接使用连续特征进行训练,除需要对类别特征进行One-Hot编码...

创建相似图片聚类任务

相似图片聚类功能,可以将您已索引到数据集内的图片按照相似度生成聚类,用于图片去重、选优等场景,例如可以通过该功能筛选相册中连拍的图片。接口说明 请确保在使用该接口前,已充分了解智能媒体管理产品的收费方式和 价格。调用该接口前...

CreateFigureClusteringTask-创建人物人脸聚类任务

创建一个人物人脸聚类任务,通过智能算法,可以在您已索引到数据集的图片中,将属于不同人物的人脸进行聚类分组。接口说明 请确保在使用该接口前,已充分了解智能媒体管理产品的收费方式和 价格。调用该接口前,请确保您已通过绑定方式...

图片管理常见问题

本文介绍使用智能媒体管理过程中可能遇到的图片管理相关问题。数据集图片数量是否有限制?数据集图片数量不能超过数据集设置的最大文件数量。其他限制信息,请参见 限额配置。数据集的粒度如何设计?不支持跨数据集进行搜索查询和人脸聚类...

CreateGroupFacesJob-人脸聚类

人脸聚类任务执行完成后,使用 ListFaceGroups 接口查看已有分组列表,并可以使用 FindImages 接口根据 GroupId 搜索该组的人脸图片。人脸分组的 GroupId 以 Group-{UUID-v4} 格式命名,即 Group-后接一个 UUIDv4 格式的字符串。人脸的分组...

UpdateFigureCluster-更新人物聚类

更新一个人脸聚类分组的信息,可以更新分组的名称、标签等信息。接口说明 请确保在使用该接口前,已充分了解智能媒体管理产品的收费方式和 价格。调用该接口前,请确保您已通过创建人物人脸聚类任务(CreateFigureClusteringTask)将数据...

QuerySimilarImageClusters-查询相似图片聚类

查询相似图片聚类列表信息。接口说明 请确保在使用该接口前,已充分了解智能媒体管理产品的收费方式和 价格。调用该接口前,请先通过 CreateSimilarImageClusteringTask 接口对数据集中的图片进行相似图片聚类。调试 您可以在OpenAPI ...

新旧版本使用指引

ListImages-获取媒体集中的图片列表 ListVideos-获取多个视频的信息 人脸聚类 CreateFigureClusteringTask-创建人物聚类任务 CreateGroupFacesJob-人脸聚类-CreateFigureClustersMergingTask-合并人物聚类 CreateMergeFaceGroupsJob-合并...

GMM聚类

聚类问题中各个类别的尺寸不同、聚类间有相关关系的时候,往往使用混合高斯分布更合适。计算逻辑原理 高斯混合模型试图找到多维高斯模型概率分布的混合表示,从而拟合出任意形状的数据分布。图:GMM聚类过程 参数说明 IN端口 参数名 参数...

DeleteLocationDateCluster-删除时空聚类分组

删除一个时空聚类。接口说明 请确保在使用该接口前,已充分了解智能媒体管理产品的收费方式和 价格。调用该接口前,请先通过 CreateLocationDateClusteringTask 接口进行时空聚类。无论删除的时空聚类分组 ID 是否存在,均会返回删除成功。...

PS-SMART二分类训练

GBDT类算法适合直接使用连续特征进行训练,除需要对类别特征进行One-Hot编码(筛除低频特征)以外,不建议对其他连续型数值特征进行离散化。PS-SMART算法会引入随机性。例如,data_sample_ratio 及 fea_sample_ratio 表示的数据和特征采样...

算法建模

本文以逻辑回归二分类算法为例,为您介绍如何使用PAI Designer训练模型。前提条件 完成数据可视化,详情请参见 数据可视化。操作步骤 登录 PAI控制台,进入工作流页面。操作详情请参见 step1:进入工作流页面。构建逻辑回归二分类节点并...

CreateFigureClustersMergingTask-合并人物聚类

将两个或两个以上人物聚类分组合并为一个人物聚类分组。接口说明 请确保在使用该接口前,已充分了解智能媒体管理产品的收费方式和 价格。调用该接口前,请确保您已通过创建人物人脸聚类任务(CreateFigureClusteringTask)将数据集中的所有...

异常指标监控

③ 根据正常和异常样本,使用 逻辑回归二分类 算法训练监控模型。④ 使用 二分类评估 组件进行模型验证,可以通过AUC、KS及F1Score等指标评估模型效果。运行工作流并查看模型效果。单击画布上方的 运行。工作流运行结束后,右键单击画布中...

Designer概述

深度学习框架组件 包括基于PAI-Easy系列的视觉类算法、语音类算法、自然语言处理算法,以及TensorFlow、PyTorch等深度学习框架。自定义算法组件 包括SQL脚本、Python脚本、PyAlink脚本等自定义算法组件,可以满足您更加定制化的算法工作流...

工况识别-训练

计算逻辑原理 使用聚类、降维等无监督学习方法对工业数据进行分析,对不同工况数据分别建模。参数说明 IN端口-输入参数 参数名 参数描述 是否必填 输入数据类型 数据源类型 特征变量 用于建立训练模型的特征变量。是 整数或浮点数(说明:...

高效向量检索(PASE)

算法流程说明:高维空间中的点基于隐形的聚类属性,按照kmeans等聚类算法对向量进行聚类处理,使得每个簇有一个中心点。检索向量时首先遍历计算所有簇的中心点,找到与目标向量最近的n个簇中心。遍历计算n个簇中心所在聚类中的所有...

时序聚类函数

时序聚类函数针对输入的多条时序数据进行聚类,自动聚类出不同的曲线形态,进而快速找到相应的聚类中心和异于聚类中的其它形态曲线。关于函数的算法及实现原理请参见 LOG机器学习介绍(02):时序聚类建模。函数列表 函数 说明 ts_density_...

服务下线通知

重要 退款需要 提交工单 进行处理,工单类型:财务-退订相关 退款规则:未使用则可以全额退款,若已有调用,按实际调用扣除之后退余款,即退款金额=(1-使用量/总量)*资源包金额 迁移方案 NLP基础服务1.0中包含的算法服务:分词 命名...

【通知】NLP1.0相关商品停止售卖通知

重要 退款需要 提交工单 进行处理,工单类型:财务-退订相关 退款规则:未使用则可以全额退款,若已有调用,按实际调用扣除之后退余款,即退款金额=(1-使用量/总量)*资源包金额 迁移方案 NLP基础服务1.0中包含的算法服务:分词 命名...

统计类算法参数调优

本文介绍统计类算法(esd、ttest和nsigma)的参数调优方法。背景信息 统计类算法(esd、ttest和nsigma)可以根据历史数据为每一个数据点计算异常分数anomalyScore。算法的输入参数(如 esd.alpha、ttest.alpha 和 nsigma.n)会决定判断阈值...

行业算法模型介绍

智能推荐根据不同的行业提供了归档的如下几类算法模型,您可以通过在线实验平台的实验参数配置针对性的进行开启或关闭以及具体算法子类型的优化。一、基于物品的协同过滤算法 协同过滤算法主要分为基于物品的协同过滤算法、基于用户的协同...

K均值聚类

是 自动 自动 K-Means算法 elkan K-Means算法 其他参数 参数名 参数描述 模型结果 模型结果展示模型聚类效果以及聚类结果,其中“CH分数(即Calinski-Harabasz指标)”和“轮廓系数”反应聚类效果,值越大,说明聚类效果越好。

资产安全概述

脱敏算法 脱敏算法模块可以看到目前支持的所有脱敏算法,主要包括 遮盖脱敏(如张三,脱敏为*三)、哈希脱敏(如加盐MD5)两大类算法。动态脱敏 不改变底层数据的存储,只在数据进行消费时,进行数据的脱敏。典型应用场景:数据分析场景的...

资产安全概述

脱敏算法 脱敏算法模块可以看到目前支持的所有脱敏算法,主要包括 遮盖脱敏(如张三,脱敏为*三)、哈希脱敏(如加盐MD5)两大类算法。动态脱敏 不改变底层数据的存储,只在数据进行消费时,进行数据的脱敏。典型应用场景:数据分析场景的...

类目预测功能介绍

由于没有行为数据,样本打标签没有依据,那么会使用另一类算法来训练模型,仅通过query和类目下物品标题的文本数据,进行分词后,计算query文本与物品标题文本的语义相关度,得到query与目的相关度。使用行为数据的模型效果要优于不使用...

创建安全联邦学习任务(任务模式)

需求是 A想联合B数据,使用XGB,进行联合建模。可通过创建TrustML/Training任务实现。步骤一:新建 TrustML/Training 任务 在DataTrust首页,单击顶部菜单栏的 通用计算。进入 任务研发 页面。在通用方案中,选择创建 安全联邦学习(任务...

向量介绍

适用场景:100%召回率 劣势:大数据量下效率较低、资源(CPU、内存)消耗较严重 聚类算法 量化聚类(Quantized Clustering)介绍:量化聚类(Quantized Clustering)是阿里巴巴开发的基于kmeans聚类的向量检索算法。先利用向量文档聚类n个...

PyAlink脚本

背景信息 PyAlink脚本支持两种使用方式(方式一:单独使用PyAlink脚本、方式二:PyAlink脚本与其他Designer的算法组件组合使用),可以使用上百种Alink组件,且支持通过编写代码的方式读入和写出多种类型的数据(PyAlink脚本不同数据类型的...

功能特性

图片聚类介绍 图片聚类 API 生成式处理 故事生成 故事功能可以将数据集中的照片使用AI算法按照时间或人物来生成一组照片故事集,并选取一张较好的照片作为封面。使用故事功能,您可以轻松实现故事相册功能,感受生活中的美好时刻。故事生成...

时序引擎版本说明

时序异常检测,修复STL类算法(OneShot STL和Online STL)verbose参数报错的问题。3.4.25(稳定版本)发布日期 类型 说明 2023年02月14日 新特性 支持通过Lindorm控制台查询访问日志。Lindorm ML时序异常检测:支持以SQL函数嵌套形式,对...
共有139条 < 1 2 3 4 ... 139 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
加密服务 智能开放搜索 OpenSearch 智能视觉 风险识别 地址标准化 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用