如果您使用的是阿里云数据库OceanBase,在对接Dataphin进行数据开发或将Dataphin数据写入至OceanBase时,您需要先完成OceanBase数据源的创建。更多OceanBase信息,请参见 什么是OceanBase。操作步骤 请参见 数据源管理入口,进入 数据源...
背景信息 如果您使用的是MongoDB,在引入MongoDB的业务数据至Dataphin中或将Dataphin数据导出至MongoDB的场景中,您需要先完成MongoDB数据源的创建。更多阿里云MongoDB信息,请参见 云数据库MongoDB-什么是云数据库MongoDB版。使用限制 ...
如果您使用的是阿里云数据库OceanBase,在对接Dataphin进行数据开发或将Dataphin数据写入至OceanBase时,您需要先完成OceanBase数据源的创建。更多OceanBase信息,请参见 什么是OceanBase。操作步骤 请参见 数据源管理入口,进入 数据源...
如果您使用的是阿里云对象存储OSS,在对接Dataphin进行数据开发或将Dataphin的数据写入至OSS时,您需要先完成OSS数据源的创建。更多OSS信息,请参见 什么是对象存储OSS。权限说明 Dataphin仅支持超级管理员、数据源管理员、板块架构师、...
如果您使用的是Oracle,在对接Dataphin进行数据开发时,您需要先完成Oracle数据源的创建。更多Oracle信息,请参见 Oracle官网。权限说明 仅支持具备新建数据源权限的账号进行新建。更多信息,请参见 数据源权限说明。操作步骤 在Dataphin...
如果您使用的是阿里云对象存储OSS,在对接Dataphin进行数据开发或将Dataphin的数据写入至OSS时,您需要先完成OSS数据源的创建。更多OSS信息,请参见 什么是对象存储OSS。权限说明 Dataphin仅支持超级管理员、数据源管理员、板块架构师、...
PAI为您提供智能圈选人群功能,您可以通过 策略训练任务 选择使用内置的智能算法,对人群数据(训练数据)进行训练,生成圈选策略,再基于圈选策略通过 人群圈选任务 对人群数据(预测数据)进行智能筛选过滤,产出目标人群数据。...
如果您使用的是FTP,在对接Dataphin进行数据开发或将Dataphin的数据写入至FTP的场景中,您需要先完成FTP数据源的创建。更多FTP信息,请参见 FTP官网。使用限制 Dataphin仅支持超级管理员、数据源管理员、板块架构师、项目管理员角色创建...
如果您使用的是HBase,在导出Dataphin数据至HBase,您需要先完成HBase数据源的创建。更多HBase信息,请参见 HBase官网。使用限制 Dataphin仅支持超级管理员、数据源管理员、板块架构师、项目管理员角色创建数据源。超级管理员、数据源管理...
通过创建多个租户,可以对不同租户分配不同的数据单元以及功能模块,并能够保证租户间数据隔离,满足不同租户的不同要求。本文为您介绍如何新建、编辑、删除以及恢复租户。权限说明 仅元仓租户的超级管理员与系统管理员支持新建及管理租户...
进入智能标注 iTAG-官方模板 登录 PAI控制台。在顶部菜单栏选择地域。在左侧导航栏选择 工作空间列表,单击指定工作空间 操作 列的 iTAG,进入智能标注iTAG页面。如果没有可用的工作空间,请 创建工作空间。在 模板管理 页签下单击 新建...
本文为您介绍智能计算灵骏的常见问题。如何创建、删除集群下的节点分组?您有两种方式为灵骏集群创建分组。创建集群时,为集群创建分组。更多信息,请参见 集群和分组配置。创建集群完成后,为已有的集群创建分组。在左侧导航栏,选择 资源...
数仓规划是基于Dataphin建设数据中台的第一步,同时也是数据体系的顶层设计中至关重要的一步。在您开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。功能介绍 数仓规划包括逻辑空间与物理空间...
处理完成标注任务后,您可以将标注结果导出至指定的OSS目录,也可以将标注结果同步创建为一个数据集,便于后续将其直接用于模型训练。本文介绍如何导出标注结果,以及如何查看导出的进度与结果。前提条件 已处理完成数据标注,详情请参见 ...
数仓规划是基于Dataphin建设数据中台的第一步,同时也是数据体系的顶层设计中至关重要的一步。在您开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。功能介绍 数仓规划包括逻辑空间与物理空间...
在工作空间页面的左侧导航栏选择 数据准备>智能标注(iTAG),进入智能标注页面。在 智能标注(iTAG)页面的 模板管理 页签,单击 新建模板。在 创建模板 页面的配置向导页面,配置如下参数,并单击 保存。参数 描述 内容组件 在 显示内容 ...
资源用量:用于数据处理单元、数据标准、智能运维等资源统计用量情况的通知。租户管理:用于租户设置变更的通知。系统消息:用于元数据获取异常等系统异常的通知。操作步骤 在Dataphin首页,按照下图操作指引,进入 通知中心。单击左侧导航...
增值功能包包括 数据萃取、数据服务、资源治理、资产安全、资产质量、智能运维 和 数据标准。可选增值功能包 描述 数据萃取 面向各行各业数据价值深度挖掘的诉求,数据萃取为您提供可视化的ID链接、行为解析和标签萃取,进一步帮助您提炼可...
iTAG 通过指标大盘展示数据标注、检查、验收的数据指标。在指标大盘页面,您可以从总体数据、任务维度和人员维度查看数据指标。本文为您介绍如何查看指标大盘。进入指标大盘 进入智能标注(iTAG)。登录 PAI控制台。在左侧导航栏单击 工作...
创建标注任务后,您需要按照任务流程为任务包进行打标、检查或验收,从而获得标注好的数据,为模型训练做准备。本文以处理图像类标注任务为例,为您介绍如何处理标注任务,其他类型的标注任务操作类似。前提条件 管理员已分配标注任务,...
资源用量:用于数据处理单元、数据标准、智能运维等资源统计用量情况的通知。租户管理:用于租户设置变更的通知。系统消息:用于元数据获取异常等系统异常的通知。操作步骤 在Dataphin首页,按照下图操作指引,进入 通知中心。单击左侧导航...
是指数据输出前和输出完成的一些特殊处理方式,比如为了满足服务的持续可用性,当前步骤写数据执行前先创建目标表Target_A,执行写入到目标表Target_A,当前步骤写数据执行完成后,对数据库中持续提供服务的表Service_B重命名成Temp_C,...
是指数据输出前和输出完成的一些特殊处理方式,比如为了满足服务的持续可用性,当前步骤写数据执行前先创建目标表Target_A,执行写入到目标表Target_A,当前步骤写数据执行完成后,对数据库中持续提供服务的表Service_B重命名成Temp_C,...
配置DM(达梦)输出组件,可以将外部数据库中读取的数据写入到DM(达梦),或从大数据平台对接的存储系统中将数据复制推送至DM(达梦),进行数据整合和再加工。本文为您介绍如何配置DM(达梦)输出组件。前提条件 已创建DM(达梦)数据源...
配置DM(达梦)输出组件,可以将外部数据库中读取的数据写入到DM(达梦),或从大数据平台对接的存储系统中将数据复制推送至DM(达梦),进行数据整合和再加工。本文为您介绍如何配置DM(达梦)输出组件。前提条件 已创建DM(达梦)数据源...
iTAG 支持通过智能标注配置进行数据预标注,您可以在预标注结果的基础上进行正式标注。在正式标注时,您仅需要对预标注结果进行校验和修正,可以提升标注效率。ITAG支持离线预标注和线上服务两种预标注方式。离线预标注是指您导入带有预...
智能研发版定价 数据处理单元规格 定价(CNY/年)500 298,000 1000 397,800 1500 497,600 2000 597,400 2500 697,200 3000 797,000 数据处理单元统计规则:数据处理单元总量=(数据同步任务数+数据集成任务数)/3+计算任务数(离线和实时)...
在引入Log Service的业务数据至Dataphin中进行数据开发的场景中,您需要先创建Log Service数据源。本文为您介绍如何创建Log Service类型的数据源。背景信息 Log Service即阿里云日志服务,如果您使用的是阿里云日志服务,在对接Dataphin...
000 4500 60C240G 101,500 5000 60C240G 110,000 数据处理单元统计规则:数据处理单元总量=(数据同步任务数+数据集成任务数)/3+计算任务数(离线和实时)+明细逻辑表总数+[向上取整(指标数/10)]其中:前200个数据集成任务不纳入统计,...
在引入Log Service的业务数据至Dataphin中进行数据开发的场景中,您需要先创建Log Service数据源。本文为您介绍如何创建Log Service类型的数据源。背景信息 Log Service即阿里云日志服务,如果您使用的是阿里云日志服务,在对接Dataphin...
如果您使用的是云数据库HBase,在对接Dataphin进行数据开发时,您需要先完成Aliyun HBase数据源的创建。权限说明 仅支持 超级管理员、数据源管理员、板块架构师、项目管理员 角色创建数据源。操作步骤 在Dataphin首页,单击顶部菜单栏的 ...
如果您使用的是SAP HANA,在对接Dataphin进行数据开发或将Dataphin的数据导出至SAP HANA场景中,您需要先完成SAP HANA数据源的创建。更多SAP HANA信息,请参见 SAP HANA官网。权限说明 Dataphin仅支持 超级管理员、数据源管理员、板块架构...
如果您使用的是云数据库HBase,在对接Dataphin进行数据开发时,您需要先完成Aliyun HBase数据源的创建。更多信息,请参见 什么是云数据库HBase。前提条件 若您需在Dataphin中创建基于阿里云产品的数据源,创建数据源前,需确保Dataphin的IP...
功能介绍 多数据源类型接入:Dataphin内置丰富的数据源类型,支持对接的数据源包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系型数据源和NoSQL数据源。更多信息,请参见 Dataphin支持的数据源。自定义数据源类型:在内置的...
功能介绍 多数据源类型接入:Dataphin内置丰富的数据源类型,支持对接的数据源包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系型数据源和NoSQL数据源。更多信息,请参见 Dataphin支持的数据源。自定义数据源类型:在内置的...
如果您使用的是SAP HANA,在对接Dataphin进行数据开发或将Dataphin的数据导出至SAP HANA场景中,您需要先完成SAP HANA数据源的创建。更多SAP HANA信息,请参见 SAP HANA官网。权限说明 Dataphin仅支持 超级管理员、数据源管理员、板块架构...
数据存储安全 PAI提供数据集管理模块,支持导入公共数据集、阿里云云产品中的数据等创建为数据集,也支持扫描OSS文件夹生成索引数据集,为智能标注、模型训练做准备。读取和存储数据至OSS及NAS,实现数据集、模型等数据文件的存储安全。...
通过创建GreenPlum数据源能够实现Dataphin读取GreenPlum的业务数据或向GreenPlum写入数据。本文为您介绍如何创建GreenPlum数据源。背景信息 Greenplum是一款大数据分析引擎,作用于分析、机器学习和AI等领域。其架构主要针对管理大规模分析...
通过创建GreenPlum数据源能够实现Dataphin读取GreenPlum的业务数据或向GreenPlum写入数据。本文为您介绍如何创建GreenPlum数据源。背景信息 Greenplum是一款大数据分析引擎,作用于分析、机器学习和AI等领域。其架构主要针对管理大规模分析...
数据开发包括编码研发和规范建模。编码研发用于构建计算任务,例如创建SQL代码任务、Shell任务、Python任务、MR任务和Spark任务;规范建模用于构建逻辑化的数据模型。前提条件 若需进行实时开发,需已购买实时研发增值服务并且当前租户已...