开发流程

创建表 导入数据 通用数据开发 ② Designer 支持规模分布式的传统机器学习、深度学习、强化学习训练,支持流批一体训练,该子模块封装了上百种机器学习算法,您可以拖拽式建模、自动调参,从而无编程玩转人工智能。Designer概述 ③ ...

数据集成支持的数据

离线集成支持的数据数据源 读取 写入 大数据存储型数据源 MaxCompute 支持 支持 Hologres 支持 支持 IMPALA 支持 支持 TDH Inceptor 支持 支持 StarRocks 支持 不支持 Hudi 支持 支持 Doris 支持 不支持 GreenPlum 支持 支持 TDengine ...

JOIN

这样可以节省在Shuffle阶段时要进行的大量数据传输工作,从而达到优化作业的目的。例如,当需要连接一个表和一个小表时,您也可以将小表加载到内存中,从而提高运行效率。配置组件 在Designer工作流页面添加 JOIN 组件(仅支持可视化方式...

什么是DSW

DSW(Data Science Workshop)是为算法开发者量...AI+大数据一体化 DSW除了支持Python和R语言之外,还对接了大数据的能力,用户能够通过SQL File插件,使用SQL语句对MaxCompute数据源进行数据查询,或通过Notebook连接EMR集群提交Spark任务。

支持的云服务

人工智能平台 PAI 人工智能平台 PAI 是基于MaxCompute的一款机器学习算法平台,实现了数据无需搬迁,便可进行从数据处理、模型训练、服务部署到预测的一站式机器学习。您创建MaxCompute项目并开通机器学习服务后,即可通过机器学习平台的...

功能简介

洞察是一款自助式数据挖掘分析型,面向业务管理者、运营、业务分析师等人员提供低使用门槛的智能、自动化、全面、精准的数据诊断和分析能力,智能发现数据规律或异常,实现从数据到知识的提取,辅助业务决策。几乎每个业务每天都存在业务...

数据集成支持的数据

离线集成支持的数据数据源 读取 写入 大数据存储型数据源 MaxCompute 支持 支持 Hive 支持 支持 Hologres 支持 支持 IMPALA 支持 支持 TDH Inceptor 支持 支持 Kudu 支持 支持 StarRocks 支持 支持 Hudi 支持 支持 Doris 支持 支持 ...

准备数据源和计算源

准备数据源 Dataphin支持对接的数据源包括大数据存储型数据源、文件数据源、消息队列数据源、关系型数据源和NoSQL数据源,各模块支持对接的数据源类型及操作指导,请参见 Dataphin支持的数据源。重要 确定业务数据源类型后,在Dataphin创建...

准备数据源和计算源

准备数据源 Dataphin支持对接的数据源包括大数据存储型数据源、文件数据源、消息队列数据源、关系型数据源和NoSQL数据源,各模块支持对接的数据源类型及操作指导,请参见 Dataphin支持的数据源。重要 确定业务数据源类型后,在Dataphin创建...

创建MaxCompute数据

背景信息 MaxCompute即阿里云大数据计算服务,适用于数据分析场景的企业级SaaS(Software as a Service)模式云数据仓库,以Serverless架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化...

查看集群信息

在左侧导航栏,选择 数据大盘>数据概览。您可以在 数据概览 页面,查看 集群数、分组数 等信息。操作日志 登录 灵骏控制台。在左侧导航栏,选择 数据大盘>操作日志。单击 事件查询 页签,查看 事件时间、事件名称 等信息。单击 事件聚合...

数据源白名单配置

产品名称 操作说明 云原生大数据计算服务MaxCompute 设置白名单 实时数仓Hologres IP白名单 云数据库ClickHouse 设置白名单 消息队列Kafka版 配置白名单 云原生分布式数据库PolarDB-X 设置白名单 云原生分布式数据库PolarDB-X(2.0)设置白...

创建Hudi数据

背景信息 Hudi即Apache Hudi,Hudi是一个通用的大数据存储系统,将核心仓库和数据库功能直接引入到数据库中,并支持记录级别的插入更新和删除数据的能力。权限说明 仅支持 超级管理员、数据源管理员、板块架构师、项目管理员 角色创建数据...

数据大盘

在左侧导航栏,单击 数据大盘>数据概览。您可以在 数据概览 页面查看集群数、分组数等基本信息,以及使用率汇总、集群磁盘信息、集群网络带宽使用等趋势图。查看操作日志 在左侧导航栏,单击 数据大盘>操作日志。您可以在 事件查询 页签,...

配置DataHub输出组件

配置DataHub输出组件,可以将外部数据库中读取数据写入到DataHub,或从大数据平台对接的存储系统中将数据复制推送至DataHub,进行数据整合和再加工。本文为您介绍如何配置DataHub输出组件。前提条件 已创建DataHub数据源。具体操作,请参见...

升级

在阿里云官网,鼠标悬停至 产品 后,再将鼠标悬停至左侧导航栏的 大数据 上,单击 数据开发和治理 列下的 Dataphin。在Dataphin产品详情页,单击 产品控制台,进入Dataphin管理控制台页面。在Dataphin管理控制台页面,单击已开通版本详情后...

配置ArgoDB输出组件

配置ArgoDB输出组件,可以将外部数据库中读取的数据写入到ArgoDB,或从大数据平台对接的存储系统中将数据复制推送至ArgoDB,进行数据整合和再加工。本文为您介绍如何配置ArgoDB输出组件。使用限制 ArgoDB输出组件支持写入文件格式为orc、...

创建Teradata数据

通过创建Teradata数据源能够实现Dataphin读取Teradata的业务数据或向Teradata写入数据。本文为您介绍如何创建Teradata数据源。背景信息 Teradata是一款大型数据仓库系统。如果您使用的是Teradata,在对接Dataphin进行数据开发或导出...

创建Teradata数据

通过创建Teradata数据源能够实现Dataphin读取Teradata的业务数据或向Teradata写入数据。本文为您介绍如何创建Teradata数据源。背景信息 Teradata是一款大型数据仓库系统。如果您使用的是Teradata,在对接Dataphin进行数据开发或导出...

Designer使用案例汇总

智能风控解决方案 案例名称 描述 图像内容风控解决方案 基于人工智能算法快速构建符合业务场景的风控模型,并部署为EAS在线服务,助力您快速识别高风险内容,进而对其进行拦截。文本内容风控解决方案 介绍如何基于人工智能算法,快速构建...

数据源管理概述

功能介绍 多数据源类型接入:Dataphin内置丰富的数据源类型,支持对接的数据源包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系型数据源和NoSQL数据源。更多信息,请参见 Dataphin支持的数据源。自定义数据源类型:在内置的...

数据源管理概述

功能介绍 多数据源类型接入:Dataphin内置丰富的数据源类型,支持对接的数据源包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系型数据源和NoSQL数据源。更多信息,请参见 Dataphin支持的数据源。自定义数据源类型:在内置的...

MaxCompute表导入OSS

数据时可能会被切分为多个文件。支持的 计算资源 MaxCompute 配置组件 在Designer工作流页面添加 MaxCompute表导入OSS 组件,并在界面右侧配置相关参数:参数类型 参数 是否必选 描述 默认值 字段设置 OSS存储目录 是 导出数据的OSS...

标注模板概述

背景信息 iTAG作为智能数据标注平台,提供了三种不同类型的模板以适应多样化的标注需求:租户模板 租户模板是指在iTAG平台上由同一租户(即使用同一账号的企业或团队)创建并保存的个性化标注模板。这类模板是根据租户自身的业务场景定制的...

快速入门

如果您是首次使用智能数据建设与治理Dataphin,您可以参考快速入门文档,了解如何购买实例并接入服务端。Dataphin全托管 Dataphin全托管快速入门 Dataphin半托管 Dataphin半托管快速入门

什么是Dataphin

Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,一站式提供数据采、建、管、用全生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据中台。Dataphin兼容多种计算...

答疑支持

若您在使用智能数据建设与治理Dataphin的过程中有任何疑问,您可通过答疑支持联系我们,为您答疑解惑。操作步骤 在Dataphin页面,按照以下操作指引或单击蓝色小机器人选择 答疑支持,进入答疑支持页面后,输入您需解答的问题。依次单击 ...

步骤六:可视化分析

本文将使用Quick BI指导您完成本教程的可视化分析步骤,包括数据源、数据集的创建和数据大屏图表的配置。步骤一:创建数据源 登录 Quick BI控制台。按照下图操作指引,进入 创建数据源 对话框。在 MySQL-阿里云 区域,配置连接参数。参数 ...

步骤六:可视化分析

本文将使用Quick BI指导您完成本教程的可视化分析步骤,包括数据源、数据集的创建和数据大屏图表的配置。步骤一:创建数据源 登录 Quick BI控制台。按照下图操作指引,进入 创建数据源 对话框。在 MySQL-阿里云 区域,配置连接参数。参数 ...

答疑支持

若您在使用智能数据建设与治理Dataphin的过程中有任何疑问,您可通过答疑支持联系我们,为您答疑解惑。使用说明 需保证网络连通、Dataphin已升级至3.14.1及以上版本且已经对接工单系统(如需对接可联系运维部署团队)方可使用工单功能。...

功能特性

灵骏满足AI、HPC等计算密集场景需要的高性能算力,可实现高性能、规模的池化算力,满足自动驾驶、科研、金融、生物制药等多行业的异构算力需求。本文为您介绍灵骏的功能特性。高速RDMA网络架构 阿里巴巴2016年开始投入专项研究RDMA...

Dataphin免费试用申请

试用功能范围 版本:智能研发版-200数据处理单元 增值功能包:实时研发-标准版,资产质量-500规则,智能运维-3条基线+1条限流,数据标准-标准版,资产安全-标准版,资源治理-标准版,标签平台-试用版。若您希望体验API功能,可勾选数据服务...

数据建模:智能数据建模

智能数据建模是阿里云DataWorks自主研发的智能数据建模产品,沉淀了阿里巴巴十多年来数仓建模方法论的最佳实践,包含数仓规划、数据标准、维度建模及数据指标四大模块,帮助企业在搭建数据中台、数据集市建设过程中提升建模及逆向建模的...

合规&认证

当前Dataphin产品的开发、测试、运维和运营服务均已通过 ISO 27001、ISO 27018 认证,意味着Dataphin 及瓴羊在企业信息处理的安全性、技术先进性等方面已经达到国际水平,有能力为企业提供坚实的数据智能服务。ISO/IEC 27001:2013 作为国际...

创建GreenPlum数据

其架构主要针对管理规模分析型数据仓库以及商业智能工作负载而设计。更多详情,请参见 GreenPlum官网。使用限制 Dataphin仅支持超级管理员、数据源管理员、板块架构师、项目管理员角色创建数据源。超级管理员、数据源管理员角色添加与...

创建GreenPlum数据

其架构主要针对管理规模分析型数据仓库以及商业智能工作负载而设计。更多详情,请参见 GreenPlum官网。使用限制 Dataphin仅支持超级管理员、数据源管理员、板块架构师、项目管理员角色创建数据源。超级管理员、数据源管理员角色添加与...

应用场景

人工智能众包可以为如下业务场景提供服务:人工智能行业 智能家居的指定唤醒词语音收集、数字串朗读,可通过阿里巴巴集团的语音识别接口自动为语音质量打分,只交付合格的数据。智慧医疗领域:X光片、病历等数据采集,以及对病源部位进行...

开通Dataphin

在阿里云官网,鼠标悬停至 产品 后,再将鼠标悬停至左侧导航栏的 大数据计算 上,单击 数据开发与服务 列下的 智能数据建设与治理Dataphin。在Dataphin产品详情页,单击 特惠购买,进入Dataphin购买页面。在购买页面,选择 地域、版本、...

管理控制台介绍

数据标准是为业务、技术和管理提供服务和支持。包括数据标准、标准集、落标映射规则、标准代码(码表)、词根等功能。如果您选择了 资产质量,下方展示 质量概况 和 质量管理 增值功能。更多信息请参见 资产质量概述。提供全链路的资产质量...

管理控制台介绍

数据标准是为业务、技术和管理提供服务和支持。包括数据标准、标准集、落标映射规则、标准代码(码表)、词根等功能。如果您选择了 资产质量,下方展示 质量概况 和 质量管理 增值功能。更多信息请参见 资产质量概述。提供全链路的资产质量...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据库备份 DBS 智能推荐 AIRec 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用