大数据人工智能技术-大数据人工智能技术文档介绍内容-阿里云

开发流程

创建表导入数据通用数据开发 ② Designer 支持大规模分布式的传统机器学习、深度学习、强化学习训练，支持流批一体训练，该子模块封装了上百种机器学习算法，您可以拖拽式建模、自动调参，从而无编程玩转人工智能。Designer概述 ③ ...

数据集成支持的数据源

离线集成支持的数据源数据源读取写入 大数据存储型数据源 MaxCompute 支持支持 Hologres 支持支持 IMPALA 支持支持 TDH Inceptor 支持支持 StarRocks 支持不支持 Hudi 支持支持 Doris 支持不支持 GreenPlum 支持支持 TDengine ...

JOIN

这样可以节省在Shuffle阶段时要进行的大量数据传输工作，从而达到优化作业的目的。例如，当需要连接一个大表和一个小表时，您也可以将小表加载到内存中，从而提高运行效率。配置组件在Designer工作流页面添加 JOIN 组件（仅支持可视化方式...

什么是DSW

DSW（Data Science Workshop）是为算法开发者量...AI+大数据一体化 DSW除了支持Python和R语言之外，还对接了大数据的能力，用户能够通过SQL File插件，使用SQL语句对MaxCompute数据源进行数据查询，或通过Notebook连接EMR集群提交Spark任务。

支持的云服务

人工智能平台 PAI 人工智能平台 PAI 是基于MaxCompute的一款机器学习算法平台，实现了数据无需搬迁，便可进行从数据处理、模型训练、服务部署到预测的一站式机器学习。您创建MaxCompute项目并开通机器学习服务后，即可通过机器学习平台的...

功能简介

洞察是一款自助式数据挖掘分析型，面向业务管理者、运营、业务分析师等人员提供低使用门槛的智能、自动化、全面、精准的数据诊断和分析能力，智能发现数据规律或异常，实现从数据到知识的提取，辅助业务决策。几乎每个业务每天都存在业务...

数据集成支持的数据源

离线集成支持的数据源数据源读取写入 大数据存储型数据源 MaxCompute 支持支持 Hive 支持支持 Hologres 支持支持 IMPALA 支持支持 TDH Inceptor 支持支持 Kudu 支持支持 StarRocks 支持支持 Hudi 支持支持 Doris 支持支持 ...

准备数据源和计算源

准备数据源 Dataphin支持对接的数据源包括大数据存储型数据源、文件数据源、消息队列数据源、关系型数据源和NoSQL数据源，各模块支持对接的数据源类型及操作指导，请参见 Dataphin支持的数据源。重要确定业务数据源类型后，在Dataphin创建...

准备数据源和计算源

准备数据源 Dataphin支持对接的数据源包括大数据存储型数据源、文件数据源、消息队列数据源、关系型数据源和NoSQL数据源，各模块支持对接的数据源类型及操作指导，请参见 Dataphin支持的数据源。重要确定业务数据源类型后，在Dataphin创建...

创建MaxCompute数据源

背景信息 MaxCompute即阿里云大数据计算服务，适用于数据分析场景的企业级SaaS（Software as a Service）模式云数据仓库，以Serverless架构提供快速、全托管的在线数据仓库服务，消除了传统数据平台在资源扩展性和弹性方面的限制，最小化...

查看集群信息

在左侧导航栏，选择数据大盘>数据概览。您可以在数据概览页面，查看集群数、分组数等信息。操作日志登录灵骏控制台。在左侧导航栏，选择数据大盘>操作日志。单击事件查询页签，查看事件时间、事件名称等信息。单击事件聚合...

数据源白名单配置

产品名称操作说明云原生大数据计算服务MaxCompute 设置白名单实时数仓Hologres IP白名单云数据库ClickHouse 设置白名单消息队列Kafka版配置白名单云原生分布式数据库PolarDB-X 设置白名单云原生分布式数据库PolarDB-X（2.0）设置白...

创建Hudi数据源

背景信息 Hudi即Apache Hudi，Hudi是一个通用的大数据存储系统，将核心仓库和数据库功能直接引入到数据库中，并支持记录级别的插入更新和删除数据的能力。权限说明仅支持超级管理员、数据源管理员、板块架构师、项目管理员角色创建数据...

数据大盘

在左侧导航栏，单击数据大盘>数据概览。您可以在数据概览页面查看集群数、分组数等基本信息，以及使用率汇总、集群磁盘信息、集群网络带宽使用等趋势图。查看操作日志在左侧导航栏，单击数据大盘>操作日志。您可以在事件查询页签，...

配置DataHub输出组件

配置DataHub输出组件，可以将外部数据库中读取数据写入到DataHub，或从大数据平台对接的存储系统中将数据复制推送至DataHub，进行数据整合和再加工。本文为您介绍如何配置DataHub输出组件。前提条件已创建DataHub数据源。具体操作，请参见...

升级

在阿里云官网，鼠标悬停至产品后，再将鼠标悬停至左侧导航栏的 大数据 上，单击数据开发和治理列下的 Dataphin。在Dataphin产品详情页，单击产品控制台，进入Dataphin管理控制台页面。在Dataphin管理控制台页面，单击已开通版本详情后...

配置ArgoDB输出组件

配置ArgoDB输出组件，可以将外部数据库中读取的数据写入到ArgoDB，或从大数据平台对接的存储系统中将数据复制推送至ArgoDB，进行数据整合和再加工。本文为您介绍如何配置ArgoDB输出组件。使用限制 ArgoDB输出组件支持写入文件格式为orc、...

创建Teradata数据源

通过创建Teradata数据源能够实现Dataphin读取Teradata的业务数据或向Teradata写入数据。本文为您介绍如何创建Teradata数据源。背景信息 Teradata是一款大型数据仓库系统。如果您使用的是Teradata，在对接Dataphin进行数据开发或导出...

创建Teradata数据源

通过创建Teradata数据源能够实现Dataphin读取Teradata的业务数据或向Teradata写入数据。本文为您介绍如何创建Teradata数据源。背景信息 Teradata是一款大型数据仓库系统。如果您使用的是Teradata，在对接Dataphin进行数据开发或导出...

Designer使用案例汇总

智能风控解决方案案例名称描述图像内容风控解决方案基于人工智能算法快速构建符合业务场景的风控模型，并部署为EAS在线服务，助力您快速识别高风险内容，进而对其进行拦截。文本内容风控解决方案介绍如何基于人工智能算法，快速构建...

数据源管理概述

功能介绍多数据源类型接入：Dataphin内置丰富的数据源类型，支持对接的数据源包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系型数据源和NoSQL数据源。更多信息，请参见 Dataphin支持的数据源。自定义数据源类型：在内置的...

数据源管理概述

功能介绍多数据源类型接入：Dataphin内置丰富的数据源类型，支持对接的数据源包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系型数据源和NoSQL数据源。更多信息，请参见 Dataphin支持的数据源。自定义数据源类型：在内置的...

MaxCompute表导入OSS

数据量大时可能会被切分为多个文件。支持的计算资源 MaxCompute 配置组件在Designer工作流页面添加 MaxCompute表导入OSS 组件，并在界面右侧配置相关参数：参数类型参数是否必选描述默认值字段设置 OSS存储目录是导出数据的OSS...

标注模板概述

背景信息 iTAG作为智能数据标注平台，提供了三种不同类型的模板以适应多样化的标注需求：租户模板租户模板是指在iTAG平台上由同一租户（即使用同一账号的企业或团队）创建并保存的个性化标注模板。这类模板是根据租户自身的业务场景定制的...

快速入门

如果您是首次使用智能数据建设与治理Dataphin，您可以参考快速入门文档，了解如何购买实例并接入服务端。Dataphin全托管 Dataphin全托管快速入门 Dataphin半托管 Dataphin半托管快速入门

什么是Dataphin

Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出，一站式提供数据采、建、管、用全生命周期的大数据能力，以助力企业显著提升数据治理水平，构建质量可靠、消费便捷、生产安全经济的企业级数据中台。Dataphin兼容多种计算...

答疑支持

若您在使用智能数据建设与治理Dataphin的过程中有任何疑问，您可通过答疑支持联系我们，为您答疑解惑。操作步骤在Dataphin页面，按照以下操作指引或单击蓝色小机器人选择答疑支持，进入答疑支持页面后，输入您需解答的问题。依次单击 ...

步骤六：可视化分析

本文将使用Quick BI指导您完成本教程的可视化分析步骤，包括数据源、数据集的创建和数据大屏图表的配置。步骤一：创建数据源登录 Quick BI控制台。按照下图操作指引，进入创建数据源对话框。在 MySQL-阿里云区域，配置连接参数。参数 ...

步骤六：可视化分析

本文将使用Quick BI指导您完成本教程的可视化分析步骤，包括数据源、数据集的创建和数据大屏图表的配置。步骤一：创建数据源登录 Quick BI控制台。按照下图操作指引，进入创建数据源对话框。在 MySQL-阿里云区域，配置连接参数。参数 ...

答疑支持

若您在使用智能数据建设与治理Dataphin的过程中有任何疑问，您可通过答疑支持联系我们，为您答疑解惑。使用说明需保证网络连通、Dataphin已升级至3.14.1及以上版本且已经对接工单系统（如需对接可联系运维部署团队）方可使用工单功能。...

功能特性

灵骏满足AI、HPC等计算密集场景需要的高性能算力，可实现高性能、大规模的池化算力，满足自动驾驶、科研、金融、生物制药等多行业的异构算力需求。本文为您介绍灵骏的功能特性。高速RDMA网络架构阿里巴巴2016年开始投入专项研究RDMA...

Dataphin免费试用申请

试用功能范围版本：智能研发版-200数据处理单元增值功能包：实时研发-标准版，资产质量-500规则，智能运维-3条基线+1条限流，数据标准-标准版，资产安全-标准版，资源治理-标准版，标签平台-试用版。若您希望体验API功能，可勾选数据服务...

数据建模：智能数据建模

智能数据建模是阿里云DataWorks自主研发的智能数据建模产品，沉淀了阿里巴巴十多年来数仓建模方法论的最佳实践，包含数仓规划、数据标准、维度建模及数据指标四大模块，帮助企业在搭建数据中台、数据集市建设过程中提升建模及逆向建模的...

合规&认证

当前Dataphin产品的开发、测试、运维和运营服务均已通过 ISO 27001、ISO 27018 认证，意味着Dataphin 及瓴羊在企业信息处理的安全性、技术先进性等方面已经达到国际水平，有能力为企业提供坚实的数据智能服务。ISO/IEC 27001:2013 作为国际...

创建GreenPlum数据源

其架构主要针对管理大规模分析型数据仓库以及商业智能工作负载而设计。更多详情，请参见 GreenPlum官网。使用限制 Dataphin仅支持超级管理员、数据源管理员、板块架构师、项目管理员角色创建数据源。超级管理员、数据源管理员角色添加与...

创建GreenPlum数据源

其架构主要针对管理大规模分析型数据仓库以及商业智能工作负载而设计。更多详情，请参见 GreenPlum官网。使用限制 Dataphin仅支持超级管理员、数据源管理员、板块架构师、项目管理员角色创建数据源。超级管理员、数据源管理员角色添加与...

应用场景

人工智能众包可以为如下业务场景提供服务：人工智能行业智能家居的指定唤醒词语音收集、数字串朗读，可通过阿里巴巴集团的语音识别接口自动为语音质量打分，只交付合格的数据。智慧医疗领域：X光片、病历等数据采集，以及对病源部位进行...

开通Dataphin

在阿里云官网，鼠标悬停至产品后，再将鼠标悬停至左侧导航栏的 大数据计算上，单击数据开发与服务列下的 智能数据建设与治理Dataphin。在Dataphin产品详情页，单击特惠购买，进入Dataphin购买页面。在购买页面，选择地域、版本、...

管理控制台介绍

数据标准是为业务、技术和管理提供服务和支持。包括数据标准、标准集、落标映射规则、标准代码（码表）、词根等功能。如果您选择了资产质量，下方展示质量概况和质量管理增值功能。更多信息请参见资产质量概述。提供全链路的资产质量...

管理控制台介绍

数据标准是为业务、技术和管理提供服务和支持。包括数据标准、标准集、落标映射规则、标准代码（码表）、词根等功能。如果您选择了资产质量，下方展示质量概况和质量管理增值功能。更多信息请参见资产质量概述。提供全链路的资产质量...

大数据人工智能技术

新品推荐