2023年

2023年1228-MaxCompute升级公共云Endpoint 尊敬的MaxCompute用户:感谢您对云原生大数据计算服务MaxCompute的支持,MaxCompute将于北京时间2024年1月4日对华北2(北京)、华东2(上海)、华东1(杭州)、华南1(深圳)、华北3(张家口...

GetDoctorHDFSCluster-获取HDFS分析结果

c-b933c5aac8fe*DateTime string 是 其日期和时间信息以 ISO 8601 格式表示,例如:2023 年 1 1 为 2023-01-01。2023-01-01 返回参数 名称 类型 描述 示例值 object 返回数据 Data object HDFS 分析数据。Metrics object 指标信息。...

发展历程

关键性里程碑 2009年9,ODPS(即现在的MaxCompute)大数据平台飞天项目正式启动。2010年10,阿里巴巴集团自主研发的第一代云计算平台稳定运行。2013年8,平台的单集群规模已达到5000台。2014年7,平台开始对外提供服务,完全替换...

客户案例

DataWorks在多个行业中均有典型的案例落地,帮助多个行业的企业解决数据痛点,挖掘数据价值,本文为您介绍典型行业中已落地的客户案例。新零售行业:大润发云上数据中台建设 客户架构如下。客户简介 为了快速数字化转型,拥抱新零售,...

选型配置说明

存储价格估算如下:本地盘实例存储为0.04 元/GB/ OSS标准型存储为0.12 元/GB/ OSS归档型存储为0.033 元/GB/ OSS深度归档型存储为0.015 元/GB/ 高效云盘存储为0.35 元/GB/ SSD云盘存储为1.00 元/GB/ 云盘的具体价格信息,请参见...

DataWorks On EMR使用说明

数据地图概述 安全中心 数据保护伞 审批中心 安全中心是集数据资产分级分类、敏感数据识别、数据授权管理、敏感数据脱敏、敏感数据访问审计、风险识别与响应于一体的一站式数据安全治理界面,帮助用户落地数据安全治理事项。安全中心概述 ...

基本概念

DTS 数据传输服务(Data Transmission Service,简称DTS)支持关系型数据库(RDBMS)、非关系型数据库(NoSQL)、数据多维分析(OLAP)等数据源间的数据交互,集数据同步、迁移、订阅、集成、加工于一体,帮助您构建安全、可扩展、高可用的...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

DataWorks on EMR Serverless StarRocks最佳实践

2024年0201之前购买的资源组,如果在资源组与数据源网络已连通的情况下,此处元数据采集显示连通性测试不通过,请联系技术支持升级资源组版本后,再进行尝试。搜索 进入数据地图页面。登录 DataWorks控制台,切换至目标地域后,单击...

【通知】敏感数据保护功能商业化

自 2021年10月13日 起,阿里云数据管理DMS中的敏感数据保护功能将转入收费阶段。商业化时间 敏感数据保护功能将于 2021年10月13日 开始收费。功能变化 商业化后,敏感数据保护的细分功能的变化如下:功能 自由操作、稳定变更模式 安全协同...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

RDS术语

DMS Data Management,数据管理,是一种阿里云提供的图形化的数据管理工具,集数据管理、结构管理、访问安全、BI图表、数据趋势、数据轨迹、性能与优化和服务器管理于一体的数据管理服务。支持MySQL、SQL Server、PostgreSQL、MongoDB、...

ListDoctorHiveTables-批量获取Hive表分析结果

20 DateTime string 是 其日期和时间信息以 ISO 8601 格式表示,例如:2023 年 1 1 为 2023-01-01。2023-01-01 TableNames array 否 表名称队列,用于过滤结果。string 否 表名称,表名称遵循 Hive 通用写法,以{库名称.表名称}唯一...

ECS实例说明

大数据型 使用本地SATA盘作存储数据,存储性价比高,是大数据量(TB级别的数据量)场景下的推荐机型。说明 Hadoop、Data Science、Dataflow和Druid类型的集群支持Core节点;Zookeeper和Kafka类型的集群不支持Core节点。本地SSD型 使用本地...

ListDoctorHDFSDirectories-批量获取HDFS目录分析结果

20 DateTime string 是 其日期和时间信息以 ISO 8601 格式表示,例如:2023 年 1 1 为 2023-01-01。2023-01-01 DirPath string 否 目录名称。目录不超过 5 级。如果不填写,就是全量目录分析。tmp/test OrderType string 否 排序方向...

GetDoctorHDFSDirectory-获取HDFS特定目录分析结果

c-b933c5aac8fe*DateTime string 是 其日期和时间信息以 ISO 8601 格式表示,例如:2023 年 1 1 为 2023-01-01。2023-01-01 DirPath string 是 目录名称。目录不超过 5 级。tmp/test 返回参数 名称 类型 描述 示例值 object 返回数据 ...

GetDoctorHiveTable-获取Hive表分析结果

c-b933c5aac8fe*DateTime string 是 其日期和时间信息以 ISO 8601 格式表示,例如:2023 年 1 1 为 2023-01-01。2023-01-01 TableName string 是 表名称,表名称遵循 Hive 通用写法,以{库名称.表名称}唯一确定。dw.dwd_creta_service...

GetDoctorHiveDatabase-获取Hive库信息

数据指的是 7 日内没有访问的数据,但是 30 以内有访问的数据。Name string 指标名称。warmDataSize Value long 指标值。1000 Unit string 指标单位。MB Description string 指标描述。Ratio of warm files ColdDataSize object 冷数据...

ListDoctorHiveDatabases-批量获取 Hive 库信息

数据指的是 7 日内没有访问的数据,但是 30 以内有访问的数据。Name string 指标名称。warmDataSize Value long 指标值。1000 Unit string 指标单位。MB Description string 指标描述。Ratio of warm files ColdDataSize object 冷数据...

GetDoctorHiveCluster-获取 Hive 集群信息

c-b933c5aac8fe*DateTime string 是 其日期和时间信息以 ISO 8601 格式表示,例如:2023 年 1 1 为 2023-01-01。2023-01-01 返回参数 名称 类型 描述 示例值 object 返回数据 Data object Hive 分析数据。Formats object[]存储格式...

数据集成概述

背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量数据表的同步任务、能够集成多种异构数据源、能够实现对数据源的数据进行轻度预处理、能够实现数据同步任务的调优(例如容错,限速,并发)等。...

大数据AI公共数据集分析

本教程通过DataWorks,联合云原生大数据计算服务MaxCompute,使用大数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等公共数据),指导您如何快速进行大数据分析,快速熟悉DataWorks的操作界面与最基础的数据分析能力。DataWorks的更...

客户案例

MaxCompute已被广泛应用于各领域处理云上大数据,帮助众多企业解决了海量数据分析问题,同时降低企业运维成本,企业人员可更专注于业务开发。本文为您介绍MaxCompute的精选客户案例。MaxCompute的全量客户案例信息,请参见 行业客户案例...

轮播页面

数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

JindoFS介绍和使用

JindoFS是基于阿里云对象存储OSS,为开源大数据生态构建的Hadoop兼容文件系统(Hadoop Compatible File System,HCFS)。JindoFS提供兼容对象存储的纯客户端模式(SDK)和缓存模式(Cache),以支持与优化Hadoop和Spark生态大数据计算对OSS...

轮播页面

图表样式 轮播页面是基础交互组件的一种,仅支持在数据中配置页面的属性,包括ID、页面名称和链接,适用于在数据看板中轮播展示多个网页。样式面板 搜索配置:单击 样式 面板右上角的搜索配置项图标,可在搜索配置面板中输入您需要搜索的...

数据集成支持的数据

支持 NoSQL数据源 HBase0.9.4 不支持 不支持 HBase1.1x 支持 支持 HBase2.0 支持 支持 Elasticsearch 支持 支持 MongoDB 支持 支持 Tablestore 支持 支持 Aliyun HBase 不支持 不支持 Redis 支持 不支持 Lindorm 不支持 不支持 半结构化...

DescribeColumns-查询数据资产表中列的数据

调用DescribeColumns接口查询数据安全中心连接授权的MaxCompute、RDS等数据资产表中列的数据。接口说明 本接口一般用于敏感数据资产信息表中列数据的查看,便于用户准确的对敏感数据进行分析。注意事项 DescribeColumns 接口已修订为 ...

实施步骤

139.224.92.81/24,139.224.92.22/24,139.224.92.35/24,139.224.4.30/24,139.224.92.102/24,139.224.4.48/24,139.224.4.104/24,139.224.92.11/24,139.224.4.60/24,139.224.92.52/24,139.224.4.26/24,139.224.92.57/24,112.74.156.111/24,120...

冷热分层

背景信息 在海量大数据场景下,随着业务和数据量的不断增长,性能和成本的权衡成为大数据系统设计面临的关键挑战。Delta Lake是新型数据湖方案,推出了数据流入、数据组织管理、数据查询和数据流出等特性,同时提供了数据的ACID和CRUD操作...

数据集成概述

背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量数据表的同步任务、能够集成多种异构数据源、能够实现对数据源的数据进行轻度预处理、能够实现数据同步任务的调优(例如容错,限速,并发)等。...

数据

数据库备份场景下,有4个概念:数据库磁盘空间、数据文件空间、备份数据量、存储数据量。数据量 说明 数据库磁盘空间 由数据库的数据文件空间、数据库的日志文件空间、操作系统文件空间和空闲空间组成。说明 RDS中为:购买时选择的存储...

创建Impala数据

版本支持:CDH5:2.11.0 CDH6:3.2.0 CDP7.1.3:3.4.0 E-MapReduce 3.x:3.4.0 E-MapReduce 5.x:3.4.0 E-MapReduce 5.x:4.2.0 数据源描述 对数据源的简单描述。不得超过128个字符。数据源配置 选择需要配置的数据源:如果业务数据源区分生产...

通过RAM角色授权模式配置数据

本文以OSS数据源为例,为您介绍如何通过RAM角色授权模式配置数据源,提高云上数据的安全性。前提条件 如果您需使用RAM用户登录并完成本文操作流程,请先为RAM用户授予 AliyunDataWorksFullAccess 和 AliyunRAMFullAccess 权限策略,详情请...

2024年

操作审计事件数据迁移至MaxCompute 2024-03-26 新增Pandas API 新说明 MaxFrame提供了兼容Pandas的API接口,您可以用类似于Pandas的方式来操作MaxCompute中的数据,同时利用MaxCompute强大的分布式计算能力,简化您在大数据环境下的数据...

Dataphin支持的数据

背景信息 Dataphin支持对接的数据源包括大数据存储型数据源、文件数据源、消息队列数据源、关系型数据源和NoSQL数据源,各模块支持对接的数据源类型说明如下:如果您需要在Dataphin中连接某数据源,则需要先在数据源管理中创建该数据源。...

DataWorks On CDP/CDH使用说明

一、数据集成 DataWorks的数据集成模块为您提供读取和写入数据至CDP/CDH Hive、CDP/CDH HBase的能力,您需要将Hive或HBase组件创建为 DataWorks的 Hive或HBase数据源,实现将其他数据源的数据同步至Hive或HBase数据源,或将Hive或HBase数据...

配置MaxCompute输出

大数据计算服务MaxCompute(原名ODPS)为您提供完善的数据导入方案,能够快速解决海量数据的计算问题。前提条件 配置MaxCompute输出节点前,您需要先配置好相应的输入或转换数据源,详情请参见 实时同步能力说明。背景信息 写入数据不支持...

OSS数据安全防护最佳实践

DSC 在您完成数据源识别授权后,从您存储在OSS的海量数据中快速发现和定位敏感数据,对敏感数据分类分级并统一展示,同时追踪敏感数据的使用情况,并根据预先定义的安全策略,对数据进行保护和审计,以便您随时了解OSS数据资产的安全状态。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 数据库备份 DBS 云数据库 RDS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用