加工数据

前提条件 开始本实验前,请首先完成 采集数据 的操作。创建函数 上传资源 下载 ip2region-emr.jar。在 数据开发 页面打开WorkShop业务流程,右键单击 EMR,选择 新建资源>EMR JAR,配置新建资源参数。关键参数配置如下:存储路径:选择...

基于GitHub公开事件数据集的离线实时一体化实践

MaxCompute是适用于数据分析场景的企业级SaaS(Software as a Service)模式云数据仓库,可以直接通过外表的方式读取并解析OSS的半结构化数据,将高价值可用数据集成至MaxCompute内部存储,然后结合DataWorks进行数据开发,生成离线数据...

数据库评估常见问题

画像报错,采集数据中缺乏某信息?ADAM 画像必须分析完整的采集数据,如果缺乏某些必要信息,请重启采集或联系 ADAM 工作人员。画像内容,如何查看兼容度?ADAM 数据库画像主要内容是围绕着源 Oracle 信息,如果想查看目标数据库兼容性,请...

采集数据

注意事项 本案例数据采集和数据加工的部分任务可以通过ETL工作流模板一键导入。在导入模板后,您可以前往目标空间,并自行完成后续的数据质量监控和数据可视化操作。仅 空间管理员 角色可导入ETL模板至目标工作空间,为账号授权空间...

整体架构

湖仓版(3.0)架构如下:数据数据管道APS可以一键低成本接入数据库、日志、大数据中数据。存储层+计算层 支持自研引擎,羲和计算引擎和玄武存储引擎。新增集成的开源引擎,Spark计算引擎和Hudi存储引擎。可以借助开源的能力为您提供更...

区域热力层

数据映射 当您需要自定义图表字段配置时,可以在 数据映射 模块设置不同的字段映射内容,将这些字段映射到组件对应的字段上。无需修改数据源的字段,就可以实现数据的实时匹配。也可以单击 图标对字段分别样式配置。过滤器 打开 过滤器,...

区域热力层

数据源 单击 配置数据源,可在 设置数据源 面板修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

创建Impala数据

在 新建数据源 对话框的 大数据存储 区域,选择 Impala。如果您最近使用过Impala,也可以在 最近使用 区域选择Impala。同时,您也可以在搜索框,输入Impala的关键词,快速筛选。在 新建Impala数据源 对话框,配置连接数据源参数。配置...

创建Impala数据

在 新建数据源 对话框的 大数据存储 区域,选择 Impala。如果您最近使用过Impala,也可以在 最近使用 区域选择Impala。同时,您也可以在搜索框,输入Impala的关键词,快速筛选。在 新建Impala数据源 对话框,配置连接数据源参数。配置...

区域热力层(v1.x版本)

数据源 单击 配置数据源,可在 设置数据源 面板修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

创建HBase数据

通过创建HBase数据源能够实现Dataphin读取HBase的业务数据或向HBase写入数据。本文为您介绍如何创建HBase数据源。背景信息 HBase是用于处理存储在Hadoop集群大量数据的SQL查询引擎。如果您使用的是HBase,在导出Dataphin数据至HBase,您...

区域热力层(v2.x版本)

数据源 单击 配置数据源,可在 设置数据源 面板修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

区域下钻热力层(v2.x版本)

使用同样的方式可配置其他省市级的下钻区域数据数据的规律为 国家>省或直辖市>地市级>区县级,即上一级必须包含下一级的区域数据(adcode和位置数据等)才可下钻。映射数据接口:参见 区域热力层数据。交互 表 1.交互说明 交互 说明 当...

区域热力层

数据源 单击 配置数据源,可在 设置数据源 面板修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

区域热力层(v3.x版本)

选择 区域热力层数据>数据接口。在 设置数据源 面板选择 数据源类型 为 API。将修改后新生成的JSON API地址粘贴到数据输入区,设置完成后,高要区 标注显示正常。数据项配置 说明 数据源 组件的数据源通过 代码编辑 或 可视化编辑 展示...

数据治理中心概述

数据治理中心可自动发现平台使用过程中数据存储、任务计算、代码开发、数据质量及安全等维度存在的问题,并通过健康分量化评估,从全局、工作空间、个人等多个视角,以治理报告及排行榜呈现治理成果,帮助您高效达成治理目标。同时,提供...

什么是DataWorks

从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与数万名政务、央国企、金融、零售、互联网、能源、制造、工业等行业的客户携手,不断提升数据应用效率,助力产业数字化升级。产品架构 DataWorks十多年...

管理问题数据

问题数据采集结果将存储与MaxCompute临时表,此过程将产生MaxCompute计算引擎存储费用。保留问题数据配置入口 您可在按表配置数据质量监控规则,添加模板规则时,在部分字段级规则配置入口,开启问题数据保留配置。开启问题数据保留配置...

入湖基础操作

关系数据库全量入湖:可以实现RDS MySQL或PolarDB数据库表数据全量同步到数据湖,选择在数据源管理中配置好的数据源,将数据源对应数据库中选定表的数据全量同步到OSS中,如果待同步表中数据,则所消耗的资源也会比较,建议在业务...

区域热力层

数据源 单击 配置数据源,可在 设置数据源 面板修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

知识库

说明 如需在数据治理中心使用Hologres数据源,请先在数据地图中采集Hologres元数据。具体操作,请参见 元数据采集。当前仅华北2(北京)、华东2(上海)、华东1(杭州)和华南1(深圳)地域的数据治理中心支持Hologres数据源。查看治理项...

数据分析概述

功能概述 SQL查询 SQL查询是使用标准的SQL语句,来查询和分析存储在MaxCompute大数据,详情请参见 SQL查询。您可以通过编写SQL语句,对有查询权限的数据源进行快速的数据查询与分析操作,详情请参见 功能概览。DataWorks SQL查询提供了...

功能特性

结构同步 空库初始化 支持将源数据库的表结构同步至空数据库数据库中不存在任何表),实现快速同步数据库表结构,适用部署多区域、多单元的数据库环境。空库初始化 表一致性修复 用于对比不同表之间的表结构,找出差异并在目标表执行...

同步字典

实例录入数据管理DMS后,DMS会自动采集实例中数据库的字典信息。当您在DMS发现实例信息不一致时,您可以手动同步字典。如果您在DMS进行数据库结构变更,DMS会自动同步字典,否则需要手动同步字典。背景信息 字典信息用于实现数据库、表、...

DataWorks数据服务对接DataV最佳实践

DataV通过与DataWorks数据服务的对接,通过交互式分析Hologres连接DataWorks数据服务开发并生成API,快速在DataV调用API并展现MaxCompute的数据分析结果。数据服务对接DataV产生背景 MaxCompute是阿里巴巴集团自主研究的快速、完全托管的...

全景查看表

说明 如需查看Hologres数据源下的表,请先在数据地图中采集Hologres元数据。具体操作,请参见 元数据采集。当前仅华北2(北京)、华东2(上海)、华东1(杭州)和华南1(深圳)地域的数据治理中心支持Hologres数据源。进入表360页面 登录 ...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

元数据采集

如果您需要采集其他工作空间中数据源的元数据信息,您可以联系空间管理员添加空间成员,详情请参见 为工作空间添加空间成员。当您需要采集已开启白名单访问控制的数据源的元数据时,则需要提前配置好数据库的白名单权限。详情请参见 元数据...

数据服务入门

步骤一:创建数据源并配置网络连通性 使用数据服务创建API前,您需将数据库或数据仓库添加为DataWorks的数据源,并保障数据服务资源组与您的目标数据源网络连通,以便调用API时DataWorks可成功访问数据源。说明 DataWorks工作空间将集群或...

技术架构选型

本教程使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据采集和基本的ETL。MaxCompute作为整个大数据开发过程的离线计算引擎。...

技术架构选型

本教程使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据采集和基本的ETL。MaxCompute作为整个大数据开发过程的离线计算引擎。...

轮播页面

图表样式 轮播页面是基础交互组件的一种,仅支持在数据中配置页面的属性,包括ID、页面名称和链接,适用于在数据看板轮播展示多个网页。样式面板 搜索配置:单击 样式 面板右上角的搜索配置项图标,可在搜索配置面板输入您需要搜索的...

轮播页面

数据源 单击 配置数据源,可在 设置数据源 面板修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

数据地图概述

数据发现 页面通过 元数据采集器 将其他数据的元数据采集至DataWorks数据地图,采集完成后,您可以在数据地图搜索并查看各数据源的元数据信息。除MaxCompute以外,目前数据地图支持的其他数据源类型有:E-MapReduce、Hologres、CDH ...

热力线层

数据源 单击 配置数据源,可在 设置数据源 面板修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

热力线层

渐变速度:热力线层渐隐渐显的速度,值越则速度越快。最小值颜色:数据中value值最小的线的颜色。最大值颜色:数据中value值最大的线的颜色,请参见 颜色选择器说明 进行修改。最大透明度:热力线的最大透明度,根据数据中每条线对应的...

EMR+DLF数据湖解决方案

步骤三:初始化数据 初始化数据一般常见的几种情况如下:已有大数据集群,需要进行数据迁移,此时可以考虑通过 Jindo DistCp 工具将老集群的数据迁移到OSS。从RDS/MySQL/Kafka 等业务系统接入数据,此时可以考虑通过实时计算Flink实现...

通过Logstash导入数仓版

Logstash组件介绍 输入-采集各种样式、大小和来源的数据 在实际业务数据往往以各种各样的形式分散或集中地存储在多个系统中,Logstash支持多种数据输入方式,可以在同一时间从多种数据源采集数据。Logstash能够以连续的流式传输方式...

路网轨迹层

数据源 单击 配置数据源,可在 设置数据源 面板修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

路网轨迹层

数据映射 当您需要自定义图表字段配置时,可以在 数据映射 模块设置不同的字段映射内容,将这些字段映射到组件对应的字段上。无需修改数据源的字段,就可以实现数据的实时匹配。也可以单击 图标对字段分别样式配置。过滤器 打开 过滤器,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 DBS 云数据库 RDS 数据传输服务 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用