什么是DataWorks

从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与数万名政务、央国企、金融、零售、互联网、能源、制造、工业等行业的客户携手,不断提升数据应用效率,助力产业数字化升级。产品架构 DataWorks十多年...

添加处理后数据数据管理

数据处理后,需要将处理后的数据添加到数据管理中,以便被用于数仓建设、标签管理等数据中台任务。本文以倾斜数据处理后为例,介绍如何添加处理后数据数据管理。前提条件 已新建数据处理任务,具体操作,请参见 新建数据处理任务。操作...

功能简介

数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”地传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

空间数据(邀测

入库任务 支持将Shapefile、GeoJSON和CSV文件类矢量数据添加到系统默认的空间数据库或者指定的PostGIS、Ganos数据库,方便对空间数据库进行空间检索、数据质检、血缘记录,打通数据...,使得空间数据被用于数仓建设、标签管理等数据中台任务...

功能简介

入库任务 支持将Shapefile、GeoJSON和CSV文件类矢量数据添加到系统默认的空间数据库或者指定的PostGIS、Ganos数据库,方便对空间数据库进行空间检索、数据质检、血缘记录,打通数据...,使得空间数据被用于数仓建设、标签管理等数据中台任务...

统一服务

数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”的传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

功能简介

数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”地传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

准备工作

开通企业数据智能平台 企业数据智能平台默认为关闭状态,使用前需要前往 AnalyticDB PostgreSQL版 控制台开通。登录 云原生数据仓库AnalyticDB PostgreSQL版控制台。在控制台左上角,选择实例所在地域。...单击 开通数据中台

应用场景

构建数据中台,行业领域模型快速沉淀 场景:快速构建数据仓库,有效治理数据质量,实现政企客户各部门数据的业务协同和共享。痛点:以政务服务为例,政务服务部门众多,业务系统复杂、流程长,数据来源多且更新频率高;数据口径标准、数据...

区域热力层(v4.x版本)

数据源面板 地理边界geojson数据接口:通过配置地理边界geojson数据接口,可将提取到的区域GeoJSON边界数据应用到DataV,配置方法如下。数据提取。使用GeoJSON行政区划边界提取小工具 DataV.GeoAtlas,最低可以提取区县级边界数据,区域...

区域热力层(v3.x版本)

数据项配置 说明 数据源 组件的数据通过 代码编辑 或 可视化编辑 展示了组件所包含的数据字段。也可以修改 数据类型,灵活配置组件数据数据映射 当您需要自定义图表字段配置时,可以在 数据映射 模块设置不同的字段映射内容,将这些...

功能特性

例如:在部分场景,数据加载耗时可占据训练整体时长60%以上,KSpeed能够实现内存级数据主动预加载数据加载时长缩减到10%以内,相当于把单位时间内的计算性能提升了1倍。GPU容器虚拟化方案eGPU 针对AI作业规模庞大、GPU硬件资源昂贵、...

手动添加数据

您可以通过 数据库备份DBS 的手动添加数据源功能,将不同环境的数据库添加至 数据库备份DBS ,便于后续对数据源进行管理与备份。费用说明 添加数据源操作不会产生费用,只有在添加数据源后开启备份才会产生费用。如何开启备份,请参见 ...

清除数据

您可以在控制清除 云原生内存数据库Tair 实例的所有过期数据或所有数据。操作步骤 说明 在 参数设置 禁用 FLUSHALL 命令不会影响控制台中 清除数据 功能。访问 Tair实例列表,在上方选择地域,然后单击目标实例ID。在 实例信息 页面...

清除数据

您可以在控制清除 云数据库 Redis 版 实例的所有过期数据或所有数据。操作步骤 说明 在 参数设置 禁用 FLUSHALL 命令不会影响控制台中 清除数据 功能。访问 Redis实例列表,在上方选择地域,然后单击目标实例ID。在 实例信息 页面,...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

与Spark集成分析

用户可以通过DLA Ganos实现Spark加载HBase的时空数据并进行规模时空分析操作。DLA Ganos是基于云原生数据湖分析(Data Lake Analytics,DLA)系统设计开发的,面向时空大数据存储与计算的数据引擎产品。基于DLA无服务器化(Serverless...

将云消息队列 Kafka 版的数据迁移至MaxCompute

本文介绍如何使用DataWorks数据同步功能,将 云消息队列 Kafka 版 集群上的数据迁移至阿里云大数据计算服务MaxCompute,方便您对离线数据进行分析加工。前提条件 在开始本教程前,确保您在同一地域已完成以下操作:云消息队列 Kafka 版 ...

DataWorks数据服务对接DataV最佳实践

DataV通过与DataWorks数据服务的对接,通过交互式分析Hologres连接DataWorks数据服务开发并生成API,快速在DataV调用API并展现MaxCompute的数据分析结果。数据服务对接DataV产生背景 MaxCompute是阿里巴巴集团自主研究的快速、完全托管的...

DescribeSampleData-查询是否加载样本数据

loading:加载中。unload:未加载。loaded 示例 正常返回示例 JSON 格式 {"RequestId":"84CD7CAF-FA7B-5178-B19F-D8CDE307D5FA_8111","HasSampleData":true,"ErrorMessage":"*","DBInstanceId":"gp-bp12ga6v69h86*","SampleDataStatus":...

客户案例

基于飞天大数据平台产品DataWorks+MaxCompute大大提高了数据业务的开发效率,构建大润发的数据中台体系。新金融行业:某互联网金融公司湖仓一体案例 客户架构如下。客户简介 公司的第一代数据湖是基于Hadoop+OSS搭建的,同时引入的数据中台...

索引优化

大数据集场景下优先考虑稀疏索引:如果您的数据量非常地大,并且您的查询限定条件为<、、=、>=、>,需要从大数据量的表取出少于50%的数据,那么使用稀疏索引(BRIN Index或者AOCS表的metascan)可以极地减少无效数据加载。...

管理缓存

tmp was successfully freed from Alluxio space.load 加载数据到Alluxio缓存。语法 alluxio fs load示例:加载/tmp3/logs 目录的所有数据到Alluxio缓存。alluxio fs load/tmp3/logs 返回如下信息。tmp3/logs loaded persist 将...

创建全球数据库网络

全球数据网络(Global Database Network,简称GDN)是由分布在同一个国家不同地域的多个 PolarDB 集群组成的网络网络中所有集群的数据均保持同步。当您的业务部署在多个地域时,利用GDN可以实现应用访问数据库的低延迟和高稳定性。本文...

PostGIS

classOf[GanosSparkKryoRegistrator].getName).getOrCreate()import spark.implicits._/SparkSession加载JTS包用于处理时空数据 spark.withJTS val sc=spark.sparkContext 加载数据:/配置链接参数 val dsParams:JMap[String,String]=Map(...

我的看板

数据来源 在工作台中创建并发布的数据看板内容,会同步在此处展示,若数据看板仅编辑完成,但是未发布,则在此处不展示。如需编辑某一看板内容,请单击页面右上角的 前往可视化工作,编辑并发布对应数据看板后,刷新当前页面即可。操作...

Hive

Hive是Hadoop生态系统的一个被广泛使用的数据仓库工具,主要用来进行Hadoop规模数据的提取、转化、加载、查询和分析等操作。Hive数据仓库工具能将存储在HDFS系统的结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将...

添加 MySQL 数据源的白名单

进入云服务器 ECS 控制的 安全组 页面,在 创建安全组 右侧的下拉列表选择 专有网络 ID,粘贴 VPC ID 筛选安全组。单击目标安全组的名称,进入详情页面。在 入方向 快速添加 IP 地址。复制 OMS 控制 添加数据源 对话框显示的 ...

数据分析整体趋势

随着Google等互联网企业崛起,以Hadoop为代表的基于传统x86服务器集群的大数据技术迅速发展,同时开源分布式数据库如Greenplum等也成为相应替代方案,为广大小企业,尤其是互联网行业大大降低了数据分析的技术和成本门槛,还有分布式技术...

创建数据

概述 您可以通过以下方式创建 OceanBase 开发者中心(OceanBase Developer Center,ODC)数据源:ODC 首页创建数据源:进入 ODC 首页后,单击 新建连接 按钮创建数据源。公有云实例创建数据源:公有云的实例,单击 登录数据库,输入...

添加 Oracle 数据源的白名单

进入云服务器 ECS 控制的 安全组 页面,在 创建安全组 右侧的下拉列表选择 专有网络 ID,粘贴 VPC ID 筛选安全组。单击目标安全组的名称,进入详情页面。在 入方向 快速添加 IP 地址。复制 OMS 控制 添加数据源 对话框显示的 ...

添加 Kafka 数据源的白名单

进入云服务器 ECS 控制的 安全组 页面,在 创建安全组 右侧的下拉列表选择 专有网络 ID,通过 VPC ID 筛选安全组。单击目标安全组的名称,进入详情页面。在 入方向 快速添加 IP 地址。复制 OMS 控制 添加数据源 对话框显示的 ...

规格及选型

案例二:互联网SaaS用户 用户为互联网SaaS客户,需要建立数据中台,涉及多数据源包括RDS、Flink、OSS等,期待在平台上完成数据的ETL流程,实现多源处理以及分析侧不同场景的混合负载支持,需要高稳定性保证,同时平台对接数据应用支持报表...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

PolarDB

本文主要介绍DLA Ganos如何加载PolarDB的栅格数据。操作步骤 初始化Spark Session。val spark:SparkSession={ val session=SparkSession.builder.master("local[*]").withKryoSerialization.config(additionalConf).getOrCreate()session...

PolarDB

classOf[GanosSparkKryoRegistrator].getName).getOrCreate()import spark.implicits._/SparkSession加载JTS包用于处理时空数据 spark.withJTS val sc=spark.sparkContext 加载数据:Spark format方式:/配置链接参数 val dsParams:JMap...

同步数据

本文介绍了多种同步数据的方式。分析型数据库MySQL版支持多种数据加载方式,包括但不限于:...通过DML(INSERT 和 DELETE)命令加载数据到分析型数据库MySQL版。如果数据在数据库其它表已经存在,可以使用 INSERT SELECT FROM 加载数据

客户案例

MaxCompute已被广泛应用于各领域处理云上大数据,帮助众多企业解决了海量数据分析问题,同时降低企业运维成本,企业人员可更专注于业务开发。本文为您介绍MaxCompute的精选客户案例。MaxCompute的全量客户案例信息,请参见 行业客户案例...

结束数据迁移任务

对于需要停止或迁移失败(不再需要)的任务,您可以结束数据迁移任务,避免源数据库的数据覆盖写入至目标数据。前提条件 数据迁移任务处于 迁移、已暂停、迁移失败 状态。影响 结束数据迁移任务后,数据迁移任务将处于 已完成 状态,...

修改数据库密码

说明 若数据传输控制自动跳转至数据管理DMS控制,您可以在右下角的 单击,返回至旧版数据传输控制。根据实例类型,在左侧导航栏单击 数据迁移、数据同步 或 数据订阅。在页面顶部选择实例所属地域。找到目标实例,单击实例ID。根据...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 云数据库 RDS 数据库备份 DBS 云数据库 MongoDB 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用