客户案例

价值体现 从大数据平台上云整体“降本增效”的方案快速切入,迁移到大数据MaxCompute、实时计算、DataWorks后,部分任务有10倍以上的性能提升,存储从自建Hadoop 3PB降到900T,利用Flink实时数据处理能力,将宝宝树现有的场景实时化(...

索引优化

数据集场景下优先考虑稀疏索引:如果您的数据量非常地大,并且您的查询限定条件为<、、=、>=、>,需要从大数据量的表中取出少于50%的数据,那么使用稀疏索引(BRIN Index或者AOCS表的metascan)可以极大地减少无效数据的加载。...

数据模型架构规范

主要从数据业务特性和访问特性两个角度来考虑:将业务相近或者相关的数据、粒度相同数据设计为一个逻辑或者物理模型;将高概率同时访问的数据放一起,将低概率同时访问的数据分开存储。核心模型与扩展模型分离 建立核心模型与扩展模型体系...

什么是数据库审计

数据库审计服务还具备强大的数据库活动审计分析能力,多个角度灵活呈现数据库的活动状态,帮助您有效执行安全策略。采用全新的人机交互操作模式,基于人性化、专业化和可用性三个层面设计产品界面。在审计日志统计分析方面,数据库审计...

报表中心

背景信息 数据库审计系统内置以下报表模板,分别不同角度展示数据库审计的分析结果。综合报表:SQL语句执行情况、会话连接、风险事件、SQL性能等角度,分析展示数据库的综合状况。合规报表:目前提供SOX-塞班斯报告和PCI-报告两类合规...

数据服务入门

DataWorks数据服务的主要目标是为个人、团队和企业构建统一的数据服务总线,帮助用户统一管理面向内外部的API服务。例如,您可以将查询数据表功能快速的生成对应的API,或将已有的API注册至数据服务平台进行统一发布和管理。本文以MySQL...

使用须知

您可以查询并分析存储在MaxCompute上的规模数据。MaxCompute SQL支持如下主要功能。功能项 说明 DDL操作 支持管理表、分区、列、生命周期及视图。DML操作 支持插入或更新表、分区数据。DQL操作 支持SELECT、子查询等多种查询操作。增强...

文档修订记录

注册EMR集群至DataWorks 2023.6.27 更新功能 运维中心 运维大屏功能改版,支持展示工作空间的运维稳定性评估、重点关注的运维指标、调度资源使用及周期任务运行概况,以及数据集成同步任务的运行详情,助力您宏观角度快速了解空间任务的...

功能发布记录 2022年之前

DataWorks的数据治理中心全局视角、工作空间视角、个人视角,自动发现并量化平台使用过程中数据存储、任务计算、代码开发、数据质量及数据安全等维度存在的待治理问题,并通过健康分模型进行统计,以治理报告及治理排行榜的形式呈现治理...

仪表盘

仪表盘是 数据管理DMS 数据分析的其中一种可视化应用类型,其提供自动布局和可交互能力,您可以通过使用仪表盘来进行数据分析和制作可视化报表。本文介绍仪表盘的基本概念、功能展示及操作步骤。基本概念 仪表盘集合:仪表盘集合是用户管理...

新功能发布记录

开启安全访问代理 接入达梦数据库 新增 全面直接接入达梦数据库(DM),包括数据导入、数据查询、数据变更、数据导出、数据服务与数据可视化等功能。支持的数据库类型与功能 数据类目 新增 对表进行分类,便于管理人员、开发人员及运维人员...

公告

新增支持OpenGauss数据源、SAP Table数据源、StarRocks数据源、Hudi数据源、Doris数据源、Greenplum数据源。资产质量新增跨源两表字段统计值一致性的质量规则模板,用于跨数据源的数据对比;有效性/字段格式校验的规则模板增加like表达式;...

数据存储

业务角度看,Key和Value可以分别对应维度列和指标列。其中数据模型定义(keys_type)中指定的列为Key列,其他列为Value列,底层存储数据时会按照Key列排序。对于用户写入的数据,SelectDB会根据不同数据模型,对于Key列相同的行(Row)...

层次调用规范

在完成数据仓库的分层后,您需要对各层次的数据之间的调用关系作出约定。层次调用规范 ADS应用层优先调用数据仓库公共层数据。如果已经存在CDM层数据,不允许ADS应用层跨过CDM中间层ODS层重复加工数据。CDM中间层应该积极了解应用层数据...

数据库性能

通过DAS的一键诊断、实时性能、实时会话、空间分析功能,您可以多个角度了解数据库状况,及时定位并解决存在的问题,保障服务的安全性和稳定性。功能介绍 功能 描述 一键诊断 您可以通过一键诊断直观地查看数据库性能情况的全貌,快速...

层次调用规范

在完成数据仓库的分层后,您需要对各层次的数据之间的调用关系作出约定。层次调用规范 ADS应用层优先调用数据仓库公共层数据。如果已经存在CDM层数据,不允许ADS应用层跨过CDM中间层ODS层重复加工数据。CDM中间层应该积极了解应用层数据...

概述

技术领域 从技术领域的角度,Flink主要用于以下场景:实时ETL(Extract-transform-load)和数据流 实时ETL和数据流的目的是实时地把数据从A点投递到B点。在投递的过程中可能添加数据清洗和集成的工作,例如实时构建搜索系统的索引和实时数...

常见问题

1.售前咨询渠道 尊敬的“准”大数据专家服务用户您好:如果您准备购买阿里云大数据专家服务,但是遇到如服务范围、规格、服务选择等售前方面的问题,您可以通过钉钉与我们联系,您将“当面”获得阿里云大数据专家咨询专家的建议。...

什么是EMR on ACK

阿里云E-MapReduce(简称EMR)on ACK提供了全新构建大数据平台的方式。您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注...

什么是DataWorks

2015年DataWorks正式上云,将多年沉淀的数据建设方法论产品化输出,服务阿里云上客户,通过不断迭代的产品能力,DataWorks正在与各行各业的客户与合作伙伴一起,通过全链路数据治理,管得好数据、用得好数据,让数据从低质低效向高质高效...

产品概述

产品描述 Dataphin是集产品、技术、方法论于一体的智能大数据平台建设引擎,为您提供数据引入、规范定义、建模研发、资产管理、数据服务等全链路智能数据建设及治理服务。功能 描述 Dataphin全托管 全托管又称公共云多租户模式,只需购买...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

应用场景

数据分析业务 云数据库 Memcache 版搭配大数据计算服务 MaxCompute。实现对大数据的分布式分析处理,适用于商业分析、挖掘等大数据处理场景。通过数据集成服务可自助实现数据在云数据库 Memcache 版与 MaxCompute 间的同步,简化数据操作...

技术架构选型

本教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

IoT数据自动化同步至云端解决方案

大数据分析是大数据完成数据价值化的重要手段之一,而进行大数据分析的第一步是让数据成功上云。解决方案 IoT数据自动化同步至云端解决方案主要包括存储原始数据和同步数据至分析系统两部分。IoT设备大量的数据通常以半结构化的形式存储。...

技术架构选型

本教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

什么是Dataphin

Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,一站式提供数据采、建、管、用全生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据中台。Dataphin兼容多种计算...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

混合存储型(已停售)

云原生内存数据库Tair 混合存储型整合了内存和磁盘二者的优势,在提供高速数据读写能力的同时满足了数据持久化的需求。说明 混合存储型已停止售卖,更多信息,请参见【通知】混合存储型实例停止售卖,推荐选择 持久内存型 实例。简介 图 1....

入门概览

如果您需要将数据从OSS导入到图数据库GDB中,需要提前创建服务关联角色。具体操作,请参见 授权GDB访问OSS。操作流程 从购买实例到连接实例,您需要完成以下操作:可选:授权RAM用户访问控制台 如果您需要使用RAM用户(子账号)管理图数据...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

基于MaxCompute进行大数据BI分析

本实践以电商行业为例,通过MaxCompute、DataWorks对业务数据和日志数据进行ETL处理,并同步至分析型数据库MySQL(AnalyticDB MySQL)进行实时分析,再通过Quick BI进行可视化展示。背景信息 MaxCompute:用于进行规模数据计算,详情请...

自媒体:易撰

所属行业:自媒体 网站地址:易撰 客户介绍 长沙营智信息技术有限公司是专业的新媒体大数据服务商,其旗下知名品牌易撰,基于新媒体大数据挖掘技术及NLP算法分析,为各内容创客、广告主提供全面、科学、精准的大数据分析服务以及大数据架构...

适用场景

从数据库自身角度出发,业务使用的SQL语句、数据类型、事务、索引、其他功能均是确定的。对于部分业务而言,只要SQL语法、数据类型、事务、索引支持较为完整,且具备有效手段可在各种极端场景下进行水平扩展,那么对于高速发展的业务而...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

DMS支持的数据库

本文介绍数据管理DMS支持录入的云数据库、他云/自建的数据库类型。支持的云数据库 关系型数据库 RDS MySQL RDS SQL Server RDS PostgreSQL RDS MariaDB PolarDB MySQL版 PolarDB PostgreSQL版 PolarDB PostgreSQL版(兼容Oracle)PolarDB...

数据可视化概览

背景信息 DMS为您提供了数据数据管理的能力,同时通过SQL Console控制台为您提供以表格形式查询数据的方式,但对于需要通过分析数据去发现业务特性,比如分析趋势、增长对比等场景,单纯的表格无法满足需求,需要把数据可视化才可以支撑...

账单数据订阅及查询分析

DataWorks及MaxCompute:DataWorks基于MaxCompute等大数据引擎,支持您在线进行SQL分析、业务洞察、编辑和分享数据,以及将查询结果保存为可视化图表卡片,快速搭建可视化数据报告。订阅账单数据后,用户中心会将相关账单数据同步至指定...

常见问题

数据湖后端存储使用OSS,用户使用数据湖构建面向大数据分析和机器学习场景可以获得集中式权限管理和统一的元数据视图,更容易对接云上大数据和分析产品。什么情况下我需要使用数据湖构建?在云上有数据分析和机器学习需求,希望构建云上的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 数据库备份 DBS 云数据库 RDS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用