开启智能存储分层

您可以在开启智能存储分层功能后,修改 Logstore属性 页面中的存储层数据保存时间参数,将存储的保存时间延长,实现不同存储层间数据的转换。重要 存储保存时间配置存在相应限制,具体信息,请参见 数据存储生命周期管理。开启智能存储分层...

数据存储生命周期管理

生命周期管理策略 热存储数据至少需保存7天才能转换为低频存储,当数据的存储时间超过配置的 热存储层数据保存 时间后,数据自动由热存储转为低频存储。热存储数据至少需保存30天才能直接转换为归档存储,当数据的存储时间超过配置的 热...

整体架构

存储层+计算层 支持自研引擎,羲和计算引擎和玄武存储引擎。新增集成的开源引擎,Spark计算引擎和Hudi存储引擎。可以借助开源的能力为您提供更丰富的数据分析场景。同时打通自研和开源引擎之间的互相访问,提供更一体化的体验。存储层:只...

Delta Lake概述

Delta数据湖方案如下:在大数据存储层之上提供了数据管理层,该数据管理层等同于数据库中的元数据管理,其元数据随着数据一起存放并对用户可见(例如 图 1 所示)。Delta基于元数据管理引入了ACID,解决了因数据导入失败而产生脏数据和数据...

减灾与应急时空解决方案与案例

完全架构于云上,总体采用数据存储层、业务服务层和应用层三层架构。底层采用云原生数据库 PolarDB PostgreSQL版(兼容Oracle)+Ganos时空数据库引擎形成坚实底座,中间层采用GeoServer进行空间数据服务发布。支持直接导入面向对象存储OSS...

算子

Filter AnalyticDB MySQL版 支持两种数据过滤过程:数据源过滤:使用存储层数据的索引进行过滤。说明 没有独立的算子用于表示数据源过滤过程,该过程中的过滤条件会体现在TableScan算子中。关于TableScan算子的详情,请参见 TableScan。非...

公共汇总粒度事实(DWS)

asale_itm_slr_td(A电商公司卖家粒度商品截至当日存量汇总表)dws_asale_itm_slr_hh(A电商公司卖家粒度商品小时汇总表)-维度为小时 dws_asale_itm_slr_mm(A电商公司卖家粒度商品分钟汇总表)-维度为分钟 DWS层数据存储及生命周期管理...

公共汇总粒度事实(DWS)

asale_itm_slr_td(A电商公司卖家粒度商品截至当日存量汇总表)dws_asale_itm_slr_hh(A电商公司卖家粒度商品小时汇总表)-维度为小时 dws_asale_itm_slr_mm(A电商公司卖家粒度商品分钟汇总表)-维度为分钟 DWS层数据存储及生命周期管理...

01新建模型目录

DIM:全称Dimension,公共维度层,是在存储层的基础上清洗脏数据、筛选有价值数据,并且对明细数据层的事实维度表进行事实维度分离。与明细数据层相比,维度数据层有着相同的数据粒度,但是具有更小的数据量、更快的查询速度。操作步骤 ...

概述

Alluxio为数据驱动型应用和存储系统构建了桥梁,将数据存储层移动到距离数据驱动型应用更近的位置,从而能够更容易被访问,同时使得应用程序能够通过一个公共接口连接到许多存储系统。背景信息 在大数据生态系统中,Alluxio位于数据驱动...

创建数据脱敏场景

该场景下,数据在存储过程中便会按照配置的脱敏规则识别敏感数据并将其脱敏,脱敏完成后再将数据存储至指定数据库位置。权限控制 新增、编辑、删除脱敏场景:租户管理员、租户安全管理员 可选择的数据范围为租户下所有项目空间。空间管理员...

数仓分层

基于阿里巴巴OneData方法论最佳实践,在阿里巴巴的数据体系中,建议将数据仓库分为三层:数据引入(ODS,Operational Data Store)、数据公共(CDM,Common Dimensions Model)和数据应用(ADS,Application Data Store)。数据仓库...

自动归档

关键优势 成本低廉的归档数据存储 备份数据从标准转移到归档,低成本长期保存数据。更多信息,请参见 价格详情。全自动化的备份转归档执行 在备份策略中开启自动归档后,云备份 按照您设置的保留周期,自动完成备份数据从标准到归档...

读写分离架构

数据的写入,直接由AnalyticDB接入层的前端节点,经过SQL解析、合法性校验、分区选择等流程后,把数据实时写入存储层存储层采用完全对等的三副本架构,副本之间通过分布式一致性协议进行数据同步。SQL的查询链路经由前端节点,经过SQL...

数仓分层

在阿里巴巴的数据体系中,我们建议将数据仓库分为三层,自下而上为:数据引入(ODS,Operation Data Store)、数据公共(CDM,Common Data Model)和数据应用(ADS,Application Data Service)。数据仓库的分层和各层级用途如下图所...

数仓分层

在阿里巴巴的数据体系中,我们建议将数据仓库分为三层,自下而上为:数据引入(ODS,Operation Data Store)、数据公共(CDM,Common Data Model)和数据应用(ADS,Application Data Service)。数据仓库的分层和各层级用途如下图所...

某历史养成类游戏开发公司实时计算和数据仓库方案

梳理业务数据,对数据进行分层存储在Lindorm SQL+Spark中:1)操作数据层:手游客户端、用户中心、广告监测、游戏服务器等产生的原始日志;2)数据明细:操作数据层使用Spark Streaming等进行数据去噪、去重、字段规范后写入Lindorm SQL...

数据引入(ODS)

ODS(Operational Data Store)存放您从业务系统获取的最原始的数据,是其他上层数据的源数据。业务数据系统中的数据通常为非常细节的数据,经过长时间累积,且访问频率很高,是面向应用的数据。说明 在构建MaxCompute数据仓库的表之前,...

数据引入(ODS)

ODS(Operational Data Store)存放您从业务系统获取的最原始的数据,是其他上层数据的源数据。业务数据系统中的数据通常为非常细节的数据,经过长时间累积,且访问频率很高,是面向应用的数据。说明 在构建MaxCompute数据仓库的表之前,...

如何基于LSM-tree架构实现一写多读

Aurora是这个领域的开山鼻祖,实现了业内第一个一写多读的数据库,计算节点Scale up,存储节点Scale out,并将日志模块下推到存储层,计算节点之间,计算与存储节点之间传输redo日志,计算节点基于Quorum协议写多副本保证可靠性,存储层...

确定需求

在真实业务场景下,可以根据业务需求、使用频度、复用性及汇总层数据计算存储进行考虑,拆解分析。例如,本例中还可以定义全表为粒度,只是该粒度中无需维度,然后定义业务限定是类目为厨具,其他保持不变,如无特殊数据情况,也可得到相同...

PolarDB HTAP实时数据分析技术解密

IBM在2013年发布的10.5版本(Kepler)中,增加了DB2 BLU Acceleration组件,通过列式数据存储配合内存计算以及DataSkipping技术,大幅提升分析场景的性能。三家领先的商用数据库厂商,均同时采用了行列混合存储结合内存计算的技术路线。列...

列存索引技术架构介绍

IBM在2013年发布的10.5版本(Kepler)中,增加了DB2 BLU Acceleration组件,通过列式数据存储配合内存计算以及DataSkipping技术,大幅提升分析场景的性能。三家领先的商用数据库厂商,均同时采用了行列混合存储结合内存计算的技术路线。列...

Serverless存储层

存储层的整体架构如下图所示:存储层与其他组件的交互如下图所示:AnalyticDB MySQL 的存储层构建在云原生基础设施之上,该架构有如下几个特点:分层存储 存储介质提供冷热分层存储能力。实时数据存储在热存储(SSD)上,保证超低延时的...

技术架构

计算节点与存储节点之间通过理解数据库语义的智能互联协议将filter和projection等算子从计算层下推到存储层执行。为了保证事务和查询语句的低延迟,同时降低计算节点之间状态同步的延迟,计算节点和存储节点之间使用25Gb高速RDMA网络互联,...

CDM接口数据层设计规范

接口数据层将不同数据域的汇总数据预关联在一个物理表,开放给应用使用,以减少应用多次重复JOIN的成本开销,CDM接口数据层更适用于实时计算。命名规则:{project_name}.dwi{业务 BU 缩写/pub}{数据域/hbd}{数据粒度缩写}[{自定义表命名...

数仓规划概述

下图以默认的五层数据分层为例,数据分层规划完成后,后续的表数据存储可根据规划分别存储至不同的数据分层中。贴源:用于数据库、日志、消息等基础源数据的引入。源数据经过一系列ETL操作进入贴源,该层级只能挂载贴源表。公共:...

表设计规范

数据存储规范 按数据规划数据的生命周期:源表ODS:每天从业务系统同步过来的数据,全部保留,生命周期定义永久保存。当下游数据受损时,可以从ODS恢复数据。若ODS每天同步过来的是全量表,则可以通过全表拉链的方式来压缩存储。数据...

创建逻辑模型:明细表

可以指定明细表后续在数据建模分析使用时,明细表的数据存储于数仓中的哪个数据分层,一般情况下明细表可存储于数据明细(DWD)。明细表创建后,您可以为明细表添加字段,且可以对明细表进行关联和分区的设置,并且可使用统一的数据...

如何开启存储压缩功能

存储层对用户数据按块进行压缩存储,通过高压缩比,节省用户数据,降低存储成本。本文介绍如何开启存储压缩功能,以及查看开启该功能后存储空间大小的方法。前提条件 产品版本需为 PolarDB PostgreSQL版 企业版。产品系列为 集群版,且版本...

规划工作空间

资源倾斜:中晚期(例如5点~7点)的调度资源组、引擎计算资源、存储空间(应对数据膨胀)应用数据层(ADS):按业务划分,针对各专项业务,建立独立工作空间。任务节点:SQL任务、数据集成任务。数据表:以满足业务场景为优先。空间成员:...

公共规范

层次调用约定 应用应优先调用公共层数据,必须存在中间CDM数据,不允许应用跨过中间CDM从ODS重复加工数据。中间CDM需要积极了解应用层数据的建设需求,将公用的数据沉淀到公共,为其他提供数据服务。应用需要积极配合...

X-Engine简介

因为目标是面向大规模的海量数据存储,提供高并发事务处理能力和降低存储成本,在大部分大数据量场景下,数据被访问的机会是不均等的,访问频繁的热数据实际上占比很少,X-Engine根据数据访问频度的不同将数据划分为多个层次,针对每个层次...

创建数仓分层

各个分层的功能介绍如下:数据引入 ODS(Operational Data Store)ODS用于接收并处理需要存储数据仓库系统的原始数据,其数据表的结构与原始数据所在的数据系统中的表结构一致,是数据仓库的数据准备区。ODS对原始数据的操作具体...

数据模型架构规范

数据层次的划分 ODS:Operational Data Store,操作数据层,在结构上其与源系统的增量或者全量数据基本保持一致。它相当于一个数据准备区,同时又承担着基础数据的记录以及历史变化。其主要作用是把基础数据引入到MaxCompute。CDM:Common ...

如何开启存储压缩功能

存储层对用户数据按块进行压缩存储,通过高压缩比,节省用户数据,降低存储成本。本文介绍如何开启存储压缩功能,以及查看开启该功能后存储空间大小的方法。前提条件 PolarDB 产品版本需为 企业版,您可以通过 5.6/5.7/8.0内核版本 来确认...

如何开启存储压缩功能

存储层对用户数据按块进行压缩存储,通过高压缩比,节省用户数据,降低存储成本。本文介绍如何开启存储压缩功能,以及查看开启该功能后存储空间大小的方法。前提条件 PolarDB 产品版本需为 企业版,您可以通过 5.6/5.7/8.0内核版本 来确认...

概述

架构特点 云原生架构(存储和计算分离,低成本)PolarDB-X 列存索引,采用云原生对象存储OSS作为主要数据存储(成本仅为本地盘的1/6~1/10),同时结合列存数据本身的高压缩性(3~5倍),可以提供非常有竞争力的低成本优势。在HTAP行列混存...

资产安全概述

静态脱敏 直接修改底层数据的存储,数据存储时就已经是加密或者脱敏过的,例如常见的pn_md5。典型应用场景:数据集成时对敏感数据加密、数仓分层建设时对应用数据脱敏等。动态脱敏白名单 应用于特定的场景下,需要 暂时对一些用户开放...

资产安全概述

静态脱敏 直接修改底层数据的存储,数据存储时就已经是加密或者脱敏过的,例如常见的pn_md5。典型应用场景:数据集成时对敏感数据加密、数仓分层建设时对应用数据脱敏等。动态脱敏白名单 应用于特定的场景下,需要 暂时对一些用户开放...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
对象存储 云数据库 RDS 数据库备份 DBS 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用