什么是云原生数据湖分析

云原生数据湖分析(简称DLA)是新一代大数据解决方案,采取计算与存储完全分离的架构,支持数据库(RDS\PolarDB\NoSQL)与消息实时归档建仓,提供弹性的Spark与Presto,满足在线交互式查询、流处理、批处理、机器学习等诉求,也是传统...

常见术语

云原生数据湖分析(简称DLA)是新一代大数据解决方案,采取计算与存储完全分离的架构,支持数据库(RDS\PolarDB)与消息实时归档建仓,提供弹性的Spark与Presto,满足在线交互式查询、流处理、批处理、机器学习等诉求,也是传统Hadoop方案...

账单数据订阅及查询分析

您可在用户中心订阅不同类型的账单数据,例如,计费项明细账单、计费项账单按天汇总等。订阅成功后,账单数据将会定时同步至MaxCompute,您...相关文档 大数据分析工具的常见问题解决方法,详情请参见 大数据分析工具的常见问题解决方法。

排查Redis实例内存使用率高的问题

如果发现Redis内存占满或收到内存告警,可参考本文判断内存占用是否长期过高、内存占用是否突然上升、是否发生内存倾斜,并通过拆分Key,设置过期策略,升级规格等方法解决问题。内存使用率高的现象分类 内存使用率高,通常分为以下三种...

大数据用户画像解决方案

进入互联网,特别是移动互联网时代,用户随时随地都会在...多维度&复杂查询:原生全局二级索引、Lindorm Search满足多维度查询需求 方案详情&专家服务 解决方案详情参见:基于Lindorm的大数据用户画像解决方案 任何问题,欢迎联系 技术支持。

后续指引

介绍:数据迁移 实践:数据迁移最佳实践 常见问题数据上传下载常见问题 规模数据迁移 MaxCompute提供MMA(MaxCompute Migration Assist)迁移工具支撑规模数据迁移。开发与分析 数据类型 MaxCompute支持三种数据类型版本,为您介绍各...

高效数据治理实施指南

背景信息 在多人协作的数据团队中,数据治理是重要且繁琐的工作,在解决“如何制定客观的数据治理目标”、“如何高效推动团队达成治理目标”的过程中,通常包含以下挑战:问题难定位:传统数据治理方式难以快速、完整、精准地定位潜在问题...

磁盘型

Tair 推出磁盘(ESSD/SSD)型实例,均兼容Redis核心数据结构与接口,可提供容量、低成本、持久化的数据库服务。适用于兼容Redis、需要容量且访问性能较高的温冷数据存储场景。背景信息 传统Redis基于内存属于易失性存储介质,随着业务...

磁盘型

云原生内存数据库Tair 推出磁盘(ESSD/SSD)型实例,均兼容Redis核心数据结构与接口,可提供容量、低成本、持久化的数据库服务。适用于兼容Redis、需要容量且访问性能较高的温冷数据存储场景。背景信息 传统Redis基于内存属于易失性...

某网约车公司车辆轨迹数据

随着车辆数量的快速增长,每辆车每分钟上传轨迹、位置等信息到MySQL导致MySQL库数据量过,将全量数据写到 云原生多模数据库 Lindorm 中可以解决数据量过多和成本问题。业务挑战 目前线下有7万+辆车,车辆数量在快速增长,每辆车每分钟...

概览

为了更好地指导您使用数据管理DMS(Data Management),DMS推出解决方案系列文档,旨在通过最佳实践(Step by Step)的形式向您介绍DMS研发流程、数据安全、数据开发的解决方案。研发流程解决方案 DMS为在线流程化系统,可统一管理企业内...

客户案例

DataWorks在多个行业中均有典型的案例落地,帮助多个行业的企业解决数据痛点,挖掘数据价值,本文为您介绍典型行业中已落地的客户案例。新零售行业:大润发云上数据中台建设 客户架构如下。客户简介 为了快速数字化转型,拥抱新零售,...

客户案例

MaxCompute已被广泛应用于各领域处理云上大数据,帮助众多企业解决了海量数据分析问题,同时降低企业运维成本,企业人员可更专注于业务开发。本文为您介绍MaxCompute的精选客户案例。MaxCompute的全量客户案例信息,请参见 行业客户案例...

T+1多库合并建仓

上述方案可解决数据而导致的用户体验问题,但在对分库分表数据进行大数据分析时,逻辑上的一个表被拆成了多张表,由于没有类似TDDL中间件来屏蔽物理表的拆分,进行数据分析时变得十分复杂。解决方案 T+1多库合并建仓是指通过DLA控制...

时空引擎版本发布记录

修复 ST_BuildPyramid 函数,解决超大数据构建矢量金字塔时的内存占用问题。4.8 新特性 增强 ST_Union 函数,支持按内存使用量分批次执行,避免大数据量造成OOM。新增 ST_SetValue 函数,支持指定像素位置设置像素值。栅格数据支持对HDFS...

时空数据库版本发布记录

本文介绍PolarDB PostgreSQL版时空数据库(Ganos)的版本更新说明。6.X 6.3 类别 说明 新增特性 Trajectory SQL 新增 ST_InsertAttr 函数,支持为轨迹增加新的属性。GeomGrid SQL 新增 ST_Degeneralize 函数,支持将低层级网格分解成高层级...

时空数据库版本发布记录

本文介绍PolarDB PostgreSQL版(兼容Oracle)时空数据库(Ganos)的版本更新说明。6.X 6.3 类别 说明 新增特性 Trajectory SQL 新增 ST_InsertAttr 函数,支持为轨迹增加新的属性。GeomGrid SQL 新增 ST_Degeneralize 函数,支持将低层级...

数据质量:全流程的质量监控

DataWorks的全流程数据质量监控功能为您提供35种预设表级别、...数据质量为您解决以下问题数据库频繁变更问题 业务频繁变化问题 数据定义问题 业务系统的脏数据问题 系统交互导致质量问题 数据订正引发的问题 数据仓库自身导致的质量问题

基于Delta lake的一站式数据湖构建与分析实战

背景信息 随着数据时代的不断发展,数据量爆发式增长,数据形式也变的更加多样。传统数据仓库模式的成本高、响应慢、格式少等问题日益凸显。于是拥有成本更低、数据形式更丰富、分析计算更灵活的数据湖应运而生。数据湖作为一个集中化的...

敏感数据保护概览

如果您有对敏感数据进行管控和脱敏的需求,可以使用 数据管理DMS 的敏感数据保护功能对数据库进行扫描,识别、脱敏和管理敏感数据。背景信息 通过敏感数据保护功能,可帮助企业及时有效地发现与识别敏感数据资产,避免敏感数据滥用,有效...

东软案例

阿里云Lindorm数据库让数字时代运维“灵动”起来,本文以东软集团有限公司为例,该集团归属于运营商、政务、汽车、医疗等行业。业务/技术亮点 移动端到云端业务全链路海量运维大数据存储。指标、日志等多源异构监控数据融合分析。99.99%...

管理敏感数据

功能介绍 数据管理DMS的敏感数据管理提供如下功能:提供敏感数据资产大盘,解决企业敏感数据分布的统一纳管问题数据自动化扫描。自定义数据扫描触发周期。自动识别企业敏感数据和对敏感数据进行分类分级,及时发现、有效管理企业资产中的...

无感数据集成(Zero-ETL)

方案概述 在大数据时代,企业面临着大量分散在不同的系统和平台上的业务数据,为了有效地管理和利用这些数据,企业往往需要依赖于ETL工具对数据进行集中式管理。ETL是将上层业务系统的数据经过提取(Extract)、转换清洗(Transform)、...

基于MaxCompute进行大数据BI分析

通过MaxCompute、AnalyticDB MySQL强大的数据加工和分析能力,降低大数据平台建设的门槛,轻松解决了海量数据的计算问题。同时有效降低企业成本,并保障数据安全。与第三方开源生态无缝对接,在不侵入用户应用的情况下,传输日志至日志服务...

Presto FAQ

本文汇总了使用DLA Presto的常见问题解决方案。高频问题 在哪些情况下,共享集群(Public)不计费?共享集群(Public)的算力是多?在控制台执行SELECT语句为什么会有Limit 500的限制?能够突破这个限制吗?阿里云子账号可以在哪里执行...

Transaction Table2.0概述

针对这些问题近几年大数据开源生态也推出了各种解决方案,最流行的就是Spark/Flink/Presto开源数据处理引擎,深度集成开源数据湖Hudi、Delta Lake和Iceberg三剑客,践行统一的计算引擎和统一的数据存储思想来综合提供解决方案,解决Lamdba...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

无感集成(Zero-ETL)

方案概述 在大数据时代,企业面临着大量分散在不同的系统和平台上的业务数据,为了有效地管理和利用这些数据,企业往往需要依赖于ETL工具对数据进行集中式管理。ETL是将上层业务系统的数据经过提取(Extract)、转换清洗(Transform)、...

云原生多模数据库Lindorm助力蚂蚁链IoT数据降本

业务挑战 业务增速快,数据总量不断增大,MySQL出现性能瓶颈 日增数据,一年数据增量超6TB,存储成本压力 数据冷热区分明显,和数据生成时间强相关 数据需要实时归档到离线进行分析 解决方案 阿里云Lindorm历经阿里众多核心服务的...

高压缩引擎(X-Engine)介绍

挑战和诉求:历史数据归档 历史数据归档的挑战 部分业务数据的读写特征,都是最新产生的数据会被更频繁地读取或更新,而更久之前的数据(如1年前的聊天记录或订单信息)很少被访问。随着业务发展,数据库系统中会积累大量访问频率很低...

基于混合负载的查询优化

传统数仓方案,通过组合多套数据库与大数据产品,利用各自不同的优势来解决不同的分析场景,带来的问题就是整个数据冗余,同时管理多个异构系统的代价。完备数据仓库,首要解决问题包括:如何更好的支持数据库场景下的交互式分析以及...

技术面临的挑战与革新

计算集群使用高主频,多CPU,内存的机型解决计算能力扩展的问题,模组之间互相解耦,独立按需扩展,提供了更好的弹性以及整体资源利用率。同时存储计算分离架构在扩展存储时因为不再是记录级别的迁移,不需要过多考虑数据库系统诸如事务...

DAS Auto Scaling弹性能力

数据库自治服务DAS的Auto Scaling是以数据库实例的实时性能数据作为输入,由DAS完成流量异常发现、合理数据库规格建议和合理磁盘容量建议,使数据库服务具备自动扩展存储和计算资源的能力。背景信息 为业务应用选择一个合适的数据库计算...

行业趋势与背景

专注解决海量数据存储、超高并发吞吐、表瓶颈以及复杂计算效率等数据库瓶颈问题,历经各届天猫双十一及阿里云各行业客户业务的考验,助力企业加速完成业务数字化转型。PolarDB-X 核心能力通过标准关系型数据库技术实现,配合完善的管控运...

全球数据库市场发展与机遇

2008年,率先发起“去IOE”战略,采用开源数据库技术替代Oracle数据库,成功解决商业数据库高成本压力和业务支持不足等问题。从2010年开始,踏上自研数据库之路,抓住云数据库的技术变革机遇,打造出了一系列先进的数据库产品。自2017年...

产品架构

高效满足IoT/监控等场景的测量数据、设备运行数据的存储处理需求,整体架构如下:TSCore 是时序引擎中负责数据组织的核心部分,其整体思想与LSM结构相似,数据先写入Memchunk,然后Flush到磁盘,但由于时序数据天然的顺序写入特征,定向...

大数据安全治理的难点

通常,大数据系统中的工作流涉及多部门、多责任人且跨系统的数据,如何才能协调好这些业务系统准时、保质保量地产出数据,避免出现因业务系统宕机/脏数据导致数据延时产出、产出脏数据,关乎到企业数据业务的连续性问题甚至高层的信任问题...

如何对JSON类型进行高效分析

半结构化数据通常存在于Web页面、XML、JSON、NoSQL数据库等场景中,其灵活性和易扩展性使其成为大数据时代中不可或缺的一部分。PolarDB MySQL版 本身是一个关系型数据库管理系统,其存储的数据通常是结构化数据,但也原生支持存储和查询半...

版本发布记录

数据字典 资源队列 解决开源版中单个查询消耗资源过多导致实例宕机问题。ClickHouse资源队列 2020年07月 功能名称 描述 相关文档 接入Quick BI 支持在Quick BI中添加ClickHouse数据源并通过Quick BI构建BI系统。Quick BI 2020年06月 功能...

深度解析Lindorm搜索索引(SearchIndex)特性

WAL保序 通过隐藏的时间戳属性,保证在宽表中先写入的数据先写入搜索,后写入的数据后写入搜索,确保宽表和搜索的数据一致性,彻底解决LilyIndexer存在的数据错乱问题。全量构建快 对于已有的历史数据,可以借助LTS的全量任务运行机制,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 云数据库 RDS 数据传输服务 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用