通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

基础数据操作

说明 在物联网存储场景中,您可以将Kafka数据、EMQX数据、物联网平台数据存储到表格存储时序表中。更多信息,请参见 时序数据接入。通过Flink计算与分析数据后,您可以使用Tablestore时序表存储输出结果。更多信息,请参见 使用时序表存储...

创建Hudi数据

背景信息 Hudi即Apache Hudi,Hudi是一个通用的大数据存储系统,将核心仓库和数据库功能直接引入到数据库中,并支持记录级别的插入更新和删除数据的能力。权限说明 仅支持 超级管理员、数据源管理员、板块架构师、项目管理员 角色创建数据...

实例选型和集群规划

采用MPP并行架构,在节点角色上区分为Master节点和Segment节点,其中Master节点是实例的入口,负责SQL请求、路由分发和结果集处理,Segment节点为计算节点,负责SQL处理数据存储,每Segment节点会处理并存储表一个分片的数据,即MPP...

如何对JSON类型进行高效分析

总之,PolarDB MySQL版 的虚拟列是种灵活且强大的功能,尤其处理半结构化数据(如JSON类型数据等)可以直接将不规则的数据存储为结构化数据,避免中间ETL额外处理逻辑,并且可以使用传统的SQL查询语言进行查询与分析。虚拟列有助于简化...

包年包月

存储:用于管控服务组件本身的磁盘诉求和用户Broker存储数据,默认最小版本每Broker需要1000G存储。计费=存储大小×存储单价×月数。CU和存储单价请参见 计费说明。欠费影响 如果您购买的服务已到期,您账户下的流数据处理Confluent...

如何迁移到DBFS?

本文档主要为您说明在使用阿里云数据存储DBFS,如何方便的将数据库迁移到DBFS上。一般存在以下几种常用的方式:主备同步:搭建主备库,通过binary log同步数据到自建于DBFS上的数据库。DTS:使用阿里云产品DTS,将数据迁移到自建于DBFS...

数据安全

加密方式 使用方式 说明 基于KMS服务密钥加密 表格存储 管理控制台 SDK 表格存储 使用默认的KMS CMK生成密钥来加密数据,并且在读取数据时自动解密。首次使用时,表格存储 会在KMS控制台创建一个KMS CMK。您无需购买KMS实例即可直接使用。...

2021年

新说明 MaxCompute支持渐进式计算,在处理数据过程中按照一定时间颗粒度自动按时间分区保存处理过程中的中间结果数据,在下一个周期执行可以重复使用上周期已经计算好的重叠时间部分的数据,从而降低了计算资源消耗、执行调度时间,为...

概述

DataHub数据同步功能 DataHub提供数据Sink/Source功能,即数据同步功能,DataHub支持将对应Topic中的数据 实时/准实时 的同步到第三方阿里云产品中,打通阿里云产品间的数据流通。目前支持MaxCompute(原ODPS)、分析型数据库MySQL(ADS)、...

常见问题

数据存储 如何查看每张表所占的磁盘空间?如何查看冷数据大小?如何查询哪些数据在冷存上?如何移动分区数据到冷存?监控、升级、系统参数 为什么监控中存在数据中断情况?20.8后的版本是否支持平滑升级,不需要迁移数据?常用系统表有哪些...

操作指南FAQ

本文介绍使用云存储网关过程中的常见问题。云上部署FAQ 创建网关找不到可用交换机如何处理?云存储网关升级失败了该如何处理?本地部署FAQ 如何检测网关网络的联通性?如何在本地数据中心部署云存储网关?云存储网关升级失败了该如何处理...

多值数据写入

时序多值模型 多值的模型是针对数据源建模,我们每数据针对的是一个数据源,它的被测量的多指标在同行上,所以每一个数据源,数据的来源在每一个时间点上都有行,这就是多值的模型。比如某个机器的cpu,mem和load指标。每次是...

常见问题

产品简介FAQ 云存储网关提供哪些服务?云存储网关支持哪些协议?产品原理FAQ 文件网关中的文件与OSS间的映射关系如何?文件网关缓存的淘汰机制是什么?文件网关的缓存有什么作用?云存储网关文件上传原理解析是什么?极速同步如何保证反向...

重要组件

由于多主机的数据库实例需要访问块存储上的同数据,常用的Ext4等文件系统不支持多点挂载,PolarDB数据库团队自行研发了专用的用户态文件系统,提供常见的文件读写查看接口,支持类似O_DIRECT的非缓存方式读写数据,还支持数据页原子...

T+1多库合并建仓

上述方案可解决因数据量大而导致的用户体验问题,但在对分库分表数据进行大数据分析,逻辑上的一个表被拆成了多张表,由于没有类似TDDL中间件来屏蔽物理表的拆分,进行数据分析变得十分复杂。解决方案 T+1多库合并建仓是指通过DLA控制...

方案设计

方面,如果我们把一个平面的格点数据存储列中,在整读整取效率比较高,但是如果只读取某个点,就会读取很多的无效数据,效率又会变得比较低。因此我们采取种折中的方案,对平面的二维数据再次进行切分,切分成更小的平面数据块...

快照链

一个数据库文件系统(以下简称文件系统)对应条快照链,快照链有以下信息:快照容量:快照链中所有快照占用的存储空间。快照个数:文件系统当前快照数量。每文件系统最多只能创建256份快照,包括手动快照和自动快照。更多详情,请参见 ...

数据脱敏

概念介绍 数据脱敏:在数据处理数据存储过程中,通过一定的算法和技术,将敏感数据进行加工处理、模糊化或替换,使得数据无法识别或难以还原,从而达到保护数据安全、防止数据泄露的目的。动态脱敏:对敏感数据进行实时的脱敏处理,只有...

什么是数据传输服务DTS

数据传输服务DTS(Data Transmission Service)是阿里云提供的实时数据流服务,支持关系型数据库(RDBMS)、非关系型的数据库(NoSQL)、数据多维分析(OLAP)等数据源间的数据交互,集数据同步、迁移、订阅、集成、加工于一体,助您构建...

数据模型

数据库在存储数据时,会将同条时间线的数据尽量聚类存储,提升时间线数据访问效率,同时更好的支持时序数据压缩。在时序表中,Tag列的值都相同的系列数据行构成了条时间线。时序数据库提供系列特有的数据访问操作,包括聚合...

什么是Dataphin

Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,站式提供数据采、建、管、用全生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据中台。Dataphin兼容多种计算...

存储冗余概述

本地冗余存储(LRS)采用单可用区(AZ)内的数据冗余存储机制,将用户的数据冗余存储在同一个可用区内多设施的多设备上。本地冗余存储能确保硬件失效数据持久性和可用性。重要 本地冗余存储类型的数据冗余在某个特定的可用区内。当...

存储类型概述

对象存储OSS提供标准、低频访问、归档、冷归档、深度冷归档多种存储类型,全面覆盖从热到冷的各种数据存储场景。说明 各存储类型的定价,请参见 OSS产品定价。各存储类型的计费方式,请参见 存储费用。标准存储(Standard)提供高可靠、高...

使用冷存储

阿里云HBase针对冷数据存储的场景,提供种新的冷存储介质,其存储成本仅为高效云盘的1/3,写入性能与云盘相当,并能保证数据随时可读。背景信息 用户可以在购买云HBase实例选择冷存储作为一个附加的存储空间,并通过建表语句指定将冷...

挂载问题

1.挂载数据库文件存储(DBFS)的约束?数据库文件存储(DBFS)...2.挂载数据库文件存储(DBFS)提示“不支持的ECS实例类型。支持挂载数据库文件存储(DBFS)的ECS实例规格如下:存储增强通用型g7se 存储增强计算型c7se 存储增强内存型r7se

客户案例

DataWorks在多行业中均有典型的案例落地,帮助多行业的企业解决数据痛点,挖掘数据价值,本文为您介绍典型行业中已落地的客户案例。新零售行业:大润发云上数据中台建设 客户架构如下。客户简介 为了快速数字化转型,拥抱新零售,...

Delta Lake概述

背景信息 通常的数据湖方案是选取大数据存储引擎构建数据湖(例如,阿里云对象存储OSS产品或云下HDFS),然后将产生的各种类型数据存储在该存储引擎中。在使用数据时,通过Spark或Presto对接数据分析引擎并进行数据解析。但该套方案存在...

验证数据压缩能力

概念介绍 存储过程是条或多条语句的集合,对数据库进行系列复杂操作存储过程可以在数据库内将这类复杂操作封装成一个代码块,以便重复使用,从而减少数据库开发人员的工作量。存储过程旨在完成特定功能的 SQL 语句集,经编译创建并...

使用函数计算清洗数据

表格存储高并发的写入性能以及低廉的存储成本非常适合物联网、日志、监控数据存储。将数据写入到表格存储时,您可以通过函数计算对新增的数据做简单的清洗,将清洗后的数据写回到表格存储的另数据表中。同时,您也可以实时访问表格...

多元索引介绍

例如当数据需要保留6,可以将每月的数据保存在一张数据表中,例如table_1、table_2、table_3、table_4、table_5、table_6,并为每个数据表创建一个多元索引,每个数据表和多元索引中只会保存一个月的数据,只需要每月把6月前的...

轮播页面

图表样式 轮播页面是基础交互组件的种,仅支持在数据中配置页面的属性,包括ID、页面名称和链接,适用于在数据看板中轮播展示多网页。样式面板 搜索配置:单击 样式 面板右上角的搜索配置项图标,可在搜索配置面板中输入您需要搜索的...

背景

业务接入流程 当您有块业务需要使用表格存储作为数据,通常会经历几过程:了解表格存储(场景案例和文档),业务需求分析,直接对照方案实现、方案设计及编码实现(表结构和查询),接入业务数据测试上线。根据业务场景能否直接...

绿地

导入数据接口 按组件绘制格式处理数据后,导入组件,重新绘制。不需要重新请求服务端数据。具体数据示例请参见画布编辑器中组件右侧配置面板 数据 页签的 数据响应结果 区域。显示组件 显示组件,不需要参数。隐藏组件 隐藏组件,不需要...

轮播页面

图表样式 轮播页面是基础交互组件的种,仅支持在数据中配置页面的属性,包括ID、页面名称和链接,适用于在可视化应用中轮播展示多网页。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,可在 搜索配置 面板中输入您需要搜索的...

自定义区域下钻层(v3.x版本)

当前接口无数据时,仍然可以下钻但无样式区分。选择 自定义区域下钻层 组件 数据 页签下的 数据接口。单击 配置数据源,在 设置数据源 面板中,选择 数据源类型 为 静态数据,参数说明如下。配置字段说明 字段 说明 adcode 区域的adcode...

雷达扫描

雷达扫描是三维城市地图的子组件,支持独立的样式和...导入位置 按组件绘制格式处理数据后,导入组件,重新绘制。不需要重新请求服务端数据。具体数据请参见上文的 数据示例。显示组件 显示组件,不需要参数。隐藏组件 隐藏组件,不需要参数。

方案背景

数据计算场景:推荐系统,订单类业务等 实时数据计算场景:监控系统,电商数字大屏等 样例场景 某电商公司为了完成电商运营数据的分析和展示,使用表格存储统一存储电商数据,通过Spark的流批处理离线聚合或实时统计电商数据,最终在...

缓存数据持久化

当您使用云数据库RDS MySQL并需要提升数据处理速率和降低访问延迟,阿里云为您提供了缓存数据持久化的高效方案,该解决方案通过整合云数据库Redis与RDS、云数据库Memcache与RDS协同工作,确保数据的高速访问和持久化存储,具备高吞吐、低...

MaxFrame概述

处理数据量大、处理逻辑复杂,需要基于MaxCompute海量数据及弹性计算资源、MaxFrame分布式能力进行大规模数据分析、处理及数据挖掘,提高开发效率。面向Data+AI开发,需要依赖第三方或自定义镜像完成数据开发、模型开发等整体流程。支持的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
对象存储 文件存储NAS 云数据库 RDS 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用