数据集成概述

背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量数据表的同步任务、能够集成多种异构数据源、能够实现对数据源的数据进行轻度预处理、能够实现数据同步任务的调优(例如容错,限速,并发)等。...

数据集成概述

背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量数据表的同步任务、能够集成多种异构数据源、能够实现对数据源的数据进行轻度预处理、能够实现数据同步任务的调优(例如容错,限速,并发)等。...

混合存储型(已停售)

电子商务 电商类应用往往有大量的商品数据。使用混合存储型可以轻松突破内存容量限制,将大量的商品数据都存储到混合存储型中。在正常业务请求中,活跃的商品数据会保留在内存,不活跃的商品数据会逐渐交换到磁盘上,从而解决内存不够的...

DML无锁变更概览

DML无锁数据变更可以将单个SQL拆分成多个批次执行,能更好地满足业务方大量数据变更的需求,例如历史数据清理、全表更新字段等,保证执行效率,减小对数据库性能、数据库空间等的影响。背景信息 当业务累积了大量数据时,需要定期清除表...

混合存储型(已停售)

电子商务 电商类应用往往有大量的商品数据。使用混合存储型可以轻松突破内存容量限制,将大量的商品数据都存储到混合存储型中。在正常业务请求中,活跃的商品数据会保留在内存,不活跃的商品数据会逐渐交换到磁盘上,从而解决内存不够的...

ActionTrail日志清洗

DLA提供ActionTrail日志自动清洗解决方案,可以将ActionTrail投递到OSS的日志文件转换为DLA中可以直接查询的数据表,同时自动对数据进行分区和压缩,方便您分析和审计云产品的操作日志。日志分析痛点 ActionTrail是阿里云提供的云账号...

表设计规范

当部分数据的生命周期与其它数据不同时,您可以通过细粒度分区实现部分数据的管理。分区字段定义依据 按优先级高低排序如下:分区列的选择应充分考虑时间因素,尽量避免更新存量分区。如果有多个事实表(不包括维度表)进行JOIN,应将...

新零售:上海百胜软件股份有限公司

是国内知名的全渠道新零售解决方案服务商,为鞋服、运动、家居、日化、美妆、珠宝、食品等品牌企业提供管理咨询和信息化解决方案,业务涵盖全渠道中台、零售分销、供应链、电子商务、移动应用、大数据等领域。目前,百胜软件与旗下22家分子...

新零售:杭州数云信息技术有限公司

所属行业:新零售 网站地址:数云信息技术有限公司 公司介绍 杭州数云信息技术有限公司成立于2011年,伴随着电子商务大数据应用和零售企业互联网化的趋势快速发展,目前已成为国内领先的数据化营销软件产品和服务提供商。数云致力于为...

DataWorks on EMR数据安全方案

大数据领域,阿里云为企业用户提供了一整套数据安全方案,包含用户认证、数据权限、大数据作业管理体系等。本文以联合使用DataWorks与EMR为例,为您介绍DataWorks on EMR场景下的数据安全方案。背景信息 DataWorks on EMR目前支持LDAP...

应用场景:低成本历史库

云原生多模数据库 Lindorm 提供海量数据的低成本存储能力(0.11元/GB/月)、弹性伸缩按需付费、多模多端处理能力满足用户多种场景下的数据存储需求,同时可以无缝对接spark、hive、flink、presto等开源分析生态满足用户对数据的复杂分析需求...

低成本RDS历史库

云原生多模数据库 Lindorm 提供海量数据的低成本存储能力(0.12元/GB/月)、弹性伸缩按需付费、多模多端处理能力满足用户多种场景下的数据存储需求,同时可以无缝对接Spark、Hive、Flink、Presto等开源分析生态满足用户对数据的复杂分析需求...

聚水潭:云原生数据仓库助力企业实现商业洞察

客户介绍 上海聚水潭网络科技有限公司成立于2014年,是一家从事SaaS ERP应用服务研发且拥有完全自主知识产权的软件公司,秉承互联网开放性、全球性、低成本、高效率的特点,为中小企业提供轻、专、密的聚水潭—电商云ERP,为电子商务类企业...

JindoFS介绍和使用

JindoFS提供兼容对象存储的纯客户端模式(SDK)和缓存模式(Cache),以支持与优化Hadoop和Spark生态大数据计算OSS的访问;提供块存储模式(Block),以充分利用OSS的海量存储能力和优化文件系统元数据的操作。JindoFS纯客户端模式(SDK...

概述

您可以将数据库中的表或单条SQL查询结果作为数据集,在仪表盘或大屏中对数据集中的数据以表格、交叉表、折线图、柱条形图、饼图、双轴图等图形或组件展现出来,并这些图形或组件进行自由组合、布局,以某种分析思路业务进行直观呈现。...

数据服务概述

阿里云API市场涵盖了金融理财、人工智能、电子商务、交通地理、生活服务、企业管理和公共事务7类目,目前已有数千款API产品在线售卖,是快速帮您实现数据变现的平台。详情请参见 阿里云API市场。调用API 应用(APP)是您调用API服务时的...

发布API

上架至阿里云API市场 阿里云API市场 涵盖了金融理财、人工智能、电子商务、交通地理、生活服务、企业管理和公共事务8类目,目前已有数千款API产品在线售卖,是快速帮您实现数据变现的平台。数据服务生成和注册的API发布至API网关后,可以...

功能特性

配置管理 数据保护 敏感数据管理 DMS的敏感数据保护能力能根据所选的敏感数据扫描模板、敏感数据识别模型以及脱敏算法对数据进行脱敏处理,以避免敏感数据滥用,有效保护企业的敏感数据资产,防止数据泄露造成企业经营资金损失或罚款。...

文档修订记录

创建数仓分层 配置及使用数仓分层检查器 2023.3.16 新增功能 数据建模 DataWorks智能数据建模联合具备丰富行业建模经验的数据架构师,总结阿里云百万用户最全面的业务场景,结合阿里巴巴技术创新能力,提供零售电子商务、金融、制造等多个...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

应用场景

访问频度极高业务 如社交网络、电子商务、游戏、广告等。可以将访问频度非常高的数据存储在云数据库 Memcache 版中,底层数据存储在 RDS 中。大型促销类业务 大型促销秒杀系统,系统整体访问压力非常。一般的数据库根本无法承载这样的...

大数据AI公共数据集分析

本教程通过DataWorks,联合云原生大数据计算服务MaxCompute,使用大数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等公共数据),指导您如何快速进行大数据分析,快速熟悉DataWorks的操作界面与最基础的数据分析能力。DataWorks的更...

冷热分层

Delta Lake是新型数据湖方案,推出了数据流入、数据组织管理、数据查询和数据流出等特性,同时提供了数据的ACID和CRUD操作。通过结合Delta Lake和上下游组件,您可以搭建出一个便捷、易用、安全的数据湖架构。在数据湖架构设计中,通常会...

数据迁移

本文为您介绍数据迁移的最佳实践,包含将其他业务平台的业务数据或日志数据迁移至MaxCompute,或将MaxCompute的数据迁移至其它业务平台。背景信息 传统关系型数据库不适合处理海量数据,如果您的数据存放在传统的关系型数据库且数据量庞大...

主备方案介绍

数据库HBase存储海量大数据,在业务场景中往往承载着重要数据,为保障数据的高可用性和安全性,云数据库HBase提供了主备双活和主备容灾特性。本文介绍云数据库HBase的主备双活和主备容灾特性功能。使用场景 主备双活:大数据量随机读响应...

敏感数据保护

Dataphin支持敏感数据的识别和敏感数据的脱敏保护,可以结合权限管控方案一起,构建起完善的敏感数据保护体系。数据分类分级 Dataphin支持对数据的分类分级进行管理,内置了常用的个人信息数据分类,同时支持客户自定义企业的数据分类分级...

敏感数据保护

Dataphin支持敏感数据的识别和敏感数据的脱敏保护,可以结合权限管控方案一起,构建起完善的敏感数据保护体系。数据分类分级 Dataphin支持对数据的分类分级进行管理,内置了常用的个人信息数据分类,同时支持客户自定义企业的数据分类分级...

数据集成概述

离线(批量)的数据通道通过定义数据来源和去向的数据源和数据集,提供一套抽象化的数据抽取插件(Reader)、数据写入插件(Writer),并基于此框架设计一套简化版的中间数据传输格式,从而实现任意结构化、半结构化数据源之间数据传输。...

数据归档概述

使用场景示例 在电子商务平台中,每天会产生大量的订单数据,这些订单数据随着时间的推移,其访问需求逐渐减少。为了提高数据库的性能和减少存储空间的占用,可以使用DMS的数据归档,周期性地归档订单数据。注意事项 数据归档操作可能会...

数据安全治理的必要性

其中,第4条“维护数据安全,应当坚持总体国家安全观,建立健全数据安全治理体系,提高数据安全保障能力”和第7条“国家保护个人、组织与数据有关的权益,鼓励数据依法合理有效利用,保障数据依法有序自由流动,促进以数据为关键要素的数字...

数据保护伞概述

数据保护伞是一款数据安全管理产品,为您提供数据发现、数据脱敏、数据水印、访问控制、风险识别、数据溯源等多种功能,帮助您快速梳理敏感数据并进行安全管控,保障数据安全。本文为您介绍数据保护伞的使用流程、使用限制等内容。使用流程...

配置跨库Spark SQL节点

任务编排中的跨库Spark SQL节点,主要针对各类跨库数据同步和数据加工场景,您可以通过编写Spark SQL,完成各种复杂的数据同步或数据加工的任务开发。前提条件 支持的数据库类型:MySQL:RDS MySQL、PolarDB MySQL版、MyBase MySQL、...

添加数据

DataV数据集支持多种数据源的接入,如数据库、excel表格文件等,通过对数据的结构化存储和元数据的汇集整理,提供高效实用的数据建模能力,可用的算子包括常见的数据聚合函数、按不同时间粒度划分、地理信息处理等。本文为您介绍如何在...

Oracle同步至Tablestore

本实践以Oracle作为来源数据源,以Tablestore作为去向数据源,因此您需要在DataWorks的工作空间的 数据源管理 页面新增Oracle数据源和Tablestore数据源,两个数据源支持的数据同步能力请参见 Oracle数据源、Tablestore数据源。已购买独享...

常见问题

数据同步过程中,可以修改源表中的字段类型,目前仅支持整型数据类型之间、浮点数据类型之间的列类型更改,并且只能将取值范围小的数据类型更改为取值范围数据类型,或者将单精度数据类型更改为双精度数据类型。整型数据类型:支持...

备份与恢复方案概览

为满足各类场景下备份与恢复的需求,云数据库MongoDB提供了丰富的方案供您选择。任务 实施方案 支持的实例类型 适用场景 备份数据库 自动备份MongoDB数据 单节点实例。副本集实例。分片集群实例。手动备份MongoDB数据 单节点实例。副本集...

离线同步任务调优

数据库性能限制的情况下,同步速度并非越快越好,考虑到速度过高可能对数据库造成过的压力从而影响生产,数据集成支持了限速选项,您可根据业务合理配置该值。详情请参见:限制同步速度。数据同步速度的影响因素 数据同步速度受来源与...

使用DataWorks

MaxCompute支持通过DataWorks的数据集成功能将MaxCompute中的数据以离线方式导出至其他数据源。当您需要将MaxCompute中的数据导出至其他数据源执行后续数据处理操作时,您可以使用数据集成功能导出数据。本文为您介绍如何将MaxCompute的...

什么是MaxCompute

MaxCompute适用于大型互联网企业的数据仓库和BI分析、网站的日志分析、电子商务网站的交易分析、用户特征和兴趣挖掘等。详细发展历程、产品荣誉及客户案例请参见 发展历程 和 客户案例。MaxCompute还深度融合了阿里云如下产品:DataWorks ...

全增量实时同步至Hologres

限流:考虑到速度过高可能对数据库造成过的压力从而影响生产,数据集成同时提供了限速选项,您可以通过限流控制同步速率,从而保护读取端数据库,避免抽取速度过,给数据库造成太的压力。限速最小配置为1MB/S,最高上限为30MB/s。离...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 云数据库 Redis 版 云数据库 RDS 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用