数据湖构建之MaxCompute湖仓一体最佳实践

背景信息 大数据计算服务MaxCompute(原名ODPS)是一种快速、完全托管的EB级数据仓库解决方案。与数据湖相比数据仓库具备易优化、易治理等优点,但同时面临数据种类单一,灵活性低,仅向特定引擎开放等不足,提高了数据存储和加工的成本,...

数据分析整体趋势

随着AWS,Azure,Alibaba,Google等云厂商的出现,云原生分布式数据仓库成为目前数据分析技术的主要解决方案,代表性云服务包括Amazon Redshift,Snowflake,Alibaba Cloud AnalyticDB,Google BigQuery等。这些云原生数据仓库技术分别起源...

RDS术语

D DAS Database Autonomy Service,数据库自治服务,是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助用户消除数据库管理的复杂性及人工操作引发的服务故障,有效保障数据库服务的稳定、安全...

RDS术语

D DAS Database Autonomy Service,数据库自治服务,是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助用户消除数据库管理的复杂性及人工操作引发的服务故障,有效保障数据库服务的稳定、安全...

RDS MySQL I/O高问题

解决方案 可以使用阿里云自研内核AliSQL提供的异步删除文件功能解决问题,更多信息,请参见 Purge Large File Asynchronously。事务写Binlog导致实例I/O高 现象 事务只有在提交时才会写Binlog文件,如果存在事务,例如一条Delete语句...

RDS MySQL空间不足问题

解决方案 优化数据结构,减少二级索引数量。字段导致空间不足 现象 如果表结构定义中有blob、text等字段或很长的varchar字段,也会占用更的表空间。解决方案数据压缩以后再插入。空闲表空间太多导致空间不足 现象 空闲表空间太多...

公交出行:启迪公交

解决方案 启迪公交采用 PolarDB-X 分布式数据库方案构建了全部业务系统,既支持海量大数据的处理能力,又支持高并发、高可用和很强的弹性伸缩能力。票务管理工作台通过用户检录数据,实时同步到阿里云AnalyticDB分析型数据库,分析出实时...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

如何打造千万级Feed流系统

本技术解决方案从Feed流系统分析、方案对比、方案实现、方案扩展等维度全面讲解如何打造一个千万级Feed流系统。Feed流介绍 基本特征 Feed是指状态或者消息,而Feed流本质上是一种信息流:N个发送者的数据,通过用户关系,推送给M个接收者,...

发展历程

2018年 MaxCompute的多个客户案例荣获“2017大数据优秀产品和应用解决方案案例”奖。基于公共云的BigBench在100 TB规模上,MaxCompute的性能指标较2017年10月提升了一倍,达到18176.71 QPM(Queries Per Minute)。此外,在超小型10 TB规模...

数据传输预检查

本文为您介绍数据迁移项目预检查环节的常见报错和解决方案数据迁移项目需要通过预检查才能成功启动。请根据现场情况和具体的报错信息,选择对应的解决方法。错误信息 报错原因 解决办法 增量日志参数检查未通过,错误参数 supplemental_...

基于Delta lake的一站式数据湖构建与分析实战

目前很多云厂商提供了一站式入湖的解决方案,帮助客户以更快捷更低成本的方式实现数据入湖,如阿里云DLF数据入湖。2.统一元数据服务 对象存储本身是没有面向数据分析的语义的,需要结合Hive Metastore Service等元数据服务为上层各种分析...

解决方案与客户案例

本文介绍了异地多活解决方案的架构和应用场景,以及国税总局和联通新客服系统案例的实现架构和效果。异地多活数据解决方案 方案背景 随着云计算的蓬勃发展,越来越多的信息系统选择部署在云计算环境下,因此基于云产品为信息系统的服务...

图扑案例

Lindorm 针对工业物联网数据高并发写入,实时存取等特点,创新性地融合时序、索引、宽表等多模引擎能力,为存储、分析低价值密度、高通量、高实时性的工业物联网监控数据提供了高性价比的最优解决方案幅度降低了数据存储和存储系统运维...

伯俊软件

所属行业:互联网、软件 网站地址:上海伯俊软件科技有限公司 公司介绍 伯俊软件是国内老牌数字化服务商,创立20余年,已为3000多家中型企业提供数字化管理产品、解决方案、“业务+数据”中台、培训及专业的技术服务,客户覆盖零售、制造...

聚合支付方案

解决方案 阿里云通过多款云数据库产品为利楚扫呗制定以下解决方案:方案解读:使用DRDS分库分表将数据库进行水平拆分,有效解决订单的存储上限及业务高峰时的高并发压力,借助了DRDS对MySQL语法的高度兼容能力,轻松从原来单体数据库升级到...

企业版和标准版功能对比

通过列存索引,PolarDB MySQL版 实现了一体化的实时事务处理和实时数据分析的能力,成为一站式HTAP数据库产品解决方案。通过一套数据库系统,即可满足业务的OLTP及OLAP需求。支持 支持 弹性并行查询(ePQ)弹性并行查询(Elastic Parallel ...

8.0.1和8.0.2版功能对比

通过列存索引,PolarDB for MySQL 版实现了一体化的实时事务处理和实时数据分析的能力,成为一站式HTAP数据库产品解决方案。通过一套数据库系统,即可满足业务的OLTP及OLAP需求。支持 支持 Hash Join 支持Hash Join,基于代价选择Hash Join...

应用场景

解决方案:与品牌数据银行能力深度融合,实现分别在阿里云及生态内为客户提供服务,并实现品牌一方数据、平台二方数据的一键高效互通互用,全面提能提效品牌全域消费者运营。与达摩盘链路打通,实现品牌自有消费者资产的一方人群和阿里域内...

数据传输服务(上传)场景与工具

解决方案的可靠性 MaxCompute具有服务等级协议(SLA),因批量数据通道、流式数据通道默认使用免费共享资源,您还需考虑实现特定方案的可靠性。Tunnel数据通道服务依照访问的先后顺序,分配服务可用资源(Slot)。当服务的剩余可用资源为0...

最佳实践概览

查询分析RocketMQ客户端日志 通过Elasticsearch和rsbeat实时分析Redis slowlog 服务器数据采集 服务器数据采集方案概述 阿里云Elasticsearch数据采集解决方案 通过自建Metricbeat收集系统指标信息 使用SkyWalking和Elasticsearch实现全链路...

基于MaxCompute实现拉链表

适用场景 在设计数据仓库的数据模型时,拉链存储技术可作为一种解决方案,满足以下需求:数据量较。表中的部分字段被更新。例如,用户的地址、产品的描述信息、订单的状态和手机号码等。需要查看某一个时间点或时间段的历史快照信息。...

产品优势

云原生数据湖分析DLA(Data Lake Analytics)是新一代大数据解决方案,采取计算与存储完全分离的架构,支持数据库与消息实时归档建仓。DLA提供弹性的Spark与Presto,满足在线交互式查询、流处理、批处理、机器学习等诉求,也是传统Hadoop...

计费逻辑说明

用于将数据模型设计管控、引标落标等能力融入DataWorks规范化开发流程,助力您实现数据资产价值化输出,详情请参见 DATABLAU概述。DATABLAU 费用包含:功能模块本身的费用。付费并发登录DATABLAU的用户数费用。DATABLAU数据建模计费标准 ...

PolarDB for AI助力菜鸟实现一站式数据智能

解决方案 经过充分的调研和评估,此业务最终采用了DB4AI解决方案,使用PolarDB数据库MLOps能力来替换原有解决方案。PolarDB for AI拥有一系列MLOps和内置的模型,解决了数据、特征和模型的割裂状态,通过SQL来驱动数据、特征和模型,实现了...

如何在较结果集中使用ORDER BY

本文介绍在数据量较的结果集场景中Lindorm SQL ORDER BY的使用解决方案以及最佳案例。使用场景 常见Lindorm SQL的ORDER BY语法使用场景如下:在数据量较小(10万内的数据量)的结果集场景中,使用ORDER BY可以在内存中计算,没有任何使用...

汇联易实战:RDS通用云盘助力突破性能瓶颈

解决方案:选择RDS通用云盘 早期的数据库存储介质选型 汇联易早期核心SaaS业务的数据库选型上,存储介质选用的是增强型SSD PL1云盘(Enhanced SSD PL1云盘,简称 ESSD PL1云盘)。该类云盘是阿里云推出的超高性能云盘产品,基于新一代分布...

Spark FAQ

本文汇总了使用DLA Spark的常见问题及解决方案。常见问题 如何处理Spark作业报错:The VirtualCluster's name is invalid or the VirtualCluster's is not in running state?如何处理Spark作业报错:User%s do not have right permission...

Designer使用案例汇总

智能推荐解决方案 案例名称 描述 推荐业务端到端的完整方案 介绍实现推荐系统的完整方案。基于对象特征的推荐 介绍如何基于对象特征进行商品推荐。使用FM-Embedding实现推荐召回 介绍如何使用FM算法和Embedding提取算法,快速生成User和...

概述

Row-oriented AI NL2BI:用自然语言实时查看BI报表 典型解决方案 ID-Mapping在游戏领域的解决方案 通义千问模型数据推理和交互 核心算法 LightGBM算法 DeepFM算法 K均值聚类算法(K-Means)随机森林回归算法(Random Forest Regression)...

东软案例

客户感言 利用阿里云新一代 云原生多模数据库 Lindorm“灵动”引擎驱动的政府、企业数字信息系统智能运维解决方案,东软做到了实时、海量、异构监控数据一站式存储,实现指标、日志、代码链路和网络包等异构数据融合分析,高可靠数据保障和...

核心能力

数据资源平台提供了一站式数据资产定义、生产、管理与服务平台,提供企业级数据资产构建能力和一致性使用体验,助力客户快速构建数据智能平台,实现数据资源统一管理,挖掘潜在规律,优化业务决策,让数据真正的驱动客户业务。...

上海新能源汽车车辆基础数据

解决方案 Lindorm历经阿里众多核心服务的规模验证,拥有相关技术领域的技术团队,保障了使用过程的持续稳定、可靠,构建起坚实的离在线存储底座,使得客户可以聚焦于业务侧的发展。Lindorm宽表引擎批量提交优化,幅度提升集群吞吐量、...

常见问题

非插件报错原因及解决方案 如何处理编码格式设置/乱码问题导致的脏数据报错?任务存在SSRF攻击Task have SSRF attacks如何处理?离线同步任务执行偶尔成功偶尔失败。离线同步源表有加列(修改)如何处理?如何处理表列名有关键字导致同步...

新零售:上海百胜软件股份有限公司

是国内知名的全渠道新零售解决方案服务商,为鞋服、运动、家居、日化、美妆、珠宝、食品等品牌企业提供管理咨询和信息化解决方案,业务涵盖全渠道中台、零售分销、供应链、电子商务、移动应用、大数据等领域。目前,百胜软件与旗下22家分子...

操作流程

流程图及说明 任务项 说明 创建解决方案 通过创建解决方案,将工作组内已加工完成的数据标准、数据模型、数据加工场景、数据服务API配置等信息,进行版本化解决方案封装。以整体解决方案为例,具体操作,请参见 新建解决方案。创建类型:...

规格及选型

优势:AnalyticDB PostgreSQL版 是替代Teradata、Oracle的标杆产品,已在数百家金融、运营商、政企验证完备的替代能力和解决方案。案例四:自动驾驶企业 用户为自动驾驶领域企业,需要基于车采数据进行地理位置和时序的采集数据分析,要求...

数据传输作业:数据集成

MaxCompute支持通过DataWorks数据集成功能将其他数据数据同步至MaxCompute,数据集成作业主要有三种类型:离线同步、实时同步、同步解决方案。本文为您介绍MaxCompute数据集成的实现方案。离线同步 离线(批量)的数据通道通过定义数据...

新零售:特步

解决方案 通过 PolarDB-X+RDS的分布式数据解决方案支撑O2O全渠道业务中台系统上线,通过垂直拆分剥离各业务中心,使不同类型的业务数据可以存储在不同的RDS上,确保资源和访问隔离,从物理上使整个数据库架构具备了扩展性。通过这套架构...

用自然语言实时查看BI报表

本文介绍了PolarDB NL2BI解决方案的背景、应用场景以及如何体验NL2BI解决方案。背景 为了让不熟悉SQL语言的用户能方便地从数据库中取数分析,PolarDB for AI联合达摩院推出自研的自然语言到数据库查询语言转义(Nature Language To SQL,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 DBS 云数据库 RDS 云服务器 ECS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用