产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

自媒体:易撰

自媒体 网站地址:易撰 客户介绍 长沙营智信息技术有限公司是专业的新媒体大数据服务商,其旗下知名品牌易撰,基于新媒体大数据挖掘技术及NLP算法分析,为各内容创客、广告主提供全面、科学、精准的大数据分析服务以及大数据架构解决方案。...

操作指南

一、大数据专家服务流程指南 二、服务流程说明 用户可以根据自己实际需要,提前或者在问题发生时购买大数据专家服务,服务项包含大数据技术架构方案咨询、大数据解决方案POC、大数据搬站迁云方案咨询、跨地域迁移支持服务、大数据专家高阶...

技术架构选型

数据模型设计之前,您需要首先完成技术架构的选型。本教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。...

物联网数据处理分析架构参考

本文以一个企业案例介绍如何基于阿里云物联网平台的数据服务,搭建企业物联网大数据应用架构。背景信息 随着物联网应用场景的深入,企业开始挖掘设备上传的数据,用于客户端应用扩展和服务营收,用于数字化运营、风控,帮助企业高效治理,...

数据模型架构规范

数据处理流程架构 数据划分及命名空间约定 请根据业务划分数据并约定命名,建议针对业务名称结合数据层次约定相关命名的英文缩写,这样可以给后续数据开发过程中,对项目空间、表、字段等命名做为重要参照。按业务划分:命名时按主要的业务...

数仓分层

在阿里巴巴的数据体系中,我们建议将数据仓库分为三层,自下而上为:数据引入层(ODS,Operation Data Store)、数据公共层(CDM,Common Data Model)和数据应用层(ADS,Application Data Service)。数据仓库的分层和各层级用途如下图所...

后续指引

介绍:数据迁移 实践:数据迁移最佳实践 常见问题:数据上传下载常见问题 规模数据迁移 MaxCompute提供MMA(MaxCompute Migration Assist)迁移工具支撑规模数据迁移。开发与分析 数据类型 MaxCompute支持三种数据类型版本,为您介绍各...

金融大数据

业务架构 架构说明:大数据仓库调用外部数据和数据集市的信息,通过数据获取层、数据模型层、数据加工层、数据应用层和分析集市的层层筛选、分析、加工,由大数据服务接口向内部源数据输出适用于多种用户场景的有效数据数据仓库功能...

产品架构

EMR自研能力 为让开源大数据组件和服务更好的运行在阿里云技术设施上,EMR自研了如下组件:数据应用平台,提供交互式开发、作业提交、作业调试和工作流一站式数据开发体验,详情请参见 EMR Studio概述。Shuffle Service是EMR在优化计算引擎...

简介

典型案例&架构 航海船舶大数据平台 场景:全球AIS船舶实时位置数据,每天上亿条轨迹写入,要求轨迹时空/时序查询秒级响应,具体包括:监管区域实时地理围栏判断。轨迹区域回放(指定区域+指定时间段)。轨迹回放(指定时间段查询)。架构...

客户案例

互联网行业:快狗打车云上大数据仓库 客户架构如下。客户简介 快狗打车则一直坚持通过“连接网络化”、“运力共享化”、“过程数据化”、“匹配智能化”等数字信息化解决方案,将闲散运力统一整合到平台上,通过大数据将运力精准匹配市场...

E-MapReduce支持倚天云服务器

大数据场景下倚天架构与X86架构对比 在相同规格下X86架构的ECS实例和基于倚天架构的ECS实例上进行了基准测试,可以看到在大数据业务场景下倚天架构实例比基于x86架构实例算力性价比更高。降低硬件成本 相比于X86架构ECS实例成本,倚天架构...

Doris概述

并且这两类进程通过一致性协议来保证服务的高可用和数据的高可靠,这种高度集成的架构设计极的降低了一款分布式系统的运维成本。从以下五个方面介绍Doris技术:在使用接口方面,Doris采用MySQL协议,高度兼容MySQL语法,支持标准SQL,您...

HBase存算一体转存算分离

本文为您介绍对于EMR-HBase集群,如何将存算一体架构转换为存算分离架构。操作步骤 停止HBase服务。首先通过flush操作来保证内存中所有表的数据都已经刷新到HFile,并执行Disable table来禁用相关的表,避免写入新的数据。停止HMaster和...

SQL处理优化

本文为您介绍数据查询DQL和数据操作DML的架构设计核心要点。数据查询DQL 在功能支持上,主要针对 TimeTravel 查询和 增量查询 的场景进行了适配开发优化。在查询效率上,跟查询普通表最大的不同在于,读取源表数据文件时,可能会涉及大量 ...

数据服务集群

本文为您介绍数据服务集群支持的特性,适用场景以及技术架构。特性介绍 Apache HBase是具有高可靠性、高性能、列存储、可伸缩、实时读写的开源NoSQL分布式系统。特别适用于需要实时读写随机访问超大规模数据集的场景。Apache HBase和Apache...

概述

Apache Druid是一个分布式内存实时分析系统,用于解决如何在规模数据集下快速的、交互式的查询和分析问题。基本特点 Apache Druid具有如下特点:支持亚秒级的交互式查询。例如,多维过滤、Ad-hoc的属性分组和快速聚合数据。支持实时的...

产品架构

本文为您介绍EMR Serverless StarRocks的架构。StarRocks架构的核心为FE(Frontend)和BE(Backend)两类进程,不依赖任何外部...物理执行单元会在对应的数据存储节点上执行,实现本地计算,避免数据的传输与拷贝,从而极的提升了查询性能。

ESS(仅对存量用户开放)

背景信息 目前Shuffle方案缺点如下:Shuffle Write在大数据量场景下会溢出,导致写放大。Shuffle Read过程中有大量的网络小包导致Connection reset问题。Shuffle Read过程中存在大量小数据量的IO请求和随机读,对磁盘和CPU造成高负载。对于...

管理数据架构待发布对象

导入的发布包文件中存在数据架构变更对象时,将在待发布数据架构页面为您展示,您可在待发布数据架构页面对数据架构对象进行管理和发布。前提条件 数据架构对象所在的数据板块已经发布。待发布数据架构对象入口 请参见 发布包总览入口,...

管理数据架构待发布对象

导入的发布包文件中存在数据架构变更对象时,将在待发布数据架构页面为您展示,您可在待发布数据架构页面对数据架构对象进行管理和发布。前提条件 数据架构对象所在的数据板块已经发布。待发布数据架构对象入口 请参见 发布包总览入口,...

跨境SaaS:深圳市易仓科技有限公司

存在资源碎片,资源利用率低 痛点5:业务快速发展,租户数据越来越,存储成本越来越高 痛点6:传统主从架构数据库模式,实例众多,数据集成成本高 痛点7:租户数据量越来越,单租户维度查询性能遇瓶颈 解决方案 PolarDB多主集群助力易仓跨...

概述

数据同步服务的内核在阿里巴巴跨域长途实时同步、实时增量分发、分布式数据库、大数据等场景中提供着功能丰富和服务稳定的数据方案,支持着阿里巴巴交易异地多活、广告、搜索、大数据实时抽取、商务对账单等双十一媒体大屏等众多业务场景。

未来规划

云计算架构的核心逻辑就是通过虚拟化技术带来池化资源,云原生数据库采用分布式数据架构,实现规模扩展,每套数据库系统横跨多台服务器和虚拟机,带来了全新的系统管理挑战。其中最核心的挑战就是如何实现弹性以及高可用,实现按需按量...

健康检查服务内容说明

架构健康检查的主要针对业务系统和大数据应用的现有架构,通过对各业务系统的主机、网络、存储等各方面的运行参数和指标分析,提供综合的健康检查结果和结论。服务范围不包含:针对架构改造的技术支持;对业务系统和大数据应用的开发;具体...

原理架构

系统架构 数据同步服务的逻辑架构图:全量同步:负责将表数据从源端数据库同步到目的端数据库,支持异构数据库间同步。增量同步:负责将源端的增量数据同步到目的端,主要包含 Store 和 JDBCWriter 两个组件。存储:采集源端 DB 的变更到...

如何对JSON类型进行高效分析

PolarDB 列存索引(In Memory Column Index,IMCI)功能推出了完备的虚拟列与列式JSON功能等,可以快速处理大数据和多种数据类型(包括结构化数据与半结构化数据等),并提供高效的数据分析、查询与流计算能力,适用于数据分析、数据仓库与...

应用场景

海量数据读写 随着业务的快速增长,数据量不断的增大,就会出现单表/单库数据量太、单台数据库服务器压力很、读写速度遇到瓶颈等一系列问题。尽管可以通过增大数据库实例的物理配置得到一定程度的缓解,但无法根本解决数据库单机瓶颈。...

资产全景

在 流动 页面,为您可视化展示 数据引入、物理表数 和 逻辑表数,为您提供数据输出后的数据查询及应用功能:将鼠标悬停在 数据引入 模块上,为您展示的 数据源 个数、数据表接入量Top5 和 数据表接入量Least5。数据源:统计昨天有数据同步...

资产全景

在 流动 页面,为您可视化展示 数据引入、物理表数 和 逻辑表数,为您提供数据输出后的数据查询及应用功能:将鼠标悬停在 数据引入 模块上,为您展示的 数据源 个数、数据表接入量Top5 和 数据表接入量Least5。数据源:统计昨天有数据同步...

产品优势

相对于传统的数据同步工具,数据同步服务的实时同步功能能够将并发粒度缩小到事务级别,能够并发同步同张表的更新数据,从而极得提升同步性能,高峰期时,同步性能可以达到 30000 RPS(性能指标仅供参考,数据同步服务的数据迁移和同步...

数据服务:低成本快速发布API

核心技术与架构 数据服务采用Serverless架构,您只需要关注API本身的查询逻辑,无需关心运行环境等基础设施,数据服务会为您准备好计算资源,并支持弹性扩展,零运维成本。计费 使用DataWorks的数据服务功能创建数据API后,API调用请求需...

应用场景

数据库网关与数据管理DMS搭配可为您提供高稳定性、低成本、统一的非阿里云数据库(例如本地IDC自建、其他云厂商的云数据库、其他云厂商云服务器上自建的数据库)的通用管理方案,实现多云统一的数据库管理服务,架构图如下所示。...

应用场景

数据库网关与数据管理DMS搭配可为您提供高稳定性、低成本、统一的非阿里云数据库(例如本地IDC自建、其他云厂商的云数据库、其他云厂商云服务器上自建的数据库)的通用管理方案,实现多云统一的数据库管理服务,架构图如下所示。...

应用场景

数据同步服务可在增量数据同步开始之前,回拉历史全量数据,并写入数仓(如大数据计算服务 MaxCompute)。在增量实时同步过程中,记录数据位点信息用于将后续的数仓数据标记完成,下游可依据标记完成时间触发后续的数据分析任务。场景三:...

创建ID

数据架构 页面,单击 标签架构。在标签架构页面,按照下图操作指引,选择 ID管理 页签,并 单击 新增ID。在 创建ID 对话框中,配置ID相关信息。参数 描述 ID名称 填写ID名称。允许中英文、数字、下划线或连字符,64字符以内。ID code ...

基础术语

OceanBase OceanBase 是阿里巴巴与蚂蚁科技独立自主研发的一款分布式关系数据库产品,融合传统关系数据库和分布式系统的优势,具备高可用、高性能、高可扩展性,在功能上兼容 MySQL 等特点,在通用硬件上提供金融级高可用的数据库服务。...

发布包总览概述

您可以在发布包总览页面根据功能板块(规划、数据架构、研发、标签架构、标签、数据标准、数据质量、数据安全),对不同类型、不同状态的待发布对象类型进行发布及管理操作。规划:您可以对规划对象执行发布、查看版本详情(数据源对象类型...

发布包总览概述

您可以在发布包总览页面根据功能板块(规划、数据架构、研发、标签架构、标签、数据标准、数据质量、数据安全),对不同类型、不同状态的待发布对象类型进行发布及管理操作。规划:您可以对规划对象执行发布、查看版本详情(数据源对象类型...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据传输服务 云数据库 Redis 版 数据库备份 DBS 云数据库 MongoDB 版 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用