EMR本地盘实例大规模数据集测试
场景描述 阿里云为了满足大数据场景下的存储需求,在云 上推出了本地盘D1机型,这个系列提供了本地 盘而非云盘作为存储,提高了磁盘的吞吐能力, 发挥Hadoop的就近计算优势。阿里云EMR 产品针对本地盘机型,推出了一整套的自动化运 维方案,帮助用户方便可靠地使用本地盘机型, 不需要关注整个运维过程同时数据的高可靠和 服务的高可用。 解决问题 1.云盘多份冗余数据导致成本高 2.磁盘吞吐量不高 3.节点的高可靠分布问题 4.本地盘与节点的故障监控问题 5.数据迁移时自动决策问题 6.自动故障节点迁移与数据平衡问题 产品列表 EMR(E-MapReduce) 本地盘 VPC
Master节点 通常可以生成 1TB的数据进行基准性能测试,首先进入 hive-testbench目录下执行如 下脚本并加载测试数据 参数说明:数据集规模参数单位为 GB,1000表示生成的数据量为 1TB/tpcdata/tpcds 为表数据生成的目录,目录不存在就自动生成,如果不指定目录, 目录就默认生成到/tmp/tpcds目录下 cd hive-testbench#如果...
来自: 最佳实践 相关产品:块存储,云服务器ECS,E-MapReduce
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测
基于湖仓一体架构使用MaxCompute对OSS湖<em>数据</em>分析预测
本篇最佳实践先创建EMR集群作为数据湖对象,Hive元数据存储在DLF,外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通,实现元数据统一。最后通过一个毒蘑菇的训练和预测demo,演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测实践 业务架构 场景描述 数据湖和数据仓库是当前大数据技术条件下构建分布式系 统的两种数据架构设计取向,数据湖偏向灵活性,数据仓 库侧重成本、性能、安全、治理等企业级特性。但是数据 湖和数据仓库的边界正在慢慢模糊,数据湖自身的治理能 力、数据仓库延伸到外部...
来自: 最佳实践 | 相关产品:对象存储 OSS,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,API网关,数据湖构建,云速搭
物联网平台设备数据上云
物联网平台设备数据上云方案为企业提供海量物联网设备的数据接入与处理。提供了多种类型设备的稳定接入、安全防护、实时监控,满足企业一站式管理设备、处理数据的需求。具有高可用、高并发、低成本的优势。
产品解决方案文档与社区权益中心定价云市场合作伙伴支持与服务了解阿里云备案控制台物联网平台设备数据上云方案介绍方案优势应用场景方案部署物联网平台设备数据上云物联网平台设备数据上云方案为企业提供海量物联网设备的数据接入与处理。提供了多种类型设备的稳定接入、安全防护、实时监控,满足企业一站式管理设备、处理...
来自: 解决方案
物联网平台设备数据上云
物联网平台设备数据上云方案为企业提供海量物联网设备的数据接入与处理。提供了多种类型设备的稳定接入、安全防护、实时监控,满足企业一站式管理设备、处理数据的需求。具有高可用、高并发、低成本的优势。
产品解决方案文档与社区权益中心定价云市场合作伙伴支持与服务了解阿里云备案控制台物联网平台设备数据上云方案介绍方案优势应用场景方案部署物联网平台设备数据上云物联网平台设备数据上云方案为企业提供海量物联网设备的数据接入与处理。提供了多种类型设备的稳定接入、安全防护、实时监控,满足企业一站式管理设备、处理...
来自: 解决方案
车辆数据安全稳定上云和分析
阿里云物联网平台提供全托管的企业级实例服务,无需自建物联网基础设施即可实现车辆数据的安全稳定上云。
阿里云物联网平台提供托管的企业级实例服务,无需自建物联网基础设施即可实现车辆数据的安全稳定上云,同时通过对车辆数据的分析,帮助企业快速实现设备数据和业务数据的融合,实现车辆智能化升级。具有低成本、高可靠、高性能、高安全等优势。方案预估:以1000辆车为例,1500元左右/月起(物联网平台+ECS,不含网络聚合...
来自: 解决方案
车辆数据安全稳定上云和分析
阿里云物联网平台提供全托管的企业级实例服务,无需自建物联网基础设施即可实现车辆数据的安全稳定上云。
阿里云物联网平台提供托管的企业级实例服务,无需自建物联网基础设施即可实现车辆数据的安全稳定上云,同时通过对车辆数据的分析,帮助企业快速实现设备数据和业务数据的融合,实现车辆智能化升级。具有低成本、高可靠、高性能、高安全等优势。方案预估:以1000辆车为例,1500元左右/月起(物联网平台+ECS,不含网络聚合...
来自: 解决方案
可观测链路 OpenTelemetry 版
针对 PHP、C++、Go、Node.js 等多语言应用,提供端到端全链路追踪、应用监控与告警、链路拓扑、日志关联分析能力,并基于 OpenTelemetry 开源标准,兼容 Jaeger、Zipkin、SkyWalking 等开源项目数据上报。快速发现分布式应用架构下的性能瓶颈,缩短错/慢调用根因定位耗时,提高全栈开发与诊断效率。
支持在多语言 SDK 或 Agent 中,直接通过相关协议上报链路数据.支持在多语言 SDK 或 Agent 中,先上报至独立的 OpenTelemetry Collector,再转发上报至服务端.跟踪端到端用户请求(用户终端、网关、微服务应用、云组件与基础设施),汇总组装成分布式调用,完整还原请求的轨迹与状态,快速定位错/慢调用根因.分布式调用...
来自: 云产品
云Clickhouse冷热数据分层存储
云Clickhouse冷热<em>数据</em>分层存储
基于云ClickHouse可以给电商、游戏、互联网以及其他行业提供高性能、高稳定性、低维护成本、高性价比的实时数据分析、精准营销、业务运营、业务分析、业务预警、业务营销、数仓加速等场景化方案,本实践会向客户提供数据库低维护成本、数据库链路构建、冷热分层存储、快熟分析等操作实践。 解决问题 1. 维护成本低不用建设维护体系,稳定性高,数据倾斜自动均衡。 2. 完善的数据同步链路,可以平滑将业务库、大数据、日志服务的数据同步到Clickhouse,降低研发成本。 3. 平滑升级版本,业务中断小。 冷热分层后透明读取,帮客户节约整体数据存储成本。
数据链路完整,基于 DTS、dataworks、云服务器 ECS SLS可以构建数据链路。云数据库 ClickHouse 3.内核优势:bug修复、资源管理 日志服务 SLS 4.安全优势:白名单、VPC网络 云数据库 RDS MySQL版 5.冷热分层存储 数据传输 DTS 解决问题 最佳实践频道 阿里云最佳实践技术分享群 1.维护成本低不用建设维护体系,稳定性 高,...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,数据传输,日志服务(SLS),云数据库 ClickHouse
游戏数据运营融合分析
游戏<em>数据</em>运营融合分析
场景描述 1.游戏行业有结构化和非结构化数据融合分 析需求的客户。 2.游戏行业有数据实时分析需求的客户,无法 接受T+1延迟。 3.对数据成本有一定诉求的客户,希望物尽其 用尽量优化成本。 4.其他行业有类似需求的客户。 方案优势/解决问题 1.秒级实时分析:依托ADB计算密集型实例, 秒级监控DAU等数据,为广告投放效果提 供有力的在线决策支撑。 2.高效数据融合分析:打通结构化和非结构化 数据,支撑产品体验分析;广告买量投放效 果实时(分钟级)分析,渠道的评估更准确。 3.低成本:DLA融合冷数据分析+ADB存储密 集型温数据分析+ADB计算密集型热数据分 析,在满足各种分析场景需求的同时,有效 地降低的客户的总体使用成本。 4.学习成本低:DLA和ADB兼容标准SQL语 法,无需额外学习其他技术。 产品列表 专有网络VPC、负载均衡SLB、NAT网关、弹性公网IP 云服务器ECS、日志服务SLS、对象存储OSS 数据库RDSMySQL、数据传输服务DTS、数据管理DMS 分析型数据库MySQL版ADS 数据湖分析DLA、QuickBI
数据融合分析:文档版本:20210224 3 游戏数据运营融合分析 最佳实践概述 ᅳ DLA融合分析(冷数据周期,低频查询、大范围跨度查询、关联 ADB 维度数据分析)+ADB存储密集型分析(温数据,1-3个月批量数据分析)+ADB计算密集型(热数据,实时分析)。ᅳ 真正实现云原生数据处理、分析链路闭环,极大提高客户收益。方案...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,对象存储 OSS,云原生数据仓库AnalyticDB My,数据湖分析,Quick BI
大数据近实时数据投递MaxCompute
大数据近实时<em>数据</em>投递MaxCompute
本文介绍离线大数据场景使MaxCompute构建云 上近实时数仓,打通云下数据上云链路,解决数据复杂类型支持和动态分区问题,满足高级数据处理需求的最佳实践。 l混合云环境下,现有业务系统零改造,打通数据上云链路。 l使用UDF实现复杂数据类型转换和数据动态分区。 l使用DataWorks配置周期调度业务流程,数据自动入仓。 l借助MaxCompute优化计算引擎,实现降本增效。 产品列表 云服务器ECS 专有网络VPC 访问控制RAM 数据总线DataHub E-MapReduceEMR DataWorks 大数据计算服务MaxCompute
全链路数据延时 15分钟左右。示例代码 本文所有配置文件及命令行代码可从代码库获取:https://code.aliyun.com/best-practice/166/tree/master 方案架构 文档版本:20240419 1 大数据近实时数据投递 MaxCompute 前置条件 前置条件 在进行本文操作前,您需要完成以下准备:注册阿里云账号,并完成实名认证。您可以登录阿里云...
来自: 最佳实践 | 相关产品:块存储,专有网络 VPC,云服务器ECS,访问控制,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,数据总线,云速搭CADT
应用日志数据归档
方案为企业提供云上日志数据的存储成本优化。提供了访问日志数据采集、自动压缩、持久化存储,满足企业的网站访问日志数据的归档需求。具有低成本、免运维、弹性扩容的优势。
相关产品云服务器 ECS日志服务 SLS对象存储 OSS专有网络 VPC在线咨询方案优势大规模采集支持高吞吐量的日志数据采集,每秒可达百万条日志数据,可满足大规模应用的日志采集需求。自动化压缩提供自动化压缩功能,可对采集到的日志数据进行压缩处理,减少存储空间占用,节省存储资源。持久化存储支持将日志数据归档到对象...
来自: 解决方案
应用日志数据归档
方案为企业提供云上日志数据的存储成本优化。提供了访问日志数据采集、自动压缩、持久化存储,满足企业的网站访问日志数据的归档需求。具有低成本、免运维、弹性扩容的优势。
相关产品云服务器 ECS日志服务 SLS对象存储 OSS专有网络 VPC在线咨询方案优势大规模采集支持高吞吐量的日志数据采集,每秒可达百万条日志数据,可满足大规模应用的日志采集需求。自动化压缩提供自动化压缩功能,可对采集到的日志数据进行压缩处理,减少存储空间占用,节省存储资源。持久化存储支持将日志数据归档到对象...
来自: 解决方案
数据资源平台
阿里云数据资源平台是构建数据智能的全流程平台,提供数据汇聚、数据加工与治理、数据分析、资产管理和统一服务等功能,帮助金融、政府及企业客户实现数据资源管理,潜在规律挖掘,业务决策优化。
数据从数源出发到数据目的地,提供全链路数据完整性监测,接入流程可追溯.根据不同行业需求支持支持关系型数据、非结构化数据、国产数据库、空间数据库、流式、文件等多种类型产业特色数据源.推荐搭配使用.一站式多模态数据同步.一站式多模态数据同步.为产业智能政企行业产品解决方案提供标准统一的数据资产构建与共享的...
来自: 云产品
数据管理与服务
数据管理与服务作为阿里云产品六大版块之一,面向不同业务场景,阿里云提供数据存储、分析、应用等全链路能力,满足企业客户全方位的数据处理需求,实现计算和存储分离、资源解耦、数据移动减化,用以满足行业快速发展的需求和趋势,利用数据重塑其业务。
阿里云开源大数据产品矩阵再升级.2022云栖大会上,阿里云资深产品专家分享基于强大的大数据AI一体化的平台能力,从工具层面介绍DataWorks端到端的全链路数据开发治理平台新能力,回归工具为人服务的本质,方位地提升一线数据开发人员/业务人员的工作效率.DataWorks全链路数据治理年度发布.伴随着用户业务的快速增长,数据...
来自: 云产品
数据中台安全解决方案
针对阿里云提供的数据中台解决方案,基于数据全生命周期安全管控,结合云上客户最佳实践,为客户提供可参考的数据中台安全解决方案。
深度整合阿里云在各行各业提供的数据中台解决方案,构建基于数据全生命周期管控的数据中台安全能力,并结合云上客户实践,提供可参考的数据中台安全整体解决方案.数据中台安全解决方案.为客户提供敏感数据识别、数据资产安全审计、数据脱敏等安全能力.数据安全中心.提供安全合规的密钥托管和密码管理服务,助您轻松使用密钥...
来自: 解决方案
数据湖构建 Data Lake Formation
数据湖构建服务是阿里云上数据湖架构中的核心部分,助力用户构建数据湖系统。支持多数据源实时入湖,实现湖上元数据统一管理,提供企业级权限控制,无缝对接多种计算引擎,打破孤岛,洞察业务价值
查看全部日志.更多产品与服务....数据湖构建(Data Lake Formation,DLF)作为云原生数据湖架构核心组成部分,帮助用户快速地构建云原生数据湖架构。...支持上游多种计算引擎 轻松构建全链路数据湖服务.兼容Hive Metastore 提供多语言Open API,易集成.独有JindoFS数据加速功能 提供高性能数据湖分析加速能力.
来自: 云产品
企业上云数据安全
企业上云<em>数据</em>安全
场景描述 企业是否选择上公共云,或者哪些系统或数据上 公共云,对数据安全的关心是重要因素之一。本 最佳实践重点在于介绍狭义的数据加密存储安 全范畴,即首先使用SDDP产品进行敏感数据发 现和分级分类,然后对高级别敏感数据进行按 需、不同类型的全链路加密存储。 解决问题 1.帮助客户发现敏感数据 2.对敏感数据进行分类、分级 3.对不同级别的数据如何选择加密方式 4.具体如何进行加密 产品列表 敏感数据识别SDDP 密钥管理服务KMS 云数据库RDS 对象存储OSS
本最佳实践重点在于介绍狭义的数据加密 存储安全范畴,即首先使用 SDDP产品进行敏 感数据发现和分级分类,然后对高级别敏感 进行按需、不同类型的全链路加密存储。解决问题 1.帮助客户发现敏感数据 2.对敏感数据进行分类、分级 3.对不同级别的数据如何选择加密方式 4.具体如何进行加密 产品列表 敏感数据识别 SDDP 密钥...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,密钥管理服务,敏感数据保护,云速搭CADT
异地双活场景下的数据双向同步
异地双活场景下的<em>数据</em>双向同步
概述 随着客户业务规模的扩大,对系统高可用性要求越来越高,越来越多用户采用异地双活/多活架构,多活架构往往涉及业务侧做单元化改造,本方案仅模拟用户已做单元化改造后的数据双向同步,数据库采用双主架构,本地写本地读,同时又保证双库的数据一致性,为业务增加可用性和灵活性。 适用场景 数据库双向同步 数据库全局ID不冲突 双活架构的数据库建设问题 技术架构 本实践方案基于如下图所示的技术架构和主要流程编写操作步骤: 方案优势 DTS双向同步,采用独立模块避免数据同步占用系统资源。 奇偶ID涉及,避免数据冲突。 DTS多种处理冲突的方式供业务选择。 安全:原生的多租户系统,以项目进行隔离,所有计算任务在安全沙箱中运行。
随着客户业务规模的扩大,对系统高可用性要求越 数据库双向同步 来越高,越来越多用户采用异地双活/多活架构,多 数据库全局 ID不冲突 活架构往往涉及业务侧做单元化改造,本方案仅模 双活架构的数据库建设问题 拟用户已做单元化改造后的数据双向同步,数据库 采用双主架构,本地写本地读,同时又保证双库的 一致性,为...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,负载均衡 SLB,容器服务 ACK,数据传输,云企业网,容器镜像服务 ACR,云解析DNS
数据管理DMS
数据管理DMS是基于阿里巴巴集团十余年的数据库服务平台的云版本,提供免安装、免运维、即开即用、多种数据库类型与多种环境统一的web数据库管理终端;可以为企业用户快速复制搭建与阿里集团同等安全、高效、规范的数据库DevOps研发流程解决方案。
提供覆盖数据全生命周期的DataOps,内置阿里巴巴大规模时间的数据流转管控体系。保障数据安全的同时,提升企业研发效率.了解各管控模式功能差异>.变更稳定功能仅稳定变更和安全协同模式支持,数据安全和研发高效功能仅安全协同模式支持.查看更多商品.更多产品与服务.SQL Server是发行最早的商用数据库产品之一,支持复杂的...
来自: 云产品
交通数据中台解决方案
阿里云交通数据中台解决方案提供从交通数据接入到数据应用的全链路智能数据构建与管理能力,帮助客户快速形成数据资产、挖掘数据价值、赋能交通业务,助力交通行业数字化转型及智能应用的创新和推广。
阿里云交通数据中台解决方案提供从交通数据接入到数据应用的全链路智能数据构建与管理能力,帮助客户快速形成数据资产、挖掘数据价值、赋能交通业务,助力交通行业数字化转型及智能应用的创新和推广.交通数据中台解决方案.本方案充分汇聚交通行业中各类结构化、非结构化等多源异构数据,打通数据之间的内在联系,支持全业务...
来自: 解决方案
< 1 2 3 4 ... 6 >
共有6页 跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 云数据库 RDS 云数据库 Redis 版 数据传输服务 弹性公网IP 短信服务

新品推荐

切换为移动版

新人特惠 爆款特惠 最新活动 免费试用