EMR HBase on OSS存算分离集群快速恢复
EMR <em>HBase</em> on OSS存算分离<em>集群</em>快速恢复
OSS-HDFS服务(JindoFS服务)是一款云原生数据湖存储产品。基于统一的元数据管理能力,在完全兼容HDFS文件系统接口的同时,提供充分的POSIX能力支持,能更好地满足大数据和AI等领域的数据湖计算场景。
最佳实践频道 阿里最佳实践分享 阿里 EMR HBase on OSS存算分离 集群快速恢复 最佳实践 文档版本:20220915(发布日期)EMR HBase on OSS存算分离集群快速恢复 文档版本信息 文档版本信息 文本信息 属性 内容 文档名称 EMR HBase on OSS存算分离集群快速恢复 文档编号 306 文档版本 V1.1 版本日期 2022-09-15 文档...
来自: 最佳实践 相关产品:专有网络 VPC,对象存储 OSS,E-MapReduce,云速搭CADT
自建Hadoop迁移MaxCompute
自建Hadoop迁移MaxCompute
场景描述 客户基于ECS、IDC自建或在友商云平台自建了大数 据集群,为了降低企业大数据计算平台的成本,提高 大数据应用开发效率,更有效保障数据安全,把大数 据集群的数据、作业、调度任务以及业务数据库整体 迁移到MaxCompute和其他云产品。 解决的问题 自建Hadoop集群搬迁到MaxCompute 自建Hbase集群搬迁到云Hbase 自建Kafka或应用数据准实时同步到 MaxCompute 自建Azkaban任务迁移到Dataworks任务 产品列表 MaxCompute,Dataworks、云数据库Hbase版、Datahub、VPC,ECS。
文档版本:20210723 30 自建Hadoop迁移MaxCompute Hbase表数据迁移到云数据库 Hbase版 4.Hbase表数据迁移到云数据库 Hbase版 4.1.创建 BDS集群 BDS 是阿里云针对 HBase自主研发的一套迁移同步服务,主要帮助云上的客户进行 自建 HBase、云 HBase集群的数据导入和导出。步骤1 通过连接登录到云数据库 Hbase版控制台 ...
来自: 最佳实践 | 相关产品:云服务器ECS,DataWorks,大数据计算服务 MaxCompute,云数据库 HBase 版,数据总线,云速搭
CDH迁移升级CDP最佳实践
CDH迁移升级CDP最佳实践
当前 CDH 免费版停止下载,终止服务,针对需要企业版服务能力并且CDH 升级过程对业务影响较小的客户,通过安装新的 CDP 集群,将现有数据拷贝至新集群,然后将新集群切换为生产集群,升级过程没有数据丢失风险,停机时间较短,适合大部分互联网客户升级使用。
数据一致性校验 最佳实践频道 阿里最佳实践技术分享 服务器 ECS(产品名称)文档模板(手册名称)/文档版本信息 阿里 CDH迁移升级 CDP 最佳实践 文档版本:20211029 文档版本:20150122(发布日期)II CDH迁移升级 CDP最佳实践 文档版本信息 文档版本信息 文本信息 属性 内容 文档名称 CDH迁移升级 CDP最佳实践 ...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云速搭
云数据库HBase
阿里云云数据库 HBase 版(ApsaraDB for HBase)是基于 Hadoop 且100%兼容HBase协议的高性能、可弹性伸缩、面向列的分布式数据库,轻松支持PB级大数据存储,满足千万级QPS高吞吐随机读写场景。
云数据库 HBase 是面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库.Lindorm...
来自: 云产品
EMR集群安全认证和授权管理 
EMR<em>集群</em>安全认证和授权管理 
场景描述 阿里云EMR服务Kafka和Hadoop安全集群使 用Kerberos进行用户安全认证,通过Apache Ranger服务进行访问授权管理。本最佳实践中以 Apache Web服务器日志为例,演示基于Kafka 和Hadoop的生态组件构建日志大数据仓库,并 介绍在整个数据流程中,如何通过Kerberos和 Ranger进行认证和授权的相关配置。 解决问题 1.创建基于Kerberos的EMR Kafka和 Hadoop集群。 2.EMR服务的Kafka和Hadoop集群中 Kerberos相关配置和使用方法。 3.Ranger中添加Kafka、HDFS、Hive和 Hbase服务和访问策略。 4.Flume中和Kafka、HDFS相关的安全配 置。 产品列表:E-MapReduce、专有网络VPC、云服务器ECS、云数据库RDS版
产品列表:E-MapReduce、专有网络 VPC、云服务 最佳实践频道 阿里云最佳实践分享 器 ECS、云数据库 RDS 如二维码过期,请搜索群号:31852400 云服务器 ECS(产品名称)文档模板(手册名称)/文档版本信息 阿里云 EMR集群安全认证和授权管理 最佳实践 文档版本:20200330 文档版本:20150122(发布日期)II EMR集群安全...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,E-MapReduce
中小企业自建Hadoop集群上云解决方案
中小企业自建 Hadoop 集群上云解决方案,助力自建 Hadoop 用户快速构建云上半托管开源大数据平台,在保持原组件使用习惯延续的同时,充分利用云上服务特点,更加便捷地迭代企业大数据平台架构,聚焦业务价值开发。
集群资源可自动按需匹配,节省计算成本,支持阿里抢占式实例和存算分离架构,可按冷热数据分层,降低存储成本.便捷运维,成本节约.可根据业务场景灵活配置规则,实现弹性伸缩,高效响应快速变化的业务需求。支持 ECS/ACK 形态,可以通过 VPC 和安全组设置集群整体网络安全策略,支持 Kerberos 身份认证、数据加密、Ranger...
来自: 解决方案
多账号下企业分账
多账号下企业分账
场景描述 财务分账,是根据企业的成本中心,将云上资源的成本划分到给各个项目组/业务部门;助力企业快速梳理云上成本结构,搭建复杂组织架构下的成本关系,便捷地进行财务和云上成本的管理。 大型企业或集团公司,由于组织架构复杂,业务复杂等原因,通常拥有多个阿里云账号来管理规模庞大的云上资源。针对云上资源,如何建立有效的分账方案,是财务关注的重要问题。 解决问题 解决CIO/CTO最关心的云上IT治理,IT成本核算等问题。 弄清楚企业内各部门成本及云上IT成本结构。 让CIO/CTO准确地掌握云上资源成本情况,清楚业务与成本的关系。 让采购/运维轻松搞定每月的IT成本汇报。
实例、集群、分拆项:资源类别 资源名称 分账粒度 弹性计算 云服务器 ECS 实例 存储 对象存储 OSS 分拆项(Bucket)数据库 云数据库RDS MySQL 实例 数据库 云数据库 PolarDB 集群 网络 负载均衡 SLB 实例 大数据 E-MapReduce(EMR)集群 实例型:如 ECS、SLB、EIP等产品,支持在实例维度进行打标。集群型:如 E-Mapreduce...
来自: 最佳实践 | 相关产品:资源管理,配置审计,云速搭CADT
实时数仓Hologres
Hologres(原交互式分析)是一站式实时数据仓库引擎,支持海量数据实时写入、实时更新、实时分析,支持标准SQL(兼容PostgreSQL协议),支持PB级数据多维分析(OLAP)与自助分析(Ad Hoc),支持高并发低延迟的在线数据服务(Serving),与MaxCompute、Flink、DataWorks深度融合,提供离在线一体化全栈数仓解决方案。
原生架构,扩展成本高,集群规模有限.支持有限SQL,对复杂Join、子查询等支持效率低.批量导入,无法灵活更新,数据时效性低.在高并发、复杂查询场景下不稳定,抖动.以列存为主,存储为HDD顺序扫描设计.资源架构耦合,资源无法独立扩展.购买软件License费用,人才招聘成本高.开源软件为主,在治理、安全方面能力较少....
来自: 云产品
微服务引擎MSE
微服务引擎 MSE 面向业界注册配置中心、分布式协调、云原生网关、微服务治理和分布式任务调度等主流开源项目,提供商业版服务。
电子书:《原生架构容器&微服务优秀案例》.Serverless 实例.原生网关作为 API 流量的统一入口,注册配置中心负责服务间同步调用的注册发现及配置管理,微服务治理提供全链路的无侵入治理功能。用户可以选择一个或多个组件,并和其他产品搭配,快速构建分布式应用体系.MSE 提供高性能、高可用的注册配置中心托管。除...
来自: 云产品
基于DataWorks的大数据一站式开发及数据治理
基于DataWorks的大数据一站式开发及数据治理
概述 基于Dataworks做大数据一站式开发,包含数据实时采集到kafka通过实时计算对数据进行ETL写入HDFS,使用Hive进行数据分析。通过Dataworks进行数据治理,数据地图查看数据信息和血缘关系,数据质量监控异常和报警。 适用场景  日志采集、处理及分析  日志使用Flink实时写入HDFS  日志数据实时ETL  日志HIVE分析  基于dataworks一站式开发  数据治理 方案优势  大数据一站式开发,完善的数据治理能力。  性能优越:高吞吐,高扩展性。  安全稳定:Exactly-Once,故障自动恢复,资源隔离。  简单易用:SQL语言,在线开发,全面支持UDX。  功能强大:支持SQL进行实时及离线数据清洗、数据分析、数据同步、异构数据源计算等Data Lake相关功能 ,以及各种流式及静态数据源关联查询。
日志 HIVE分析 基于 DataWorks一站式开发 数据治理 产品列表 最佳实践频道 阿里最佳实践技术分享 实时计算、EMR EIP、VPC ECS DataWorks 服务器 ECS(产品名称)文档模板(手册名称)/文档版本信息 阿里 基于Dataworks的大数据 一站式开发及数据治理 最佳实践 文档版本:20210207 文档版本:20150122(发布日期)II...
来自: 最佳实践 | 相关产品:块存储,云服务器ECS,E-MapReduce,DataWorks,实时计算,云速搭
块存储EBS
阿里云块存储EBS是为云服务器ECS提供的低时延、持久性、高可靠的块级随机存储,拥有丰富的产品类型,多元的存储特性,适用于自建数据库加速,快照数据保护等场景,ESSD PL3规格最高可提供100万IOPS以及4000MB/S吞吐能力,有效提升存储性能,大大降低成本。
充分利用了AlibabaLinux操作系统极速启动优化特性,以及阿里最新一代主机及ESSD云盘性能提升效果。微博混合平台进一步具备了5分钟交付2000台搭配ESSD云盘的阿里第六代主机能力.在实际生产环境中,基于 ESSD的PIKA业务性能提升了125%,ESSD云盘9个9的数据可靠性满足了业务的强需求,而且大大降低了整体支出成本...
来自: 云产品
上成本优化workshop
<em>云</em>上成本优化workshop
某金融科技公司,它主要提供信贷,理财,电商等 服务,目前已经拥有千万级注册用户。该公司在将 在线业务系统和大数据业务从自建 IDC 机房迁移 到阿里云后,今年大数据集群经历过多次因为资 源不足导致弹性扩容失败的故障,运维负责人非 常苦恼。由于该公司从事互联网金融的借贷业务, 白天的催收非常依赖晚上大数据计算的结果,若 因为资源不足导致计算结果失败则意味着白天催 收业务员无事可做,会对公司业务造成严重影响。 后来,通过阿里云解决方案架构师建议的方案,将 大数据集群迁移到资源较充足的可用区以及配置 弹性伸缩多规格 ECS 选型增加交付成功率等方 法,目前已阶段性的解决因资源不足导致弹性扩 容失败的问题,但该方案在 Spot 计算资源不足 时,启用大量按量收费算力,带来了较高的成本, 并且抢占式实例和按量付费实例都不保证资源 100%交付,还是存在交付失败的可能性,特别是 在双 11 期间由于其他客户的资源需求上升带来 的资源挤兑客观上存在,就进一步增加了弹性扩 容失败的风险,从而影响业务正常运行。
步骤1 通 过 以 下 链 接 进 入 EMR 管 理 控 制,单击目标集群。(https://emr.console.aliyun.com/#/cn-hangzhou/cluster)步骤2 展开弹性伸缩下拉菜单,单击弹性伸缩配置。文档版本:20210329 31 上成本优化 workshop 计费优化 步骤3 关闭运行中的伸缩组。步骤4 成功关闭后,单击配置规则。步骤5 将成本优化策略...
来自: 最佳实践 | 相关产品:云服务器ECS,负载均衡 SLB,弹性公网IP,容器服务 ACK,日志服务(SLS),NAT网关,函数计算,E-MapReduce,云数据库PolarDB,弹性容器实例 ECI,存储容量单位包,预留实例券,Hologres
云数据库产品总览(瑶池)
阿里云提供完善的数据库解决方案,多款数据库产品,满足99%的业务场景,荣获Gartner、信通院等国内外多项认证。轻松满足高可靠、高可用性、高性能等数据库需求;运维工作量大幅减少,让企业一站式享受数据上云及分布式架构的技术红利!
云数据库HBase增强提供全文索引方案,通过BDS实现HBase与Solr之间的数据实时同步,使业务轻松应对高维度&随机组合查询需求;提供压缩存储优化特性和冷热分离功能,0应用改造实现冷热数据分离存储,降低不常用冷数据存储成本,提升常用热数据访问性能.专属集群MyBase以资源独享、自主运维、安全可控的新型模式,很大程度上...
来自: 云产品
原生数据库PolarDB MySQL
PolarDB MySQL版是自研的云原生关系型数据库,100%兼容MySQL。多主多写、多活容灾、HTAP、交易和分析性能最高分别是开源数据库的6倍和400倍,TCO低于自建数据库50%。
云数据库HBase.云原生数据仓库ADB.数据传输DTS.推荐搭配产品.通用:大容量数据存储.海量存储,支持上百TB级别数据.PolarDB采用计算和存储分离架构,支持数据库服务器的CPU、内存能够快速扩容,最快可增加15个只读节点,支持并行查询、读写分离等功能,使查询耗时指数级下降,解决计算量较大的查询、多表连接查询、日常...
来自: 云产品
原生数据库
PolarDB是阿里云自研的云原生数据库,在存储计算分离架构下,利用了软硬件结合的优势,为用户提供秒级弹性、高性能、海量存储、安全可靠的数据库服务。100%兼容MySQL和PostgreSQL生态,支持分布式扩展,高度兼容Oracle语法。
云数据库HBase.云原生数据仓库ADB MySQL.数据传输DTS.推荐搭配产品.通用:大容量数据存储.海量存储,支持上百TB级别数据.PolarDB采用计算和存储分离架构,支持数据库服务器的CPU、内存能够快速扩容,最快可增加15个只读节点,支持并行查询、读写分离等功能,使查询耗时指数级下降,解决计算量较大的查询、多表连接查询、...
来自: 云产品
原生多模数据库Lindorm
云原生多模数据库Lindorm提供各规模、多模型的云原生数据库服务。可兼容HBase/Cassandra、OpenTSDB、Solr、SQL、HDFS等多种开源标准接口。支持海量数据的低成本存储处理和弹性按需付费,是互联网、IoT、车联网、广告、社交等场景首选数据库,也是为阿里核心业务提供支撑的数据库之一。
云数据库 HBase .搭配使用产品.电商高并发场景.提供稳定、高性能、安全可靠的数据库服务.查看Lindorm使用文档.查看产品开发指南.查看快速入门指南.进入技术交流社区.面向海量KV、表格数据,具备全局二级索引、多维检索、动态列、TTL等能力,适用于元数据、订单、账单、画像、社交、feed流、日志等场景,兼容HBase、...
来自: 云产品
SLS多云日志采集、处理及分析
SLS多云日志采集、处理及分析
场景描述 从第三方云平台或线下IDC服务器上采集 日志写入到阿里云日志服务,通过日志服务 进行数据分析,帮助提升运维、运营效率, 建立DT 时代海量日志处理能力。 针对未使用其他日志采集服务的用户,推荐 在他云或线下服务器安装logtail采集并使用 Https安全传输;针对已使用其他日志采集 工具并且已有日志服务需要继续服务的情 况,可以通过Log producer SDK写入日志 服务。 解决问题 1.第三方云平台或线下IDC客户需要使用 阿里云日志服务生态的用户。 2.第三方云平台或线下IDC服务器已有完 整日志采集、处理及分析的用户。 产品列表 E-MapReduce 专有网络VPC 云服务器ECS 日志服务LOG DCDN
本示例以 SNAT+DCDN的方式同时日志采集机器组采用自定义标识的方式让日志采 集集群具备公网安全加速传输能力同时日志采集集群规模具备弹性伸缩能力,当用户 的日志集群所在机房众多,通过专线/高速通道等方式配置成本及带宽成本都比较高,希望通过公网安全稳定传送日志数据到阿里日志服务,推荐采用此方式 步骤1 创建日志...
来自: 最佳实践 | 相关产品:云服务器ECS,日志服务(SLS),NAT网关,E-MapReduce,全站加速 DCDN,云速搭CADT
自建Hadoop迁移到阿里EMR
自建Hadoop迁移到阿里<em>云</em>EMR
场景描述 场景1:自建Hadoop集群数据(HDFS)迁移到 阿里云EMR集群的HDFS文件系统; 场景2:自建Hadoop集群数据(HDFS)迁移到 计算存储分离架构的阿里云EMR集群,以OSS 和JindoFS作为EMR集群的后端存储。 解决的问题 客户自建Hadoop迁移到阿里云EMR集群的 技术方案; 基于IPSecVPN隧道构建安全和低成本数据 传输链路 产品列表 E-MapReduce,VPC,ECS,OSS,VPN网关。
本实践方案提供如下场景的最佳实践:基于 IPSec VPN隧道+DistCp(Hadoop原生工具),将数据迁移到阿里 EMR ,目标存储包括 HDFS,阿里 OSS和阿里 EMR的 Jindo 技术架构 本实践方案基于如下图所示的技术架构和主要流程编写操作步骤:方案优势 安全性 基于 IPSec VPN/专线的方式进行数据安全传输。低成本 在阿里...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,VPN网关,E-MapReduce,云速搭
数据湖-在线学习场景数据分析
数据湖-在线学习场景数据分析
场景描述 本场景以在线教育中一个答题闯关类的应用为 例,使用WebServer来模拟演示这类日志数据 的分析处理。通过Nginx和Pythonflask搭建 WebServer,模拟应用中的关键页面,比如登 录、课程内容等,之后构造若干用户使用的模拟 日志数据,投递到数据湖进行分析后获取应用 PV、UV、课程内容访问排行、平均得分等等。 解决问题 基于数据湖(EMR+OSS)搭建大数据平台。 EMR和OSS使用和配置。 数据统一存储到OSS。 产品列表 E-MapReduce 对象存储OSS 云服务器ECS 访问控制RAM 专有网络VPC
 支持Hadoop,Hive,Spark,Flink,Presto,HBase,Impala,Druid等引擎高 性能的运行在数据湖之上。文档版本:20200331 1数据湖-在线学习场景数据分析 最佳实践概述  支持Fuse/Posix 文件接口。 支持混合的方案,支持上云下同时读写访问。文档版本:20200331 2数据湖-在线学习场景数据分析 前置条件 前置条件 在...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,访问控制,E-MapReduce
< 1 2 3 >
共有3页 跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库HBase版 云数据库专属集群 云数据库 Redis 版 表格存储 弹性公网IP 短信服务

新品推荐

切换为移动版

新人特惠 爆款特惠 最新活动 免费试用