附录:SOFAStack 产品目录

SOFAStack 源于自蚂蚁内部沉淀十多年的金融级分布式中间件技术体系,吸收了支付宝自创立以来在关键金融交易系统锤炼出来的架构实践。SOFAStack 所有的产品技术均经过蚂蚁集团自身严苛的金融场景验证,为金融交易技术保证风险安全的同时,...

性能监控最佳实践

建设一体化性能监控平台 随着互联网技术的不断发展,企业的业务规模和复杂度也在不断增加。为了保证业务的稳定性和可靠性,企业需要对其系统进行全面的性能监控。而一体化性能监控就是一种集成了多种监控工具和技术的综合性监控方案,可以...

东软案例

总得来说,造成这种现象的主要问题原因,可总结为以下两个方面:新需求推动IT系统监控数据量激增:移动智能终端设备的普及使应用逐渐渗入到我们工作生活的方方面面,企业应用数量激增。企业面向客户、合作伙伴和内部员工建设IT系统及应用...

全场景解决方案

同时,金融行业历来是强监管、强安全、高复杂度的行业,伴随金融监管体制改革,监管部门对金融IT系统建设和运维有非常严格的要求,需要具备金融级安全、可靠及高性能的云原生解决方案。蚂蚁集团自主研发的金融级分布式架构平台,专注为...

灾备规划

云容灾服务因免去了灾备中心建设、硬件系统采购、运维等复杂的工作,加上资源可弹性扩展、按量付费的特性,这些都降低了规划工作的难度。您只需花少量的时间进行选型、规划等就可以轻松使用阿里云作为您的容灾服务提供者。本文将从需求分析...

混合云应用活容灾最佳实践

通过MSHA多活容灾助力企业进行混合云应用活容灾建设的实践案例,给出了容灾架构建设实践方法,同时利用Chaos故障演练产品注入真实故障,来验证故障场景业务容灾能力是否符合预期。若您在使用过程中有任何疑问,欢迎您搜索钉钉群号...

客户案例

唐家才 网商银行 CTO“网商银行选择 OceanBase 三地五中心部署架构,不仅在数据上从具备抵御同城机房故障提升到具备异地城市容灾的能力,同时内置的多租户隔离的能力,满足全行多应用系统的管理与使用需求,让应用系统多活架构设计上变的...

关键技术竞争力

基于混沌工程的红蓝攻防能力 TRaaS 基于混沌工程、建立演练机制,提供故障注入、演练编排体系能力,支持在不同环境、不同阶段,主动对业务系统进行故障注入,从而在主动观测单应用健壮性的同时,验证整个体系的故障发现能力、应急响应能力...

GTM如何实现异地容灾

两地三中心容灾架构,是指在同城双中心的基础上,在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。目标读者 企业网络部、业务运维部工作...

GTM如何实现同城容灾

同城双活容灾架构,是指在同城建立两个可独立承担关键系统运行的数据中心,双中心具备基本等同的业务处理能力并通过高速链路实时同步数据,日常情况下可同时分担业务及管理系统的运行,并可切换运行;灾难情况下可在基本不丢失数据的情况下...

名词解释

两地三中心 即生产数据中心、同城灾备中心、异地灾备中心建设方案。这种模式下,两个城市的三个数据中心互联互通,如果⼀个数据中心发生故障或灾难,其他数据中心可以正常运行并对关键业务或全部业务实现接管。命名空间 多活命名空间MSHA ...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

设计原则

IT系统故障或灾难是不可避免的。如果没有数据容灾措施,数据中心或服务器发生故障或灾难时,数据的完整性、可恢复性和可用性都将受到严重影响;数据容灾可以保障企业业务的持续运行和数据的可靠性。在数据中心或服务器出现故障或灾难时,...

设计方案

基于稳定性支柱设计原则,整体稳定性设计方案可参考如下:架构设计原则 软件系统从所有的功能都在一个应用程序内运行的单体应用架构,到不同的功能模块分别部署在不同的服务器上的传统分布式应用架构,再到服务细分通过轻量级的通信机制...

GTM实现跨网访问加速与故障切换

相关概念 名词 概念 GTM 全局流量管理(Global Traffic Manager),简称GTM,支持智能解析、健康检查、故障隔离、故障切换,可帮助企业快速构建同城双中心、两地三中心的容灾架构。智能解析 是指根据用户请求源地址(运营商、地域等),...

什么是多活容灾

随着商业需求、新技术的不断升级以及新的内部和外部规则的变化,IT系统也会随之改变。要确保灾难恢复计划的有效性,必须定期检查和修改计划。容灾架构保鲜 多活容灾旨在给出一套帮助业务应对未来潜在灾难场景下的解决方案。但业务会持续...

什么是应用高可用服务AHAS

故障演练 故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景实现,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。...

应用场景

机房级容灾 同城活 同一个城市,建设两个机房环境,两地距离 50 km 以内,万兆光纤专线互连,业务应用层面可以两个机房同时提供业务服务,当一个机房故障,不影响另外一个机房业务使用。异地主备 满足容灾需求,两地不同城市分别建设两个...

典型客户案例

四川农信 业务挑战 现有 IT 系统在过去的一段时间有效地支撑了各业务系统的运营,但目前的 IT 技术环境在面对未来业务大发展的需求时仍会面临极大的挑战,主要有以下几点:传统架构面临挑战 新一代的银行系统必须直面来自不同阶层、不同...

网络架构容灾

网络是数字世界的基础设施,没有网络的联通,所有信息都无法交互,因此网络架构的设计在应用系统中至关重要,特别是针对网络架构的高可用及容灾能力的设计,是业务在异常发生时,实现快速恢复、降低业务损失的关键。云上网络规划设计 为...

可运维性咨询服务内容说明

2.服务范围 本项目乙方服务包括以下内容:基于阿里云SRE最佳实践帮助乙方全面评估云平台和应用运维成熟度,量身定制面向云时代的稳敏态运维体系,提升应用系统整体可运维性!可运维性咨询包括高可用性、可观测性、可弹性、安全性、稳定性...

分支门店

业务运维效率低 不同门店的建设阶段导致操作系统、浏览器、通用办公软件等版本存在差异,新业务系统上线或变更时容易出现兼容性问题,影响业务效率 全国提升门店连锁率的背景下,需要快速提升业务扩张的效率和门店的标准化 门店出现IT问题...

变更管理

运维事件中心是阿里云提供的云上变更管理服务,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更...

基本概念

资源管理 资源管理,实现系统资产和配置管理功能,提供各类资源及其相关属性的维护管理,范围不仅包括设备、服务器和IoT之类物理资源,也包括IP地址、业务链路等逻辑资源。设备 一般指IP网数通类网络通信设备,比如交换机、路由器、防火墙...

支持计划

阿里云售后团队向客户提供的关于第三方软件的建议只适用于有经验的系统管理员或其他相关IT人员。阿里云不负责以上第三方软件的安装、调试或更新,或对建议的实施。第三方软件目录及问题服务范围举例:第三方软件目录 服务范围:示例 非服务...

功能架构

系统通过采集各种指标、日志和链路等数据,并进行海量数据的清洗、计算。以此来支撑产品层的应用监控、业务监控、平台监控、基础设施监控、告警管理和分布式链路等能力。作为一个企业级产品,系统提供资源租户隔离、访问鉴权控制和监控配置...

概述

卓越运营第三个关键领域是围绕快速和规律的自动化部署确定企业IT运营的技术平台,推动基础设施即代码、自动化运维、自动化配置等能力中心的技术架构,提高组织高速交付应用程序和服务的能力,与使用传统软件开发和基础设施管理流程相比,...

SA混合云存储阵列

但也有很多企业对传统存储阵列的依赖度很高,在短期内完全迁移到云端会有诸多的挑战,可能会涉及到系统的重新构建或者应用程序的开发,对客户来说改动量很大,也会面临不小的风险。同时还有很多客户对敏感数据的物理存放地有要求,所以...

客户端离线排查

云安全中心控制台显示客户端离线时,表示该服务器已失去云安全中心的防护。此时,该服务器可能存在被黑客入侵的风险。建议您参考本文内容尽快排查离线原因,保障客户端在线。背景信息 云安全中心提供客户端问题一键排查功能,如果您发现...

多账号配置统一合规审计

轻松应对企业IT运维职责挑战 企业IT运维团队在日常工作中时刻伴随着各种风险,在部署和交付的各个环节都可能因配置错误、配置疏漏、管理粗糙等原因留下安全隐患,使IT系统可能发生账号被盗、成本溢出、数据泄露等严重事故。该方案一方面...

服务等级协议

本服务等级协议(Service Level Agreement,以下简称“SLA”)约定了阿里云向客户提供的运维事件中心(简称“运维事件中心”)的服务可用性等级指标及赔偿方案。特别提示您,除非另有约定,本协议不适用于运维事件中心公测、邀测、免费的...

支持计划-服务报告

2.服务范围 服务范围包含:面向IT系统范围包括 阿里云 资源以及依托云资源建设IT系统,包括高可用巡检、高可用防护、高可用架构,年度服务报告包含但不限于-过去一年稳定性大事件回顾。稳定性工作总结。新财年稳定性工作规划。面向客户在...

GxP欧盟附录11标准合规包

16.1 为了提供支持关键过程的计算机化系统,应作出规定,确保在系统出现故障(例如手动或替代系统)时继续为这些流程提供支持。采用替代安排所需的时间应视风险而定,并适合特定系统及其所支持的业务流程。应充分记录和测试这些安排。17.1 ...

什么是混合云容灾服务

解决的核心问题 混合云容灾解决的核心问题如下:应用级容灾保障业务持续性(Business Continuity):在数据中心故障或长时间系统维护作业时,在云上快速恢复应用运行,缩短业务停机时间,极大减少损失。数据级容灾:在数据中心备份您的数据...

概述

系统稳定性是指系统在运行过程中面对各种非预期事件影响下能够持续提供可靠服务的能力,是系统建设的重中之重。但随着各公司业务范围的扩展和软件系统架构持续迭代升级,系统的复杂度随之增加,面对更多的非预期事件风险,如各类软硬件故障...

应用场景

业务架构(以两地三中心架构为例)数据库由两个 PolarDB 集群组成:北京的可用区集群,覆盖AZ1和AZ2。上海的单可用区集群。应用在北京,对AZ1的数据库进行本地读写。当北京AZ1故障时,优先切换到北京AZ2。当北京AZ1和AZ2均故障时,切换到...

产品优势

支持蚂蚁产品双中心容灾切换,满足监管合规需求。技术风险防控内容库快速更新 阿里云、蚂蚁技术风险团队基于域内、域外技术风险防控经验,共建日常巡检、故障诊断、应急预案内容库,用户可享受最新的技术风险防控内容。

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

如何管理故障

可对故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云安全中心 云数据库 Redis 版 云服务器 ECS 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用