概述

通过 DST,运维人员、开发人员和架构师能看清楚复杂的大规模微服务架构下的应用及服务之间的 复杂调用关系、性能指标、出错信息 与 关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运...

搭建高可用架构

恢复数据 如果您已经按照前文的步骤搭建了高可用架构实例,您的业务一般是可以稳定运行的,即使出现问题也能快速恢复到可用状态。如果是单机故障,RDS除了基础系列之外的实例都可以在短时间内进行 主备切换 快速恢复您的业务。如果是可用区...

分布式链路概述

帮助运维人员、开发人员和架构师轻松应对复杂的大规模微服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运维开发工作...

故障演练

有损演练是指直接在线上真实业务环境注入异常进行演练,演练模拟的真实有效性高,为了平衡业务影响一般会选择最核心场景、在业务最低峰期做演练,而且演练频次相对较小,例如为了验证多活容灾能力的机房断网演练,一般是一个月一次的演练...

概述

通过分布式链路跟踪,运维人员、开发人员和架构师能看清楚复杂的大规模微服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障...

变更发布策略

一般会将新版本的实例规格和数量与旧版本保持一致。当新版本服务验证通过后,将业务流量全部切至新版本。旧版本作为热备。如新版本上线后出现问题,可将流量全部切回至旧版本完成回滚,缩短故障恢复时间。A/B测试:通过用户请求的元信息将...

流水线管理

如果需要支持推送模式,则需要在应用元数据中进行设置(仅应用 Owner 和架构师有权限修改)。提交主干代码:如果在应用进入到集成阶段后,需要修改主干代码,只能通过 MR 模式向主干提交。手动触发 可以在配置变更完成后和其他需要的时机...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

Well-Architected Tool

您可以阅读问题并确定该问题是否适用于您的工作负载:如果问题不适用您的工作负载,您可以选中 问题不适用,然后选择不适用的原因,跳过该问题。如果问题适用您的工作负载,您可以选择当前遵循的最佳实践条目。如果您当前未遵循任何最佳...

国泰产险:上线从28天变成1天,云效助力持续交付转型

配置管理也是个老大难问题,线上经常会出现配置项不对,造成发布失败。所以我们想了一些方案。环境管理也是云效提供的一些功能。测试管理也是一个非常大的难点。比如做一个分层的测试,单元测试是开发同学做,接口和UI是测试同学做,集成...

全场景解决方案

SOFA 微服务和 Service Mesh 微服务,提供了既支持 SOFA 框架又支持 Service Mesh 架构的微服务管理和治理能力,解决用户在技术转型期间与未改造的遗留系统相互之间的打通和过渡问题,帮助金融机构平稳地从传统的集中式微服务架构演进到云...

云卓越架构服务内容说明

1.服务概述 1.1 服务说明 云卓越架构咨询服务旨在帮助企业在阿里云平台上构建符合卓越架构方法论与实践要求的企业云上架构咨询与实施服务。通过该服务,阿里云卓越架构咨询团队提供覆盖安全合规、成本优化、性能效率、业务稳定、卓越运营五...

概述

但随着各公司业务范围的扩展和软件系统架构持续迭代升级,系统的复杂度随之增加,面对更多的非预期事件风险,如各类软硬件故障、错误的变更、突发流量,甚至到光纤挖断、自然灾害等引起的整个机房不可用情况,如何保障系统稳定性具有很大...

变更实例配置

变配影响 经典 实例和 云原生 标准架构实例 实例执行切换时会出现1~2次30秒内的 连接闪断。为保障变配后的新实例能快速追平原实例的增量数据,同时规避因DNS缓存引起的数据双写,在变配过程中,实例会出现 1分钟内的只读状态。为保障更出色...

Multi-Master基础架构

通常情况下,数据库实例中只有Main Master在工作,Standby Master节点作为高可用备份,当Main Master节点出现故障时,Standby Master才切换成Main Master进行工作。随着业务的发展,例如实时数仓和HTAP场景需求的增加,Single-Master的...

标准架构

当主节点出现故障,自研的HA系统自动进行主从切换,保证业务平稳运行。数据可靠 默认开启数据持久化功能,数据全部落盘。支持数据备份功能,用户可以针对备份集回滚实例或者克隆实例,有效地解决数据误操作等问题。同时,在支持容灾的...

一键同步

为了方便用户组对于钉钉、飞书、企业微信账号信息的同步管理,一键同步功能支持同步组织架构以及成员,您可以根据需求选择部门或则其一成员进行信息同步操作。前提条件 已创建用户组,请参见 创建用户组。操作入口 登录 Quick BI控制台。在...

灾备方案

标准版-双副本高可用架构 标准架构(双副本)实例采用双机主从(Master-Replica)架构,高可用HA模块侦测到主节点故障时,自动进行主从切换,将Replica提升为Master,而原来的Master恢复连接后成为新的Replica。集群架构 图 3.集群版-...

单元化介绍

什么要做单元化,单元化架构能给系统带来什么样的能力。本文结合蚂蚁集团支付宝系统的单元化架构建设实践,阐释单元化的原理与实现。单点瓶颈 任何一个互联网系统,不论是支付宝、淘宝,还是 Google、Facebook,当发展到一定规模时,都会...

灾备方案介绍

标准版-双副本高可用架构 标准架构(双副本)实例采用双机主从(Master-Replica)架构,高可用HA模块侦测到主节点故障时,自动进行主从切换,将Replica提升为Master,而原来的Master恢复连接后成为新的Replica。集群架构(双副本)图 3...

序言

数字金融时代的云原生架构转型 步入数字金融时代,“云原生架构”作为金融 IT 架构的关键发展趋势已经成为业界共识,但 IT 架构转型绝不是一蹴而就的,在积极探索和应用以“云原生”为代表的新兴技术的同时,必须考虑与传统模式和技术融合...

应用容灾

当某机房出现故障,可以做到机房级的快速切换。更精细化的场景,如果是某中心内某应用的故障,还需要做到应用级的切换。为了实现机房间的流量调度,同城应用多活架构下,建立多个服务部署的逻辑区,这个逻辑区称之为“单元格(Cell)”。每...

网络架构容灾

网络是数字世界的基础设施,没有网络的联通,所有信息都无法交互,因此网络架构的设计在应用系统中至关重要,特别是针对网络架构的高可用及容灾能力的设计,是业务在异常发生时,实现快速恢复、降低业务损失的关键。云上网络规划设计 为...

设计原则

面向失败的架构设计原则 众所周知,系统异常事件是不可避免的,如网络延迟、硬件故障软件错误、突峰流量等,建议在系统设计阶段就要从这些异常事件引起的系统执行“失败”出发,提供冗余、隔离、降级、弹性等能力,旨在确保系统的高可用...

构建运营模型

其中的成员包括:架构师和专业技术人员,负责上云架构设计和业务上云迁移工作;安全、合规等领域专家,负责设计企业IT治理方案、预估风险和制定治理规则;财务专家,负责制定财务的管理流程和成本分摊规则。云管理团队:在企业业务全面上云...

持续架构优化

通过分析后发现这些业务,随着业务的发展,新的业务场景也会出现,云厂商也会推出新的产品类型和产品规格,通过持续架构优化,适配业务需要,并优化云资源使用,降低用云成本。对应用架构进行云原生化改造 云原生架构是基于云原生技术的一...

典型客户案例

人保健康新一代电商平台对标行业顶尖水平,引入蚂蚁集团分布式交易架构基础软件,采用微服务、分布式数据库、容器等多项新技术,系统自 2018 年 4 月 18 日上线以来,较好的满足了互联网保险业务快速迭代、高并发、弹性扩展的需求,支撑了...

变更实例配置

变配影响 经典 实例和 云原生 标准架构实例 实例执行切换时会出现1~2次30秒内的 连接闪断。为保障变配后的新实例能快速追平原实例的增量数据,同时规避因DNS缓存引起的数据双写,在变配过程中,通常情况下实例会出现 1分钟内的只读状态,而...

常见问题

一般使用常见问题 数据源类 配置和接入类 告警类 数据源类 日志支持哪些时间格式?支持如下时间格式:normal:最常见的时间格式 2016-12-13 10:00:14 apache:apache 时间格式 08/May/2017 01:13:52_long:完整时间戳,精确到毫秒,格式 ...

经典应用服务常见问题

分组被自动加锁,是由于有其他发布单正在发布该分组内的服务器,应用页面顶部会出现提示 该应用下有服务器正在其他发布单XXX发布,单击发布单链接,可查看正在发布的应用。当正在发布的服务器发布完成后,已加锁的分组可进行解锁继续发布。...

添加钉钉账号为组织用户

当用户名称有变更时,您可以看到对应用户的用户名称后面会出现 名称变更 的提示。此时,您可以根据需要单击 图标删除用户。当用户不在组织内时,您可以看到对应用户的用户名称后面会出现 待删除 的提示。此时,您可以单击 图标删除用户或...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

产品架构

Holo Master Hologres原生部署在K8s上,当某个Worker出现故障时,由K8s进行快速拉起创建一个新的Worker,保障Worker级别的可用性。在Worker内部,每个组件的可用性则由Holo Master负责,当组件出现状态不正常时,Holo Master则快速重新拉...

附录:SOFAStack 产品目录

SOFAStack 源于自蚂蚁内部沉淀十多年的金融级分布式中间件技术体系,吸收了支付宝自创立以来在关键金融交易系统锤炼出来的架构实践。SOFAStack 所有的产品技术均经过蚂蚁集团自身严苛的金融场景验证,为金融交易技术保证风险安全的同时,...

可观测性的设计原则

每个组件都可以将标识符添加到它们的日志中,以便在出现问题时进行故障排除。分布式跟踪可以使用开源工具Jaeger、Zipkin、skywalking或CAT等,阿里云上有ARMS服务来实现。日志记录 系统需要记录关键事件和故障,以帮助诊断问题和解决故障。...

常见问题

本文汇总了 SOFARegistry 使用过程中的一些常见问题及对应的解决方案。RPC 服务端发布之后,为什么在微服务控制台无法找到该服务。问题原因 应用服务器的 IP 地址,不在发布部署参数 rpc_enabled_ip_range 范围内。例如:应用服务器的 IP ...

用云成本需求分析

伴随云计算的发展,新技术、新产品、新工具不断出现,往往都会带来性能或效率上的提升,从而提升企业用云性价比和管理效率。如服务器、数据库的升级、研发效能平台的推出等,企业利用新技术架构或产品类型适配自身业务发展可提升用云效能...

容器网络与节点规划

这样就算有一台 ECS 出现故障,剩余 ECS 仍可以支持现有业务正常运行。确定 CPU:Memory 比例。对于使用内存比较多的应用例如 Java 类应用,建议考虑使用 1:8 的机型。使用大规格 ECS 的优势如下:网络带宽大,对于大带宽类的应用,资源...

什么架构感知

架构架构组件 为了更好地理解AHAS提供的架构感知模块,您需要先了解什么架构架构组件。架构分为水平和垂直两个维度:水平架构:进程拓扑、容器拓扑、主机拓扑。垂直架构:进程、容器、主机之间的依赖关系。架构组件是指架构的组成...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 云数据库 MongoDB 版 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用