查看实例的系统日志和屏幕截图

系统通过串口打印输出的日志会包含两种类型的信息,一类是系统启动开机时的日志内容,另一类是系统内核故障或异常时的日志内容。更多详情,请参见《云栖社区》博客 操作系统有异常?诊断日志来帮忙。使用限制 使用该功能时您需要注意如下...

云资源视图

背景信息 当您在自己的系统中安装了AHAS探针后,AHAS就能自动识别系统中的进程、容器和主机,并基于网络流量构建出拓扑图,显示进程、容器、容器组和主机之间的网络依赖关系,让您对自己的系统架构一目了然。说明 容器组层仅适用于...

ECS系统事件概述

系统事件由阿里云定义,用于记录和通知云资源的信息,例如运维任务执行情况、资源是否出现异常、资源状态变化等。说明 阿里云有众多产品支持系统事件,例如ECS、RDS、SLB等。本文仅说明云服务器ECS支持的系统事件,如需了解其他产品的系统...

什么是全局流量管理?

系统架构 全局流量管理是由管控层和解析层两部分组成:管控层:管控层通过控制台和OpenAPI对外提供服务,主要实现了域名解析数据、配置数据、监控数据、日志数据等的增删改查功能和存储功能。管控层位于【中国内地-华北3(张家口)】。解析...

什么是容器报警演练

不同于其他故障演练模块对系统注入真实故障,报警演练只会对集群的API Server投递事件,由事件触发报警链路,不会对系统造成真实故障。无侵入。无需在用户集群中安装探针以注入故障,所有事件投递都是通过API Server来进行网络请求。

实例的节点故障处理机制

副本集架构 副本集实例提供多个节点供用户访问,当其中的某个节点发生故障后,系统会使用Secondary节点或隐藏节点替换故障节点继续提供服务,并对故障节点进行检查与修复。该过程对用户完全透明,可能会产生1次30秒内的连接闪断,建议您在...

分布式链路概述

帮助运维人员、开发人员和架构师轻松应对复杂的大规模微服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运维开发工作...

灾备方案

图 1.Tair 容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案...

业务连续性

阿里云的客户需要负责业务系统架构设计合理性,确保能在必要时实现故障转移,保障业务连续不中断。建议您根据本文介绍的相关方案,来建设您的边缘计算应用的业务连续性能力。最佳实践 多实例容灾 为了确保高可用,应用必须能处理高负载、...

事件管理

事件是指任何可能中断或降低服务质量(或具有此类威胁)的计划外事件。例如业务出现风险、服务器运行缓慢、接口响应延时过...通过这些信息的汇聚,可在后期统一进行分析查看,协助后续类似事件发生的处理以及对系统架构的优化提供可靠依据。

灾备方案介绍

图 1.Redis容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案...

基于Kubernetes容器集群的容灾架构与方案

在进行系统架构设计时,您必须考虑到信息系统和基础设施可能遇到的各种潜在威胁,例如:硬件故障、软件系统崩溃、人为操作失误、安全攻击、自然灾害等。为了确保系统能够在各种异常故障场景下快速恢复并保持业务连续性,您必须为系统设计...

SOFAMesh 服务网格总体经济影响报告

在应用架构、基础架构和部署架构等不同维度,异构环境均将以常态化的混合形态长期存在,而仅仅采用容器、Kubernetes(K8s)与微服务技术,缺乏服务网格支持的早期云原生实践也将对企业内部的技术团队带来极大挑战。Forrester 提出适应未来...

管理MySQL集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

产品架构

本文介绍故障演练的产品架构,以下简称故障演练为AHAS Chaos。产品架构图 AHAS Agent AHAS Agent安装在指定的目标机器上,用来执行服务端下发的故障注入命令以及采集演练相关的必要信息,例如CPU、内存占用等。主要有以下特点:快捷高效:...

管理探针

应用高可用服务AHAS会通过探针从您的系统中采集所需的信息。本文介绍了如何安装、升级、停止和卸载探针。什么是探针?应用高可用服务AHAS包括以下两种探针:应用高可用探针(即AHAS探针):这是安装在操作系统上的独立进程,用来采集架构...

接入主机

在普通主机上安装AHAS探针后,即可体验架构感知和故障演练功能,直观地查看应用对基础架构的依赖关系,组件间的依赖关系,以及对应用进行故障演练。本文介绍如何将探针接入主机,主机类型包括Linux和Windows。操作步骤 登录 AHAS控制台,并...

概述

运维人员、开发人员和架构师能看清楚复杂的大规模微服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运维开发工作。...

什么是业务实时监控

分布式链路:提供应用拓扑和链路查询功能,观测应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运维开发工作。日志查询和日志关联...

概述

在传统 IT 环境中,系统的容量评估和规划是系统设计的重要环节,通常会基于系统对峰值负载表现出来的性能承载能力来给系统选择合适的节点数量规划,在双活系统中考虑到 failover 会需要给单节点设计更大的冗余,对于过载的场景也需要有过载...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,数据库、MQ等中间件异常事件),以及集成各业务自建的定位工具能力,并在故障及风险预警的应急过程中进行可疑原因定位,帮助促进故障及风险预警初因定位的时长缩短。...

概述

SOFARegistry 是蚂蚁集团开源的一个生产级、高时效、高可用的服务注册中心,采用 AP 架构(CAP 理论中的 AP,强调可用性),支持秒级时效性推送,同时采用分层架构支持无限水平扩展。SOFARegistry 最早源自于淘宝的 ConfigServer,十年来,...

网商银行

是中国第一家将核心系统架构在金融云上的银行。基于金融云计算平台,网商银行拥有处理高并发金融交易、海量大数据和弹性扩容的能力,可以利用互联网和大数据的优势,给更多小微企业提供金融服务。业务挑战 网商银行将普惠金融作为自身的...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

故障基础数据管理

服务组与故障业务线的关系:一个服务组对应故障中一个角色,但可以服务多条故障业务线 服务组与工单问题分类的关系:一个服务组可以服务工单多个问题分类 服务组与组织架构的关系:一个服务组可以服务多个组织架构,一个组织架构可以拆分为...

产品系列概述

高可用系列 一主一备的高可用架构,支持自动故障切换。备节点不可访问。支持增加 只读实例 扩展读能力。大中型企业的生产数据库。互联网、物联网、零售电商、物流、游戏等行业的数据库。集群系列 一主多备的高可用架构,支持自动故障切换。...

Tair选型指南

选择容灾方案 图 3.Tair容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主从节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。...

企业单AZ架构升级到多AZ

更多稳定性相关信息,请参见 为什么选择我们-稳定可靠 选择多AZ部署是为了确保服务的稳定性和业务连续性,在设计系统架构时,需要权衡成本和所需的可用性级别,因为多AZ部署通常与更高的成本相关,因此需要对您的业务连续性要求做好评估。...

证券交易所

阿里金融云提供整体架构解决方案,赋能证券交易行业IT体系平稳、有序地切换到新技术体系。金融级别的合规集群保障了容灾能力和稳定性;多运营商BGP优质网络接入为全国客户提供了流畅的网络体验,规避了运营商网络之间的互联互通风险。阿里...

接入ECS

AHAS架构感知和故障演练支持在ECS上一键安装应用高可用探针。安装成功后,您可以直观地查看应用对基础架构的依赖关系,组件间的依赖关系,以及对应用进行故障演练。本文介绍如何快速接入ECS。前提条件 确保待安装探针的ECS系统为Linux或...

创建MySQL集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

什么是持续交付

代码服务 采用支撑百万用户规模的 GitLab 架构,进一步提升性能、确保数据安全、实现单元化部署,形成更安全、稳定、高效、智能、集成、开放的代码生态系统。多样化分支策略支持高扩展、分布式、响应式、大文件、按需下载,更有流控、安全...

Data API功能简介

降低使用成本 通过使用RDS Data API Service,一些特定的系统可以免去后端服务,直接从前端请求到数据库,简化系统架构的同时,由于不再需要服务端业务逻辑开发,减少了应用程序开发的人力成本,降低了维护基础设施的风险,而且更便于扩展...

云数据库Redis版产品选型必读

云原生 版实例 创建Redis云原生版实例 Redis社区版 7.0 6.0 5.0 标准架构 集群架构 读写分离架构 企业版(内存型)兼容Redis 6.0 兼容Redis 5.0 标准架构 集群架构 读写分离架构 企业版(持久内存型)兼容Redis 6.0 标准架构 集群架构 读写...

产品优势

蚂蚁技术风险管理体系方法论+平台工具完整落地 通过高可用管理平台工具,可以输出蚂蚁多年积累点的技术风险防控内容,并在此基础上助力用户建设符合用户实际情况的技术风险防控体系,提升用户整体技术风险防控水平。技术风险防控效率有效...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。功能简介 故障注入流程如下所示:在微服务中,其实现方式为:管控...

产品功能

分布式架构,单节点故障业务不受影响 云数据库Memcache版采用分布式集群架构,每个节点均由双机热备架构组成,具备自动容灾及故障迁移能力。多种规格可适配不同的业务压力,数据库性能支持无限扩展。支持数据持久化及备份恢复策略,有效的...

使用可视化演练

右侧显示系统整体的架构。展示了应用之间的调用关系。您可在右侧架构中单击某个应用,展示应用详情视图。在页面右上角,您可单击 应用筛选,选择需要展示的应用。演练状态观测。当有演练进行时,会将演练中的应用进行标识,让您直观地观察...

创建集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后再替换...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 物联网无线连接服务 云服务器 ECS 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用