监控与日志

例如您可以根据通过捕获的流量信息分析带宽使用情况、排查网络故障、优化流量使用成本、分析异常流量等。云企业网流日志 流日志会在指定的捕获窗口捕获转发路由器之间的跨地域流量信息和边界路由器VBR(Virtual border router)连接的流量...

监控、诊断和故障排除

网络故障引起丢包重试。例如客户端发起一个删除操作删除某个Object,此时请求达到服务端,执行删除成功,但是响应在网络环境中丢包,然后客户端发起重试,第二次的删除操作可能就会遇到404错误。这种由于网络问题引起的404错误可以通过客户...

基于ack-lingjun-aiast组件实现集群自动化运维

该系统能够实时监测并分析系统的运行状态,快速检测故障并采取恢复措施,例如硬件故障、网络故障、软件错误等,从而降低运维成本,提高系统可靠性和稳定性。组件介绍 安装灵骏AI助手开启PAI的作业监控和恢复功能后,当发生故障或异常时,...

基本概念

故障管理 网络故障的发现、分析、定位等维护管理,包括告警信息的收集入库、规则匹配、关联分析以及告警清除等一系列流式处理过程。Netconf netconf协议一般用于网络业务配置,使用结构化可描述语言实现快速的网络设备下发。gRPC 高性能、...

网络资源

网络闪断故障可能由多种原因引起,如网络设备故障、电力波动、通信线路故障等。网络闪断会导致数据传输中断,影响系统和应用程序之间的数据传输,频繁的网络闪断可能导致系统或应用程序无法正常运行。常使用的容错策略如下:设备冗余:使用...

常见重大封网时段公告

封网期间影响如下:封网期间禁止出入机房,只处理重启服务器和网络紧急故障,不再进行诸如路由策略,带宽流量调配,业务割接等涉及电路,数据调整等操作。封网期间机房不办理外部人员进出手续。说明 封网属于不可抗力或不可控因素,该时段...

智能卡简介

网络灾备 当前网络出现故障后,支持切换到备份网络,提升设备在线时长。降低成本 节省了事前勘测和故障后运维的人力以及相关成本。支持存量设备升级 设备本身无需硬件改造,安装相关SDK进行存量设备OTA升级后,即可支持智能卡。可选网络 ...

容灾演练断网方式说明

可用区断网 当整个机房的外部网络出现中断后,外部请求无法进入故障机房,机房内业务同样无法访问外部网络,但机房内网络互通,形成一个局部环境。可用区断网正是为了模拟此类真实故障而提供的机房级故障模拟能力。可用区断网方式采用租户...

概述

通过集群多副本等方式,应对自身节点故障。产品架构 产品架构如下:说明 图中 Session Cluster、Data Cluster、Meta Cluster 都是集群,表示 SessionServer、DataServer、MetaServer 可无限扩展。Client(客户端):提供应用接入服务注册...

跨可用区容灾

故障恢复时,HDR使用该网络恢复容灾数据。HDR默认读取从站VPC网络的可用虚拟交换机。复制网络和恢复网络不在一个可用区时,将导致RTO时间变长。建议配置和 复制网络 相同的可用区。IP地址 故障恢复时,创建的ECS实例的IP地址的生成方式。...

跨地域容灾

故障恢复时,HDR使用该网络恢复容灾数据。HDR默认读取从站VPC网络的可用虚拟交换机。复制网络和恢复网络不在一个可用区时,将导致RTO时间变长。建议配置和 复制网络 相同的可用区。IP地址 故障恢复时,创建的ECS实例的IP地址的生成方式。...

强弱依赖治理最佳实践

在对业务分析进行依赖预判后,应通过故障注入的方式验证真实依赖关系是否与预判相符,例如注入依赖的服务间的网络延迟故障。强弱依赖的验证可以有多种指标,例如监控与日志的报警,请求的返回状态码等等。本文示例预期frontend与...

多可用区部署

如果可用区A的网络存在故障,由于同步延迟问题,在可用区A网络恢复之前的时间段内可用区B的数据会一直处于缺失的状态。备实例资源利用率不高。在主备容灾下,大部分时间备实例的资源不会被使用,只有在主备切换操作的时候才会被访问。主备...

网络诊断

容器服务平台提供网络诊断功能,帮助您诊断网络常见问题,例如Pod之间不通、集群到公网访问不通、公网到LoadBalancer不通。本文介绍网络诊断的基本原理、使用方式、以及如何针对常见网络不通的场景定位网络问题和使用网络诊断。重要 使用...

网络类场景

网络延迟 网络延迟场景可以指定网络延迟因素(例如网卡、本地端口、远程端口、目标IP等)和延迟时间,对应用或服务注入网络调用延迟故障。验证网络延迟情况下系统的容错能力。表 1.参数说明 参数名称 参数说明 网卡名称 具体的网卡设备,为...

添加机房

可用区之间网络互通,故障隔离。是否将实例放在同一可用区内,主要取决于对容灾能力和网络延时的要求。您可以在创建工作空间组时添加机房,详情请参见 创建工作空间组。也可以在创建完工作空间组后添加,具体操作如下所示。操作步骤 登录 ...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

服务等级说明

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

SLA服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

服务协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的;(6)...

服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)用户的应用程序或数据信息受到黑客攻击而引起的;(4)用户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)用户的疏忽或由用户授权的操作所引起的...

归档存储服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)用户的应用程序或数据信息受到黑客攻击而引起的;(4)用户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)用户自行升级操作系统所引起的;(6)...

产品架构

本文介绍故障演练的产品架构,以下简称故障演练为AHAS Chaos。产品架构图 AHAS Agent AHAS Agent安装在指定的目标机器上,用来执行服务端下发的故障注入命令以及采集演练相关的必要信息,例如CPU、内存占用等。主要有以下特点:快捷高效:...

服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄露所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

混沌工程缓存实战系列-Redis

本示例创建网络延迟的故障场景。登录 AHAS控制台,在左侧栏选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练>新建空白演练。在 演练配置 页面,填写相关参数,选择 演练内容 为 主机内网络延迟。更多参数信息,请参见 创建演练。...

故障演练

例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过将被演练的资源关闭,使资源处于人工构造的故障...

开通LTS

在同一专有网络内可用区与可用区之间私网互通,可用区之间能做到故障隔离。网络类型 固定选择 专有网络。vpcId 选择用户所需的专有网络,创建专有网络请参见 创建专有网络。vswitchID 虚拟交换机ID。Core规格 Core规格。core节点数量 默认...

什么是全球加速

全球加速 GA(Global Accelerator)是一款覆盖全球的网络加速服务,依托阿里云优质BGP带宽和全球传输网络,实现全球网络就近接入,可以减少延迟、抖动、丢包等网络问题对服务质量的影响,为全球用户提供高可用和高性能的网络加速服务。...

源为PolarDB-X的功能规范和约束说明

在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则切流。切流后可能有5分钟...

源为PolarDB-X的功能规范和约束说明

在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则切流。切流后可能有5分钟...

通过物理专线实现本地IDC与云上VPC互通

您可以通过物理专线将本地IDC(Internet Data Center)连接到阿里云,使云上专有网络VPC(Virtual Private Cloud)和本地IDC的网络互通。场景示例 本文以下图为例,某企业在杭州拥有一个IDC机房,并且该企业在阿里云华东1(杭州)地域部署...

安全托管服务

服务类型 描述 接入配置 根据需求,协助您整理网络架构、VPC和路由信息,收集策略配置需求。协助您配置入侵防御和漏洞虚拟补丁。产品适配和访问测试验证。协助您优化云防火墙 上精准访问控制策略。通过云防火墙进行防护的业务 变化时,调整...

ADP底座/本地运维控制台

新增监控大盘,暴露了计算、存储、网络等关键信息,便于运维排错;(监控配置当前放在Trident-addon库中);新增报告功能,可以获取节点硬件信息并生成报告;新增根据实际环境判断是否安装组件rpm包的功能,可灵活配置以支持多种IaaS场景;...

设计原则

面向失败的架构设计原则 众所周知,系统异常事件是不可避免的,如网络延迟、硬件故障、软件错误、突峰流量等,建议在系统设计阶段就要从这些异常事件引起的系统执行“失败”出发,提供冗余、隔离、降级、弹性等能力,旨在确保系统的高可用...

故障演练

故障演练是整体容灾流程中极其重要的一环。本文介绍ECS容灾中故障演练的操作流程。故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被容灾保护的...

故障演练

故障演练是整体容灾流程中极其重要的一环。本文介绍ECS容灾中故障演练的操作流程。故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被容灾保护的...

弹性加速计算实例EAIS安全性说明

弹性加速计算实例EAIS的云上安全性,是阿里云在面对当前的网络安全形势和挑战时所采取的措施,以及提高用户在资源和网络访问控制、EAIS资源操作、故障隔离和风险检测等方面的安全性所具备的能力。说明 通过在ECS实例(非GPU实例)上绑定...

功能特性

查看同域流量分析 网络监测与诊断 帮助用户在云上运维阶段更高效地监测网络业务变化和故障诊断排查。功能集 功能 功能描述 参考文档 事件中心 问题事件 展示已经造成业务受损,并且7天内状态一直处于进行中的异常事件列表。查看问题事件 ...

VPC授权连通性测试

VPC授权连通性测试用于验证API网关实例到您授权的VPC中实例的网络连通性,有助于将API调试阶段由于网络连通问题引发的调用失败提前暴露。本文将重点介绍VPC授权连通性测试功能,以及如何根据排错引导解决连通性测试失败的情况。1.概述 VPC...

移动性能监控简介

应用场景 网络性能问题定位 通过网络全链路数据监控,及时发现网络问题,定位故障链路问题节点,辅助用户进行网络诊断。页面性能问题定位 通过对页面加载时长指标进行监控,发现慢加载页面,从而定位问题页面,帮助技术人员进行问题排查。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
负载均衡 共享流量包 高速通道 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用