产品服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)任何数据资源平台以外原因引起的,比如:由数据资源平台所依赖的上下游软件产品故障或配置调整引起的;数据同步模块中由于源端数据库或目的端数据库自身原因导致的;...

服务等级说明

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

SLA服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)用户的应用程序或数据信息受到黑客攻击而引起的;(4)用户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)用户的疏忽或由用户授权的操作所引起的...

服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄露所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

服务协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的;(6)...

本地盘实例运维场景和系统事件

更换盘可以保留除盘外其他本地盘的数据,对应的运维流程如下:您收到磁盘故障以及计划隔离盘的通知。您完成准备工作,包括修改/etc/fstab 配置文件、备份数据等。如果系统事件中包括隔离盘事件或对应操作,您响应通知,授权隔离...

EasyCkpt:AI大模型高性能状态保存恢复

功能介绍 针对频繁故障的情况,PAI通过之前的故障失败场景总结出以下GPU和深度学习场景故障的功能特点:特点1:任务的故障是部分的。通常,故障的根因是一到两台机器的故障,这只会影响部分Worker。对于大规模分布式训练任务而言,不会所有...

ECS系统事件汇总

SystemMaintenance.IsolateErrorDisk 因系统维护隔离盘 严重 Instance:SystemMaintenance.IsolateErrorDisk:Inquiring:因系统维护隔离盘问询中 Instance:SystemMaintenance.IsolateErrorDisk:Executing:因系统维护隔离盘执行中 ...

Windows系统的ECS实例ping外网地址提示“一般故障”...

本文介绍Windows系统的ECS实例ping外网地址提示“一般故障”的错误原因和解决方案。问题现象 Windows系统的ECS实例ping外网地址时提示“一般故障”错误。问题原因 出现该问题可能有以下原因:可能原因 排查方案 ECS实例中安装了第三方杀毒...

主备方案介绍

主备节点分别部署在同一地域下两个不同的可用区,当任一可用区因电力、网络等不可抗因素失去通信时,高可用HA系统将执行故障切换,确保整个节点的持续可用。您可以使用LTS数据通道服务完成主备节点之间实时增量数据双向同步,同时在LTS上...

回切至本地物理机

故障切换 面板,填写 CPU、内存 信息、选择 恢复网络、IP地址、是否 使用SSD、选择 恢复点、弹性公网IP、切换后执行脚本。注意 当前时间 恢复点只能使用一次。在弹出的 完成故障切换 对话框,单击 确定。本地恢复 注意 目前仅支持本地...

跨可用区批量克隆ECS实例

背景 可用区(Availability Zone,简称 AZ)是指在同一地域内,电力和网络互相独立的物理区域。例如,华北1(青岛)地域支持2个可用区,包括青岛可用区B和青岛可用区C。同一可用区内实例之间的网络延时更小,其用户访问速度更快。将应用...

NVMe协议介绍

在多重挂载场景下,多个不同客户端同时写入一个云盘可能导致数据被写,PR可用精确地控制某个云盘的读写权限,从而确保计算端按照预期写入数据,例如PR能力在故障切换场景能确保失效节点不再写入数据,从而保证新节点上线后写入数据的正确...

节点诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。基于专家经验和AI智能诊断两种诊断模式,节点诊断可以深入定位问题根因。节点诊断包括诊断检查项和诊断根因。诊断检查项:包括Node检查、...

Pod诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查...

本地盘最佳实践

建议选择 内网传输 的网络模式,并启用块复制,最大化提高迁移备份效率。建议开启 自动增量同步,定期使用SMC迁移生成备份镜像。SMC迁移时不会干涉原系统,不会修改原系统配置或文件,除了会占用一定的CPU/内存、带宽资源,其他不影响原...

RDS与自建数据库对比优势

备节点的故障发现时长为秒级,在99%的场景下,备节点从故障发生到节点恢复不超过10分钟。在好的架构下才能实现高可靠性。实现RPO=0的成本极高,需要单独购买研发服务。数据可靠性一般,取决于单块磁盘的损害概率。实现RPO=0的成本极高,...

产品优势

云盒内的ECS实例可通过专有网络冷迁移到公共云地域,公共云地域的ECS实例也可以冷迁移至云盒。安全性 提供多重安全方案,包括角色权限控制、内网隔离、防病毒攻击及流量监控等。支持操作审计,云盒所有的操作日志透明化。提供针对云盒网络...

售前常见问题

相比于自建防火墙,阿里云云防火墙有以下优势:托管服务:自建防火墙设备授权根据VPC数量增加,通过路由方式进行配置和设备同步,增加更多网络故障点的同时,带来了更复杂的安全控制与管理开销。云防火墙由阿里云托管提供,无需部署任何...

通过物理专线实现本地IDC与云上VPC互通

您可以通过物理专线将本地IDC(Internet Data Center)连接到阿里云,使云上专有网络VPC(Virtual Private Cloud)和本地IDC的网络互通。场景示例 本文以下图为例,某企业在杭州拥有一个IDC机房,并且该企业在阿里云华东1(杭州)地域部署...

弹性加速计算实例EAIS安全性说明

弹性加速计算实例EAIS的云上安全性,是阿里云在面对当前的网络安全形势和挑战时所采取的措施,以及提高用户在资源和网络访问控制、EAIS资源操作、故障隔离和风险检测等方面的安全性所具备的能力。说明 通过在ECS实例(非GPU实例)上绑定...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

应用场景

​ 高可靠:在宕机、网络故障等情况下,严格保证数据一致性。节约成本:节省运维成本,避免了分布式场景下产生的数据异常。节省开发成本,像使用单机事务一样使用分布式事务。推荐搭配 ECS 和 MQ 使用。通用分布式事务管理 提供通用的分布...

响应云盒维修事件

流程说明 运行中的ECS实例出现故障风险时,会向您发送ECS故障 事件(Reboot事件)通知,收到ECS故障事件通知后,您可以响应故障事件并按照建议进行处理,例如:将现有业务迁移到冗余资源保证业务正常运行,将出现故障风险的ECS实例作为备机...

智能卡简介

网络灾备 当前网络出现故障后,支持切换到备份网络,提升设备在线时长。降低成本 节省了事前勘测和故障后运维的人力以及相关成本。支持存量设备升级 设备本身无需硬件改造,安装相关SDK进行存量设备OTA升级后,即可支持智能卡。可选网络 ...

网络资源

网络资源是指用于节点之间通信和数据传输的硬件和软件资源,除了包括广域网、局域网、交换机、路由器,还包括常用到的专有网络、虚拟交换机、负载均衡、弹性公网、VPN、DNS、CDN等资源。在分布式系统中,网络资源的主要作用是支持节点之间...

常见重大封网时段公告

封网期间影响如下:封网期间禁止出入机房,只处理重启服务器和网络紧急故障,不再进行诸如路由策略,带宽流量调配,业务割接等涉及电路,数据调整等操作。封网期间机房不办理外部人员进出手续。说明 封网属于不可抗力或不可控因素,该时段...

常见网络问题

本文介绍 云备份 备份客户端的常见网络问题。背景信息 在非阿里云VPC的各类线下环境中安装备份客户端时,可能遇到各种未知且复杂的网络环境。例如防火墙会阻拦域名或端口的连接导致备份失败,防火墙会限制网络传输速度导致部分请求超时,...

MSE注册配置中心高可用最佳实践

处于同一个地域中不同可用区的应用相互之间网络延迟很小(3 ms以内),同时提供了故障隔离。多可用区实例将物理服务器部署在不同的可用区,当可用区A出现故障时,流量会在短时间内切换到另一个可用区B。整个过程您无需感知,应用代码无需...

概述

通过集群多副本等方式,应对自身节点故障。产品架构 产品架构如下:说明 图中 Session Cluster、Data Cluster、Meta Cluster 都是集群,表示 SessionServer、DataServer、MetaServer 可无限扩展。Client(客户端):提供应用接入服务注册...

使用ClassicLink

专有网络VPC(Virtual Private Cloud)提供ClassicLink功能,使经典网络的ECS实例可以和专有网络中的云资源通过内网互通。背景信息 ClassicLink可以实现经典网络的ECS实例访问已连接的VPC内的云资源,包括ECS实例、RDS实例、SLB实例等。VPC...

限制不同交换机下的ECS间的互通

本文为您介绍如何通过网络ACL功能限制不同交换机下ECS实例的互通。前提条件 您已经创建了专有网络和交换机。具体操作,请参见 创建和管理专有网络 和 创建和管理交换机。您已经在交换机中创建了ECS实例。具体操作,请参见 自定义购买实例。...

配置健康检查

警告 若您选择关闭本功能,请确保您有其他方式保证链路的冗余性,否则当物理专线链路故障后,会导致网络中断。描述 为健康检查添加描述信息。步骤二:在本地数据中心侧添加健康检查配置 您需要在本地数据中心侧添加健康检查相关配置,以...

围绕混沌工程的平台实践

本文主要介绍AHAS Chaos是如何围绕混沌工程来打造故障演练服务,您可以了解到混沌工程的基本知识和AHAS Chaos的优势。混沌工程和故障演练 首先您需要了解混沌工程和故障演练的关系。以下是混沌工程官方定义:混沌工程是在分布式系统上进行...

产品架构

基于目前主流的隧道技术,专有网络VPC(Virtual Private Cloud)隔离了虚拟网络。每个VPC都有一个独立的隧道号,一个隧道号对应一个虚拟化网络。虚拟化网络背景信息 随着云计算的不断发展,人们对虚拟化网络的要求越来越高,例如弹性...

容灾演练断网方式说明

可用区断网 当整个机房的外部网络出现中断后,外部请求无法进入故障机房,机房内业务同样无法访问外部网络,但机房内网络互通,形成一个局部环境。可用区断网正是为了模拟此类真实故障而提供的机房级故障模拟能力。可用区断网方式采用租户...

归档存储服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)用户的应用程序或数据信息受到黑客攻击而引起的;(4)用户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)用户自行升级操作系统所引起的;(6)...

自建VPN无法连通

解决方案 当前的网络故障现象如下。VPN隧道建立正常。在网关的安全组对所有地址放行后,其他ECS实例能连通线下服务器。在网关的安全组只放行线下服务器所属的192.168.1.0/24网段则其他ECS实例无法连通线下服务器。整理当前的网络架构如下。...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。“用户体验下降”说明故障的核心要关注用户感受,可通过客服...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
共享流量包 负载均衡 高速通道 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用