业务背景 GxP欧盟附录11(GxP EU Annex 11)是欧盟对于计算机化系统使用的规范性要求,主要针对在制药、生物技术和医疗器械领域中使用计算机化系统的企业和组织。他要求涵盖了计算机化系统的开发、验证、操作、维护和监测等方面,以确保...
相关设备故障:包括UPS失效引起的电力中断。自然灾害,包括洪水、火灾、地震。这里以阿里集团为例。为降低故障的影响,阿里集团故障管理体系从整体体系化治理的角度出发,将影响真实业务的场景定义、发现和应急能力以及后续治理都纳入故障...
例如:将已定义的属性 电压 作为出参,则设备上报该故障事件时,将携带当前设备的电压值,用于进一步判断故障原因。当接入网关协议为OPC UA时,需设置参数索引,用于标记参数的顺序。说明 不能用以下系统保留参数作为输出参数的标识符:set...
针对实例启动过程中因操作系统内配置异常、异常关机等问题导致操作系统无法正常启动的情况,您可以通过VNC登录实例发现的启动异常或者实例健康诊断工具返回的异常字段,在本文查看此类问题的解决方案。Windows 1662001135:Windows系统因...
3 选择容灾方案 云原生内存数据库Tair 实例若因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制保障数据的一致性和业务可用性。云原生内存数据库Tair 提供多种灾备方案供您选择,可满足不同的业务场景。4 预估内存规格 提前...
选择容灾方案 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。选择大版本 推荐使用更新的大版本...
例如:将已定义的属性 电压 作为出参,则设备上报该故障事件时,将携带当前设备的电压值,用于进一步判断故障原因。当接入网关协议为OPC UA时,需设置参数索引,用于标记参数的顺序。说明 不能用以下系统保留参数作为输出参数的标识符:set...
journalctl-u kubelet 集群常见问题 下表罗列了一部分ACK集群常见的故障原因以及处理方法。故障场景 处理方法 API Server组件停止或Master组件停止:不能创建、停止、更新Pod、Service、Deployment等资源。已有的Pod和Service仍然能够正常...
说明 由于设备端存在的差异化,即使固件验证升级成功,也无法完全体现设备升级后各项功能是否正常可用,建议您在设备固件升级后自行检查设备是否正常使用,避免批量升级后引起大批量的设备故障。选择要进行批量升级的固件,单击 操作 中的 ...
如果您在Alibaba Cloud Linux 3系统中启用了共享内存通信SMC(Shared Memory Communication),且使用过程中遇到无法正常通信、部分端口不可用、对比TCP没有应用性能提升等问题,可以参考本文提供的方案进行排查并解决。启用SMC后应用性能...
通过日志记录的消息内容、业务类型、操作类型和状态码等信息,可以了解设备状态、通信情况,并定位操作失败的原因,帮助您监控和管理设备,进行故障排查。本文介绍如何查看云端运行日志,以及相关错误码和排错方法。日志业务类型说明 上行...
Windows挂载SMB协议文件系统失败自动检查脚本 交叉挂载失败排查思路 Linux挂载SMB协议文件系统失败排查思路 Windows系统挂载NFS协议的通用型NAS文件系统失败排查思路 常见挂载报错FAQ 如何解决子目录不存在报错?如何解决ECS实例重命名报错...
内容如下:阿里云专家结合丰富的云上实战经验和最佳实践,从全链路维度分析客户反馈的所需分析诊断的问题点或故障,排查确定问题的根本原因,提供针对性的解决方案并指导客户实施。包括如下场景及场景间的组合(每个专家诊断与调优的具体...
目前仅支持Linux操作系统挂载NFS文件系统,Windows操作系统挂载SMB文件系统、Windows操作系统挂载NFS文件系统及Linux操作系统挂载SMB文件系统场景,请您登录ECS实例执行命令挂载。更多信息,请参见 Windows系统挂载SMB文件系统、Windows...
数据库问题专家诊断与调优 阿里云数据库专家结合丰富的云上实战经验和最佳实践,结合各项数据库指标,以及前后端的日志及各项应用指标,分析客户反馈的数据库所需分析诊断的问题点或故障,排查确定数据库问题的根本原因,提供针对性的解决...
所选配的设备名,在Linux操作系统下与磁盘设备号对应,在Windows操作系统下与磁盘管理器中的磁盘顺序一致。什么是独立云盘?独立云盘,即单独购买的按量付费数据盘,而不是随实例创建的数据盘。它可以在同一个可用区内的不同ECS实例之间...
30人 基于ITSM/ITIL的阿里云运维最佳实践工作坊 8 数字化时代业务形态越来越复杂,IT技术已经是业务发展的主要驱动力,面对复杂不确定的业务形态,如何让运维体系保障业务的安全、稳定和灵活性?阿里云集合传统IT运维理论并通过大规模商业...
主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...
赔偿范围不包括以下原因所导致的服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序受到黑客攻击...
赔偿范围不包括以下原因所导致的请求失败或服务不可用:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序受到...
2 服务可用性 2.1 服务可用性计算公式 服务可用性以单个工业大脑产品为维度,按照如下方式计算:服务可用性=((服务周期总分钟数-服务不可用时段次数*5)/服务周期总分钟数)×100%2.2 服务可用性承诺 工业大脑产品服务可用性不低于99.9%,...
(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的...
(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的...
(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的...
2.3 除外情形 因 下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)任何...
(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄露所引起的;(5)客户的疏忽或由客户授权的操作所引起的...
2.3 除外情形 因 下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)用户...
背景信息 当站点因为不可抗力因素或者设备故障导致应用在短时间内无法恢复时,LHC 可提供多集群联邦发布容灾保护。当站点故障时,通过简单的配置,即可在容灾站点迅速恢复业务。容灾是一个范畴比较广泛的概念。广义上,容灾是一个系统工程...
Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...
服务赔偿条款 2.13.1 赔偿范围:因阿里云设备故障、设计缺陷或操作不当导致用户所购买的归档存储服务无法正常使用,阿里云将对不可用时间进行赔偿,但不包括以下原因所导致的服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起...
云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...
(3)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(4)客户的应用程序受到黑客攻击而引起的;(5)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(6)客户的疏忽或由客户授权的操作所引起的;(7)...
网络闪断故障可能由多种原因引起,如网络设备故障、电力波动、通信线路故障等。网络闪断会导致数据传输中断,影响系统和应用程序之间的数据传输,频繁的网络闪断可能导致系统或应用程序无法正常运行。常使用的容错策略如下:设备冗余:使用...
服务可用性不包括以下原因导致的不可用时间:运营商核心网异常、阿里云预先通知用户后进行的系统维护、任何阿里云以外的网络和设备异常、客户原因引起的异常等。边缘节点存在割接情况,一般割接频率不高于1次/月/节点,每次持续时间不多于6...
基于稳定性支柱设计原则,整体稳定性设计方案可参考如下:架构设计原则 软件系统从所有的功能都在一个应用程序内运行的单体应用架构,到不同的功能模块分别部署在不同的服务器上的传统分布式应用架构,再到服务细分通过轻量级的通信机制...
对于有效请求率低于100%的情况,您需要根据自己的使用情况进行分析,可以通过请求分布统计或者请求状态详情确定错误请求的具体类型、原因,并排除故障。对于某些业务场景,出现有效请求率低于100%是符合预期的。例如,用户需要先检查访问的...
提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样会浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...
2.3 除外情形 赔偿范围不包括以下原因所导致的服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级、运维变更和模拟故障演练;(2)由于源端数据库或目标端数据库自身原因导致的;(3)由于源端数据库...
同时,无法有效排除环境因素的干扰,例如一天不同的时段发电量不同,也受天气影响巨大,按照该检测方法无法动态适应各个变化的情况,为运维工作增加了不确定性,并带来运维负担。解决方案 物联网平台的数据服务提供数据智能功能,可以基于...
此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...