监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

响应云盒维修事件

当云盒中的硬件设备发生故障需要更换时,阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。本文为您介绍云盒维修相关的流程,以及如何响应云盒维修事件。背景信息 配置云盒计算资源时,您需要配置一定的...

ping不通云服务(SAG-100WM)

可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请参见...

故障管理

相关设备故障:包括UPS失效引起的电力中断。自然灾害,包括洪水、火灾、地震。这里以阿里集团为例。为降低故障的影响,阿里集团故障管理体系从整体体系化治理的角度出发,将影响真实业务的场景定义、发现和应急能力以及后续治理都纳入故障...

无法连接到同一个云连接网内的本地客户端

本文介绍SAG-1000设备无法连接到同一个云连接网内的本地客户端的原因和处理方法。问题现象 SAG-1000设备无法连接到同一个云连接网内的其他本地客户端。可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标PC环境的网络故障。...

ping不通云服务ECS(SAG-1000)

本文介绍SAG-1000设备无法ping通ECS实例的原因和处理方法。问题现象 终端无法连接到阿里云,例如ping不通同CEN的ECS。可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入...

流量回放和压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

智能压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

按步骤提交设备故障信息

本案例创建四个业务服务和一个Web应用,搭建一个设备故障上报的工单页面,引导使用Web应用的用户完成故障信息的提交。前提条件 已完成项目的创建(例如 project_space)。详细内容,请参见 项目。步骤一:使用云数据库创建数据库表 登录 云...

功能特性

设备诊断 针对设备运行数据提供的一系列运维场景智能服务,帮助您分析判断设备故障、探测设备潜在风险并及时预知业务异常。查看运维大盘 展示设备的地区热力图分布,方便您直观、快速地了解所有设备的状态。在线调试 直接从物联网平台控制...

ALIYUN:SAG:SmartAccessGateway

当主设备故障时自动切换到备设备。说明 当HardWareSpec取值为sag-vcpe时,仅支持指定warm_backup。Period Integer 是 否 智能接入网关实例的购买时长。取值:1~9、12、24、36。单位:月。MaxBandWidth Integer 是 否 智能接入网关实例的...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

地址标准化服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

设计方案

在软件系统架构演进中不变的是系统的基本属性,包含存储、计算和网络,变的是存储、计算和网络的实现方式和规模,往大规模、高性能、高可靠、易扩展等方向迭代演进,所以对架构稳定性提出了更高的要求。系统可预见的稳定性风险包含软硬件...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

开发Link Visual的功能介绍

若关闭则设备不开启所有报警事件上报,设备在状态变更及开机时主动上报 是 App和设备开发者需要关注并处理该物模型 AlarmNotifyPlan 属性 报警提醒计划 App设置和获取设备当前报警计划,定义设备何时开启报警提醒,设备在状态变更及开机时...

概述

PolarDB 的无感秒切技术故障探测、切换速度和切换体验三个方面对切换场景进行了优化,包括计划内的切换,如集群升降配和小版本升级,以及计划外的容灾切换。整合了多项技术,来解决用户的痛点问题:引入全新的高可用模块Voting Disk...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换机之间链路故障原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

共享内存通信(SMC)常见问题

解决方案1:执行 smcr d 命令,检查当前系统中是否有可用的 SMC-R(RDMA)设备,如果所需的RDMA设备为阿里云eRDMA设备,请确保该ERI设备已经在ECS控制台中添加并正确安装和配置ERI驱动。原因2:在多以太网卡环境中,连接所用的以太网卡不...

OTA固件升级

说明 由于设备端存在的差异化,即使固件验证升级成功,也无法完全体现设备升级后各项功能是否正常可用,建议您在设备固件升级后自行检查设备是否正常使用,避免批量升级后引起大批量的设备故障。选择要进行批量升级的固件,单击 操作 中的 ...

产品优势

本文介绍Link WAN网管核心与自建核心能力间的差异以及D2D通信技术。能力差异 能力 Link WAN(LoRaWAN)其他LoRa平台 LoRaWAN国际标准 遵循LoRaWAN国际标准协议。标准纷乱,彼此互不相通,系统维护成本高。技术 阿里云自主迭代,跟随联盟...

产品优势

视图计算产品采用云化架构,既能支持不同协议设备监控视频快速上云,在云上对监控视频集中安全存储,全网跨地域视频分发播放,又拥有强大可弹性扩容的计算能力支持对接不同算法平台实现按需视频智能计算。大规模并发,安全高效 云化高可靠...

操作系统迁移

操作系统因生命周期、第三方支持、开源计划演进原因将会停止技术支持,例如CentOS官方将停止维护CentOS 7/CentOS 8等Linux项目,Windows官方将停止维护Windows Server 2008/2012等Windows项目,这些进入到停止维护周期(EOL)的操作系统...

阿里邮箱产品服务条款

且遵守如下规则:2-3-1 客户保证对绑定企业邮箱的域名拥有合法的使用权,并保证在本服务过程中能合法持有和管理该域名,如因政策法规、任何第三方原因技术上的原因导致域名无法正常使用,将可能影响企业邮箱的正常服务,阿里云对此将不...

运维服务内容说明

因客户自身原因导致的问题故障,不属于阿里云运维服务范围。如客户有不定期现场服务需求,可按天购买运维专家现场服务。运维服务专家可帮助客户进行疑难问题现场处理,故障现场救援,变更现场保障、现场运维培训等服务。运维专家现场服务需...

产品架构

更进一步,技术碎片化导致技术架构割裂,不利于技术架构的演进和发展,最终导致技术架构无法跟进业务前进的步伐。举个简单的例子,当业务发展,需要支持跨可用区高可用、全球同步或者降低存储成本时,各技术组件都需要独立演进和发展,耗时...

主从实例读写分离部署(共享存储)

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移Shard职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker Node3),...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

应用场景

业务上,用户可以根据设备元数据来管理设备,例如查询某台设备的当前运转状态、多条件在线检索设备、圈选符合条件的设备集合等。通过分析设备元数据来实时监控设备的运转状态,出现异常及时响应,避免故障发生等。在工业生产过程中对数据...

用云成本需求分析

这不光是对于云厂商通过自身技术迭代增加算力减少成本的要求,同时也是对企业自身IT系统技术演进的要求。成本优化的目标,也可以是在保持存量业务不变的情况下,减少10%的云资源使用。这些成本管理和优化的目标需求需要被识别,并在计划...

RPC

服务网格(Service Mesh)是蚂蚁集团下一代架构的核心,在蚂蚁集团当前的体量下,将现有的 SOA 体系快速演进至 Service Mesh 架构,犹如给奔跑的火车换轮子。本文以 RPC 层面的设计和改造方案为中心,分享蚂蚁集团在双十一大促面临大流量...

SOFAMesh 服务网格总体经济影响报告

对于积累了大量技术资产的传统企业甚至是互联网企业而言,云原生平台的构建都是一个混合演进的发展过程。在应用架构、基础架构和部署架构等不同维度,异构环境均将以常态化的混合形态长期存在,而仅仅采用容器、Kubernetes(K8s)与微服务...

业产技融合分层协作方案

敏捷开发的简介及迭代排期的最佳实践_云效-阿里云帮助中心 建议:将产品需求拆分为多个技术任务,分配给不同的技术人员,共同完成产品需求的开发交付 由于技术团队的分工不断细化,很多技术团队都会出现设计师、前端开发、后端开发、测试等...

关键技术竞争力

生产运维智能化:技术风险体系保障业务连续性 TRaaS(Tech Riskdefend as a Service)技术风险防控平台,以蚂蚁内部 SRE 长期实践方法论和内部工具沉淀为依托,解决用户上云和分布式改造过程中所面临的可观测、故障应急、容灾、混沌工程、...

什么是多活容灾

多活容灾MSHA(Multi-Site High Availability)是在阿里巴巴电商业务环境演进出来的多活容灾商业化产品,是应用高可用服务AHAS的核心模块,为客户提供容灾架构建设能力。横向支持容灾架构的上线、运维、演练、切流,升级到下线。纵向支持...

什么是数据库自治服务DAS

管理成本高 随着云技术的普及,企业可以更为便捷的根据不同的业务类型,使用不同的数据库,或者将数据库部署在不同的环境中,多环境和多种数据库的管理的挑战也随之而来:精通多种数据库的专业DBA是稀缺人才,招聘难。管理部署在多种环境的...

技术架构

架构演进理念 当前,分布式领域有3大技术方向:Sharding技术,NewSQL原生分布式技术,云原生DB技术。每种分布式都有其独特的优势和特点。PolarDB-X 的架构继承了DRDS和X-DB技术的稳定性,结合了PolarDB的云原生技术,融入了NewSQL对于分布...

GxP欧盟附录11标准合规包

业务背景 GxP欧盟附录11(GxP EU Annex 11)是欧盟对于计算机化系统使用的规范性要求,主要针对在制药、生物技术和医疗器械领域中使用计算机化系统的企业和组织。他要求涵盖了计算机化系统的开发、验证、操作、维护和监测等方面,以确保...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 云服务器 ECS 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用