功能特性

设备诊断 针对设备运行数据提供的一系列运维场景智能服务,帮助您分析判断设备故障、探测设备潜在风险并及时预知业务异常。查看运维大盘 展示设备的地区热力图分布,方便您直观、快速地了解所有设备的状态。在线调试 直接从物联网平台控制...

什么是物模型

事件(Event)设备运行时,主动上报给云端的信息,一般包含需要被外部感知和处理的信息、告警和故障。事件中可包含多个输出参数。例如,某项任务完成后的通知信息;设备发生故障时的温度、时间信息;设备告警时的运行状态等。事件可以被...

查看运行分析

对于开源Flink实时计算引擎的实时实例,可在Dataphin中查看运行分析。运行分析不仅可以支持对实时实例信息进行分析、刷新等操作,也可以展示失败次数、反压情况、各Sink的数据输出、Checkpoint失败次数等信息。运行分析入口 在Dataphin首页...

ADP底座介绍

ADP底座包含了两个部分:ADP容器底座:整个应用运行时的公共底座,是一个K8s为基础的容器云平台,他是应用自有组件和中间件的部署、运维的基础设施,为上层业务应用的运行和管理维护提供必要的系统支持。ADP-Local:跟随软件产品交付部署到...

名词解释

RPO Recovery Point Object,即数据恢复点目标,以时间为单位,即在灾难发生系统和数据必须恢复的时间点要求。RPO标志系统能够容忍的最大数据丢失量。系统容忍丢失的数据量越小,RPO的值越小。RTO Recovery Time Object,即恢复时间...

基本概念

属性 设备的功能模型之一,一般用于描述设备运行时的状态,如环境监测设备所读取的当前环境温度等。属性支持GET和SET请求方式。应用系统可发起对属性的读取和设置请求。服务 设备的功能模型之一,设备可被外部调用的能力或方法,可设置输入...

系统故障排查

概述 本文主要介绍使用阿里云服务器ECS系统故障排查,包含CPU、磁盘I/O、内存、硬盘、带宽资源占用异常的问题排查与定位。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,...

网络架构容灾

如果为了满足业务对延迟等需求,必须选择相同接入点,也必须保证两条专线在两个不同的接入设备上,这样即使有一台设备故障导致其中一条线路异常,也可以保证另外一条线路正常运转。专线/VPN主备:在物理专线、IPSec-VPN连接、BGP动态路由...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

采集客户端数据的高可用方案

因此对于单硬件设备故障风险,日志服务天然具备了可用性特征。但是在一些相对极端的场景下,单集群可能由于一些预期外原因存在故障停服风险。针对该单集群故障风险,日志服务提供两种异地多活的客户端数据采集方案。方案比较 对比项 方案1...

运行时介绍

名称 标识符 操作系统 架构 Custom Runtime(Debian10)custom.debian10 Debian 10 x86_64 Custom Runtime custom Debian 9 x86_64 运行时终止策略 随着运行时的版本迭代,函数计算 会停止对部分运行时的维护,不再继续提供对该运行时的...

运行时介绍

名称 标识符 操作系统 架构 Custom Runtime(Debian10)(公测中)custom.debian10 Debian 10 x86_64 Custom Runtime custom Debian 9 x86_64 运行时终止策略 随着运行时的版本迭代,函数计算 会停止对部分运行时的维护,不再继续提供对该...

查看并管理待提交实例

实例生成失败:因系统故障原因,导致无法正常生成补数据实例。对于生成失败的待提交实例,您可以进行重跑操作。具体操作,请参见 重跑待提交实例。已暂停:暂停后将不会生成可以运行的补数据实例,不影响已生成的补数据实例。若您需要对...

查看并管理待生成实例

实例生成失败:因系统故障原因,导致无法正常生成补数据实例。对于生成失败的待生成实例,您可以进行重跑操作。具体操作,请参见 重跑待生成实例。已暂停:暂停后将不会生成可以运行的补数据实例,不影响已生成的补数据实例。若您需要对...

设备分发

以下设备数据不会分发:运行时数据:即设备状态、物模型数据、设备影子、文件、日志等设备运行时产生的数据。分发后,设备状态将变为未激活,设备成功重新连接物联网平台后,即被激活,可正常上下线。其他已产生的运行时数据将保留在源地域...

出错提示S9磁盘分区头数据同步出错

其中S9_*可能的错误码如下:S9_F4 S9_F40 问题原因系统SMC客户端进行磁盘分区头块级别的数据同步出错,可能原因有:S9_F4:源系统磁盘分区块数据网络同步中断。S9_F40:源系统到目标实例的IP:8703端口网络连接不通。解决方案 不同的...

测试指标

集群 对于使用集群方式的系统,主要通过以下方式考量其集群可靠性:集群中某个节点出现故障时系统是否有业务中断情况出现。在集群中新增一个节点时,是否需要重启系统。当故障节点恢复后,加入集群,是否需要重启系统。当故障节点恢复后...

基本概念

属性 设备的功能模型之一,一般用于描述设备运行时的状态,如环境监测设备所读取的当前环境温度等。属性支持GET和SET请求方式。应用系统可发起对属性的读取和设置请求。期望属性值 通过期望属性值功能,设置您希望的设备属性值。若设备在线...

节点异常问题排查

Kubelet异常处理 问题原因 通常是Kubelet进程异常、运行时异常、Kubelet配置有误等原因导致。问题现象 Kubelet状态为 inactive。解决方案 执行如下命令重启Kubelet。重启Kubelet不会影响运行中的容器。systemctl restart kubelet Kubelet...

节点异常问题排查

Kubelet异常处理 问题原因 通常是Kubelet进程异常、运行时异常、Kubelet配置有误等原因导致。问题现象 Kubelet状态为 inactive。解决方案 执行如下命令重启Kubelet。重启Kubelet不会影响运行中的容器。systemctl restart kubelet Kubelet...

网站耗资源(客户程序故障)常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

出错提示“Problems with parsing data in/etc/fstab...

本文主要介绍在Linux操作系统迁移,迁移任务出错提示“Problems with parsing data in/etc/fstab”信息的问题描述、问题原因及其解决方案。问题描述 在使用SMC操作系统迁移,迁移任务出错提示“Problems with parsing data in/etc/...

围绕混沌工程的平台实践

原则3在生产环境中运行实验 混沌工程推荐故障演练是在生产环境中进行,主要的原因有以下两点:系统的行为会根据环境和流量模式的变化,例如系统依赖的组件在测试环境和生产环境会有比较大的差异。系统的监控和人员的应急响应在测试环境和...

主从实例读写分离部署(共享存储)

当主实例写入系统会自动将主实例的数据同步给从实例,因此从实例的在不使用的情况下,CPU和内存也有一定的开销(约为主实例的 1/8),同时也建议主从实例的规格配置差异不要太过明显。更多技术原理请参见 高可用技术揭秘。使用说明 ...

耗资源用户处理流程

当您的站点出现因过度消耗资源导致运行速度下降或严重影响服务器性能系统会根据影响程度采取不同的处理方式以保证网站正常运行。耗资源即程序异常占用过多CPU及内存,导致资源浪费。例如您在使用云虚拟主机时,因为运行了编写不合理的...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

我是系统集成商

系统设置 业务实体设置 业务实体与地点是根据企业设备资产运营管理的需要,对企业管理资产的组织进一步逻辑划分,业务实体与地点下能保持相对独立的数据权限和业务流程。业务实体定义 进入 系统管理 和 业务实体访问,将列出所有系统中的...

流量回放和压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

智能压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

Windows 实例系统重启后显示系统恢复选项

问题现象 Windows 实例一直正常运行很多天,但是重启后无法进入操作系统,桌面显示“系统恢复选项”。使用之前备份的自动快照也无法正常恢复。问题分析 这种情况可能是实例进入了 Windows 恢复环境。Windows 操作系统在遇到异常、无法启动...

EMR Kafka磁盘故障运维

当出现磁盘故障,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

出错提示S6磁盘分区创建快照出错

其中S6_*可能的错误码如下:S6_8 S6_1 问题原因 块复制迁移过程中,SMC客户端会在源系统内部自动创建磁盘分区快照设备,用于数据同步。源系统SMC客户端进行磁盘分区创建快照出错,可能原因如下:Windows:磁盘分区空间不足。系统安装有...

使用集群诊断

配置故障诊断 重要 使用故障诊断功能系统将在您的集群上执行数据采集程序并收集检查结果。采集的信息包括系统版本、负载、容器组件等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。配置Pod诊断和...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

出错提示S3磁盘分区数据同步出错

本文主要介绍在使用SMC迁移,迁移任务出错提示“S3磁盘分区数据同步出错”的问题描述、问题原因及其解决方案。问题描述 在SMC迁移,迁移任务出错提示“S3_*磁盘分区数据同步出错”。其中S3_*可能的错误码如下:S3_F30 S3_F32 S3_F6 S3_...

Windows系统的ECS实例ping外网地址提示“一般故障”...

本文介绍Windows系统的ECS实例ping外网地址提示“一般故障”的错误原因和解决方案。问题现象 Windows系统的ECS实例ping外网地址提示“一般故障”错误。问题原因 出现该问题可能有以下原因:可能原因 排查方案 ECS实例中安装了第三方杀毒...

监控、诊断和故障排除

总请求数和有效请求数 该指标从总访问量角度来反应系统运行状态,当有效请求数不等于总请求数表明某些请求失败。您可以关注总请求数或者有效请求数的波动状况,特别是突然上升或者下降的情况,需要进行跟进调查,可以通过设置报警规则...

如何正确配置Linux实例/etc/fstab文件中的块设备

当您的Linux实例/etc/fstab 文件中未正确配置要自动挂载的文件系统信息或者存在已不可用的文件系统信息,重启系统后可能导致ECS实例的操作系统无法正常启动。您可以通过实例健康诊断工具进行问题修复。前提条件 Linux实例已通过实例健康...

添加摄像头

单击离线诊断后,系统为您进行故障诊断,您可以根据诊断结果,处理设备离线问题。运维告警 单击运维告警,系统跳转到该设备的运维告警页面,您可以查看运维告警信息。更多信息,请参见 运维告警。系统事件 单击系统事件,系统跳转到该设备...

使用集群诊断

配置故障诊断 重要 使用故障诊断功能系统将在您的集群节点上执行数据采集程序并收集检查结果。采集的信息包括系统版本、负载、Docker、kubelet等运行状态以及系统日志中的关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 物联网无线连接服务 云安全中心 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用