故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

PAI灵骏智算服务概述

网络支持常见的Fat-Tree网络拓扑,支持TCP/IP和RDMA等多种通信协议。其中,PAI灵骏 25G网络和100G网络独立组网;25G网络用于服务器带内管理,100G网络的多个网卡用于AI训练业务的高效通信。为提升 PAI灵骏 网络可用性,PAI灵骏 支持双上...

演练场景说明

网络类场景 网络故障场景包含网络延迟、网络丢包和篡改域名解析。网络故障是系统运行过程中时常遇到的问题,所以需要提升系统在网络异常情况下的容错能力。Java 场景名称 特性 虚拟机场景 故障演练支持的虚拟机场景。代码逻辑场景 故障演练...

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

蓝牙设备端开发

设备端Breeze SDK Breeze协议规定了接入阿里云IoT生活物联网平台的BLE设备与移动端App之间的通信协议,为了方便用户实现更快速的接入,生活物联网设备端SDK提供了Breeze协议的代码实现:Breeze SDK,其结构框图如下所示。HAL层:Breeze SDK...

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

编辑自定义功能

例如:将已定义的属性 电压 作为出参,则设备上报该故障事件时,将携带当前设备的电压值,用于进一步判断故障原因。当接入网关协议为OPC UA时,需设置参数索引,用于标记参数的顺序。说明 不能用以下系统保留参数作为输出参数的标识符:set...

网络规划

同一地域不同可用区之间的网络通信延迟很小,但也需要经过业务系统的适配和验证。由于系统调用复杂、跨可用区调用等原因可能会增加系统的网络延迟。建议您对系统进行优化及适配,以满足您对高可用和低延迟的实际需求。具体使用多少个交换机...

用户分析

通过对用户及其设备的历史网络指标进行分析,分别从时间、探测协议网络类型和探测目的端(服务器端)等维度,对用户的网络状况进行画像,协助业务定位与用户网络质量分析。操作入口 一、网络质量分析器首页——探测结果明细——分析 通过...

用户分析

基于用户及其设备的历史网络指标,分别从时间、探测协议网络类型和探测目的端(服务器端)等维度对用户的网络状况进行画像,协助业务定位与用户网络质量分析。操作入口 您可以从以下页面查看用户分析图表。在 探测结果明细 页面,单击 ...

传输信道

网络代理可把指令请求进行转发。本地直连 通过IP端口直连。双方需先提前为对方开通IP白名单,IP地址信息在本地化部署时输入。暂不支持修改,如果需要修改请联系运维部署人员。中心调度 通过DataTrust云端节点进行中心调度。您需先登录 阿里...

调用方式

KMS实例API基于HTTP协议通信,并使用TLS协议保护通信安全。当您调用接口时,需要按照接口说明在请求数据中加入相应请求参数,通过HTTP POST请求发送至KMS,系统会返回响应数据。请求及返回数据都使用Protocol Buffers编码。Protocol ...

基本概念

设备 一般指IP网数通类网络通信设备,比如交换机、路由器、防火墙等,根据业务场景也可以涵盖无线网络AP/AC的管理和运维。电路(链路)根据管理域链路包括单端链路和双端链路,业务类型包括自有业务或者对接外部的如专线等。安全域 设备等...

单个添加物模型

例如:将已定义的属性 电压 作为出参,则设备上报该故障事件时,将携带当前设备的电压值,用于进一步判断故障原因。当接入网关协议为OPC UA时,需设置参数索引,用于标记参数的顺序。说明 不能用以下系统保留参数作为输出参数的标识符:set...

协议优化

QUIC在应用程序层面就能实现不同的拥塞控制算法,不需要操作系统和内核支持,这相比于传统的TCP协议,拥有了更好的改造灵活性,非常适合在TCP协议优化遇到瓶颈的业务。DCDN 支持IETF QUIC和GOOGLE QUIC。GOOGLE QUIC支持的版本号为Q39、Q43...

什么是QUIC协议

如果客户端和DCDN节点之间的链路使用QUIC协议,则可以保障数据传输的安全性,同时提升资源的访问效率。通过本文您可以了解什么是QUIC协议以及如何开通以和收费等问题。什么是QUIC QUIC(Quick UDP Internet Connections)是一种实验性传输...

故障处理流程

当智能接入网关设备发生网络故障后,您可以先观察现象、收集信息,然后对现象和信息进行分析诊断,尝试修复问题。本文为您介绍智能接入网关设备故障处理流程。SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下...

消息通信说明

MQTT云网关设备可通过自定义的消息Topic与物联网平台进行通信,物联网平台会透传设备的上下行通信数据。本文介绍设备实现上下行通信的相关说明。MQTT云网关产品和设备的详细内容,请参见 创建云网关产品(MQTT)和 创建云网关设备(MQTT)...

什么是QUIC协议

如果客户端和CDN节点之间的链路使用QUIC协议,则可以保障数据传输的安全性,同时提升资源的访问效率。通过本文您可以了解什么是QUIC协议以及如何开通以和收费等问题。什么是QUIC QUIC(Quick UDP Internet Connections)是一种实验性传输层...

堡垒机无法连接ECS排查步骤

网络通信异常,建议您检查网络ACL、安全组、云防火墙、以及服务器内的iptables或主机防火墙的相关策略是否阻拦【可能原因二】堡垒机的相关配置影响 包含资产管理的主机信息(基本信息、服务端口、主机账户),运维规则(基本信息、资产/...

创建域名

云原生网关提供多域名管理能力,便于您管理不同域名下的协议、证书及路由配置。同时也支持泛域名匹配,例如绑定了*.hello.com 这个泛域名之后,可以通过 1.hello.com 、2.hello.com 等域名同时访问。前提条件 完成相关域名的备案。说明 ...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

淘宝App在短视频场景下的IETF QUIC最佳实践

QUIC协议与TCP协议对比 既然QUIC协议设计初衷是解决传输层协议问题,与其竞对的就是TCP协议,那么从传输协议特性分析两种协议设计差异,可得出以下对比:QUIC为每个加密级别使用单独的包号空间,除了0-RTT和1-RTT密钥使用相同的包号空间,...

DCDN为淘宝App短视频场景加速的IETF QUIC最佳实践

QUIC协议与TCP协议对比 既然QUIC协议设计初衷是解决传输层协议问题,与其竞对的就是TCP协议,那么从传输协议特性分析两种协议设计差异,可得出以下对比:QUIC为每个加密级别使用单独的包号空间,除了0-RTT和1-RTT密钥使用相同的包号空间,...

网络最大传输单元MTU

理论上MTU越大,可在单个数据包中传递的数据越多,网络通信越高效。本文介绍巨型帧相关功能以及如何修改ECS实例网卡的MTU。巨型帧(Jumbo frames)巨型帧是指有效负载超过IEEE 802.3标准所限制的1500字节的以太网帧,增大的有效载荷百分比...

管理协议服务

本文介绍如何通过控制台管理CPFS协议服务,包括创建协议服务、修改协议服务、删除协议服务等操作。前提条件 已创建文件系统。更多信息,请参见 创建文件系统。如果使用Fileset导出目录,请确认已创建Fileset。更多信息,请参见 创建Fileset...

产品服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)任何数据资源平台以外原因引起的,比如:由数据资源平台所依赖的上下游软件产品故障或配置调整引起的;数据同步模块中由于源端数据库或目的端数据库自身原因导致的;...

关联域名

云原生网关提供多域名管理能力,便于您管理不同域名下的协议、证书及路由配置。同时也支持泛域名匹配,例如绑定了*.hello.com 这个泛域名之后,可以通过 1.hello.com 、2.hello.com 等域名同时访问。本文介绍如何为云原生网关关联域名。...

通信网络加速的审计事件

通信网络加速已与操作审计服务集成,您可以在操作审计中查询用户操作云通信网络加速产生的管控事件。操作审计支持将管控事件投递到日志服务SLS的LogStore或对象存储OSS的存储空间中,满足实时审计、问题回溯分析等需求。操作审计记录了...

CPFS2.0静态卷

VPC网络 协议集群使用的VPC网络,与CPFS文件系统使用的VPC网络相同,不可修改。交换机 选择协议集群使用的vSwitch网络,默认为CPFS文件系统使用的vSwitch,可配置为该VPC内的其他vSwitch。说明 单个协议服务最多消耗vSwitch上32个IP地址,...

服务等级说明

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

CPFS2.0静态卷

VPC网络 协议集群使用的VPC网络,与CPFS文件系统使用的VPC网络相同,不可修改。交换机 选择协议集群使用的vSwitch网络,默认为CPFS文件系统使用的vSwitch,可配置为该VPC内的其他vSwitch。说明 单个协议服务最多消耗vSwitch上32个IP地址,...

CPFS2.0静态卷

VPC网络 协议集群使用的VPC网络,与CPFS文件系统使用的VPC网络相同,不可修改。交换机 选择协议集群使用的vSwitch网络,默认为CPFS文件系统使用的vSwitch,可配置为该VPC内的其他vSwitch。说明 单个协议服务最多消耗vSwitch上32个IP地址,...

服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄露所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

HTTPS连接通信

数据内容的格式说明如下:消息通信Topic的数据格式说明,请参见 Topic分类和通信说明。设备定位Topic的数据格式说明,请参见 HTTP定位。返回结果示例:body:{"code":0,"message":"success","info":{"messageId":892687*47040 } } 表 5.错误...

泛化协议设备接入相关问题

由于网络故障原因导致的异常断开,SDK会自动发起重连。如何批量生成设备证书?您可以直接使用物联网平台提供的SDK来调用API BatchRegisterDevice,批量生成设备证书。更多信息,请参见 下载云端SDK 和 BatchRegisterDevice。如何获取子...

服务等级协议

服务可用性不低于99.95%,如【平台】因阿里云原因未达成前述可用性,客户可以根据本协议第3条约定申请补偿。2.3 除外情形 因 下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起的,包括...

应用场景

在线教育 提供高可用、高品质、高并发的实时音视频通信网络,轻松实现老师与学生、学生与学生之间的音视频连麦互动,提升课堂教学体验。支持课程音视频流实时推送至直播中心实现大规模直播分发,并支持服务端同步录制,对接OSS实现课程存档...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 高速通道 弹性公网IP 负载均衡 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用