趋势分析

通过延时、丢包率、探测次数三个指标在不同维度、不同汇聚粒度的表现来判断网络趋势,可以用来定位网络故障发生的时间点以及业务的网络质量趋势。首页点击 详情分析 按钮,进入“趋势分析”页面。筛选条件:说明 筛选条件“统计时间段”,...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

故障协同处理(基于钉钉)

时间线:展示故障的时间线记录,其中有7个节点必须完善详细内容,节点已用红星标注,包含:故障发生故障发现、故障通告、业务响应、初因定位、恢复执行和故障恢复。节点记录和PC端故障时间线保持一致。复盘 按钮:故障恢复后,需进行故障...

基本概念

故障管理 网络故障发现、分析、定位等维护管理,包括告警信息的收集入库、规则匹配、关联分析以及告警清除等一系列流式处理过程。Netconf netconf协议一般用于网络业务配置,使用结构化可描述语言实现快速的网络设备下发。gRPC 高性能、...

功能特性

资源统计 网络拓扑 专有网络拓扑 一键可视化呈现专有网络中网络资源在云间的连接关系与部署位置。查看专有网络拓扑 云企业网拓扑 一键可视化呈现云企业网构建起的全球资源在云间的连接关系。查看云企业网拓扑 负载均衡网络拓扑 一键可视化...

网络拓扑概述

网络拓扑图可以清晰地展示网络中资源的连接和关系,可视化网络结构,帮助您快速了解您的云上网络架构,进行网络配置验证、网络问题排查和云网络资源统一运维。背景信息 当前阿里云上网络资源类型丰富,功能形态各异,大量网络资源分散在...

使用专有网络拓扑

专有网络拓扑包括资源拓扑与路由拓扑,为您展示 专有网络 VPC(Virtual Private Cloud)下各类资源之间的关联关系与路由转发路径,并支持查看相关网络实例的基本信息,进行实例诊断,路径分析等操作。资源拓扑 资源拓扑通过拓扑组网,展示...

容器资产全景

容器资产全景功能从集群、容器、镜像、应用等资产维度为您提供安全可视化的管控能力和云上容器资产的网络拓扑,帮助您提升管理容器资产安全的效率。使用该功能您可以轻松掌控容器资产的安全状态,并了解容器资产间的网络连接情况。本文介绍...

故障演练

例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过将被演练的资源关闭,使资源处于人工构造的故障...

基本概念

熔断 熔断可以使应用程序具备应对来自故障、潜在峰值和其他未知网络因素影响的能力,避免网络和服务调用故障级联发生,系统整体性能下降或者崩溃。ASM支持在流量策略中配置熔断功能,在网络访问超出熔断配置时能够拒绝请求。更多信息,请...

使用负载均衡拓扑

负载均衡拓扑为您展示负载均衡中...实例诊断 在 负载均衡网络拓扑 页面,单击CLB实体,您可以在CLB工具栏中单击 实例诊断,网络拓扑将自动跳转至该CLB实例的 实例诊断详情 页面,支持查看具体的诊断信息。相关文档 CLB监听概述 后端服务器概述

什么是云拨测

故障排查与定位:云拨测快速发现并定位网络问题,提供详细的故障报告和解决建议,助力用户高效解决网络故障网络优化与调整:基于云拨测提供的网络性能数据,用户可以优化网络架构、调整服务部署,以提升网络性能和用户体验。服务质量报告...

代码逻辑场景

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

性能监控最佳实践

系统间依赖梳理:新业务上线,老业务裁撤,机房搬迁/架构升级,IT 系统间的依赖关系错综复杂,已经超出了人工梳理的能力范畴,基于全链路追踪的拓扑发现,使得上述场景决策更加敏捷、可信。自定义标记透传:全链路压测,用户级灰度,订单...

云资产全景

云资产全景为您提供云上资产全景、网络拓扑和安全态势的可视化界面。从安全评分、安全产品和云产品三个维度全面展示您资产的安全态势,帮助您统一管控云上资产,提升安全运营的效率。版本限制 仅云安全中心的企业版和旗舰版支持该功能,...

观测组网与流量

您可以在 网络智能服务 NIS(Network Intelligence Service)中通过网络拓扑和流量分析快速了解公司业务在云网络的组网形态及流量分布情况,帮助您优化资源分配,规划网络架构。使用场景 通过NIS观测全球组网拓扑,查看资源与路由转发关系...

历史功能发布记录(2023年之前)

全部 v1.14及以上 全部 使用服务发现范围配置提升控制平面推送效率 增强ASM网格拓扑功能。通过监控网络流量来推断服务拓扑和网格分析,帮助您了解 服务网格 的结构和运行状况。全部 v1.14及以上 全部 查看应用的网格拓扑 新增ASM安全策略...

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换...

附录:SOFAStack 产品目录

查看完整的应用调用拓扑关系:自动发现该服务之前的调用以及对所有中间件的调用,绘制整个系统的完整调用拓扑关系。快速定位不健康应用:在调用关系拓扑中,对不健康应用进行显示标识,便于快速发现有问题应用并进行分析。分析服务性能:...

可观测概述

可观测性在云原生应用中扮演着非常重要的角色,它可以帮助我们实时监控服务的运行情况和性能指标,发现并解决服务故障和瓶颈,从而提高应用的可靠性和性能。阿里云服务网格ASM提供了统一标准化方式,为您提供一种收敛后的可观测数据生成与...

功能特性

公网暴露 实时监控互通的VPC之间的流量情况,帮助您实时获取VPC网络流量数据,及时发现和排查异常流量。VPC互访 攻击防护 内置威胁检测引擎,支持配置攻击防护规则,实现更精准地识别和阻断入侵风险。实时展示入侵防御、漏洞防护、失陷感知...

使用云防火墙阻止安装非法工具

安装非法工具的危害 安装非法工具有可能导致以下问题:内部员工执行违规操作 企业内部员工下载并安装非法工具后,可通过该工具对企业的内部资产或外部资产进行绘制,将内部网络拓扑透露给外部人员或进行其他违规操作。黑客攻击 黑客入侵到...

实例的节点故障处理机制

当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 ...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入 https://<块网关IP地址>访问本地块网关控制台。输入用户名和密码,单击 确认。单击 关于,进入 关于系统 页面。找到 日志信息 区域,...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入 https://<文件网关IP地址>访问本地文件网关控制台。输入用户名和密码,单击 确认。单击 关于,进入 关于系统 页面。找到 日志信息 区域...

基本概念

边车 边车(Sidecar),Sidecar 是一个轻量级的网络代理,它们与应用程序部署在一起,对所有流入与流出的网络请求进行拦截,实现各种网络策略,例如服务发现与负载均衡、流量拆分、故障注入(fault injection)、熔断器以及分阶段发布等...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

历史功能发布记录(2022年)

管理服务网格 2022年05月 功能名称 功能描述 发布地域 相关文档 集群故障诊断时支持诊断ECS实例的健康状态 您在运行集群故障诊断时将同时运行ECS实例健康诊断,帮助您对ECS实例的系统状态、网络状态、磁盘状态等进行全方位诊断,及时发现并...

功能特性

申请跨境数据同步权限 什么是跨境 事件中心 事件通知 通过云监控平台的事件订阅对重要的事件设置定制化的报警通知,让您及时了解事件的发生与进展,帮助您实时掌握事件动态,便于您在业务故障时快速分析并定位问题。订阅事件通知 主动运维...

JVM注入动态脚本

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

使用云企业网拓扑

在左侧导航栏,选择 网络拓扑>云企业网拓扑。在 云企业网拓扑 页面,选择 云企业网ID,单击 生成拓扑,查看云企业网实例已经连接的网络实例。在 设置 区域,您可进行如下操作:选择 反色模式,调节实体图标的颜色。选择 展示实例ID,在实体...

EMR Kafka磁盘故障运维

当磁盘发生故障时,应及时完成相关故障的处理,及时恢复集群的容错能力。磁盘运维概述 本文从磁盘监控和磁盘故障恢复角度来介绍磁盘运维策略。磁盘监控 以下内容从Kafka服务层面以及ECS系统层面来简单了解一下磁盘的监控策略。Kafka服务...

DeviceWanLinkDown

DeviceWanLinkDown事件提示您设备WAN链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,分钟级的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障。

DDH上的ECS实例常见问题

本文介绍与DDH上的ECS实例相关的问题及解决方案。在DDH和共享宿主机上创建的ECS实例有什么区别?在DDH上创建ECS实例有什么限制...ddh-A和ddh-B的网络拓扑不一致时,二者会有明显差距,具体差距大小取决于ddh-A和ddh-B在网络拓扑维度上的距离。

业务迁移大盘

网络拓扑创建 当您不确认您的系统之间的互访时,您可以在网络拓扑页面中进行查看,并且在拓扑页进行资源的选中和取消。当您确认资源的选择后,您可以在拓扑页点击“全选”、“组成迁移组”,完成迁移组的创建。基于标签导入迁移组 您可以在...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

什么是阿里云应用监控 eBPF 版

通过网络拓扑展示特定容器之间或容器与特定云产品实例之间的网络性能,快速发现关联服务的性能问题。默认将HTTP返回码≥300、响应时间>500 ms的错慢请求明细进行存储,方便您查看具体错慢原因。告警配置 阿里云 应用监控 eBPF 版 提供开箱...

通用环境变量列表

DLC为TensorFlow训练配置的通用环境变量如下:环境变量名 描述 TF_CONFIG TensorFlow分布式网络拓扑信息,示例如下:{"cluster":{"worker":["dlc1y3madghd*-worker-0.t1612285282502324.svc:2222","dlc1y3madghd*-worker-1.t...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
共享流量包 弹性公网IP 高速通道 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用