监控分析平台对比

Kafka消费设置:使用Logstash消费Kafka数据再写入到ES,需要Kafka topic的partition数和logconsumer_threads匹配,否则容易导致各partition消费不均。ES参数调优:对写入吞吐、可见性延时、数据安全性以及查询性能等多方面因素进行综合...

附录:SOFAStack 产品目录

应用场景 支付与转账 金融行业常见的支付、转账、账务等业务场景对于吞吐量有很高的要求。SOFAStack 分布式事务在各类大促中的优异表现证明了性能不会成为瓶颈。财富理财 这类场景中往往涉及的金额较大,所以对于产品的稳定性要求非常高。...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括Pod诊断、Service诊断、Ingress诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACS集群中使用集群诊断功能。前提条件 已创建ACS集群。具体操作,请参见 创建ACS集群。确保ACS集群运行...

产品优势

服务部署后,计算巢提供阿里云自助服务和全链路检测能力,实现一排查、智能故障检测,提升业务稳定性。计算巢为用户提供了丰富的软件选择,覆盖常见的软件类型,包括:数据库等基础软件,CRM等应用软件,以及制造、医疗等行业软件。已经...

集群管理FAQ

当Kubernetes集群出现问题或者节点异常时,您可通过容器服务ACK提供的一键故障诊断功能,辅助您定位集群中出现的问题,详情请参见 使用集群诊断。如果集群诊断功能无法满足需求,您需要分别在Master节点和异常的Worker节点上收集Kubernetes...

表设计

类似MachineIp这种分区是很常见的一种分区方式,即把某个业务上比较分散的Key放到第一列,例如UserId,DeviceId、OrderId等等。这种模式只要这个Key本身比较分散,一般无太大问题。说明 有一种局部热点情况,假设10.10.0.0/16这个网段的...

常见问题FAQ

云投屏产品FAQ问题 M21播放盒子常见问题 Q:遥控器无法控制屏幕 A:请尝试将遥控器与屏幕重新配对。操作步骤如下:拔掉盒子的电源,然后重新插上,盒子开机。在盒子开机后10分钟内,同时按住遥控器的“OK”(中间大圆圈按键)和“返回...

监控、诊断和故障排除

对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

端云互联最佳实践

端云互联适配Windows、Mac和Linux系统,支持Dubbo、SpringCloud和HSF等微服务框架,对于同类产品可用性较高。安全性:本地通道服务跟云端代理间基于SSH加密通道进行通信,无需担心通信数据窃取。使用场景 在云原生时代,开发测试环境部署...

应用场景

产品优势 针对上述痛点,无影云应用 具备以下优势:应用快速部署分发:企业可以将本地应⽤⼀部署上云,实现应用新版本一更新,显著缩短新业务上线时间。兼容各类认证方式:可对接企业现有AD账号体系,也可通过SAML集成现有认证体系。...

应用场景

产品优势 针对上述痛点,无影云应用 具备以下优势:应用快速部署分发:企业可以将本地应⽤⼀部署上云,实现应用新版本一更新,显著缩短新业务上线时间。兼容各类认证方式:可对接企业现有AD账号体系,也可通过SAML集成现有认证体系。...

AIOps 解决方案专家服务内容说明

智能运维又称AIOps,即人工智能与运维结合,可通过机器学习的防范来提升运维效率。它提供:时序指标异常诊断、根因分析、资源编排、故障自愈等能力。常见的AIOps应用路径为:对监控的各种关键性能指标(KPI)行实时异常检测;对多维指标...

组件画布操作

本文档介绍组件在画布编辑器中的操作方法,包括组件拖拽、组件缩放、组件旋转、操作快捷等基础功能和批量配置、轮播容器等高级功能,帮助您更加方便快捷地在数据看板中对组件进行操作。基础功能 操作 描述 拖拽 在左侧 组件库 中选中一个...

OSS文件上传和下载失败的排查方法

对于其他的上传方式,分片上传适用于以下场景:恶劣的网络环境:如手机端,当出现上传失败的时候,可以对失败的Part进行独立的重试,而不需要重新上传其他的Part。断点续传:中途暂停之后,可以从上次上传完成的Part的位置继续上传。加速...

常见问题

本文介绍 PolarDB PostgreSQL版(兼容Oracle)的常见问题和解答。基本问题 Q:什么是 PolarDB?A:PolarDB 是一个关系型数据库云服务,目前已在全球十多个地域(Region)的数据中心部署,向用户提供开箱即用的在线数据库服务。PolarDB 目前...

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

EDAS直播公告

EDAS解决了您自主诊断时遇到的痛点,EDAS提供了自动化诊断功能,可以帮助您一完成故障发现、诊断和治理。EDAS监管一体化的架构升级,监控方面整合了Prometheus监控、SLS日志和ARMS应用监控,管控方面整合了微服务、AHAS限流降级的能力...

流水单据型业务场景多活实践

说明 基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复后判断业务的实际恢复情况。演练预期如下:下单链路对订单应用是强依赖,强依赖故障会影响业务不可用。故障爆炸半径控制在...

执行演练

在执行故障演练过程中,您可以实时查看演练进度、每个演练活动的运行状态及结果,同时也能够随时结束演练,进行恢复阶段的活动,清除故障演练影响。背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止...

应用故障自动诊断

常见故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...

虚拟机场景

本文列出了虚拟机常见故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

什么是事件

支持将影响恶化的事件一升级为故障,实现事件全生命周期的在线化管理。核心功能 流转灵活、事件分级处理、全生命周期动态记录。流转灵活:触发的事件支持处理人灵活的响应、转交、升级故障并完结处理故障;事件分级:事件支持根据其影响...

多元索引最佳实践

使用路由常见问题如下:一般情况下,推荐路由的值要尽量多样,同一个路由下的总数据量不要太多(例如不要超过1亿行)。如果一个路由下的数据太多,则建议将多个不变的字段拼接为路由。如果用户设置UserId为路由,但是遇到了...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

GTM实现跨网访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

故障排查与常见问题

控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...

本地IDC通过负载冗余专线连接上云

标签 标签:标签的标签,支持选择已有标签或输入新的标签。标签最多支持64个字符,不能以 aliyun 或 acs:开头,也不能包含 http:// 或 https:// 。标签值:标签的标签值,支持选择已有标签值或输入新的标签值。标签值最多支持128...

本地IDC通过主备冗余专线连接上云

标签 标签:标签的标签,支持选择已有标签或输入新的标签。标签最多支持64个字符,不能以 aliyun 或 acs:开头,也不能包含 http:// 或 https:// 。标签值:标签的标签值,支持选择已有标签值或输入新的标签值。标签值最多支持128...

一键诊断

在数据库出现故障时,您可以利用一诊断功能,快速诊断选定时间段内数据库性能情况,直观地查看数据库性能情况的全貌,快速定位异常原因。前提条件 实例为如下版本:RDS MySQL 8.0 高可用系列或集群系列 RDS MySQL 5.7 高可用系列或集群...

耗资源用户处理流程

为了保证您的站点能够安全、...关于网站耗资源的原因以及排查方法,更多信息,请参见 网站耗资源(客户程序故障常见问题。增强版共享虚拟主机和独享虚拟主机可以更好地应对耗资源问题,避免站点被关停。更多信息,请参见 云虚拟主机官网。

故障止损恢复

建议在故障应急协同群中推荐输出常见的快速恢复能力,并提供PC、手机端的一快速执行能力,减少研发在各自平台上查找快恢入口的时间,也解决研发在外无电脑应急的尴尬局面。快恢能力主要包含人工梳理快恢预案、通用垂直专项快恢能力:人工...

监控任务性能

诊断 功能已从 性能监控 页面至 任务管理 页面。您可以在 任务管理 页面单击目标模块,然后在页面下方 一诊断 区域的 健康度详情 页签,单击 一诊断 按钮。实例启动后,如何调整全量或增量任务的速率?调整方法,请参见 调整迁移...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤七:故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 数字证书管理服务(原SSL证书) 负载均衡 云防火墙 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用