使用ACK AI助手进行故障排查和智能问答

若ACK AI助手无法定位问题的根因并提供可用的解决方案,您可以发起进一步发起诊断,对异常的Pod、Node节点发起基于ACK技术专家诊断经验的深度故障诊断功能。更多信息,请参见 使用集群诊断。前提条件 已开通 容器服务 Kubernetes 版 并已...

CreateWorkspace-创建工作空间

代码版本,支持 commitSHA、分支、标签 master filePath string 否 打开空间默认打开的文件相对路径 src/Test.java reuse boolean 否 工作空间复用标识,按照"用户+技术栈+代码地址+版本"进行复用 true-复用 false-不复用,每次均为新创建 ...

网络类场景

排除端口 无需注入网络延迟调用故障的端口,与本地服务端口和远程服务端口功能互斥。可以指定多个,使用逗号分隔,使用连接符表示范围。例如80,8000-8080。远端服务IP 指定演练对象访问的远端服务IP。可以通过子网掩码来指定一个网段的IP...

什么是云拨测

故障定位与诊断:云拨测利用先进的Traceroute诊断技术,快速发现并定位网络故障,提供详细的故障报告和解决建议。实时告警与通知:云拨测提供实时告警功能,当业务出现异常时,会主动发送告警通知,快速响应并处理问题。数据可视化:通过...

持续架构优化

对应用架构进行云原生化改造 云原生架构是基于云原生技术的一组架构原则和设计模式的集合,旨在将云应用中的非业务代码部分进行最大化的剥离,从而让云设施接管应用中原有的大量非功能特性(如弹性、韧性、安全、可观测性、灰度等),使...

AnalyticDB PostgreSQL版7.0版本

聚合函数复用 支持聚合函数复用,您对相同列使用可复用的聚合函数时,相同列仅进行一次聚合计算。索引 新增Hash、BRIN、Bloom索引,优化B-tree、GIN、Gist、Bitmap索引。内核功能 7.0版本兼容PostgreSQL大多数功能,大多数情况下您可以按照...

产品优势

蚂蚁技术风险管理体系方法论+平台工具完整落地 通过高可用管理平台工具,可以输出蚂蚁多年积累点的技术风险防控内容,并在此基础上助力用户建设符合用户实际情况的技术风险防控体系,提升用户整体技术风险防控水平。技术风险防控效率有效...

演练方案

故障演练模块支持创建、编辑、发布、复用、删除、导出演练方案,以及查看演练记录,下面逐一进行操作说明。创建演练方案 在左侧导航栏选择 运维管理>高可用管理。在左侧导航栏上,单击 故障演练>演练方案。单击 创建演练方案,在 创建演练...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统后,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

附录:SOFAStack 产品目录

SOFAStack 源于自蚂蚁内部沉淀十多年的金融级分布式中间件技术体系,吸收了支付宝自创立以来在关键金融交易系统锤炼出来的架构实践。SOFAStack 所有的产品技术均经过蚂蚁集团自身严苛的金融场景验证,为金融交易技术保证风险安全的同时,...

未收到告警通知的排查思路

本文介绍未收到告警通知的排查思路。排查流程 操作步骤 登录 日志服务控制台。在Project列表区域,单击目标Project。该Project为您告警监控规则...如果全局配置错误数和通知渠道错误数为0,说明无故障,请提 工单 联系日志服务技术支持人员。

自定义 SOFABoot 技术

技术栈背景信息 关于 什么是技术栈、技术栈目录结构、如何制作技术栈包 以及其它更多技术栈详情,请参考 技术栈使用指南。自定义技术栈 需求背景 SOFAStack 默认提供 SOFABoot 技术栈。如果面临比较紧急的业务需求,或默认技术栈无法满足...

什么是云原生应用组装平台BizWorks

提供了业务建模、微服务开发、轻应用组装、能力开放等平台功能,致力于帮助企业快速设计、构建、组装和运营可复用的业务能力组件和应用,提升业务与技术协同能力,助力企业高效数字化创新。本文介绍BizWorks的产品背景、核心优势、功能特性...

主从实例读写分离部署(共享存储)

Hologres 从V1.1版本开始,针对线上生产环境高可用的场景,提供了共享存储的主从多实例部署方式,在该模式下支持故障隔离,负载隔离,有效支撑了高可用场景。本文介绍高可用方案的一些基本原理以及如何配置共享存储的主从多实例。单实例...

应用场景

同时不断更新优化日常巡检、故障诊断、应急预案等内容的建设,不断丰富和完善应用技术风险防控体系,简化日常应用运维操作。故障演练 为不断提升产品高可用能力,通过高可用管理平台的故障演练模块,设计并规划演练计划和恢复方案,继而在...

Service诊断

重要 使用故障诊断功能时,系统将在您的集群节点上执行数据采集程序并收集检查结果。采集的信息包括系统版本,负载、容器组件等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。Service诊断对应的检查项 ...

Service诊断

重要 使用故障诊断功能时,系统将在您的集群节点上执行数据采集程序并收集检查结果。采集的信息包括系统版本,负载、Docker、kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。Service诊断对应的...

容灾演练断网方式说明

可用区断网正是为了模拟此类真实故障而提供的机房级故障模拟能力。可用区断网方式采用租户隔离技术,在用户指定VPC网络下对可用区交换机层面进行网络访问控制(网络ACL),实现子网流量的受控访问。使用场景 机房级业务整体不可用。机房级...

Service诊断

重要 使用故障诊断功能时,系统将在您的集群节点上执行数据采集程序并收集检查结果。采集的信息包括系统版本,负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。Service诊断对应的...

关键技术竞争力

生产运维智能化:技术风险体系保障业务连续性 TRaaS(Tech Riskdefend as a Service)技术风险防控平台,以蚂蚁内部 SRE 长期实践方法论和内部工具沉淀为依托,解决用户上云和分布式改造过程中所面临的可观测、故障应急、容灾、混沌工程、...

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

功能特性

高可用管理平台 HAS 定位于 IT 技术风险防控。产品主要功能包括风险管理、日常巡检、故障诊断、应急预案、故障演练等。风险管理 风险管理 是高可用管理平台核心,是风险事件汇集、处置的中枢平台,具体如下。风险事件 风险事件汇集:负责将...

云盘三副本技术

阿里云云盘三副本技术通过分布式文件系统为云服务器ECS提供稳定、高效、可靠的数据随机访问能力,为ECS实例实现99.9999999%的数据可靠性保证。本文介绍三副本的概念及原理。三副本介绍 您对云盘的读写最终都会被映射为对阿里云数据存储平台...

主从(备)切换原因

实例故障 阿里云检测到实例发生故障,无法正常使用,系统会发起主从(备)切换,及时恢复业务正常运转,缩小故障影响范围。主从(备)切换完成后,实例状态会显示运行中,您不需要进行任何操作,实例可以正常运行。您可以在 服务可用性 ...

连接池

选择合适的连接池软件可以提高数据库的性能和可扩展性,减轻数据库的负载压力,并提供更好的连接管理和故障处理能力。pgBouncer:支持数据库连接池功能,可以管理和复用数据库连接,减少应用程序和数据库之间的连接开销,并提高系统的并发...

阿里云上稳定性保障服务(容灾)内容说明

1.服务概述 1.1 服务说明 帮助客户在云上建立容灾能力,当灾难发生时,在保证生产环境的数据尽量少丢失的情况下,保证生产系统的业务不间断运行,促进故障逃逸能力的提升。1.2 适用的客户场景 云上容灾服务适用于客户同一个地域(Region)...

SOFAMesh 服务网格总体经济影响报告

对于积累了大量技术资产的传统企业甚至是互联网企业而言,云原生平台的构建都是一个混合演进的发展过程。在应用架构、基础架构和部署架构等不同维度,异构环境均将以常态化的混合形态长期存在,而仅仅采用容器、Kubernetes(K8s)与微服务...

功能概览

功能概述 混合云容灾服务基于云盘异步复制技术实现跨地域或者跨可用区容灾能力,应对不同的业务需求。该技术是在云盘层通过异步复制实现,无需在受保护的实例上安装代理。当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性...

功能概览

功能概述 云备份服务基于云盘异步复制技术实现跨地域或者跨可用区容灾能力,应对不同的业务需求。该技术是在云盘层通过异步复制实现,无需在受保护的实例上安装代理。当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害...

公共云基础服务说明书

服务说明 阿里云公共云基础服务是阿里云客户购买云产品后获得云产品基本使用,技术支持等服务能力的通道,阿里云也提供包括电话、工单、官网在线咨询等多种支持方式,全天候不间断(7x24小时)为客户提供服务,通过各种工具和技术、人员及...

配置DDoS高防后访问网站提示502错误

网络出现拥塞或抖动 在已经排除以上两种原因后,偶发的局部网络抖动、运营商线路故障等因素,也可能导致502错误。相关文档 常见问题概览 配置DDoS高防后访问网站提示504错误 适用于 DDoS高防 如果您的问题仍未解决,您可以在阿里云社区 ...

同城多活架构实践

虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始重视同城多活容灾能力的建设,以及定期做故障演练确保故障恢复能力的有效性。同城多活架构改造 基于MSHA多活容灾解决方案,您...

ECS资源复用

ECS资源复用版是MaxCompute按量付费类型中的一种实例规格,旨在将ECS闲置实例转换为可用的MaxCompute计算资源,该方式可以充分利用已有的计算资源,而不需要额外购买新的MaxCompute计算资源,从而在满足大数据处理需求的同时,提高资源利用...

故障排查

Service无法正常工作 在排除网络插件自身的问题外,最可能的是 label 配置有问题,您可以通过查看 endpoints 进行故障排查。具体操作,请参见 检查Service。如何升级集群?升级集群的Kubernetes版本,具体操作,请参见 手动升级ACK集群。从...

什么是故障

定义故障等级的原则为:不同服务/业务可依据自身的特点为每一级别设定定义,定义可由企业技术支持角色召集开发、运维、测试、PD、客满、运营等角色一起制定。确定版本需得到各方认同方能发布;故障等级由影响程度来确定:影响程度以受影响...

分区剪枝

若不包含,则会把分区从查询计划中排除(剪枝)。分区剪枝极大地减少了从磁盘检索的数据量并缩短了处理时间,从而提高了查询性能并优化了资源利用率。根据实际的SQL语句,PolarDB PostgreSQL版 数据库支持使用静态或动态剪枝。静态剪枝发生...

分区剪枝

若不包含,则会把分区从查询计划中排除(剪枝)。分区剪枝极大地减少了从磁盘检索的数据量并缩短了处理时间,从而提高了查询性能并优化了资源利用率。根据实际的SQL语句,PolarDB PostgreSQL版(兼容Oracle)数据库支持使用静态或动态剪枝...

分区剪枝

若不包含,则会把分区从查询计划中排除(剪枝)。分区剪枝极大地减少了从磁盘检索的数据量并缩短了处理时间,从而提高了查询性能并优化了资源利用率。根据实际的SQL语句,PolarDB PostgreSQL版(兼容Oracle)数据库支持使用静态或动态剪枝...

作业调试

在正式环境中使用Session集群,JM的复用机制会对作业间的稳定性产生负面影响,详情如下:JobManager单点故障会对集群内的所有作业造成影响。TaskManager单点故障会对在其上有task运行的相关作业造成影响。同一个TaskManager内部,不同Task...

RDS与自建数据库对比优势

备节点的故障发现时长为秒级,在99%的场景下,备节点从故障发生到节点恢复不超过10分钟。在好的架构下才能实现高可靠性。实现RPO=0的成本极高,需要单独购买研发服务。数据可靠性一般,取决于单块磁盘的损害概率。实现RPO=0的成本极高,...
共有141条 < 1 2 3 4 ... 141 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 共享带宽 负载均衡 应用高可用服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用