故障排查与常见问题

本文提供您在使用容器服务ACK时可能遇到的常见异常问题,并为您提供诊断流程、排查思路和解决方案。故障排查索引 集群类型 相关文档 托管版与专有版容器集群ACK 使用OpenAPI诊断工具进行故障排查 Service异常问题排查 Nginx Ingress异常...

什么是故障

故障等级 每个故障以P1-P4级别来区分重要程度,以获得不同的处理方式和关注度。P1最高优,P4低优。定义故障等级的原则为:不同服务/业务可依据自身的特点为每一级别设定定义,定义可由企业技术支持角色召集开发、运维、测试、PD、客满、...

故障管理

故障管理 故障管理是单独针对故障的一整套完成的应急相应流程机制,包括:故障应急、故障收敛、故障追踪、故障复盘、故障改进等核心功能。通过建立故障应急机制,可保证服务稳定运行、服务体验保证等。故障管理也可以理解为重大事件的升级...

什么是企业级分布式应用服务EDAS

企业级分布式应用服务EDAS(Enterprise Distributed Application Service)是一个应用托管和服务管理的云原生PaaS平台,提供应用开发、部署、监控、运维等全栈式解决方案,同时支持Spring Cloud和Apache Dubbo(以下简称Dubbo)等服务...

功能发布记录(2020~2021年)

本文介绍 服务引擎MSE(Microservices Engine)的版本变更信息,包括发布时间、功能名称、描述以及相关文档等信息。更多功能发布记录,请参见 版本发布记录(2023年)、功能发布记录(2022年)。2021-12-30 表 1.云原生网关 功能名称 ...

如何管理故障

本文档主要介绍如何管理故障故障发生条件 当事件重要程度上升、整体影响面恶化、持续长时间未解决,综合评估已达到故障时(P1-P4),处理人可手动将事件升级为故障。当报警来源的指标持续恶化,触发故障产生规则,系统自动产生故障故障...

结构发布流程化

保障数据结构的规范性 安全规则 的研发规范包含新建表、修改表字段、修改表索引等多方面的近40条规范,方便研发同学自助设计满足企业研发规范的表结构,可避免因不满足规范的结构发布上线而导致的生产故障。同时,该功能可节省运维人员因...

服务实例隔离与诊断

服务实例隔离与诊断可以有效地应对线上故障(例如内存泄露),提升服务系统整体稳定性。当服务提供者的某些实例出现异常时,MSE治理中心将异常实例的流量隔离,并结合阿里云 应用实时监控服务 ARMS(Application Real-Time Monitoring ...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。功能简介 故障注入流程如下所示:在服务中,其实现方式为:管控...

微服务治理技术白皮书

如今越来越多的企业使用服务架构来开发业务应用,而业务发展离不开服务治理的保驾护航。《服务治理技术白皮书》着重分享如何借助于治理的能力,高效构建完整的服务治理体系,提升开发效率和线上稳定性。下载白皮书,了解详情:...

功能优势

典型应用场景:历史库 损 99%百亿级别 100 QPS 结构化和非结构化混合检索 以检索与输入图片中的连衣裙相似度最高、价格在100元到200元之间且上架时间在最近1个月以内的产品为例,介绍结构化和非结构化混合检索。有下列商品库,其中商品表...

功能架构

分布式链路 分布式链路帮助运维人员、开发人员和架构师看清楚复杂的大规模服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、...

强弱依赖治理最佳实践

本文以对一个部署在Kubernetes上的服务应用进行强弱依赖治理为例,介绍通过场景化演练来发现依赖问题、暴露风险的整个过程。背景信息 关于强弱依赖治理的更多信息,请参见 强弱依赖治理概述 和 应用强弱依赖治理。示例说明 本文示例的...

什么是微服务引擎MSE

服务引擎MSE(Microservices Engine)是一个面向业界主流开源服务生态的一站式服务平台,提供注册配置中心(原生支持Nacos、ZooKeeper、Eureka)、云原生网关(原生支持Ingress、Envoy)、服务治理(原生支持Spring Cloud、Dubbo、...

以太网接口频繁Up/Down

检查项 检查标准 后续操作 用测试测试双绞线是否故障。测试显示双绞线正常。如果检查出线缆故障,请更换线缆。设备间双绞线长度是否满足要求。设备间线缆长度。说明 10/100/1000M电接口采用RJ45连接器,接口线缆为5类或5类以上双绞线,...

逻辑表

配置完逻辑库后,系统会自动解析逻辑库中符合条件的物理表,生成逻辑表,您也可以...常见问题 Q:已配置逻辑库,但在控制台中找不到对应的逻辑表。A:请确认物理表中有多张表结构一致且表名前缀相同的物理表,满足条件后重新 手动更新逻辑表。

什么是应用高可用服务AHAS

应用高可用服务(Application High Availability Service)是一款专注于提高应用高可用能力的SaaS产品,主要包含多活容灾、故障演练和流量防护三个独立的功能模块。其中流量防护已迁移至服务治理服务MSE。多活容灾 多活容灾MSHA(Multi-...

EDAS直播公告

EDAS解决了您自主诊断时遇到的痛点,EDAS提供了自动化诊断功能,可以帮助您一键完成故障发现、诊断和治理。EDAS监管控一体化的架构升级,监控方面整合了Prometheus监控、SLS日志和ARMS应用监控,管控方面整合了服务、AHAS限流降级的能力...

什么是故障演练

适用场景 故障演练可适用于以下典型场景:衡量服务的容错能力 通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

基于MSE云原生网关实现同城多活

每个集群对应一个Nacos,可有效保证服务调用在可用区内闭环,单可用区发生故障后触发网关自动切流后可保证服务调用流量无损。准备工作 创建两个Nacos引擎。在两个不同可用区各创建一个K8s集群。具体操作,请参见 创建Kubernetes托管版...

故障排查

本文介绍阿里云容器服务ACK集群在使用过程中常见问题的故障分析和排查流程。ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。配置故障注入规则 登录 SOFAStack 控制台。在左侧菜单栏选择 ...

故障隔离

故障隔离是在服务实例出现故障时,实现实例级别的精细化摘流隔离,使故障影响范围更小,提高服务的可用性。添加故障隔离规则 登录 SOFAStack 控制台。在左侧菜单栏选择 中间件>服务平台>服务网格>服务治理,然后单击 故障隔离 页签。单击...

概述

但随着各公司业务范围的扩展和软件系统架构持续迭代升级,系统的复杂度随之增加,面对更多的非预期事件风险,如各类软硬件故障、错误的变更、突发流量,甚至到光纤挖断、自然灾害等引起的整个机房不可用情况,如何保障系统稳定性具有很大...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

SOFAStack 常见问题

SOFAStack 是否可以部署在虚拟机、物理机上?可以,SOFA 部署支持物理机、虚机 VM。SOFAStack 当前是否只支持阿里云容器服务 ACK?...SOFA 服务支持客户端限流、集群容错,服务熔断、故障注入、服务降级等,保障服务高可用。

云原生网关概述

插件市场 高可用 采用Envoy内核,将K8s Ingress和服务网关合二为一,支持过载保护、无损上下线、多可用区容灾、弹性扩缩、故障自愈,SLA保障率高达99.95%。新建云原生网关 MSE Ingress概览 优势 云原生网关产品优势如下:低成本 MSE云...

微服务架构设计与治理服务内容说明

服务治理改造方案设计与验证完成 服务治理方案设计方案 甲方在线确认《验收报告》服务架构实施支持服务 基于客户需求完成了服务架构实施方案的落地 服务治理方案落地,关联应用完成改造上线 甲方在线确认《验收报告》8....

功能更新记录

本文介绍故障演练Chaos历次发布涉及的功能变更,帮助您了解故障演练的发布动态。2021年10月 功能名称 功能概述 支持资源包类型 支持地域 发布时间 服务强弱依赖支持Dubbo 在应用强弱依赖治理的基础上,服务强弱依赖治理功能,通过接入...

基本概念

应用服务 可被其他应用(服务)调用的服务,实现中心应用对外透出的接口的结构化定义。例如:商品信息查询、商品状态管理、订单查询服务等。基础能力 业务域中应用服务开放给外部调用的服务总称。例如:注册用户、创建订单。脚手架代码 ...

GetApplicationList-获取应用列表

变更历史 变更时间 变更内容概要 操作 2023-09-06 OpenAPI 返回结构发生变更 看变更集 变更项 变更内容 出参 OpenAPI 返回结构发生变更。2023-07-13 OpenAPI 返回结构发生变更 看变更集 变更项 变更内容 出参 OpenAPI 返回结构发生变更。...

授权信息

权限策略通用结构 权限策略支持JSON格式,其通用结构如下:{"Version":"1","Statement":[{"Effect":"<Effect>","Action":"<Action>","Resource":"<Resource>","Condition":{"<Condition_operator>":{"<Condition_key>":["<Condition_value>...

概述

通过分布式链路跟踪,运维人员、开发人员和架构师能看清楚复杂的大规模服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障...

概述

通过 DST,运维人员、开发人员和架构师能看清楚复杂的大规模服务架构下的应用及服务之间的 复杂调用关系、性能指标、出错信息 与 关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运...

事件中心事件汇总

MSE事件中心对注册配置中心、服务治理、云原生网关生成的事件数据进行集成,让您感知所有MSE托管资源的事件变更,并针对异常事件进行自主排查。本文介绍服务引擎MSE支持的所有事件,并为各事件提供处理建议。Nacos 事件Code 事件名称 ...

微服务注册配置中心版本选型

默认多AZ(Availability Zone)平均部署,提高集群容灾能力,故障自动检测及恢复,SLA保障率高达99.95%支持动态配置,扩缩容不重启,降低服务中断时间 SLA保障率为99.5%性能 集成高性能JDK,协程处理优化,提升并发处理性能,读性能提升1倍...

快速入门

服务(SOFAStack Microservices)提供分布式应用常用解决方案,支持在线配置、管理、监控 SOFA 应用等。它主要是通过 SOFARPC 来实现服务的发布和引用,而服务注册、动态配置、限流熔断、服务降级等功能,都是服务于SOFARPC 的。快速入门...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

智能导购设置

门店管理 企业微信接入智能导购企版的管理后台后,将自动读取企业微信通讯录的数据(部门-成员)并创建组织结构(门店-导购)。运营人员可以通过 门店管理 查看门店数据并管理门店「联系我」二维码。门店「联系我」二维码是为门店顾客...

MSE云原生网关和自建网关对比

稳定性 高可用 多可用区部署,故障自动检测及恢复,SLA保障率高达99.95%。需自行探索和开发高可用保障体系,SLA保障率低。需自行探索和开发高可用保障体系,SLA保障率低。性能 CPU水位在30~40%时,TPS性能高出开源Nginx Ingress约90%,高出...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 Serverless 应用引擎 微服务引擎 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用