常见问题

运维管理 容器应用服务常见问题 经典应用服务常见问题 中间件 SOFABoot 常见问题 服务常见问题 服务故障排查之 DRM 服务故障排查之限流 服务故障排查之 RPC 服务网格-故障排查 消息队列常见问题 任务调度常见问题 分布式链路跟踪...

事件分析概述

服务领域:服务在现代开发架构中比较常见,该架构由小型、松耦合、可独立部署的服务集合而成,这导致服务架构很难调试,系统中某一部分的小故障可能会导致大规模服务崩溃。很多时候不得不跳过某些正常服务来调试单个请求。事件总线...

应用场景

本文主要为您介绍容器服务 ACK 的常见应用场景。DevOps 持续交付 最优化的持续交付流程 配合 Jenkins 帮您自动完成从代码提交到应用部署的 DevOps 完整流程,确保只有通过自动测试的代码才能交付和部署,高效替代业内部署复杂、迭代缓慢的...

RPC

容器替换方案 框架升级方案,只是解决了可以做,而并不能做得好,更没有做得快,面对线上数十万着流量的业务容器,如何实现这些容器的快速稳定接入?在流量很大情况下,传统的替换接入需消耗大量接入成本,于是,蚂蚁团队选择了原地接入...

附录:SOFAStack 产品目录

应用场景 传统应用服务改造 通过服务产品将传统金融业务系统拆分为模块化、标准化、松耦合、可插拔、可扩展的服务架构,可缩短产品面世周期,快速上架,抢占市场待机;不仅可确保客户服务的效率,也降低了运营成本。高并发业务快速...

新手指引

Serverless 应用引擎 SAE(Serverless App Engine)是面向应用的Serverless PaaS平台,能够帮助PaaS层用户免运维IaaS、按需使用、按量计费,做到低门槛服务、PHP应用上云。本文介绍如何使用 SAE,帮助您快速了解 SAE 以及各方面的实践...

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

直播公告(2020~2022年)

服务体系在阿里巴巴内部广泛使用,历经10多年双十一考验,甚至经历多次断网、节点全挂、存储不可用等各种高危故障,由此沉淀出了许多宝贵经验,阿里云服务引擎 MSE 生长在此基础之上,默认具备许多项高可用能力。服务发现与配置管理高...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

应用场景

服务网关(如Spring Cloud Gateway)是指与业务紧耦合的、提供单个业务域级别的策略,如服务治理、身份认证等。MSE云原生网关将两层网关变为一层,不仅可以节省50%的资源开销,还可以降低运维及使用成本。在传统网关模式中,流量网关负责...

GetProblem-故障详情

服务组名字 isValid Long 1 是否合法 timelines Array of 故障操作时间线 故障操作时间线 keyNode String 1,2,3,4,5,7,6,8,9,10 关键节点码表:PROBLEM_KEY_NODE cancelProblemOperateLogs Array of 已取消故障操作日志 已取消故障操作日志...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

服务实例隔离与诊断

服务实例隔离与诊断可以有效地应对线故障(例如内存泄露),提升服务系统整体稳定性。当服务提供者的某些实例出现异常时,MSE治理中心将异常实例的流量隔离,并结合阿里云 应用实时监控服务 ARMS(Application Real-Time Monitoring ...

故障排查

本文介绍服务引擎MSE在使用过程中常见问题的故障分析和排查流程。服务注册配置中心问题排查 在浏览器中输入 XXX:8848/nacos,访问MSE的Nacos注册中心时返回404错误。具体操作,请参见 通过“XXX:8848/nacos”访问MSE的Nacos注册中心时...

专家成长计划技术培训课程

现场面授(特殊情况可调整为线上钉钉群直播)分析型数据库AnalyticDB详解 1天 30人 本培训课程为阿里云原厂培训系列课程之一,通过专业的阿里云认证讲师面对面讲解、互动、产品演示,讲授ADS产品的最佳实践及常见问题解决办法,您深入...

应用上云方案设计

平迁上云方案 产品选型策略 针对传统应用平迁上云场景,常见产品对标选型策略如下图所示。场景示例1:单体应用迁移 云上重部署应用 针对平迁方式的应用上云场景,对于已有成熟CI/CD工具及流程的企业,我们建议优先使用现有CI/CD工具,在云...

同城多活常见问题

本文介绍同城多活的常见问题以及解决方案。假设数据库主备,ECS双可用区部署,是否就是同城多活?和EDAS、MSE集群流量同可用区优先的差异和优势?消息是基于Shutdown机制实现多活么?数据库是两个机房各一个主备,还是主机房一主一备,备...

运营阶段

通过前期的设计,到构建,服务进入日常运营环节。在这个阶段往往会产生大量的运营事件,比如日常的资源申请。企业在持续运营过程中也会产生或大或小的生产故障,需要做好线故障管理,提升服务SLA。

闲鱼

本文介绍如何通过 函数计算,解决闲鱼研发耦合严重和运维复杂等问题。客户介绍 闲鱼是依托阿里电商体系的前台型业务,有非常独特的业务特点和用户诉求,在底层依托阿里系统的同时,在表现层和业务层需要探索适合闲鱼的、并且更加快速灵活的...

闲鱼

本文介绍如何通过 函数计算,解决闲鱼研发耦合严重和运维复杂等问题。客户介绍 闲鱼是依托阿里电商体系的前台型业务,有非常独特的业务特点和用户诉求,在底层依托阿里系统的同时,在表现层和业务层需要探索适合闲鱼的、并且更加快速灵活的...

石家庄掌讯:借助云效+SAE实现快速部署持续交付

解决效果 总体上来说,掌讯信息公司在与云效&SAE共建之后,通过Codeup自动化代码检查提升了代码质量,降低了生产的故障,FLow自动化流水线、SAE的接入不但降低了成本,同时提升了交付效率。降成本•小成本投入提高质量管理能力和持续交付...

AIOps 解决方案专家服务内容说明

支持 AIOps方案实施支持 智能故障发现解决方案实施支持 支持 支持 定制化业务风险巡检方案实施支持 支持 支持 AIOps方案现场部署 智能故障发现解决方案线下输出 支持 定制化业务风险巡检方案线下输出 支持 备注:服务基础版和标准版的服务...

功能发布记录(2023年~2024年)

设置无损上下线【产品变更】SAE集成的MSE服务治理功能商用通知 2023年09月30日 功能名称 变更类型 功能描述 相关文档 命名空间管理能力 新增 新增命名空间管理能力,支持在 SAE 2.0的同一个命名空间内同时创建服务应用和Web应用。...

关键技术竞争力

传统应用现代化:不止于异构应用治理 在传统单体式架构向服务架构迁移的过程中,随着应用服务数量的增加,服务间的通信、监控以及安全性 管理成为新的挑战。服务网格作为应用与基础设施的桥梁,突破传统的 SDK 接入方式,以对应用...

微服务引擎MSE的审计事件

服务引擎MSE已与操作审计服务集成,您可以在操作审计中查询用户操作服务引擎产生的管控事件。操作审计支持将管控事件投递到日志服务SLS的LogStore或对象存储OSS的存储空间中,满足实时审计、问题回溯分析等需求。操作审计记录了用户...

产品系列

数仓版(3.0)预留模式规格 型号 规格 CPU 内存(GB)磁盘空间(GB)C8 24核 192 最小空间:100 最大空间:2000 C32 96核 768 最小空间:100 最大空间:8000 常见问题 如何查看产品系列?在 云原生数据仓库AnalyticDB MySQL控制台 集群信息...

IT服务:SAE支持石家庄掌讯应用极速上云

提升质量,减少故障 针对流量增长,以往公司会提前预估峰值,按峰值保有ECS资源,但经常出现容量预估不准的情况(例如资源浪费或资源不足),更甚者会影响系统的SLA。通过SAE的秒级自动弹性,公司可以轻松动态扩容应对峰值大考,峰谷时按需...

MSE注册配置中心和自建注册配置中心对比

升级和扩缩容 免去手动配置和升级,同时运维操作过程支持无损上下线能力,避免升级、扩缩容等运维操作引起的线故障。需要手动操作,繁杂且效率低,容易引起线故障。高可用 多可用区部署,故障自动检测及恢复,SLA保障率高达99.95%。需...

演练概述

基于阿里巴巴多年业务的真实线故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。完整的故障演练...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

EDAS直播公告

安利的企业服务架构转型之路 云途时代数字化转型实践 EDAS 3.0核心功能演示 2020-05-15 服务治理实践之金丝雀发布 应用的有些故障是因为发布直接或间接引起的,因此提升发布的质量,减少错误的发生,是有效减少线故障的一个关键环节...

设置钉钉机器人告警

若您想接收服务巡检的告警,需要在 安全设置 中选中 自定义关键词,输入 服务线上监控预警。在 添加机器人 对话框中复制生成的Webhook地址。在控制台上添加钉钉机器人为联系人。具体操作,请参见 创建联系人。设置告警规则。若您未创建告...

设置钉钉机器人告警

若您想接收服务巡检的告警,需要在 安全设置 中选中 自定义关键词,输入 服务线上监控预警。在 添加机器人 对话框中复制生成的Webhook地址。在控制台上添加钉钉机器人为联系人。具体操作,请参见 创建联系人。设置告警规则。若您未创建告...

设置钉钉机器人告警

若您想接收服务巡检的告警,需要在 安全设置 中选中 自定义关键词,输入 服务线上监控预警。在 添加机器人 对话框中复制生成的Webhook地址。在控制台上添加钉钉机器人为联系人。具体操作,请参见 创建联系人。设置告警规则。若您未创建告...

设置钉钉机器人告警

若您想接收服务巡检的告警,需要在 安全设置 中选中 自定义关键词,输入 服务线上监控预警。在 添加机器人 对话框中复制生成的机器人地址。在控制台上添加钉钉机器人为联系人。具体操作,请参见 创建联系人。创建一个联系组,并选择上...

以太网接口频繁Up/Down

检查项 检查标准 后续操作 用测试仪测试双绞线是否故障。测试仪显示双绞线正常。如果检查出线缆故障,请更换线缆。设备间双绞线长度是否满足要求。设备间线缆长度。说明 10/100/1000M电接口采用RJ45连接器,接口线缆为5类或5类以上双绞线,...

以太网接口无法接通

检查项 检查标准 后续操作 用测试仪测试双绞线是否故障。测试仪显示双绞线正常。如果测试仪检测出线缆故障,请更换线缆。设备间双绞线长度是否满足要求。设备间线缆长度需小于100米。说明 10/100/1000 Mbps电接口采用RJ45连接器,接口线缆...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云消息队列 RocketMQ 版 微服务引擎 数据库自治服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用