基本概念

更多请查看 什么是事件 故障 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时...

分布式链路概述

分布式链路(原 SOFAStack 中间件中的 概述)逐步融合到业务智能可观测服务中,实现监控和链路分析一体化,方便用户对问题进行跟踪定位,应用性能、调用链路进行实时分析。背景信息 分布式链路是面向分布式架构、微服务(比如 Spring ...

跟踪概览

故障诊断与运维 服务故障分析:在出现服务中断或性能下降时,可以使用跟踪日志来分析事件前后的操作,以帮助确定故障原因。配置变更追踪:记录云资源配置的所有更改,帮助识别可能导致服务中断的配置错误。基本概念 概念 说明 跟踪 跟踪...

PTS压测快速入门

阿里云提供的业务高可用架构体系,为企业提供营销活动、成本控制(压测、容量规划、流量控制)、应急(开关)、容灾逃逸(架构感知、故障演练、异地多活)的解决方案。其中PTS压测作为容量规划阶段重要的环节,可模拟海量用户的真实业务...

常见问题

通过 云企业网体验馆 得到的数据仅供参考,由于连接质量、距离等外部因素,多次测试时,可能会出现不同的测试结果。如何使用云企业网实现三个账号的VPC实例互通?例如账号A下的VPC1、账号B下的VPC2、账号C下的VPC3需要互相通信,您可以将...

签署代付协议

发起签署时,为什么会出现“身份证号码和社会统一识别代码必须为18位”的提示?A:出现如图提示时,表明您这边前期在认证阿里云账号时,使用其他证件认证,导致系统未能识别您的实名认证信息以及社会统一识别代码等,需要您手动发起 工单...

可观测性的设计原则

每个组件都可以将标识符添加到它们的日志中,以便在出现问题时进行故障排除。分布式跟踪可以使用开源工具Jaeger、Zipkin、skywalking或CAT等,阿里云上有ARMS服务来实现。日志记录 系统需要记录关键事件和故障,以帮助诊断问题和解决故障。...

使用前必读

旧版公共实例已不支持资源规格扩容,如果资源规格不足,物联网平台提供实例迁移功能,可帮助您将旧版公共实例下产品、设备和消息转发数据迁移到 同账号同地域 下的 标准型 企业版实例中使用,降低迁移影响和系统改造成本。本文介绍实例迁移...

什么是混合云容灾服务

概念 描述 故障转移(Fail Over)即容灾恢复,指您的IDC应用出现故障时,在阿里云上恢复应用的过程。故障恢复(Fail Back)当您的IDC内的环境恢复以后,将应用数据迁回自有IDC恢复应用运行的过程。RPO Recovery Point Objective(数据恢复...

诊断网页加载过慢的问题

问题描述 网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类问题的难点如下:复现困难 假设您的一位用户是A,当A访问某网页时,该页面加载在A本地的浏览器上。由于页面的加载耗时受地域、网络情况、浏览器或者运营商...

资源稳定性最佳实践

默认规则 规则名称 规则描述 RDS实例开启日志备份 如果没有开启日志备份,当本地日志丢失会出现无法恢复数据的风险。如果RDS实例开启日志备份,视为"合规。使用独享型的RDS实例 使用独享类型的RDS实例规格,视为“合规”。RDS实例SQL审计...

创建专有宿主机

如果本地SSD型DDH出现故障,您可以 提交工单 申请人工迁移,但迁移后本地盘数据丢失。计算型 c7 宿主机名称 输入宿主机名称。长度为2~128个字符,必须以大小写字母或中文开头,可包含数字、半角句号(.)、下划线(_)、半角冒号(:)或...

PolarDB MySQL版8.0.1版本发布日志

修复RO节点的物理机出现故障时,RW节点在特殊情况下未将其复制关系中断,而引发RW节点刷脏受阻的问题。修复HA后,因表数量过多而引发table cache淘汰导致Autoinc回退的问题。修复多主集群缓存中心重启情况下,读写节点可能无法启动的问题。...

服务发布策略

蓝绿部署通过使用额外的实例资源来解决服务发布期间的不可用问题,当服务新版本出现故障时,也可以快速将流量切回旧版本。如下图所示,某服务旧版本为v1,新版本v2进行冗余部署。版本升级时,将现有流量全部切换为新版本v2。当新版本v2...

PolarDB MySQL版5.6版本发布日志

修复RO节点的物理机出现故障时,RW节点在特殊情况下未将其复制关系中断,而引发的RW节点刷脏受阻的问题。修复在RW节点执行Degrade操作后,Standby节点丢失物理复制重连机制的问题。修复一键升级RDS MySQL至PolarDB MySQL版场景下,...

用云成本需求分析

合规性 企业面临外部对企业云上信息系统的合规要求,如等保2.0,3.0法规要求,同时当云上资源达到一定规模时,在内部制定合规管控的基线,满足自身管理效率和安全合规的需求,包括记录云上资源管理的操作日志、资源。配置变更日志,还需...

常见问题

鼠标移动到最左边的表头上,会出现删除的图标。4.请问一下云效项目编码的设定系统只允许4-6大写字母,这个是基于什么来限制呢?因为项目编号后续会拼接在任务上,形成任务编号。比如TEST-01,使用过长的字母或者数字在拼接任务编号时会造成...

什么是多活容灾

容灾演练一般会经历下面四个阶段的演进:阶段一,可控的暴露问题 围绕“基础设施”和“业务系统”提前梳理出影响可用率的风险因子,确定风险因子具体影响大小、是否可自愈、是否为跌零因子,此阶段需要通过生产小规模的生产实验来探索和...

混沌工程缓存实战系列-Redis

因为服务端出现故障更加真实,所以可以从服务端层面去制造故障,但对于问题定位和排查的要求更高。注入故障,观察指标的变化。缓存监控指标 目前支持的可监控的缓存指标如下:指标 说明 缓存QPS QPS是最通用也是最易观察的指标。缓存命中...

API概览

当一致性复制组中某些复制的主盘出现故障时,可以调用该接口恢复从盘的读写权限。ReprotectDiskReplicaGroup 启用异步复制组反向复制 启用一致性复制组中复制的反向复制功能。启用反向复制功能后,可以将原灾备站点的云盘数据复制到原...

标准版-双副本

当主节点出现故障,自研的HA系统自动进行主从切换,保证业务平稳运行。数据可靠 默认开启数据持久化功能,数据全部落盘。支持数据备份功能,用户可以针对备份集回滚实例或者克隆实例,有效地解决数据误操作等问题。同时,在支持容灾的...

产品FAQ

1、云企业官网各版本间差异 2、云·企业官网需要买服务器吗?3、标准价格、标准服务指什么?4、支持IPv6有什么作用?5、独立IP有什么作用?6、SEO指什么网站有什么作用?7、赠送SSL证书,实现网站HTTPS有什么作用?8、阿里云视频与普通...

常见问题

撤回证书申请后出现“页面加载时遇到问题”报错 申请SSL证书时关于域名的注意事项 域名未通过安全审核并出现“无法申请免费DV证书”提示 如何制作CSR文件 上传CSR文件时出现“审核失败-主域名不能为空”报错 域名授权验证配置推送失败 申请...

ECS系统事件概述

说明 非预期运维事件一般指的是因底层宿主机发生了无法预测的故障,或者ECS实例的操作系统发生了内核错误等问题,导致ECS实例突然出现宕机或重启。因宿主机故障导致ECS实例宕机或重启事件(SystemFailure.Reboot)属于偶发现象,无法避免。...

CloudLens概述

企业对云产品的合理使用与运维管理 数据孤岛:数据分散、多个系统切换,缺乏统一视角。难以关联分析:云产品的日志、指标、配置计量等数据,缺乏统一的关联分析手段。实时和灵活度不够:难以实时预警、大规模秒级分析、灵活分析(粒度、...

读写访问文件类问题

flock+seek使用方法 由于NFS协议本身没有提供Atomic Append语义的支持,因此当并发写入同一文件末尾(如日志)时,很可能会出现相互覆盖的情况。在Linux中,通过使用flock+seek的方式,可以在NFS协议文件系统上做到模拟Atomic Append,...

设计原则

衡量可采取两种形式:技术指标:Cloud First、成本最优、系统稳定、安全合规、运营效率等 业务指标:业务流程效率、成本节省、服务级别等 企业对供应商的准入考核在技术上面可以从:成本、稳定、安全、性能这四个维度制定详细的规范。...

概述

SOFAStack 提供了一套用于快速构建金融级分布...用于满足企业对外部合作伙伴开放业务,企业自身混合云互通、企业内网应用集成异构系统间通信的需求,帮助客户更好的进行场景和业务的创新。更多 API 网关的详情,请参见 什么是 API 统一网关。

智能质检应用说明

提前进行干预,以避免合规风险 当企业的业务(如金融、保险、出行等)涉及到用户人身财产安全时,为了确保用户的决策是在熟悉风险,且在自身承受亏损的范围内进行,避免企业出现诱导、未提示风险等违规行为,有监管部门对企业进行管控。...

微服务治理差异化能力

注意 最好EDAS限流降级能力别与hstrix降级能力共用,可能会出现效果不符合预期的情况。如果您已经配了hstrix能力,并且打算使用EDAS限流降级能力,建议关闭hstrix规则。容错:单点故障自愈能力 线上常出现以下场景:某应用发布,灰度部分...

跨地域容灾

警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作停掉实时复制流程。您需要重新启动复制,并完成一次全量复制才能被保护服务器继续进行容灾保护。故障切换步骤如下:登录 混合云容灾管理控制台。单击 切换到...

常见问题

警告 创建单节点地址后,当此节点故障时,该地址可能会出现最多1小时不可用的情况,请勿用于生产环境。Q:一个集群内最多允许创建多少个单节点地址?A:如果您的集群内有3个节点,则只允许为其中1个只读节点创建单节点地址;若集群内有4个...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,整体的应用做容灾备份来应对单地区的故障,满足业务的...

实时分析链路数据

在 调用链分析 页面筛选错误调用或慢调用,并设置按IP进行分组统计,如果异常调用集中出现在特定机器,则有较大概率是机器故障问题三:慢接口治理 新应用上线或大促前性能优化,如何快速梳理慢接口列表,解决性能瓶颈?新应用上线或大促...

云防火墙常见问题

本文介绍了使用云防火墙的常见问题及其解决方案。售前常见问题 功能特性相关 为什么使用云防火墙需要授予服务关联角色(AliyunServiceRoleForCloudFW)?云防火墙最多支持几个跨账号部署?金融云基础版云防火墙与其他版本有哪些差异?云...

读多写少型业务场景多活实践

虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,快速发展的业务造成不小的打击,迫使企业开始考虑容灾能力的建设。这次故障中受损的导购业务,是典型的读多写少型业务场景,包括以下链路:导购页面的展示,是读链路。电商...

企业标识名设置

如果企业在未设置标识名的情况下,会对代码管理员在 Codeup 首页展现标识名设置入口,用户可自定义设置对应的标识名。点击设置后出现设置弹窗,支持全平台唯一的企业标识名设置。注意:一旦设置成功后将不可更改,请谨慎操作。已设置标识名...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

企业财务”升级为“企业账号”操作说明

A:升级入口存量企业财务用户分批开放,如需提前升级,可提交工单申请;且仅财务主账号可发起升级,Q3:为什么升级需要录入身份证信息?A:新版支持用户开通企业管理员账号来管理企业/公司,以及在阿里云网站上的所有账号相关信息,需要...

新手指引

互联网访问安全(办公数据保护版)互联网访问安全(办公数据保护版),基于Cloud DLP的产品架构,满足企业对办公数据进行即时的识别、监控与保护。了解 SASE 各功能的配置流程 前提条件 企业接入 SASE 的第一步,需要先配置企业的身份源和...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 阿里邮箱 域名 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用