功能发布记录

故障演练支持自定义监控 故障演练支持自定义监控。演练场景、演练方案、演练执行单展示优化 演练场景、演练方案、演练执行单展示优化,区分我的和全部。场景实例、系统原子操作展示优化 场景实例、系统原子操作展示关联演练执行单列表。...

常见问题

code=exited”错误 启动SSH服务时出现“error while loading shared libraries”错误 ECS网络问题 Windows实例ping外网地址提示“一般故障”Linux系统的ECS中没有禁pingping不通的解决方法 使用ping命令测试ECS实例时ping不通的排查方法 ...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

应急响应服务

什么是应急响应服务 背景信息 安全管家的应急响应服务基于阿里巴巴多年的安全攻防实战技术能力和管理经验,参照国家信息安全事件响应处理相关标准,在发生安全事件,按照预防、情报信息收集、遏制、根除、恢复流程,提供专业的7*24远程...

运维服务内容说明

1.服务概述 阿里云运维服务(Alibaba Cloud Managed Services),基于阿里巴巴数字化运维解决方案,提供专属运维服务专家,帮助企业客户做好云上运维管理,降低运维开销和风险,提升运维效率和业务连续性,增强系统安全性和合规性,助力...

支持计划

业务不可用分钟(包含专项应急小组会诊)一般问题小时一般咨询小时 7×24小时专属企业钉钉群快速响应,提供业务咨询、自动预警、故障处理等服务,并可由多位专家进行疑难应急会诊案例严重性的响应时间:业务不可用分钟(包含专项应急小组...

附录:SOFAStack 产品目录

API 网关 API 网关(API Gateway)是一个 API 管理平台,帮助企业统一管理对内外开放的 API,为网络隔离的系统间提供高性能、高安全性、高可靠性的通信,同时保障内部系统的安全性;用于满足企业对外部合作伙伴开放业务、企业自身混合云...

块存储FAQ

重启Linux系统ECS实例或者重新初始化系统数据盘不见了怎么办?Linux系统ECS实例重新初始化系统如何重新挂载数据盘?重新初始化系统盘与更换系统盘(操作系统)有什么差异?扩容云盘问题 更换系统盘时,我的快照会丢失吗?更换系统...

测试指标

可靠性指标 双机热备 对于将双机热备作为可靠性保障手段的系统,可衡量的指标如下:节点切换是否成功及其消耗时间。双机切换是否有业务中断。节点回切是否成功及其耗时 双机回切是否有业务中断。节点回切过程中的数据丢失量。在进行双机...

常见问题-FAQ

基于地理位置的访问策略为何不生效?答:由于GTM自定义域名所关联的域名线路类型与访问策略的线路类型冲突,详情请参考 GTM基于地域线路解析记录如何生效。全局流量管理(GTM)和负载均衡(SLB)有什么区别?答:首先 GTM 是通过DNS将域名...

功能说明

基本配置 基本配置是指对创建的GTM实例进行基本配置及访问策略类型选择,基本配置包含“实例名称、CNAME接入域名类型、业务域名、全局TTL、报警通知组、报警通知方式相关信息”,访问策略类型包含“基于地理位置的访问策略”和“基于访问...

基本概念

通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。API 应用程序编程接口,是一些预先定义的函数,或指软件系统不同组成部分衔接的约定。API 分组 用于将 API 进行逻辑的分组,分组下的 API 使用相同的分组...

什么是多活容灾

由于用户投入资金的数量限制,想用少的资金达到第6级容灾级别显然是有难度的,我们设计出的系统也只能是在现有的条件下尽量减少故障历时,尽量多的恢复数据,这也是衡量我们所设计出来的容灾系统质量的指标。实际的容灾系统设计过程中,...

消息存储和清理机制

而 云消息队列 RocketMQ 版 基于阿里云云原生自研的存储系统,支持所有实例按需按量使用存储空间,存储容量无上限约束。因此所有消息将严格按照约定的保存时间进行存储,无需担心因为存储空间不足消息被删除的情况出现。使用建议 消息存储...

基本概念

L LBS 基于位置的服务(Location Based Services,简称 LBS),是利用各类型的定位技术来获取定位设备当前的所在位置,通过移动互联网向定位设备提供信息资源和基础服务。类安全加固 对 Java 代码进行混淆,隐藏真实运行流程,防止 jadx-...

如何开通移动端协同应用

本文档用于展示公有云业务的需求基于多端协同流转时,企业管理者如何开通移动端协同应用(维蜜)的相关操作流程。背景介绍 为拓展 运维事件中心 的使用场景,满足移动化办公/运维需求,移动端协同应用(维蜜)应运而生。关于移动应用的产品...

产品简介

产品简介 阿里巴巴通义实验室千寻搜索算法,基于达摩院长期积累的自然语言处理技术,专注企业统一搜索场景,提供精准的多源异构搜索,以PaaS服务形式提供离线数据处理和搜索服务API。同时支持公有云、专有云、基于云原生的基础架构下混合云...

调用链采样配置最佳实践

对于绝大多数分布式系统,不是每一条调用链都值得被可观测平台记录,因为其中包含大量重复、低关注度信息。调整采样是目前解决这类问题最高效且主流的方式,但具体配置什么样的采样策略,能够在可控的资源开销和费用成本内,最大程度保证错...

网络架构容灾

网络是数字世界的基础设施,没有网络的联通,所有信息都无法交互,因此网络架构的设计在应用系统中至关重要,特别是针对网络架构的高可用及容灾能力的设计,是业务在异常发生时,实现快速恢复、降低业务损失的关键。云上网络规划设计 为...

重保应急原则

重保封网期间对政务云平台的变更有严格要求:紧急度较高的线上故障处理一般遵循服务团队的用户通知流程;常规紧急变更需提前申请,待评估审批才能实施变更,保障政务云平台及云产品的稳定性。此外,政务云提供重保服务时,会组建重保团队...

故障管理

故障管理 故障管理是单独针对故障的一整套完成的应急相应流程机制,包括:故障应急故障收敛、故障追踪、故障复盘、故障改进等核心功能。通过建立故障应急机制,可保证服务稳定运行、服务体验保证等。故障管理也可以理解为重大事件的升级...

无法ping通ECS实例公网IP的排查方法

相关文档 无法连接Linux实例的排查方法 无法远程连接Windows实例的排查方法 无法访问ECS实例中的服务的排查方法 Windows系统的ECS实例ping外网地址提示“一般故障”错误怎么办?为什么Windows系统的ECS实例配置辅助私网IP,无法从ECS实例...

Windows系统ECS实例激活失败

查看IP安全策略,详情请参见 服务器ping外网提示一般故障处理方法 中查看是否设置了 IP 安全策略章节。查看是否有其它安全软件对kms.cloud.aliyuncs.com的1688 TCP端口的访问做了拦截。执行 route print 命令查看服务器内部的路由是否正常...

ECS实例使用的Windows系统激活失败如何解决?

查看IP安全策略,请参见 服务器ping外网提示一般故障处理方法 中 查看是否设置了IP安全策略 章节。查看是否有其他安全软件对kms.cloud.aliyuncs.com的1688 TCP端口的访问做了拦截。执行 route print 命令查看服务器内部的路由是否正常,...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

远程桌面无法连接到Windows实例的快速排查方法

在实例中使用ping命令测试与客户端的连通性,提示“一般故障”的错误,请参见 Windows实例ping外网地址提示“一般故障”进行解决。步骤六:检查CPU负载、带宽及内存使用情况 确认是否存在CPU负载过高的情况,如果存在,则参考本步骤解决...

安全响应

应急响应通常是安全事件发生,或正在发生过程中,采用的一系列延缓攻击或阻断攻击的流程、手段和方法。应急响应也包含前、中、三个节点。通常情况下我们将应急响应的阶段划分如下:应急响应前:应制定应急响应事件的分类分级、预案、...

如何在SLES for SAP高可用环境下不停机修改SBD设备的...

问题描述 阿里云上SAP用户系统的核心应用(如SAP S/4HANA、SAP PO、SAP HANA等)主要是通过操作系统的高可用组件(如SUSE HAE、RHEL HA、Microsoft Windows Cluster等)实现SAP系统高可用架构,为业务连续性提供保障。SLES HAE是SUSE linux...

关键技术竞争力

基于混沌工程的红蓝攻防能力 TRaaS 基于混沌工程、建立演练机制,提供故障注入、演练编排体系能力,支持在不同环境、不同阶段,主动对业务系统进行故障注入,从而在主动观测单应用健壮性的同时,验证整个体系的故障发现能力、应急响应能力...

客户端离线排查

云安全中心控制台显示客户端离线时,表示该服务器已失去云安全中心的防护。此时,该服务器可能存在被黑客入侵的风险。建议您参考本文内容尽快排查离线原因,保障客户端在线。背景信息 云安全中心提供客户端问题一键排查功能,如果您发现...

套餐定价

Linux操作系统的套餐 说明 Linux操作系统的套餐是指当您选择Linux系统的应用镜像,或者CentOS、Debian及Ubuntu等基于Linux的系统镜像,可以选用的套餐配置。套餐配置 24元/月的套餐 34元/月的套餐 67元/月的套餐 133元/月的套餐 256元/月...

无法远程连接Windows实例的排查方法

在实例中使用ping命令测试与客户端的连通性,提示 一般故障 错误时,请参见 Windows实例ping外网地址提示“一般故障”进行解决。步骤九:检查CPU负载、带宽及内存使用情况 无法正常远程连接Windows实例时,可能是因为CPU负载、带宽不足或...

RDS SQL Server异地容灾

RDS SQL Server提供了异地容灾方案,可以将源实例的业务数据自动同步至容灾实例中,当源实例所在地域的RDS实例发生故障时,可手动切换系统到容灾地域的RDS实例上,从而保障业务的连续性和可用性。前提条件 已在地域A和地域B分别创建了RDS ...

保险行业解决方案与案例

需求背景 某保险公司(中国前三)核心及业务系统迁移是当前保险业机构最大规模的数据库国产化改造项目。该公司依托云计算技术和互联网技术构建了分层清晰的数字化平台,推动技术架构和技术标准的统一,实现系统间整合和内通外联,同时,...

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障的发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

跨地域容灾

生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障。准备工作 在实现跨地域容灾之前,您需要选择一个不同于生产环境的地域作为容灾目标地域...

可运维性咨询服务内容说明

评估系统是否具备故障演练和逃逸能力,并基于阿里巴巴多年业务的真实线上故障库的积累,通过模拟调用延迟、服务不可用、机器资源满载等,真实检验应用的高可用能力,同时考察相关人员对问题的应急能力,以及问题上报、处理流程是否合理,...

云上护航服务内容说明

1.服务概述 在客户业务推广、广告营销、版本更新、线上大促活动等期间,其网络系统压力爆发时,阿里云向客户提供相关技术保障服务,协助客户业务稳定度过峰值。2.服务范围 2.1云上护航服务范围 云上护航服务范围 包含:阿里云 服务与产品...

集群容量规划

存储容量评估 存储容量评估主要考虑以下几点:副本数量:默认建议副本为0,搜索引擎基于分布式共享存储,节点宕机,数据可以自动迁移到其它节点上提供服务,对于部分可靠性要求高的场景,可考虑设置副本数量为1。索引数据膨胀:数据一般...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...
共有123条 < 1 2 3 4 ... 123 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 OceanBase 版 数据库自治服务 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用