同城容灾架构概述

基本原理 同城容灾是在相隔较远的两地(同城)建立两套功能相同的IT系统,当一处系统因意外(火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。对于中大型企业来说,如果希望业务系统具备同城容...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

Linux系统的ECS实例运行卡顿,在/var/log/messages...

本文介绍Linux系统的ECS实例运行卡顿,在/var/log/messages 日志中出现类似“INFO:task jbd2/vda1-8:366 blocked for more than 120 seconds”错误的问题原因和解决方案。问题现象 Linux系统的ECS实例出现运行卡顿、系统响应变慢、某些进程...

WLAN有哪些干扰源

2.4GHz ISM(Industry Science Medicine)是全世界公开通用使用的无线频段,开发的产品具有全球通用性,各种无线产品均可使用此频段,微波炉、无绳电话蓝牙设备等均会对WLAN 网络产生频率干扰。其中对WLAN 干扰最为严重的设备是2.4GHz 的...

标准版-双副本

阿里云自研 故障探测切换系统(HA)阿里云Redis服务封装HA切换系统,实时探测主节点的异常情况,可以有效解决磁盘IO故障,CPU故障等问题导致的服务异常,及时进行主从切换,从而保证服务高可用。主从复制机制 阿里云针对Redis主从复制机制...

权限及隐私说明

隐私保护 为了保护用户的隐私,需要在用户拨打电话或者接听电话时停止麦克风和摄像头数据的发送,此时需要用 READ_PHONE_STATE 权限去监听系统的来电和去电广播。如果用户没有授予该权限也不影响视频通话功能的使用,但是,在未授予此权限...

标准架构

阿里云自研 故障探测切换系统(HA)阿里云 Tair 服务封装HA切换系统,实时探测主节点的异常情况,可以有效解决磁盘IO故障,CPU故障等问题导致的服务异常,及时进行主从切换,从而保证服务高可用。主从复制机制 阿里云针对 Tair 主从复制...

智能边缘一体机产品介绍

一、产品概要 边缘应用是指部署在用户现场的应用,常见于一些用户对数据处理实时性、安全性和运行可靠性要求比较高的场景下。如门禁系统、楼宇自动化BA系统、视频算法应用等。EdgeBox是一种现场应用部署模式的变革,通过Kubernetes技术,将...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

通用性能

系统指标 指标详细 维度 能力 说明 系统部署 Agent自动注册 按规模可选择Agent集群式入网,高可用执行分钟级故障切换 系统性能 自动化峰值调用性能:100/分钟 自动化任务下发 并发调用性能:100台设备并行配置 系统稳定 系统动态扩容能力:...

什么是容器报警演练

容器演练是针对Kubernetes集群定制的故障演练,可以对Kubernetes集群中至关重要的高可用特性进行验证。目前AHAS仅支持容器演练中的报警演练。本文主要介绍容器演练中的报警演练功能。报警演练功能概述 Kubernetes集群的自动报警功能是保障...

应用场景

主节点对外提供服务,当主节点出现故障系统自动切换备用节点接管服务,整个切换过程对用户全部透明。电商行业应用 电商行业通过Redis实现商品秒杀、购物推荐等功能。场景一:秒杀类购物系统 大型促销秒杀系统系统整体访问压力非常大,...

ECS系统事件概述

系统事件由阿里云定义,用于记录和通知云资源的信息,例如运维任务执行情况、资源是否出现异常、资源状态变化等。说明 阿里云有众多产品支持系统事件,例如ECS、RDS、SLB等。本文仅说明云服务器ECS支持的系统事件,如需了解其他产品的系统...

第三方蓝牙通信插件适配指南

由于各家蓝牙应用层协议千差万别,为了将不同的蓝牙应用层协议接入到统一框架,势必需要有一个适配层来抹平各个协议的差异。如阿里巴巴IoT就定义了一套应用层的通信协议:Breeze。背景信息 通常,各家的蓝牙应用层协议都会定义如下功能。...

多台ECS实例批量挂载同一NAS文件系统

如果您的业务场景需要多台ECS实例共享同一NAS文件系统中的数据,您可以通过云助手仅执行一次操作,实现多台ECS实例批量挂载同一NAS文件系统。前提条件 已创建文件系统。具体操作,请参见 创建文件系统。网络环境 当您的业务的网络符合或...

产品优势

主要优势 多监控系统集成:支持10+常见监控系统集成,简单配置即可快速完成对接;灵活的报警降噪能力:支持横向抑制、纵向收敛,全面压制报警风暴,不再遗漏核心报警;大幅降低事务性操作:完善的事件分派、通知机制,避免重复事务性操作,...

设备端开发

为提升您基于新开发的Combo设备(同时支持Wi-Fi和BLE)硬件平台移植生活物联网平台SDK提供的蓝牙辅助Wi-Fi配网功能的效率,本文档将选择一款硬件开发板,进行实际的移植示例,将整个功能移植、应用开发、功能调试等过程串联起来供您参考。...

主备方案介绍

灾备方案 说明 单可用区高可用方案 主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统监控主备节点的健康状态并自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案 主备节点...

EasyCkpt:AI大模型高性能状态保存恢复

在训练过程中,可能会遇到硬件故障系统问题、连接错误、以及其他未知的问题。这种频繁中断导致的训练进度的损失对于耗时又耗资源的大模型训练来说是难以承受的。尽管可以通过做Checkpoint来保存和恢复进度,但Checkpoint本身的耗时与模型...

操作系统迁移(Windows)

微软目前已停止对Windows Server 2008 R2等操作系统提供技术支持,出于安全或业务需求的考虑,您需要将Windows Server 2008 R2及以上操作系统迁移到更高的版本。本文介绍如何通过SMC迁移Windows系统。前提条件 已完成迁移前准备工作。具体...

Windows实例中数据恢复

本文介绍了Windows系统常见的数据盘分区丢失的问题以及对应的处理方法,同时提供了使用云盘的常见误区以及最佳实践,避免可能的数据丢失风险。前提条件 已注册阿里云账号。如还未注册,请先完成 账号注册。在修复数据前,您必须先对丢失...

应用场景

简单易用:最终用户可以在任何本地设备上通过⽆影客户端访问各类专业设计应⽤,无需担心应⽤和系统的适配以及故障问题。性能强劲:提供了多个高性能的GPU实例规格,可以⽀撑不同类型的设计类应⽤运⾏负载。企业办公数据安全 场景痛点 企业...

应用场景

简单易用:最终用户可以在任何本地设备上通过⽆影客户端访问各类专业设计应⽤,无需担心应⽤和系统的适配以及故障问题。性能强劲:提供了多个高性能的GPU实例规格,可以⽀撑不同类型的设计类应⽤运⾏负载。企业办公数据安全 场景痛点 企业...

NVMe协议介绍

集群文件系统 在多重挂载的场景下,要保证多个挂载节点看到相同数据的文件系统,集群文件系统能确保写入的数据、创建的文件、修改的元数据能够实时同步到所有挂载节点,从而在文件系统层保证数据的一致性。传统的ext3、ext4通常会缓存数据...

常见问题

本文汇总了 PolarDB 集群访问相关的常见问题。Q:如果应用程序使用 PolarDB 公网地址连接数据库,产生的流量需要收费吗?A:阿里云不会对 PolarDB 公网地址产生的流量进行收费。Q:一个集群最多允许创建多少个单节点集群地址?A:一个集群...

常见问题

本文汇总了 PolarDB 数据库代理相关的常见问题。读写分离 Q:为什么刚插入的语句,立即查的时候查不到?A:读写分离的架构下,主节点和只读节点之间复制会有延迟,但 PolarDB 支持会话一致性,即同一个会话内保证能读到之前的更新,详情请...

故障排查

本文介绍阿里云容器服务ACK集群在使用过程中常见问题的故障分析和排查流程。ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes...

GTM实现跨网访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

Windows操作系统云虚拟主机耗资源(客户程序故障)...

本文主要介绍Windows操作系统云虚拟主机耗资源(客户程序故障)问题的原因分析及处理意见。调用Access程序问题(最常见)原因:Access数据库大小超过30M,频繁调用时耗用系统资源。解决方法:将数据库大小压缩到30M以内,或者升级到SQL ...

事件分析概述

微服务领域:微服务在现代开发架构中比较常见,该架构由小型、松耦合、可独立部署的服务集合而成,这导致微服务架构很难调试,系统中某一部分的小故障可能会导致大规模服务崩溃。很多时候不得不跳过某些正常服务来调试单个请求。事件总线...

什么是数据库备份DBS

常见问题和故障处理 使用DBS时遇到的各类问题,例如需要修改备份源数据库、数据库恢复失败、如何备份RDS只读实例等,您可以在 常见问题 或 常见报错 内查找,可以解决您的绝大部分问题。说明 若在文档中未找到您遇到的异常或报错,或按照...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

HDFS Web UI介绍

本文为您介绍如何访问HDFS Web界面,包括获取NameNode服务地址、浏览NameNode UI首页,并提供有关启动NameNode UI的相关说明。访问HDFS Web UI 您可以...相关文档 如果在使用HDFS过程中遇到任何问题或故障,详情请参见 常见问题和故障诊断。

部署数据库

Oracle是一个多用户系统,能够自动从批处理或在线环境的系统故障中恢复运行。系统提供了一个完整的软件开发工具Developer2000,包括交互式应用程序生成器、报表打印软件、字处理软件以及集中式数据字典,用户可以利用这些工具生成自己的...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

自动快照概述

应用场景 使用自动快照对运行关键应用的云盘进行定期数据备份,应对因误删、勒索病毒等造成的数据丢失或者应用系统故障,需要时能快速找回云盘数据以保证业务的连续性。注意事项 使用自动快照策略时,您需要注意以下事项:限制项 说明 自动...

网络资源

网络资源是流量入口和数据交互的基础设施,常见的网络资源风险点如下:网络带宽不足 指网络连接的带宽无法满足系统或应用程序的需求,导致网络传输速度慢,影响系统的响应和性能。针对网络资源带宽不足的情况:带宽监控预警:实时监控网络...

使用ASM构建分布式系统的容错能力

分布式系统存在高度复杂性的特点,在基础设施、应用逻辑、运维流程等环节都可能存在稳定性风险而导致业务系统的失效。因此构建一个具有容错能力的分布式系统非常重要。本文介绍如何通过ASM设置超时、重试、隔板和熔断机制构建分布式系统的...

使用ASM构建分布式系统的容错能力

分布式系统存在高度复杂性的特点,在基础设施、应用逻辑、运维流程等环节都可能存在稳定性风险而导致业务系统的失效。因此构建一个具有容错能力的分布式系统非常重要。本文介绍如何通过ASM设置超时、重试、隔板和熔断机制构建分布式系统的...

访问密钥(AccessKey)常见问题

本文为您介绍访问密钥(AccessKey)相关的一些常见问题。包括什么是AccessKey、如何查看AccessKey、AccessKey是否还在使用、AccessKey泄露后如何处理等。什么是AccessKey 访问密钥AccessKey(简称AK)是阿里云提供给阿里云用户的永久访问...
共有105条 < 1 2 3 4 ... 105 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用