什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一环。这些消息服务之前并没有在系统中实际经历过真实流量考验,其中某些隐患或缺陷很难被发现...

监控分析平台对比

常见参数包括线程数、内存控制、translog设置、队列长度、各类操作的间隔interval、merge参数等。内存:通常JVM堆内存大小在32 GB以内,剩余的留给OS缓存使用,如果频繁GC会严重影响性能,甚至直接导致服务不可用。master节点内存占用和...

常见问题

本文汇总了 云数据库ClickHouse 的常见问题及解决方案。选型与购买 云数据库ClickHouse和官方版本对比多了哪些功能和特性?购买实例时,推荐选择哪一个版本?单双副本实例各有什么特点?购买链路资源时显示“当前区域资源不足”,应该如何...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

配置任务常见错误码及排查方法

本文介绍了用户在使用控制台或OpenAPI配置任务时系统返回的错误码、出现报错的场景及解决方法。用户配置使用类错误码 错误码 报错场景 原因及解决方法 DTS.Msg.LXCreateOrderError 购买DTS实例时创建订单不成功。原因:未将UID添加至白名单...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

使用组复制

组复制MySQL Group Replication(简称 MGR)是MySQL官方在已有的Binlog复制框架之上,基于Paxos协议实现的一种分布式复制形态,能够保障RPO=0。RDS MySQL集群系列实例支持组复制。本文介绍如何使复制方式为组复制。背景信息 使用了组复制的...

事件中心

事件模型 事件中心的一个事件主要由以下参数来定义:参数 是否必须 描述 source 是 事件来源 type 是 事件类型 level 是 事件等级 time 是 事件发生时间 data 是 事件体(一般为JSON格式)PID 否 Pod ID IP 否 IP地址 ClusterId 否 集群ID ...

历史功能发布记录(2021年)

2021年12月 功能名称 功能描述 发布地域 相关文档 分布式云容器平台 ACK One 上线 分布式云容器平台 ACK One(Alibaba Cloud Distributed Cloud Container Platform)是阿里云面向混合云、多集群、分布式计算、容灾等场景推出的企业级云...

常见问题

本文介绍 PolarDB PostgreSQL版 的常见问题和解答。基本问题 Q:什么是 PolarDB?A:PolarDB 是一个关系型数据库云服务,目前已在全球十多个地域(Region)的数据中心部署,向用户提供开箱即用的在线数据库服务。PolarDB 目前100%兼容...

设计方案

容错 容错是指在分布系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

Linux系统常用内核网络参数介绍与常见问题处理

本文介绍常见的Linux系统内核网络参数常见问题的解决方案。注意事项 在修改内核参数前,您需要注意以下几点:从实际需求出发,尽量有相关数据的支撑,不建议您随意调整内核参数。了解参数的具体作用,需注意不同类型或版本的环境中,内核...

GxP欧盟附录11标准合规包

他要求涵盖了计算机化系统的开发、验证、操作、维护和监测等方面,以确保这些系统符合相关法规和标准,用于生产、控制和保证产品质量和可靠性。Annex 11是GMP(Good Manufacturing Practice)的一部分,作为药品生产过程中的重要指导标准之...

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请...

创建操作系统迁移任务

导入迁移源信息后,SMC控制台会自动生成迁移源记录,您需要在控制台为迁移源创建操作系统迁移任务,并完成操作系统的迁移。说明 关于操作系统迁移的更多信息,请参见 操作系统迁移(Linux)和 操作系统迁移(Windows)。前提条件 已导入...

监控报警概述

无影云电脑(专业版)的监控报警功能可以全方面地监控云电脑的分布情况、云电脑资源使用情况、会话连接情况以及网络运行状况等,帮助您全盘了解资源健康状况,及时发现并解决问题,以保证业务顺畅运行。功能介绍 监控大盘展示云电脑相关的...

主从实例读写分离部署(共享存储)

数据状态保存在盘古分布式存储系统中,无需从计算节点迁移,计算节点轻量无状态,系统可以快速从故障中恢复。该方案为当前每个实例内部默认启用,当系统发生故障时,无需手工运维介入,系统可以自动恢复。在恢复期间,如果查询算子需要访问...

快速入门

操作视频 步骤一:创建文件系统 您可以通过 文件存储 HDFS 版 控制台创建文件系统或调用 CreateFileSystem 创建文件系统。登录 文件存储HDFS版控制台。在顶部菜单栏选择要创建文件系统实例的区域。例如 华东1(杭州)。在 概览 页面,单击 ...

网络资源

分布系统中,网络资源的主要作用是支持节点之间的通信和数据传输。网络资源需要支持安全的数据传输和通信协议,以保护分布系统的敏感数据和通信内容的机密性和完整性。网络资源还需要提供高带宽、低延迟和稳定的网络连接,以确保节点...

购买UEM

使用终端访问控制系统的功能之前,您需要先购买UEM。本文介绍如何购买UEM。操作步骤 登录 终端访问控制系统控制台。单击 立即开通,进入产品购买页面。在购买页面按需配置购买参数。可参考以下表格配置参数参数 说明 商品类型 选择您需要...

常见问题

RUN fsck MANUALLY.”的错误 访问实例异常时的问题排查和指引 避免无法启动Linux实例升级内核系统 Linux实例常用内核网络参数介绍与常见问题处理 如何使用Windows事件查看器查看实例运行日志 Windows Update补丁更新失败 如何通过工具自动...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

2022年

更新说明 在表级别设置Split Size参数控制并发度,当您发现资源比较充足且作业跑的比较慢的时候或者发现作业等待资源时间比较长且资源不足时,可以通过调整该参数,提升计算效率。SELECT语法 2022-07-07 聚合函数。更新说明 新增 BITWISE_...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

多台ECS实例批量挂载同一NAS文件系统

如果您的业务场景需要多台ECS实例共享同一NAS文件系统中的数据,您可以通过云助手仅执行一次操作,实现多台ECS实例批量挂载同一NAS文件系统。前提条件 已创建文件系统。具体操作,请参见 创建文件系统。网络环境 当您的业务的网络符合或...

源服务器迁移至轻量应用服务器

服务器迁移中心 支持将其他厂商轻量服务器(腾讯云轻量应用服务器、AWS Lightsail Instance和华为云云耀云服务器)迁移至阿里云 轻量应用服务器。本文介绍如何将其他...常见错误及修复方案的更多信息,请参见 常见问题 和 服务器迁移故障

源服务器迁移至轻量应用服务器

服务器迁移中心支持将其他厂商轻量服务器(腾讯云轻量应用服务器、AWS Lightsail Instance和华为云云耀云服务器)、IDC服务器、虚拟机和其他云平台的云主机迁移至阿里云...常见错误及修复方案的更多信息,请参见 常见问题 和 服务器迁移故障

实例启动异常常见错误与对应解决方案

针对实例启动过程中因操作系统内配置异常、异常关机等问题导致操作系统无法正常启动的情况,您可以通过VNC登录实例发现的启动异常或者实例健康诊断工具返回的异常字段,在本文查看此类问题的解决方案。Windows 1662001135:Windows系统因...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

开源ChaosBlade与商业化AHAS CHAOS故障演练对比

商业化AHAS CHAOS故障演练是阿里巴巴内部广泛使用的演练平台云上版本,具有灵活的流程编排、丰富的故障场景等特点,可以帮助企业提升分布系统的容错能力,保障在企业上云或往云原生系统迁移过程中业务的连续性。AHAS CHAOS故障演练在...

ZooKeeper的使用场景和MSE ZooKeeper的优势

分布式锁:在分布式环境中,程序都分布在独立的节点中,分布式锁是控制分布系统之间同步访问共享资源的一种方式,分布式锁主要有如下2种类型:排他锁(Exclusive Locks):又称为独占锁,利用ZooKeeper在一个具体路径下只能创建一个节点...

应用场景

故障恢复 通过ASM,可以轻松实现开箱即用的故障恢复功能:分布系统存在高度复杂性,在基础设施、应用逻辑、运维流程等环节都可能存在稳定性风险导致业务系统的失效。提供了基于Istio的混沌工程能力,包括如何使用连接池配置和异常检测...

围绕混沌工程的平台实践

以下是混沌工程官方定义:混沌工程是在分布系统上进行实验的学科,目的是建立对系统抵御生产环境中失控条件的能力以及信心。因此混沌工程是一门学科,它提供了基本的理论指导,而故障演练是混沌工程的具体实践,通过向目标系统注入真实...

挂载命令参数设置类问题

本文介绍挂载文件系统时,挂载命令参数常见问题。noresvport挂载参数 为什么要使用noresvport参数挂载NAS?如何检查并修改noresvport挂载参数问题?什么情况会引发网络切换或者后端服务的HA倒换?为什么需要重新挂载?还有没有其他的方案...

快速使用专属集群MyBase

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后再替换...

附录:SOFAStack 产品目录

SOFAStack 源于自蚂蚁内部沉淀十多年的金融级分布式中间件技术体系,吸收了支付宝自创立以来在关键金融交易系统锤炼出来的架构实践。SOFAStack 所有的产品技术均经过蚂蚁集团自身严苛的金融场景验证,为金融交易技术保证风险安全的同时,...

基本概念

分布式事务 distributed transaction,事务的发起者、资源及资源管理器和事务协调者分别位于不同的分布系统的不同节点之上。分支事务 action,一个分布式事务可能包含多个数据库本地事务,在分布式事务框架下,分支事务可能是一个分库上...

错误处理

阿里云风险控制系统禁止此操作。403 Forbidden User not authorized to operate on the specified APIs.Please check your permission.用户未被授权使用指定API进行操作,请检查账号的权限。400 StateConflict User operation is not valid...

计算资源

计算资源常指用于执行计算任务的软硬件资源,包括CPU、GPU、内存、操作系统和特定计算任务的软硬件环境等。计算资源的主要作用是执行各种计算任务,包括数据处理、算法运算、业务逻辑执行等。计算资源的性能和容量直接影响到系统的计算能力...

操作系统迁移(Windows)

微软目前已停止对Windows Server 2008 R2等操作系统提供技术支持,出于安全或业务需求的考虑,您需要将Windows Server 2008 R2及以上操作系统迁移到更高的版本。本文介绍如何通过SMC迁移Windows系统。前提条件 已完成迁移前准备工作。具体...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云消息队列 RocketMQ 版 文件存储 CPFS 云安全中心 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用