资源伸缩和系统扩展

在云上架构设计过程中,需要考虑架构的可伸缩性和可扩展性,以实现高性能的云上架构。不同的应用部署方式需要使用不同的伸缩方案,常见的伸缩方案主要有以下几种:云服务自动扩缩 在阿里云上进行自动伸缩依赖的云服务是 弹性伸缩 ESS(Auto...

产品架构

采用集群部署模式极大地保证了异常情况下负载均衡服务的可用性、稳定性与可扩展性。四层专用集群内的每台机器都会将所有会话通过组播报文同步到该集群内的其他机器上。如下图所示,当客户端向服务端传输三个数据包后,在机器1上建立的会话A...

组件概述

ack-node-repairer 可选组件 ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。ags-metrics-collector 可选组件 为基因计算客户使用的监控服务组件,可以通过该组件监控基因工作...

概述

此外,表格存储提供全托管服务,使用表格存储您无需担心软硬件预置、配置、故障、集群扩展、安全等问题,可以极大地减少管理成本。大数据分析 如果您的业务采用MySQL数据库,随着业务的发展,大数据分析场景逐渐增多,而MySQL数据库进行大...

常见问题

运维便捷 使用 表格存储,您只需专注于业务研发,无需担心软硬件预置、配置、故障、集群扩展、安全等问题,在保证高服务可用性的同时,极大地减少了管理及运维成本。表格存储 是否有存储和扩展限制?表格存储 没有存储和扩展限制。表格存储...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

扩展程序概述

DataWorks通过OpenEvent能力为您提供消息推送订阅能力,同时您可以将服务程序注册为DataWorks的扩展程序,通过扩展程序来卡点并响应订阅的事件消息,以此实现通过扩展程序对特定事件进行消息通知与流程管控。本文为您介绍通过OpenEvent和...

开发部署扩展程序:自建服务方式

处理流程 通过自建服务开发和部署扩展程序,并通过OpenEvent和OpenAPI进行扩展程序与DataWorks的通信,实现自定义流程控制的操作如下:通过 OpenEvent 实现扩展消息订阅。OpenEvent 通过EventBridge提供部分事件的消息订阅,订阅后,您可...

什么是AI通信加速库DeepNCCL

DeepNCCL是为阿里云神龙异构产品开发的一种用于多GPU互联的AI通信加速库,在AI分布式训练或多卡推理任务中用于提升通信效率。本文主要介绍DeepNCCL的架构、优化原理和性能说明。产品简介 DeepNCCL基于NCCL(NVIDIA Collective ...

什么是Deepytorch Training(训练加速)

针对NVLink互连拓扑的通信优化,可以通过扩展单机内部不同的N-Trees拓扑结构组合,实现拓扑调优并充分发挥多通道性能。例如,在通信数据量超过128 MB的场景下,NVLink互连拓扑优化方案相比NCCL原生在性能上提升了20%以上。多机优化 多机...

MongoDB只读节点简介

为了扩展主从节点的读请求能力,云数据库MongoDB提供具备独立连接地址的只读节点,适合独立系统直连访问,以减轻大量读请求给主从节点造成的压力。在有大量读请求的应用场景下,数据库的主从节点可能难以承受读取压力,甚至对业务造成影响...

云数据库 OceanBase 版

OceanBase 是阿里巴巴和蚂蚁集团 100%自主研发的原生分布式关系数据库,在普通硬件上实现金融级高可用,在金融行业首创“三地五中心”城市级故障自动无损容灾新标准,同时具备在线水平扩展能力,创造了 6100万次/秒处理峰值的业内纪录,在...

负载均衡

负载均衡SLB(Server Load Balancer)是一种对流量进行按需分发的服务,通过将流量分发到不同的后端服务来扩展应用系统的服务吞吐能力,并且可以消除系统中的单点故障,提升应用系统的可用性。

网络类场景

排除端口 无需注入网络延迟调用故障的端口,与本地服务端口和远程服务端口功能互斥。可以指定多个,使用逗号分隔,使用连接符表示范围。例如80,8000-8080。远端服务IP 指定演练对象访问的远端服务IP。可以通过子网掩码来指定一个网段的IP...

云解析DNS

云解析DNS(Alibaba Cloud DNS)是一种安全、快速、稳定、可扩展的权威DNS服务,云解析DNS为企业和开发者将易于管理识别的域名转换为计算机用于互连通信的数字IP地址,从而将用户的访问路由到相应的网站或应用服务器。

配置设备级高可用

当主网关设备发生故障时,HA机制能够从备份的网关设备中选举一台设备成为新的主网关设备,用来承担数据流量,从而保障网络的可靠通信。动态HA功能无需配置虚IP地址,系统会主动帮您探测设备状态,在主网关设备故障时,自动帮您切换流量。...

安装ACCL库

ACCL(Alibaba Collective Communication Library)是一款高性能通信库,提供了AllReduce、AllToAllV、Broadcast等常用集合操作接口以及点到点Send/Recv接口,为多机多卡训练提供高效的通信支持。本文为您介绍如何安装ACCL库。背景信息 ...

运营商回执错误码

其他未能定位的故障 500 运营商错误 运营商侧未能定位的故障 400 网元繁忙 网元是通信网中关键的设备,通信网是按照容量规划建设的,容量不够表明当前某个关键设备的已经满负载 482 被叫号码不可用 检查被叫号码状态后重试 476 号码强制...

主备方案介绍

主备节点分别部署在同一地域下两个不同的可用区,当任一可用区因电力、网络等不可抗因素失去通信时,高可用HA系统将执行故障切换,确保整个节点的持续可用。您可以使用LTS数据通道服务完成主备节点之间实时增量数据双向同步,同时在LTS上...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统后,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

灾备方案

同城容灾方案★主备节点分别部署在同一地域下两个不同的可用区,当任一可用区因电力、网络等不可抗因素失去通信时,高可用HA系统将执行故障切换,确保整个实例的持续可用。跨地域容灾方案★由多个子实例构成全球分布式实例,所有子实例通过...

灾备方案介绍

同城容灾方案★主备节点分别部署在同一地域下两个不同的可用区,当任一可用区因电力、网络等不可抗因素失去通信时,高可用HA系统将执行故障切换,确保整个实例的持续可用。跨地域容灾方案★由多个子实例构成全球分布式实例,所有子实例通过...

音视频通信

音视频通信RTC(Real-Time Communication)是阿里云覆盖全球的实时音视频开发平台,提供高可用、高品质、超低延时的实时网络服务,适用于在线教育、互动娱乐、视频会议、保险定损、调度指挥等场景。使用阿里云RTC SDK,您可以在移动、Web、...

DescribeChannelOverallData-查询频道概览数据

123 Ext object 扩展数据。OverallData object 概览数据。ConnAvgTime float 平均通信连接的用时,单位:秒。0.5 FiveSecJoinRate float 5 秒内连通成功率,用小数表示,例如 1.0 表示连通成功率为 100%。0.91 TotalAudioStuckRate float ...

归档存储服务等级协议

故障恢复能力 阿里云为付费用户的云服务提供7×24小时的运行维护,并以在线工单和电话报障等方式提供技术支持,具备完善的故障监控、自动告警、快速定位、快速恢复等一系列故障应急响应机制。2.11.网络接入性能 阿里云归档存储对用户不限制...

范围类型

你可以使用 btree_gist 扩展来在纯标量数据类型上定义排除约束,然后把它和范围排除结合可以得到最大的灵活性。例如,安装 btree_gist 之后,只有会议室号码相等时,下列约束将拒绝重叠的范围:CREATE EXTENSION btree_gist;CREATE TABLE ...

运维事件中心

运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更...

运维事件中心的审计事件

GetRichText 查询字段的扩展信息。GetRouteRule 查询规则详情。GetService 查询服务详情。GetServiceGroup 查询服务组详情。GetServiceGroupPersonScheduling 查询某用户服务组排班。GetServiceGroupScheduling 查询服务组排班详情。...

实践教程概览

MPI(Message Passing Interface)是支持多编程语言的并行计算通信库,具有高性能、大规模性、可移植性、可扩展性等特点。本教程以IMB软件和MPI通信库为例介绍如何测试E-HPC集群的通信性能。测试SCC集群性能 超级计算集群SCC具有无虚拟化...

DescribeChannelOverallData

Ext Map 扩展数据。OverallData Object 概览数据。ConnAvgTime Float 0.10325 平均通信连接的用时,单位:秒。FiveSecJoinRate Float 1.0 5秒内连通成功率,用小数表示,例如1.0表示连通成功率为100%。TotalAudioStuckRate Float 0.02 整体...

控制面质量

最近几年,云原生概念越来越火,蚂蚁集团历来热衷于技术创新,积极在云原生领域实践 Service Mesh 理念,结合现有技术架构,将一些通用能力(通信/数据/安全等)抽离出来,沉淀出了 MOSN。同时,依托于 Istio 的能力,扩展出了 Service ...

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

产品系列概述

高可用系列 一主一备的高可用架构,支持自动故障切换。备节点不可访问。支持增加 只读实例 扩展读能力。大中型企业的生产数据库。互联网、物联网、零售电商、物流、游戏等行业的数据库。集群系列 一主多备的高可用架构,支持自动故障切换。...

产品系列概述

高可用系列 一主一备的高可用架构,支持自动故障切换。备节点不可访问。支持增加 只读实例 扩展读能力。大中型企业的生产数据库。互联网、物联网、零售电商、物流、游戏等行业的数据库。集群系列 一主多备的高可用架构,支持自动故障切换。...

产品系列概述

高可用系列 一主一备的高可用架构,支持自动故障切换。备节点不可访问。支持增加 只读实例 扩展读能力。大中型企业的生产数据库。互联网、物联网、零售电商、物流、游戏等行业的数据库。集群系列 一主多备的高可用架构,支持自动故障切换。...

产品系列概述

高可用系列 一主一备的高可用架构,支持自动故障切换。备节点不可访问。支持增加 只读实例 扩展读能力。大中型企业的生产数据库。互联网、物联网、零售电商、物流、游戏等行业的数据库。集群系列 一主多备的高可用架构,支持自动故障切换。...

核心特性

PolarDB-X 支持集中式和分布式一体化形态,具备金融级数据高可用、分布式水平扩展、HTAP混合负载、低成本存储和极致弹性等能力。PolarDB-X 坚定以兼容MySQL开源生态,从SQL语法、事务行为、生态工具等多个维度都做了深度兼容,应用无需或者...

MSE注册配置中心和自建注册配置中心对比

Replication algorithm limits scalability:受限于传统对等星型的广播同步复制模型,影响了集群规模横向扩展。高可用 多可用区打散部署容灾,节点故障自动检测,秒级恢复,SLA保障率高达99.95%,兼容Nacos多重数据保护策略。需自行探索和...

应用场景

通过微服务产品将传统金融业务系统拆分为模块化、标准化、松耦合、可插拔、可扩展的微服务架构,可缩短产品面世周期,快速上架,抢占市场先机,不仅可确保客户服务的效率,也降低了运营成本。传统应用微服务改造 通过微服务产品将传统金融...

应用场景

传统应用微服务改造 通过微服务产品将传统金融业务系统拆分为模块化、标准化、松耦合、可插拔、可扩展的微服务架构,可缩短产品面世周期,快速上架,抢占市场先机,不仅可确保客户服务的效率,也降低了运营成本。开发简单:提供高性能微...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 云数据库 Redis 版 对象存储 负载均衡 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用