通用性能

系统指标 指标详细 维度 能力 说明 系统部署 Agent自动注册 按规模可选择Agent集群式入网,高可用执行分钟级故障切换 系统性能 自动化峰值调用性能:100/分钟 自动化任务下发 并发调用性能:100台设备并行配置 系统稳定 系统动态扩容能力:...

概述

系统稳定性是指系统在运行过程中面对各种非预期事件影响下能够持续提供可靠服务的能力,是系统建设的重中之重。但随着各公司业务范围的扩展和软件系统架构持续迭代升级,系统的复杂度随之增加,面对更多的非预期事件风险,如各类软硬件故障...

文件引擎版本说明

版本说明 小版本号 类型 说明 4.4.10 功能优化 优化系统稳定性。4.3.4 新特性 支持纠删码功能正式版本。功能优化 优化系统稳定性和容量型存储性能优化。4.2.4 新特性 支持纠删码预览版本。功能优化 优化系统稳定性。3.11.16 功能优化 优化...

容量

合理的容量设计是确保系统稳定的基础。性能压测、容量规划、弹性伸缩这三方面是容量设计中的重点,也是保障业务稳定运行、提升用户体验和降低成本的关键。性能压测可以为容量规划提供参考依据,以确定系统稳定运行所需的资源规模和配置,...

自适应流控

系统规则:当关闭自适应流控,需要您手动设置系统规则。系统规则从整体维度对应用入口流量进行控制,结合应用的负载、CPU使用率、总体平均RT、入口QPS和并发线程数等几个维度的监控指标,让系统的入口流量和系统的负载达到一个平衡,保证...

接入应用方式

接入容器服务Kubernetes版应用 对于部署在容器服务Kubernetes版中的Java应用,可以使用AHAS应用防护可以对其配置流控、降级和系统规则来保证系统稳定性。接入SAE应用 对于在Serverless应用引擎SAE平台上部署的应用,可以使用AHAS应用防护对...

什么是应用防护

AHAS应用防护以流量为切入点,从流量控制、熔断降级、系统负载保护等多个维度来保障业务的稳定性,提供更专业稳定的流量防护手段、秒级的流量水位分布分析功能,是阿里巴巴双十一技术体系中的核心组件,同时也是开源框架Sentinel的商业化...

元数据仓库共享模型概述

元仓共享模型是基于Dataphin内部的系统元数据表,通过任务加工生成的可以被稳定、标准化访问的开放元数据表,可降低对系统元数据表的依赖,提升系统稳定性。基于开放的元数据信息,您可以结合业务场景进行二次开发,以更好地满足对下游业务...

弱依赖降级

对于弱依赖不稳定时,需要配置降级规则来保护系统稳定性。背景信息 在实际业务中,应用通常会调用依赖方(远程服务、数据库、第三方 API 等)来完成服务。例如,支付的时候需要远程调用银联提供的 API。然而依赖方的稳定性是不能保证的。若...

弱依赖降级

为弱依赖配置降级原则可保证系统稳定性。背景信息 在实际业务中,应用通常会调用依赖方(远程服务、数据库、第三方API等)来完成服务。例如,支付时需要远程调用银联提供的API。然而依赖方的稳定性是不可控的,若依赖方出现不稳定的情况,...

特性与优势

持续增强系统稳定性,在宕机数据统计结果中,相比其他操作系统减少约50%的宕机率。优势 与其他Linux系统相比,Alibaba Cloud Linux具有以下优势:阿里云官方为Alibaba Cloud Linux提供免费的软件维护和技术支持。各版本生命周期请参见 ...

强依赖隔离

对于强依赖,需要配置隔离原则来保护系统稳定性。功能原理 当强依赖出现不稳定的时候,可以通过配置并发线程数隔离原则来限制不稳定的强依赖并发数,隔离强依赖。配置并发线程数隔离原则后,无需再进行线程池隔离,AHAS会控制资源的线程数...

强弱依赖治理概述

强弱依赖治理就是通过科学的手段持续稳定地得到应用间依赖关系、流量、强弱等数据,提前发现因为依赖问题可能导致的故障,避免依赖故障影响用户体验,积累数据持续推进系统稳定性提升。什么是强弱依赖?异常发生时,不影响核心业务流程,不...

交付模式

客户可以根据系统性能指标灵活选配配置资源,保障系统稳定运行。私有化部署可以与客户自有业务系统进行深度整合,更加灵活、易用、可控。如果您有购买需求,请联系阿里云客户经理。公有云共享模式 公有云共享模式是指阿里云决策引擎部署在...

测试指标

稳定性指标 定义及解释 最短稳定时间:系统按照最大容量的80%或标准压力(系统的预期日常压力)情况下运行,能够稳定运行的最短时间。一般来说,对于正常工作日(8小时)运行的系统,至少应该能保证系统稳定运行8小时以上。对于7×24运行...

慢SQL治理

慢SQL影响系统稳定性。针对慢SQL,MSE数据库治理提供了SQL级别的洞察与防护,您可以根据SQL洞察能力为慢SQL配置流控降级规则保障系统稳定性。本文介绍针对慢SQL如何设置SQL流量控制与保护。背景信息 系统中出现慢SQL可能会导致CPU、负载...

极氪汽车云成本精细化治理实践

团队面临集群环境配置不一致,发布脚本缺乏标准,应用发布上线变得越来越困难,线上系统稳定性风险极大增加。应用工作负载难以预估,缺乏数据可见性 Kubernetes为容器资源管理提供了资源请求(Request)的语义描述。容器的Request一般基于...

保险行业解决方案与案例

有效控制实施风险,该保险公司数据中心、研发中心与阿里云 PolarDB PostgreSQL版(兼容Oracle)团队共同制定了详实的迁移规划,针对核心系统制定了“主备库”的方案,利用DTS迁移工具实现数据实时回流到原有生产库备库,待系统稳定运行一段...

UpdateOsVersion

ProjectId String 是 P0VFCREU 项目ID ReleaseNote String 是 改用UI用户体验,提升系统稳定性 版本发布说明,客户端展示升级说明。RomList String 是 10|0|http://www.oss-server.com/file0.zip,11|123|...

概述

慢SQL是比较致命的影响系统稳定性的因素之一。系统中出现慢SQL可能会导致CPU、负载异常和系统资源耗尽等情况。严重的慢SQL发生后可能会拖垮整个数据库,对线上业务产生阻断性的风险,对于线上常见的慢SQL问题,MSE服务治理提供了场景化的...

在线影院:SAE助力南瓜电影应用极速上云

业务稳定性:通过SAE完善的监控告警系统和自动化运维能力,运维人员能够及时发现系统的瓶颈并优化,在业务高峰期也能够配合自动弹缩保证系统稳定运行。使用效果 扩容更快 无需考虑实例高峰期不足、低谷期浪费,SAE会按照最优化自动伸缩...

控制台首页

运维监控场景:快速定位解决异常 为用户提供阿里云平台级的稳定性监控和资源级别的运维监控,提升日常运维排查问题的效率:系统稳定性:通过云监控等事件指标反映用户在阿里云上搭建的业务系统稳定性,主要反映云产品资源对业务稳定性的...

V3.2.36版本升级通知

出于对堡垒机系统稳定性及安全性的考虑,过载保护进程优化后,超出资产配额并发数的会话访问将无法连接。关于堡垒机资产并发数说明,请参见 计费方式。升级中的堡垒机实例会处于 变配中 的状态,升级时间预计为20min左右,升级过程可能会...

概述

不改造业务报文格式,尽量保持云上业务系统稳定,实现低成本,快速迁移设备到物联网平台,减少企业基础设施成本。方案中,企业IoT设备迁移上云有三个核心变更点:设备端进行OTA升级,修改接入域名为物联网平台的接入点。配置规则引擎,把...

什么是云消息队列 RocketMQ 版?

高性能 可提供单实例集群最高100万TPS稳定消息收发的能力,无需担心大促等峰值流量场景的系统稳定性。安全可靠 同城冗余:服务端多可用区高可用,数据采用三副本存储。当某个可用区不可用时,仍然能够保障服务的正常访问。数据复制:支持跨...

Alibaba Cloud Linux 2 EOL延保支持计划

Alibaba Cloud Linux 2作为Alibaba Cloud Linux的第一个版本,自2019年03月上线以来,一直致力于为用户提供更稳定、性能更好、更可控的操作系统,为阿里云大量用户提供服务。Alibaba Cloud Linux 2将于2024年03月31日结束生命周期,届时将...

可运维性咨询服务内容说明

4.4稳定性评估 乙方专家团队通过对甲方应用系统和云平台的调研,评估系统稳定性现状,并基于阿里云SRE丰富的风险库和最佳实践,提前识别修复在架构和资源层面存在的不稳定因素,提高系统健壮性!4.5可弹性评估 乙方专家团队通过对甲方应用...

医疗检验:SAE携手谱尼测试稳步上云共同抗疫

疫情对谱尼测试的系统稳定性、高可用性等方面带来了考验。本文介绍SAE助力普尼测试稳步上云并共同抗疫的成功案例。背景信息 谱尼测试集团创立于2002年,现已发展成为拥有逾6000余名员工,由近30个大型实验基地及近100家全资子、分公司组成...

ECS实例操作系统内部(GuestOS)常见问题与修复方案

性能问题 CPU使用率是否过高 如果CPU持续保持高使用率,则会对系统稳定性和业务运行造成影响。具体操作,请参见 Windows实例中CPU使用率较高问题的排查及解决方法。检查Windows操作系统的版本 微软已经于2020年01月14日停止对Windows ...

容量规划

容量规划是指根据业务需求和系统性能,包括用户量、数据量、并发量等指标,合理规划和配置系统集群资源,以满足系统扩展、用户...各个基础产品能力可以灵活组合和拆分,根据业务需求进行容量规划和资源分配,以实现系统稳定和高承载的能力。

变更管理

变更管理是任何系统稳定运行的重要环节之一。它需要具备以下特质或能力:标准的变更管理流程:变更管理流程是变更管理最佳实践的第一步。该流程应该包括变更发起、变更审批、变更实施和变更验证等环节。在引入变更管理流程时,需要确保流程...

GISV上云服务内容说明

对云上系统进行监控,确保系统稳定性及安全性 A/S/C/I S/R/I SAP B1上云服务 迁移实施阶段 系统迁移上云及部署 完成SAP B1系统的整体上云实施过程,实现业务平滑上云 A/S/C/I R/I 方案验证 对云上系统进行监控,确保系统稳定性及安全性 A/S...

功能与优势

大幅提高系统稳定性,减少运维工作量,降低调优的难度。精细化资源管理,大幅度降低成本。提供原厂高可用服务保障。通过钉钉、邮件、短信、电话等途径进行及时告警,并可对接企业内部统一监控告警系统(Prometheus)。问题分析与诊断 动态...

概述

Redis应用最佳实践 检测云数据库Redis的实例规格是否满足要求,检测审计日志开启、公网及白名单设置、多可用容灾能力、实例续费及到期、变更管理等是否存在风险,确保正确应用云数据库Redis版,保障系统稳定性和安全性。

应用场景

系统稳定性差,任何一个下游发生故障,将直接影响整个业务系统的可用性。为提升核心应用用户体验和稳定性,您可以通过DTS提供的数据订阅,将深耦合业务优化为通过实时消息通知实现的异步耦合,让核心业务逻辑更简单可靠,具体调整为:该...

管理集群

资源分配策略 专属集群资源调度的默认分配策略:均衡分配:最大化追求更稳定系统表现,优先从未分配资源或已分配资源较少的主机中分配资源。紧凑分配:最大化追求更充分的资源利用率,优先从创建时间较早且已分配资源较多的主机中分配...

设计原则

在分布式系统中,需要考虑的稳定性问题比较复杂,贯穿软件系统设计态、研发态、运维态、运行态,覆盖从IaaS、PaaS到上层SaaS系统,所有这些都可能会影响系统稳定性。为了确保系统能够持续稳定地工作,建议遵循以下设计原则。面向失败的...

DT-PID V2.1.0

减小积分时间常数使系统消除稳态误差能力增强,但过小的积分时间常数会使得积分作用过强,导致系统闭环稳定性下降。微分时间常数Td 微分具有相位超前作用,直接影响系统的动态响应超调量,即 影响系统稳定性余量;微分控制在比例控制或比例...

ECS系统事件概述

监控系统事件 为保障ECS实例上业务运行的稳定性以及实现自动化运维,建议您设置事件通知来监听底层环境的变化。设置事件通知后,系统会推送消息到您设置的通知方式。通过云监控配置报警规则,推送事件通知,请参见 设置事件通知。通过钉钉...

操作系统迁移及升级

当操作系统因生命周期、第三方支持、开源计划演进等原因停止技术支持后,如果您的操作系统后续想得到维护和技术支持,需要将操作系统迁移或升级至稳定的软件版本。本文介绍如何通过ECS控制台迁移或升级操作系统。前提条件 确保阿里云账号...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
阿里邮箱 负载均衡 短信服务 弹性公网IP 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用