简介

使用 系统运维管理 SDK之前,您需要:了解并开通阿里云 系统运维管理,详情请参见 什么是系统运维管理。创建AccessKey。系统运维管理 支持以下主流语言的SDK包。语言 参考文档 Python 简介 Java 简介 Go 简介 C#简介 相关链接 阿里云开发者...

在批量执行命令中使用加密参数

通过 什么是系统运维管理 的参数仓库,可以更为方便的对参数进行集中管理。利用参数仓库的 加密参数,可以更安全的管理命令中的敏感信息。本文介绍如何在OOS批量执行命令时使用加密参数。前提条件 已开通密钥管理服务(KMS),请参见 什么...

系统运维管理概述

相关文档 什么是系统运维管理OOS 系统运维管理OOS入门概述 系统运维管理OOS弹性计算类(ECS)动作 通过OOS批量启动ECS实例实践 云助手概述 产品支持 如果您有相关需求或反馈,可以通过钉钉(钉钉通讯客户端下载地址)添加产品支持群联系...

强弱依赖治理概述

什么是强弱依赖?异常发生时,不影响核心业务流程,不影响系统可用性的依赖称作弱依赖,反之为强依赖。以商品详情页为例。商品详情页后台系统架构如下。如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候...

概述

系统稳定性是指系统在运行过程中面对各种非预期事件影响下能够持续提供可靠服务的能力,是系统建设的重中之重。但随着各公司业务范围的扩展和软件系统架构持续迭代升级,系统的复杂度随之增加,面对更多的非预期事件风险,如各类软硬件故障...

容量

合理的容量设计是确保系统稳定的基础。性能压测、容量规划、弹性伸缩这三方面是容量设计中的重点,也是保障业务稳定运行、提升用户体验和降低成本的关键。性能压测可以为容量规划提供参考依据,以确定系统稳定运行所需的资源规模和配置,...

变更管理

变更管理分为组织变更与变更支持:组织变更:确保组织中的变更顺利实施,并通过管理变更的人为方面来实现业务连续稳定运行的实践。变更支持:正确地评估变更风险、对变更进行合理授权、管理变更时间表,通过增加成功变更次数来实现业务的...

利用定时开关机节省成本

什么是OOS 系统运维管理 OOS(CloudOps Orchestration Service),简称OOS,是全面、免费的云上自动化运维平台,提供运维任务的管理和执行。典型使用场景包括:事件驱动运维,批量操作运维,定时运维任务,跨地域运维等,OOS为重要运维场景...

自动监控和响应ECS系统事件

什么是NPD、Draino和Autoscaler?NPD:Kubernetes社区的开源组件,可用于监控节点的健康状态、检测节点的故障,比如硬件故障、网络问题等。更多信息,请参见 NPD官方文档。Draino:Kubernetes中的一个控制器,可监视集群中的节点,并将异常...

性能优化与诊断简介

在RDS PostgreSQL日常运维中,您可以通过数据库自治服务DAS(Database Autonomy Service)来处理数据库故障、优化性能、提升效率、降低运维成本。DAS是一种基于机器学习和专家经验的云服务,实现数据库自...相关文档 什么是数据库自治服务DAS

概述

变更系统是指承载任何对线上生产环境变更操作的系统或工具。例如拥有控制台的白屏化系统/工具、压测/演练平台、黑屏脚本、开放出来的可触发变更操作的API、不以变更为主要功能和目标的平台/系统,如具备了对生产环境实施变更的功能,则相应...

快照概述

什么是数据库文件系统快照 数据库文件系统快照是某一时间点文件系统状态的备份文件,文件系统部署在云盘上,因此文件系统快照服务实际上基于云盘快照,对某个文件系统打快照相当于对该文件系统所部署的所有云盘同时打快照。文件系统第一份...

畅捷通借助EDAS实现的微服务治理能力提升之路

如何提升整体的微服务治理能力与监控能力,在频繁的版本迭代中确保系统稳定健壮,是畅捷通IT团队需要解决的重要课题。解决方案 经过与阿里云技术专家多轮深入的技术交流后,畅捷通IT团队决定将整个微服务架构逐步部署到阿里云提供的企业...

性能测试技术指南

操作系统平台:操作系统是哪种平台,进行工具监控。中间件:哪种中间件,进行工具监控和瓶颈定位。数据库:哪种数据库,进行工具监控和瓶颈定位。应用:启动多少个实例,启动参数是多少,进行问题查找和瓶颈定位。可以配合APM工具(如ARMS...

系统安全防御最佳实践

系统安全是业务安全稳定运行的重要因素之一,随着网络安全对抗的愈演愈烈,规模化的自动化攻击、蠕虫、勒索、挖矿、APT等攻击形式逐渐增多,给系统的安全运行带来了很大的挑战。本文介绍云防火墙如何防御系统入侵。默认安装的系统存在以下...

通用性能

系统指标 指标详细 维度 能力 说明 系统部署 Agent自动注册 按规模可选择Agent集群式入网,高可用执行分钟级故障切换 系统性能 自动化峰值调用性能:100/分钟 自动化任务下发 并发调用性能:100台设备并行配置 系统稳定 系统动态扩容能力:...

企业单AZ架构升级到多AZ

更多稳定性相关信息,请参见 为什么选择我们-稳定可靠 选择多AZ部署是为了确保服务的稳定性和业务连续性,在设计系统架构时,需要权衡成本和所需的可用性级别,因为多AZ部署通常与更高的成本相关,因此需要对您的业务连续性要求做好评估。...

什么要使用服务监管系统

所有服务类商品都会进入服务监管系统,服务监管系统是为了保障用户权益、监管服务商服务质量、以及服务进度的在线管理系统,同时系统会记录所有的服务操作日志作为处理用户与服务商双方纠纷依据。服务监管系统具有如下功能:明确用户需求 ...

PTS压测快速入门

更多信息,请参见 什么是性能测试PTS 和 什么是架构感知。线上管控阶段:在线上管控执行阶段,您需要管控系统的流量,控制各种业务逻辑,阿里云提供 流量防护 和 功能开关 平台帮助您管控线上业务。更多信息,请参见 什么是应用防护 和 ...

接入应用方式

接入容器服务Kubernetes版应用 对于部署在容器服务Kubernetes版中的Java应用,可以使用AHAS应用防护可以对其配置流控、降级和系统规则来保证系统稳定性。接入SAE应用 对于在Serverless应用引擎SAE平台上部署的应用,可以使用AHAS应用防护对...

JindoData概述

JindoFS存储系统是原JindoFS Block模式的全新升级版本。阿里云OSS-HDFS服务(JindoFS服务)是JindoFS存储系统在阿里云上的服务化部署形态,和阿里云OSS深度融合,开箱即用,无须在自建集群部署维护JindoFS,即免运维。OSS-HDFS服务的详细...

自适应流控

系统规则:当关闭自适应流控,需要您手动设置系统规则。系统规则从整体维度对应用入口流量进行控制,结合应用的负载、CPU使用率、总体平均RT、入口QPS和并发线程数等几个维度的监控指标,让系统的入口流量和系统的负载达到一个平衡,保证...

常见问题

产品简介FAQ 什么是文件存储NAS?文件存储NAS支持哪些访问协议?如何选择NFS和SMB文件系统协议?每个账户可以创建多少个文件系统、文件系统有什么限制?更多产品简介常见问题 产品定价FAQ 开通NAS服务后,就开始计费吗?购买了存储包为什么...

内存诊断

伙伴系统 伙伴系统是Linux内核用来管理物理内存页的一种算法,它管理起来的内存分为了不同的组,总共11组,每个组中的内存块大小都是一样的,都是2的幂次方个物理页,一个内存页一般是4 KB,所以大小一般是4 KB、8 KB、16 KB、32 KB……4 ...

特性与优势

持续增强系统稳定性,在宕机数据统计结果中,相比其他操作系统减少约50%的宕机率。优势 与其他Linux系统相比,Alibaba Cloud Linux具有以下优势:阿里云官方为Alibaba Cloud Linux提供免费的软件维护和技术支持。各版本生命周期请参见 ...

如何解决实例迁移后的宕机问题?

可能有以下原因:Linux系统未安装配置virtio驱动 Windows ISO阶段驱动安装失败 Windows系统注册表损坏 Windows安装有360软件等安全软件限制 解决方案 安装virtio驱动 如果检查Linux系统是内核损坏,请下载安装官方内核再次尝试 Windows请...

保险行业

新开保险公司关键系统是业务系统和财务系统,阿里金融云上有大量的部署参考案例。架构优势:提供开业系统架构参考 按需规划网络、部署方案 确定云计算的使用范围 规划安全体系 技术架构 架构说明:全系统的安全机制:通过前端的安全机制,...

Windows系统挂载SMB协议文件系统

背景信息 默认情况下,一般挂载文件系统是以登录系统的用户身份执行的。在Windows操作系统中,系统服务(Services)、计划任务(Scheduled Tasks)以及很多系统调用都是以SYSTEM系统账号进行操作。如果需要以SYSTEM身份进行挂载,请参见 以...

产品价值

高枕无忧 分布式技术架构确保了整体系统稳定性达到 100%。降低 Capex/OPEX 采购成本、运维成本同比降低 50%以上。扩容方便 像自来水一样按需线性扩容,无需考虑 License 等因素。提高交付速度 业务先行,即插即用,极速交付。(一分钟网络...

慢SQL治理

慢SQL影响系统稳定性。针对慢SQL,MSE数据库治理提供了SQL级别的洞察与防护,您可以根据SQL洞察能力为慢SQL配置流控降级规则保障系统稳定性。本文介绍针对慢SQL如何设置SQL流量控制与保护。背景信息 系统中出现慢SQL可能会导致CPU、负载...

极氪汽车云成本精细化治理实践

团队面临集群环境配置不一致,发布脚本缺乏标准,应用发布上线变得越来越困难,线上系统稳定性风险极大增加。应用工作负载难以预估,缺乏数据可见性 Kubernetes为容器资源管理提供了资源请求(Request)的语义描述。容器的Request一般基于...

版本选型

热点参数防护 为应用配置热点规则后,MSE将分析统计参数,即资源调用过程中的调用次数较高的参数,并根据配置的热点规则对包含热点参数的资源调用进行限流,保护系统稳定性。熔断 熔断规则可以监控应用内部或者下游依赖的响应时间或异常...

修复实例操作系统无法启动问题的操作指南

云盘读写 系统盘:不支持 修复盘系统是从特定虚拟存储设备启动的系统,对于修复盘系统本身,所有的修改操作只会暂存于内存中,只在当次运行过程中有效,重启修复盘系统后就会清空并失效。数据盘:支持 创建快照 系统盘:不支持 数据盘:...

支持渠道

运维与管理:针对云上系统稳定高效运行、应对业务高峰的需求,提供面向各类云产品的架构检查、护航等运维管理服务。优化与提升:针对应用系统架构、数据库等优化、改造和升级需求,指导或协助完成方案落地。阿里云根据您的需要,为您提供...

创建事件运维任务

系统事件 代表了云产品资源状态的变更,比如ECS实例发生了异常重启、ECS实例被释放、快照创建完成、将要执行运维等等。系统运维管理 支持创建事件运维任务,在系统事件发生时,执行指定的模板,进行事件运维。事件运维任务会一直执行并监听...

调整Linux实例中limits系统参数的方法

概述 Linux系统的/etc/security/limits.conf 配置文件可以对系统资源进行限制,该配置文件用于限制用户可以使用的文件数、线程和内存等资源使用量,从而提高系统稳定性。该配置文件中的 nofile 参数为系统中所有用户打开文件数的最大值,/...

产品优势

完备的鉴权和审计 您可以继续使用熟悉的资源访问管理和用户权限管理系统(RAM)来管理OOS,无论是 系统运维管理 OOS(CloudOps Orchestration Service)自身的操作,还是通过 系统运维管理 OOS(CloudOps Orchestration Service)执行的对...

应用防护规则常见问题

系统保护规则可以从系统指标维度(入口QPS、RT、线程数、Load等)来进行流量控制,让系统尽可能跑在最大吞吐量水位的同时保证系统整体的稳定性。系统保护规则是整体维度的而不是资源维度的,并且仅对入口流量生效。入口流量指的是进入应用...

helloworld简单示例

其完成的主要功能包括:系统板级初始化 内核基础组件初始化 application_start用户入口 串口打印输出 循环睡眠打印该示例的运行依赖下述基本功能完成对接:uart串口 内核的任务和中断运行正常 系统tick定时器正常运行即helloworld_demo这个...

Helm版本说明

优化CPU、内存资源使用与系统稳定性。2022年05月 此次升级不会对业务造成影响。v1.1.4 node-exporter安全加固。gpu-exporter修复挂载卷问题。2022年04月 此次升级不会对业务造成影响。v1.1.3 兼容1.22版本集群。2022年02月 此次升级不会对...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
阿里邮箱 负载均衡 短信服务 弹性公网IP 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用