读写访问文件类问题

解决方案(推荐)不同进程或不同客户端写入同一文件系统的不同文件,后续分析处理时再进行归并,这个方案能够很好地解决并发写入导致的问题,同时无需使用文件锁,不会对性能造成影响。对于并发追加写同一个文件(如日志)的场景,可以...

故障演练

故障演练是整体容灾流程极其重要的一环。本文介绍ECS容灾中故障演练的操作流程。故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体及其重要的一环,它的核心意义在于:方便地验证被容灾保护的...

车辆数据分析和价值挖掘

分析洞察的结果可以配置为自定义服务API,也可以直接被用户业务系统集成调用,用户只需关注业务开发,无需关注设备数据的存储、备份、分析和API开放等技术细节,大大加快了业务中物联网数据应用的开发。前提条件 数据分析动洞察前需要进行...

使用政务常用操作系统

阿里云电子政务云平台为您优选提供丰富的操作系统,除常用的Windows、Linux等操作系统外,政务云云市场为您提供 红旗 Linux、中标麒麟操作系统、Red Hat 等政务类业务常用操作系统。操作步骤 使用政务云平台专用的账号登录 ECS控制。说明...

故障演练

故障演练是整体容灾流程极其重要的一环。本文介绍ECS容灾中故障演练的操作流程。故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体及其重要的一环,它的核心意义在于:方便地验证被容灾保护的...

挂载访问FAQ

挂载失败分类 挂载失败可能原因 解决方案 ECS实例或云助手状态异常 ECS实例非运行状态 在ECS控制检查目标ECS实例状态并修复。云助手客户端未安装 请您安装云助手客户端。具体操作,请参见 Linux实例安装云助手Agent。挂载命令运行超时...

mPaaS应用与运维指导服务说明书

线上问题排查流程分享 常见线上问题解决方案分享 为甲乙双方约定的指定问题提供解决方案 服务范围不包含:基于阿里云产品上自建的第三方业务业务代运维/操作。第三方软件配置指导以及故障排查等。3.前提条件 客户开通和使用阿里云移动...

应用场景

Node.js 提供的精确到虚拟机级别的深度监控,能够如实的反应应用运行状态,通过配置报警规则,用户可以在发现系统出现故障(内存泄露或者 CPU 热点等)趋势时,通过诊断接口迅速定位故障点。Node.js 性能平台特别适合业务发展迅速、应用...

概述

在企业数字化转型过程,基于云计算平台服务,可以让企业快速构建新业务、减少业务故障率、持续观测业务指标、提升业务稳定性,使企业更加专注于业务本身。总体而言,主要包括以下几个关键领域:卓越运营第一个关键领域是确定组织的运营...

概述

通过技术手段干预变更的整个生命周期,在变更前进行准入检测,变更约束渐进式的执行过程,并通过宏观的观测手段验证变更的阶段结果,及时发现问题进行回滚止血,同时在变更后,通过影响面的拓扑提供变更数据的应用,辅助故障定位和问题...

同城容灾架构概述

对于大型企业来说,如果希望业务系统具备同城容灾的能力,推荐使用如下图所示的公共云同城容灾架构。架构说明:在同城不同可用区之间,对原有应用架构做一套完整的备份,SLB、ECS、RDS、Redis等均在两个机房同时部署。前端部署DNS解析,...

挂载文件系统失败故障排查

本文介绍云服务器ECS挂载NAS文件系统时,挂载失败的排查方法与解决方案。重要 在排查前,请确认挂载点状态为 可用 状态。如果挂载点状态为 休眠 状态,您需要通过控制或OpenAPI重新启用挂载点。更多信息,请参见 休眠挂载点。在排查前,...

ECS系统事件概述

状态变化事件包括了一些未在ECS控制台中展示的系统事件,例如实例运行状态变化、抢占式实例中断等,这些系统事件不支持直接在ECS控制台和通过OpenAPI响应。ECS中没有针对这些系统事件定义事件状态,但系统事件产生时仍然会上报至云监控,...

故障管理

及时发现,快速定位、快速恢复故障达到降低故障的影响面(1-5-10解决方案);确保改进措施有效落地、避免故障重复发生。通过建立一个规范可遵循、全流程闭环的故障管理体系,配合技术手段的提升,可以有效降低故障发生的几率,缩短故障的...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

故障复盘

故障复盘规范 故障复盘作为故障体系的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

业务开通

完成入驻 完成入驻流程 进入 渠道商工作 业务>业务管理>业务管理 界面,在 未生效业务 页签单击 继续入驻,系统跳转至 渠道业务-入驻向导 界面。核对 资金合同配置 所有合同与资金账号签约是否都已完成,并阅读 重要提醒 内容并勾选...

创建文件系统

避免创建文件系统后,由于操作系统版本或实例规格等问题导致在业务中无法使用CPFS文件系统。更多信息,请参见 客户端说明。CPFS智算版文件系统仅支持搭配PAI灵骏智算服务使用,不支持ECS实例访问。创建 CPFS文件系统 登录 NAS控制。在 ...

性能测试

TPS可以参照同行业系统和结合具体业务小企业TPS值为50~1000笔/秒,银行TPS值为1000~50000笔/秒,大型电商系统TPS值为30000~300000笔/秒。成功率:这个指标是衡量系统处于压力下,业务的成功率,一般业界成功率要大于99.6%。确定以上...

产品高可用

为了防止集群机器故障导致的会话中断,您可以在业务逻辑加入重试机制,降低对用户访问造成的影响。单CLB实例的高可用 为了向广大用户提供更稳定可靠的负载均衡服务,阿里云负载均衡已在大部分地域部署了多可用区以实现同地域下的跨...

名词解释

另一方面是在⼀个数据中心发⽣故障或灾难的情况下,其他数据中心可以正常运行并对关键业务或全部业务实现接管,实现用户的故障无感知。两地三中心 即生产数据中心、同城灾备中心、异地灾备中心建设方案。这种模式下,两个城市的三个数据...

应用场景

为提升核心应用用户体验和稳定性,您可以通过DTS提供的数据订阅,将深耦合业务优化为通过实时消息通知实现的异步耦合,让核心业务逻辑更简单可靠,具体调整为:该场景,买家下单系统只要完成下单操作,就直接返回,底层通过DTS的数据订阅...

通用性能

系统指标 指标详细 维度 能力 说明 系统部署 Agent自动注册 按规模可选择Agent集群式入网,高可用执行分钟级故障切换 系统性能 自动化峰值调用性能:100/分钟 自动化任务下发 并发调用性能:100设备并行配置 系统稳定 系统动态扩容能力:...

公共云基础服务说明书

附录:第三方软件问题与说明 阿里云将尽最大努力为客户提供以下第三方软件在阿里云ECS服务器/操作系统环境安装、配置和疑难排解的建议,确保其在阿里云ECS服务器/操作系统环境正常运行。阿里云售后团队向客户提供的关于第三方软件的...

什么是全球多活数据库集群

应用场景 异地容灾 当一个数据中心发生故障,只需做流量切换,其他数据中心即可正常运行并接管关键业务或全部业务。灾备资源充分利用 集群所有灾备节点均对外提供读写服务,避免造成服务器资源浪费。业务系统多地域部署 业务系统部署全球...

企业单AZ架构升级到多AZ

多可用区部署的常见应用:关键业务系统:对于需要高可用性和连续性的关键业务系统,如金融服务、医疗保健和电子商务平台,多AZ部署可以确保系统即使在一个数据中心发生故障的情况下也能继续运行。容灾要求高的场景:当组织需要符合特定的...

通用

而如何保障“各个业务模块完美隔离,但仍能保持高并发协同开发”,落地一套适合海尔集团的“移动中台技术选型迫在眉睫。解决方案 引入移动开发平台 mPaaS,各个业务模块实现独立开发、测试与发布。各业务模块的“资源、代码”等核心要素...

CLB访问日志功能简介

CLB访问日志优势 CLB访问日志有以下优势:简单 将开发、运维人员从日志处理的繁琐耗时解放出来,将更多的精力集中到业务开发和技术探索上。海量 CLB的访问日志数据规模通常很大,处理访问日志需要考虑性能和成本问题。日志服务相较于自建...

ENS通过SAG vCPE访问云上资源

登录ENS中业务系统实例。以管理员身份打开您电脑的命令行窗口。通过SSH方式登录您的业务系统实例。ssh root@112.XX.XX.27#通过业务系统实例公网IP地址进行登录,请您根据实际情况更换公网IP地址。yes#第一次通过SSH登录时请输入yes建立认证...

使用快照(公测)

在执行可能影响云电脑稳定性的关键操作之前,例如修改注册表、修改关键系统文件等,建议您提前创建快照,一旦出现系统故障,就可以使用快照恢复数据。本文介绍如何使用快照。背景信息 快照是某一时间点某一块云盘的数据状态文件,可用于...

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障的发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

运行并管理手动任务

手动业务流程发布至生产环境后您可以在该页面手动触发任务运行。支持您通过列表或DAG图方式,快速查看任务的详细信息并执行相关操作。说明 手动任务提交至调度系统后,不会自动运行,只有手动触发才会运行。详情请参见:创建手动任务。目前...

常见问题

code=exited”错误 启动SSH服务时出现“error while loading shared libraries”错误 ECS网络问题 Windows实例ping外网地址提示“一般故障”Linux系统的ECS没有禁ping却ping不通的解决方法 使用ping命令测试ECS实例时ping不通的排查方法 ...

客户案例

业务挑战 一致性,一致性是金融业务的生命线,为了应对硬件或者系统故障(IDC/OS/机器故障),传统的数据库在这方面为业务提供多种选择。最大可用模式在主库故障情况下可能造成数据丢失。最大保护模式会提高全年的不可用时间,并造成性能...

演练概述

基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务...当故障演练自动结束、您主动终止或者演练的任何环节出现异常后,系统都会进入恢复阶段,自动清除相应的故障,使故障演练对象恢复演练前的状态。

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

组件中心

中间件 分布式链路跟踪 一款实时监控并管理企业应用性能和故障的云服务,其提供数字化性能管理解决方案,帮助企业在分布式架构下快速发现并准确定位应用全生命周期的性能问题。任务调度 提供分布式任务调度框架,实现任务的分布式处理,并...

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

围绕混沌工程的平台实践

原则3在生产环境运行实验 混沌工程推荐故障演练是在生产环境进行,主要的原因有以下两点:系统的行为会根据环境和流量模式的变化,例如系统依赖的组件在测试环境和生产环境会有比较大的差异。系统的监控和人员的应急响应在测试环境和...

应用场景

故障演练 为不断提升产品高可用能力,通过高可用管理平台的故障演练模块,设计并规划演练计划和恢复方案,继而在演练过程不断发现、解决容灾预案存在的问题。以此,降低产品使用过程中故障发生概率,提高故障恢复效率,进而实现产品高...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 云服务器 ECS 轻量应用服务器 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用