在函数中配置官方公共

函数计算 提供了常用的公共层,您无需自定义层即可为您...s deploy 更多信息 您还可以通过API或SDK来管理层和配置层。您可以在以下API中配置层:CreateFunction-创建函数 UpdateFunction-更新函数 您可以通过 OpenAPI Explorer 调用API和SDK。

产品正式商业化发布

故障管理闭环:事件影响恶化,将升级为故障,故障管理形成闭环,持续提升业务连续性。云钉一体的运维协同:基于钉钉打通多端、多团队的协同,加速运维事件处理。产品适用场景 一站式运维事件管理:满足各类监控场景下报警统一事件化管理...

产品简介

什么是运维事件中心 运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能;一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应...

产品优势

本文档描述产品的主要使用优势。主要优势 多监控系统集成:支持10+常见监控系统集成,简单配置即可快速完成对接;灵活的报警降噪能力:支持横向抑制、...阿里巴巴故障管理最佳实践输出:帮助云上企业构建故障管理体系,持续提升业务连续性。

变更管理

运维事件中心是阿里云提供的云上变更管理服务,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更...

什么是消息演练

单个或多个模块都可能会有不同类型的故障发生,导致模块不能正常运行,例如Producer无法发送消息,这种场景叫做消息的演练场景。需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

创建自定义

可以为您提供公共依赖库、运行时环境及函数扩展等发布与部署能力。您可以将函数依赖的公共库提炼到或者...删除版本 单击目标名称,在详情页面的 版本管理 区域,单击目标版本 操作 列的 删除,在弹出的 确认 对话框中单击 删除。

运营阶段

通过前期的设计,到构建,服务进入日常运营环节。在这个阶段往往会产生大量的运营事件,比如日常的资源申请。企业在持续运营过程中也会产生或大或小的生产故障,需要做好线上故障管理,提升服务SLA。

创建自定义

删除版本 单击目标名称,在详情页面的 版本管理 区域,单击目标版本 操作 列的 删除,在弹出的 确认 对话框中单击 删除。相关文档 使用API创建和更新函数时可以通过 layers 参数配置,请参见 CreateFunction-创建函数 和 ...

RAM子账号授权

运维事件中心包含以下3种初始权限。AliyunGEMPFullAccess」-管理运维事件中心的权限(除人员新增、群协同组织绑定...授权后的子账号,一是可以直接自助开通本产品(无需主账号开通),二是可以添加至人员中心,进行相关的报警/事件/故障管理

什么是资源管理

阿里云资源管理(Resource Management)服务是一系列企业IT治理产品和服务的集合,主要包括资源目录、资源组、资源共享、标签和资源中心。您可以使用资源目录在云上构建企业业务组织关系,使用资源组和标签分层次管理云上资源,使用资源...

为函数安装第三方依赖

构建自定义安装依赖 通过控制台在线构建 登录 函数计算控制台,在左侧导航栏,选择 高级功能>层管理。具体操作,请参见 创建自定义。说明 此方式仅支持Node.js和Python运行环境。此方式不支持包含系统动态链接库(.so)的依赖,例如...

为函数安装第三方依赖

构建自定义安装依赖 通过控制台在线构建 登录 函数计算控制台,在左侧导航栏,选择 高级功能>层管理。具体操作,请参见 创建自定义。说明 此方式仅支持Node.js和Python运行环境。此方式不支持包含系统动态链接库(.so)的依赖,例如...

API概览

层管理 API 标题 API概述 CreateLayer 创建 在指定实验室下创建一个,用于分层实验。之间正交,可独立开展实验,避免流量饥饿问题。DeleteLayer 删除 删除指定。UpdateLayer 更新 更新指定的信息,例如更新的名称、...

基于MSE云原生网关实现同城多活

方案架构 基于云原生网关同地域跨可用区的全局流量管理能力,当单可用区(可用区I)发生故障后,可实现100%流量自动被路由到其它可用区(可用区J)。说明 两个可用区各一个SLB,可有效避免SLB单点故障,当单可用区SLB发生故障后,可通过DNS...

灾备规划

RTO和RPO要求 应用容灾有两个核心的指标:RPO:指应用发生故障时可以容忍的数据丢失量。数据越重要,RPO就要求越小。RPO越小,往往要求数据备份、复制频率更高,对生产环境、网络的压力也会越大,成本通常也越高。RTO:指故障发生后,期望...

GTM如何实现异地容灾

两地三中心容灾架构,是指在同城双中心的基础上,在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。目标读者 企业网络部、业务运维部工作...

MSE注册配置中心高可用最佳实践

无容灾保护 当来自Consumer端的请求量突然增加时,如果Provider容量水位较高,会导致个别Provider发生故障:注册中心会将故障节点摘除,全量流量会给剩余节点。剩余Provider节点负载变高,大概率也会发生故障。最终所有Provider节点故障,...

常见问题-FAQ

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM最快可在1分钟左右准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台...

FAQs

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM能在 3分钟左右 准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台、...

名词解释

这种模式下,两个城市的三个数据中心互联互通,如果⼀个数据中心发生故障或灾难,其他数据中心可以正常运行并对关键业务或全部业务实现接管。命名空间 多活命名空间MSHA Namespace,是一个逻辑租户的概念,用于进行租户粒度的管控配置和云...

如何处理健康检查导致的大量日志

风险说明 HTTP/HTTPS模式下关闭健康检查后,负载均衡不再检查后端服务器,一旦某台后端服务器发生故障,则无法实现访问流量自动切换至其它正常的后端服务器。操作步骤 登录 传统型负载均衡CLB控制台。在 实例管理 页面中找到对应的CLB实例...

GTM如何实现同城容灾

创建1个全局访问策略,解析请求流量 选择 全局,主地址池集合 选择「业务中心01」地址池和「业务中心02」地址池,负载均衡策略 选择 返回全部地址,此设置可实现两个数据中心同时提供服务和发生故障时系统自动摘除故障地址的效果。...

管理缓存

通过将数据写回到UFS,可以保证如果Alluxio发生故障数据还是可恢复的。语法 alluxio fs persist示例:将Alluxio中 tmp 目录持久化到底文件系统中。alluxio fs persist/tmp 返回如下信息。persisted file/tmp with size 46 setTtl 设置...

设备级高可用

当主设备发生故障时,需在智能接入网关管理控制台切换备设备为主设备,用备设备替换主设备连接入网。双机热备:两台设备同时在线。自动检测,自动切换主备设备。SAG-100WM默认为双机冷备模式,您可以在智能接入网关管理控制台将其切换为双...

轻量应用负载均衡概述

当其中一部分轻量应用服务器发生故障后,负载均衡会自动屏蔽故障的轻量应用服务器,将请求分发给正常运行的轻量应用服务器,保证应用程序仍能正常工作。弹性管理应用程序的服务能力。您可以根据业务发展的需要,自行添加或移除轻量应用负载...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

产品架构介绍

多活流量必须经过接入,以便在故障发生时,通过接入切换入口流量。比例分流:接入支持按比例将流量分流到机房。特殊场景下,可以将机房流量切零,从而实现故障情况下的流量切换。精准路由:接入支持根据HTTP请求Header/Cookie/...

集群系列

且单个只读实例没有灾备,因此为了保障业务的可用性和连续性,建议至少创建两个只读实例,以确保某一个只读实例发生故障时,另一个只读实例可以继续提供服务。购买集群系列实例时,建议您选择多可用区部署,以实现跨可用区的容灾能力。架构...

组复制简介

组复制 的架构 如上图所示,在MySQL的Server和Replica之下,组复制的架构分为三层:组复制(Group Replication Logic Layer):在单机MySQL的Server之下,组复制增加了组复制,该通过钩子(HOOK)与Server相连,负责向组通讯...

网络架构容灾

当地址池中地址发生故障时,HealthCheck模块会准确的检测到异常情况并与DNS交互(如下图中序号3所示),摘除故障地址(如下图中序号4所示),这样用户端会自动解析到可用的地址池(如下图中序号5所示)。并当故障地址恢复时,自动恢复至...

主从实例读写分离部署(共享存储)

该方案为当前每个实例内部默认启用,当系统发生故障时,无需手工运维介入,系统可以自动恢复。在恢复期间,如果查询算子需要访问恢复中的节点,则查询会立即失败。Hologres从V1.1版本开始,采用全新恢复机制,节点恢复速度在一分钟左右,比...

功能特性

创建实例 自动切换 在实例主节点发生故障时将自动切换,实现实例的故障自愈,切换通常需要30秒左右完成。主备切换 全量备份与全量恢复 对当前实例通过内存快照方式对全量数据进行备份并保存在云存储中,可通过全量恢复将数据恢复至备份时。...

集群高可用架构推荐配置

多可用区的地域:所有托管组件均严格采用多副本、多AZ均衡打散部署策略,确保在单个可用区或节点发生故障时,集群仍然能够正常提供服务。单可用区地域:所有托管组件均严格采用多副本、多节点打散部署策略,确保在单个节点发生故障时,集群...

使用Redis实现多地容灾的会话管理

会话(session)管理是互联网应用的重要功能,当业务在多地部署时,会话管理就有了就近访问和多地容灾的需求,云数据库Redis版可以帮助业务实现高效的会话管理。背景信息 随着业务规模不断扩大,应用的使用者可能需要在不同的地域使用服务...

附录:SOFAStack 产品目录

兼容性保障:分布式事务是一个抽象的基于 Service 的概念,与底层事务实现无关,也就是说在分布式事务的范围内,无论是关系型数据库 MySQL、Oracle,还是 KV 存储 MemCache,或是列存数据库 HBase,只要将对它们的操作包装成分布式事务的...

混合云应用双活容灾最佳实践

说明 演练前,基于MSHA流量监控或其他监控产品,确定业务稳态的监控指标(如日常情况RT≤200ms,错误率),以便在故障发生时判断故障影响面以及在故障恢复后判断业务的实际恢复情况。步骤二:应用故障注入 这里使用阿里云故障演练产品,对...

解决方案与客户案例

每个单元内的业务架构分为接入、服务、数据:接入 业务流量通过租户侧DNS解析后按照权重分配到不同单元的接入,进入接入后,通过解析请求header/cookie中的分流标,对比自定义的分流规则,判断请求是否归属本单元,若归属本...

解决方案与客户案例

整个部署架构分多个地域,每个地域称为一个单元,其中某个单元又承担着整个多活架构的逻辑中心角色,提供一些中心化的服务能力(如Sequence分发、强一致读服务等),每个单元内的业务架构分为接入、服务、数据:接入:业务流量通过...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 云安全中心 轻量应用服务器 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用