概述

稳定通常包含系统可用、可靠观测运维扩展维护等。使用云计算平台服务可以更好的构建系统稳定,例如云计算平台可以根据系统的实际需求,动态分配和释放计算资源,使得系统更容易扩展,降低系统负载压力,...

设计方案

整体稳定设计方案参考如下:架构设计原则 软件系统从所有的功能都在一个应用程序内运行的单体应用架构,到不同的功能模块分别部署在不同的服务器上的传统分布式应用架构,再到服务细分通过轻量级的通信机制进行互相调用的微服务架构,...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

监控指标说明

该指标协助您进行作业诊断,排查作业Task级别的故障原因。次数 TM GC Time 每次TM GC时间。长时间GC会导致占用过大内存空间,从而影响作业性能。该指标协助您进行作业诊断,排查作业级别的故障原因。毫秒(ms)TM ClassLoader/...

故障管理

故障管理的重要 无论是理论还是实践,均证明故障只要有发生的可能,它总会发生。根据墨菲定律,假设某意外事件在一次实验(活动)中发生的概率为p(p>0),则在n次实验(活动)中至少有一次发生的概率为P=1-(1-p)n。由此可见,当实验次数...

归档存储服务等级协议

数据审查 依据现行法律法规或根据政府监管部门监管、安全合规、审计或取证调查等原因的需要,在符合流程和手续完备的情况下,阿里云可以提供用户所使用的服务的相关信息,包括关键组件的运行日志、运维人员的操作记录、用户操作记录等...

SLA服务等级协议

服务可用将根据服务周期内每5分钟错误率之和除以服务周期内5分钟的总个数计算出每5分钟错误率的平均值,从而计算得出服务可用,即:2.2 服务可用承诺 智能客服工作台服务可用不低于99%,如客服工作台未达到前述可用承诺,客户...

服务等级说明

服务可用 赔偿代金券金额 99%≤服务可用月度服务费用的20%95%≤服务可用月度服务费用的30%服务可用月度服务费用的50%3.2 赔偿申请时限 客户在每个自然月第五个工作日后对上个月没有达到服务可用承诺的数据总线提出赔偿申请。...

服务等级协议

2.服务可用 2.1 服务可用性计算公式 运维事件中心服务可用按服务周期统计,服务可用将根据服务周期内每5分钟错误率之和除以服务周期内5分钟的总个数计算出每5分钟错误率的平均值,从而计算得出服务可用,即:服务可用=(1-服务...

服务条款

服务条款 本服务条款是阿里云计算有限公司(以下简称“阿里云”)与您就批量计算服务(Batch Computing Service,简称BatchCompute)的相关事项所订立的有效合约。您通过盖章、网络页面点击确认或以其他方式选择接受本服务条款,包括但不...

创建Web函数

取值说明如下:启用:函数的执行日志被持久化保存到日志服务,方便您进行代码调试、故障分析和数据分析等。禁用:函数的执行日志将无法通过日志服务存储和查询。启用 环境变量:设置函数运行环境中的环境变量。更多信息,请参见 环境变量。...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障计算节点宿...

配置网络

您在 函数计算 创建的函数,默认可以访问公网,无法访问VPC内的资源。如果您需要函数能够访问VPC内的资源,或允许指定的VPC来调用函数,那么您需要手动为函数配置网络和权限。本文介绍如何通过 函数计算 控制台为函数配置网络。注意事项 ...

名词术语

安全多方计算(MPC)MPC是密码学中的定义,意为在无可信计算方的情况下,多个参与方各自持有秘密输入完成对某个函数的计算,但每个参与方最终只能得到计算结果和能从自己输入和计算结果中推出的信息,其他信息均得到保护。数据使用方 ...

配置网络

您在 函数计算 创建的函数,默认可以通过公网调用,无法通过VPC调用。如果您需要函数能够访问VPC内的资源,或允许指定的VPC来调用函数,那么您需要手动为服务配置网络访问能力。网络配置为服务级别,即对服务下的所有函数生效。本文介绍...

快速创建函数

使用 函数计算,您无需采购和管理服务器等基础设施,只需编写并上传代码或镜像,就可以实现弹性可靠的应用。本文介绍如何在 函数计算 控制台快速开发一个简单的Serverless Hello World函数。背景信息 通过函数计算控制台快速创建函数的流程...

公告

计算成本优化功能在原计算资源优化功能(对 包年包月一级Quota 类型的计算资源生成更优的资源配置方案)的基础上增加支持查看使用 按量付费计算资源 调整为使用 包年包月计算资源 的资源配置推荐方案及效果推演,帮助您进一步优化计算成本...

弹性加速计算实例EAIS安全说明

弹性加速计算实例EAIS的云上安全,是阿里云在面对当前的网络安全形势和挑战时所采取的措施,以及提高用户在资源和网络访问控制、EAIS资源操作、故障隔离和风险检测等方面的安全所具备的能力。说明 通过在ECS实例(非GPU实例)上绑定...

功能发布记录

本文介绍弹性高性能计算产品功能和对应的文档动态。2023年 2023年9月 功能名称 变更类型 功能描述 发布时间 相关文档 通过Serverless集群提交作业 新增 Serverless集群的计算节点由ECI实例组成,您只需提供打包好的容器镜像,即可使用ECI...

概述

分布式系统将计算任务和数据分布在多个节点上以实现更高的性能、可靠扩展,当一个节点发生故障或错误时,其他节点可以继续工作,相比于单机系统,架构本身就有较高的节点容错。但随着服务拆分,更多组件的引入,分布式系统的复杂...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

配置HTTP触发器并使用HTTP触发

函数计算 推荐您使用 函数计算 为新建HTTP触发器分配的子域名 subdomain 作为HTTP触发器URL进行函数测试,能有效避免 404 报错,也能避免代码中耦合 函数计算 的服务名称和函数名称,增强代码的移植。关于 404 报错的更多信息,请参见 ...

产品优势

视图计算产品采用云化架构,既能支持不同协议设备监控视频快速上云,在云上对监控视频集中安全存储,全网跨地域视频分发播放,又拥有强大弹性扩容的计算能力支持对接不同算法平台实现按需视频智能计算。大规模并发,安全高效 云化高可靠...

高可用版

图数据库GDB支持高可用版和单节点版两个系列。高可用版采用一主一备的经典高可用...可靠 计算与存储分离,计算节点的故障不会造成数据丢失。基于超大规模的阿里云飞天分布式存储,保证数据多副本的可靠。适用场景 企业级的生产图数据库。

弹性预留CU

弹性预留CU是指根据业务需求动态预留计算资源的能力。您可以通过合理的评估后购买弹性预留CU,并结合新的Quota计划、时间计划实现计算资源的弹性扩、缩容。本文为您介绍弹性预留CU的计费规则及使用说明。资源说明 基础资源 资源说明 计费...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

如何管理故障

对故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...

设计原则

数据容灾的目标是确保在不避免的情况下,数据的完整恢复和可用不受到严重影响,以保障业务的持续运行和数据的可靠。数据容灾通常包括备份、复制、快速恢复、灾难恢复计划等措施,以及实施这些措施的技术和流程。数据容灾必要...

单实例快速恢复

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

Where

本文为您介绍Where修改的兼容和不兼容详情。Where的计算不涉及到状态,因此它的修改不会影响自身算子的状态兼容,但它的修改会影响其输出算子的兼容。如果需要通过修改Where条件来修正作业数据(例如过滤脏数据),在 其他配置 ...

MaxFrame概述

MaxFrame是由阿里云自研的分布式计算框架,支持Python编程接口、兼容Pandas接口且自动进行分布式计算,同时直接使用MaxCompute计算资源及数据接口,与MaxCompute Notebook、镜像管理等功能共同构成了MaxCompute完整的Python开发生态。...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以控成本在线上故障重放,以持续的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复避免的重大问题,或通过验证故障发现...

弹性加速计算实例FAQ

本章节汇总了使用弹性加速计算实例EAIS时的常见问题。什么是弹性加速计算实例EAIS?弹性加速计算实例EAIS(Elastic Accelerated Computing Instances)是一款阿里云提供的性能卓越、成本优化、弹性扩展的IaaS(Infrastructure as a Service...

弹性强度说明

弹性强度代表资源库存的健康程度,弹性强度越优,代表未来断供的可能越低。由于计算巢创建服务和部署服务实例是分开的,所以建议在创建服务时选择弹性强度较优的实例规格,以提高服务实例的部署成功率。本文详细介绍了弹性强度的相关信息...

什么是视觉计算服务

阿里云视觉计算服务Visual Compute Service(简称VCS)是一款弹性伸缩的视觉智能计算服务。提供视觉数据接入、AI算法训练、计算资源调度的能力,通过API支撑开发业务应用,同时帮助开发者提升视觉AI创新效率,专注核心业务创新。VCS支持...

什么是弹性加速计算实例EAIS

弹性加速计算实例EAIS(Elastic Accelerated Computing Instances)是一款阿里云提供的性能卓越、成本优化、弹性扩展的IaaS(Infrastructure as a Service)级别弹性计算服务。EAIS可以将CPU资源与GPU资源成功解耦,帮助您将GPU资源附加到...

三可用区概述

容灾能力 计算节点容灾能力 单可用区故障 主可用区故障,会导致主可用区所有计算节点不服务,此时用户需要 手动 进行主可用区切换,将备可用区提升为主可用区,一般切换时间能够控制在30秒以内。备可用区故障,不影响实例可用。高可用...

产品优势

服务部署后,计算巢提供阿里云自助服务和全链路检测能力,实现一键排查、智能故障检测,提升业务稳定计算巢为用户提供了丰富的软件选择,覆盖常见的软件类型,包括:数据库等基础软件,CRM等应用软件,以及制造、医疗等行业软件。已经...

开通批量计算服务

2.开通 BatchCompute 2.1 定位 BatchCompute 产品 点菜单中“产品”,在“弹性计算”中找到批量计算(BatchCompute)进入 产品主页。2.2 开通 BatchCompute 服务。点击“授权”,则开通批量计算。说明 主账号只能通过此方法开通批量计算...

产品优势

与常规的异构实例相比,阿里云弹性加速计算实例EAIS具有解耦、低成本、弹性、多适配性和高性能的优势。解耦 常规GPU实例的CPU、内存和GPU是部署在同一台物理机上的。EAIS实例可以将CPU与GPU成功解耦,其CPU、内存和GPU可以存在于不同的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
函数计算(旧版) 轻量应用服务器 云数据库 RDS 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用