服务等级目标SLO概述

SLO提供了一种形式化的方式来描述、衡量和监控微服务应用程序的性能、质量和可靠。SLO为应用开发和平台团队、运维团队提供了一个共享的质量基准,可作为衡量服务水平质量以及持续改进的参考。使用SLI组合定义的SLO能够帮助团队以更精确的...

功能发布记录

本文介绍 服务网格 ASM相关内容的最新动态。2024年03月 功能 功能描述 发布地域 适用Istio版本 适用产品规格 相关文档 访问日志支持以纯文本(非JSON)的形式定义输出。支持将访问日志以纯文本的形式输出至容器标准输出。纯文本形式相比...

数据加速Fluid概述

您应及时关注对应第三方开源社区或商业公司的官网、代码托管平台的版本更新动态并仔细阅读及遵守相应的开源协议,自行承担因第三方组件导致的应用侧程序开发、维护、故障与安全等潜在风险。特性 Alluxio JuiceFS Jindo EFC 底层存储类型 ...

服务治理概述

部署和运维 EDAS多语言互通 查询多语言应用服务 为多语言应用配置故障注入 安全和可用 使用服务鉴权实现多语言应用的访问控制 使用离群实例摘除保障多语言应用的可用.aliware-toc-container.list-item{ white-space:normal;}

基本概念

熔断 熔断可以使应用程序具备应对来自故障、潜在峰值和其他未知网络因素影响的能力,避免网络和服务调用故障级联发生,系统整体性能下降或者崩溃。ASM支持在流量策略中配置熔断功能,在网络访问超出熔断配置时能够拒绝请求。更多信息,请...

标准版-单副本

警告 单副本架构不能保障数据可用服务连续,选用前请务必确认风险,不建议您在生产环境中使用该架构的实例。云数据库Redis版服务等级协议不适用于单副本架构的实例。由于该架构只有一个数据库节点,无热备节点用于HA,且不提供数据...

标准架构

阿里云自研 故障探测切换系统(HA)阿里云 Tair 服务封装HA切换系统,实时探测主节点的异常情况,可以有效解决磁盘IO故障,CPU故障等问题导致的服务异常,及时进行主从切换,从而保证服务高可用。主从复制机制 阿里云针对 Tair 主从复制...

主从(备)切换

MyBase MySQL 实例支持主从(备)切换,当主实例不可用时,备(从)实例会切换为新的主实例,保障实例的高可用。此外,您还可以手动切换主从(备)实例。背景信息 自动切换:高可用版实例默认开启自动切换,当主实例出现故障无法访问时,...

应用场景

当任何一个单元出现故障时,您只需将该单元的流量切换至其他单元即可,可实现业务的秒级恢复,有效地保障了服务的高可用。您还可以根据业务的某个维度将业务流量分流至各个业务单元。例如,按照用户所属区域划分各单元的流量,实现用户...

历史功能发布记录(2023年之前)

全部 v1.14及以上 企业版、旗舰版 启用CNI插件提升安全 选择性服务发现支持简易配置服务发现的范围。只需勾选数据面命名空间即可划定 服务网格 服务发现范围,以此简化配置来提升网格性能。全部 v1.14及以上 全部 使用服务发现范围配置...

高可用

阿里云Elasticsearch提供数据备份与恢复、负载均衡、跨可用区部署,以及保障集群稳定的各类内核优化策略,全方位保障集群数据的可靠服务的可用。数据备份与恢复 备份与恢复方式 说明 自动备份与恢复 阿里云Elasticsearch支持自动数据...

查看事件与监控信息

服务实例创建完成后,您可以在计算巢控制台查看服务实例的事件和监控信息,本文向您介绍如何查看服务实例事件和监控信息。操作步骤 登录 计算巢控制台。在左侧导航栏中,单击 服务实例管理。根据您创建的服务实例类型,单击对应的服务类型...

应用场景

传统型负载均衡CLB(Classic Load Balancer)的应用场景为高访问量的业务,提高应用程序的可用和可靠。应用于高访问量的业务 如果您的应用访问量很高,您可以通过配置监听规则将流量分发到不同的云服务器ECS(Elastic Compute Service...

事件分析概述

以云服务器ECS为例,很多情况会因系统错误或云盘性能受损而触发故障类事件,这类事件通常会涉及到周边产品(比如容器服务ACK等),捕获全部云上事件做基础排障的挑战比较大。事件总线EventBridge 支持全部云服务事件无缝接入,更大程度...

构建运营模型

4.提高业务的稳定和可靠:基于云平台提供的监测和专业技术能力,可以协助企业提升故障响应速度,缩短故障诊断时间,提高业务的稳定和可靠。运营模型定义 分散式运营模型 应用,是一个可独立交付的对外提供服务的单元,是开发、部署...

什么是数据库自治服务DAS

解决方案 数据库自治服务DAS(Database Autonomy Service)是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助用户消除数据库管理的复杂及人工操作引发的服务故障,有效保障数据库服务的稳定...

自动或手动主备切换

当主实例发生故障或不可用时(例如操作系统错误、硬件故障等),系统会自动触发主备切换,主实例和备实例将进行互换,切换后实例地址保持不变,应用程序会自动连接到新的主实例(原备实例),从而保障业务的连续和高可用。此外,您还...

集群高可用架构推荐配置

高可用(High Availability,HA)是指系统的设计能够确保服务可靠和持续的一种特性。容器服务 Kubernetes 版 基于Kubernetes架构提供了多种集群高可用保障机制,以确保集群控制面、节点与节点池、工作负载、负载均衡等维度的高可用,...

如何实现无损发布或无损上下线

下游服务正常停止,但上游服务因其他原因(例如网络故障、资源不足、处理逻辑异常等),没有及时处理和使用注册中心给予的新下游服务地址列表。使用了旧版本的客户端,由于机制问题移除下线的地址列表时效较低。解决方案 最佳方式为接入...

归档存储服务等级协议

1.服务范围 阿里云归档存储为用户提供大容量的云归档服务。用户可以调用归档存储提供的API或者SDK通过网络进行数据的上传和下载,并可通过Web控制台进行有限功能的管理。归档存储的存储容量支持弹性扩容,并提供基于云计算模式的按使用量...

节点诊断

集群DNS服务可用 检查节点能否正访问集群kube-dns服务的Cluster IP,正常使用集群的DNS服务。请检查CoreDNS Pod运行状态和运行日志。更多信息,请参见 DNS解析异常问题排查。节点Kubelet状态 检查节点Kubelet状态。请检查节点Kubelet日志...

监控和分析

监控云上资源,系统的安全状况,找出业务系统可能存在的漏洞,对可疑活动的告警作出反应,或是针对企业日常活动中的安全事件进行追溯,是构建业务安全机密、完整、可用重要的一环。监测控制 通过运用云上的多种监测控制手段,以此来...

管理主备切换

当主实例异常无法使用时,或实例存在潜在风险并在备实例中进行了紧急修复时,RDS会自动触发主备切换,将主实例和备实例进行互换,切换后实例连接地址保持不变,应用自动连接到新的主实例(原备实例),从而保障实例的高可用。此外,您还...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全和可用的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整、可恢复和可用不受到严重影响,以保障业务的持续运行和数据的...

管理服务版本

背景信息 在微服务领域,服务泛指应用程序的功能单元,通常具备独立的业务域,例如订单服务、用户服务等。从物理上看,服务部署运行在具有网络地址的容器、虚拟机和物理机上;从逻辑上看,服务由一组提供相同功能的网络节点组成。服务版本...

管理服务版本

背景信息 在微服务领域,服务泛指应用程序的功能单元,通常具备独立的业务域,例如订单服务、用户服务等。从物理上看,服务部署运行在具有网络地址的容器、虚拟机和物理机上;从逻辑上看,服务由一组提供相同功能的网络节点组成。服务版本...

通信能力技术服务协议

故意制作、传播计算机病毒等破坏性程序的。其他危害计算机信息网络安全的行为。第五条 阿里的权利及义务 阿里如遇网络或系统维护或升级,需要暂停服务或要求您做出配合的,应当提前1个工作日告知您。阿里向您提供可以实现统计查询、账单、...

通过Uptime实时监控阿里云Elasticsearch服务

Heartbeat支持通过HTTP/HTTPS、TCP和ICMP服务,定期检测网络端点状态,并将采集的检测数据,输出到Kibana的Uptime应用中,实时监控应用程序服务的可用和响应时间,在业务受到影响前检测出问题。本文介绍如何通过Uptime实时监控阿里云...

应用场景

服务网格 ASM主要适用于需要对应用服务进行流量管理、安全管理、故障恢复、观测监控以及微服务架构迁移的应用场景。本文介绍ASM的常见应用场景。流量管理 通过ASM,可以轻松实现基于配置的流量管理:将流量管理与基础设施管理分隔开来,并...

基本概念

阿里云服务网格提供一个全托管式的服务网格平台,兼容社区Istio开源服务网格,用于简化服务的治理,包括服务调用之间的流量路由与拆分管理、服务间通信的认证安全以及网格可观测能力。相关文档 关于Kubernetes的更多概念及术语详情,请...

功能介绍

移动办公:基于钉钉小程序,将物联网的设备管理、视频服务、算法服务、数据服务、场景服务与钉钉服务结合,在移动端完整输出,形成物联网移动端能力的闭环,提升组织效能。快速触达:本地告警事件、设备故障等消息,通过钉钉快速触达责任人...

服务器迁移中问题

本文介绍服务器迁移相关的故障问题及解决方案。日志报错提示子账号权限不足Forbidden.SubUser,怎么办?日志报错提示Forbidden.Unauthorized错误,怎么办?日志报错提示Your Account Haven't Completed Real-name Authentication错误,...

智能分析-异常根因定位分析利器

日志服务Trace应用提供智能分析功能,用于分析可观测数据和定位系统的异常根因。本文介绍可观测数据的必要、优势以及使用智能分析功能的方法。系统必要属性-可观测 随着IT系统几十年的飞速发展,开发模式、系统架构、部署模式和...

IIS Web网站访问故障

本文介绍IIS(Internet Information Service)作为Web服务的网站,访问故障相关的问题及解决方案。本文介绍的IIS Web网站访问故障相关问题如下:访问部署在Windows实例上的基于IIS搭建的Web网站时,提示“500-内部服务器错误”,如何处理?...

产品高可用

CLB系统的高可用 负载均衡实例采用集群部署,可实现会话同步,以消除服务器单点故障,提升冗余,保证服务的稳定。其中四层负载均衡通过LVS(Linux Virtual Server)+keepalived的方式实现,七层负载均衡通过Tengine(淘宝网发起的Web...

标准版-双副本

阿里云自研 故障探测切换系统(HA)阿里云Redis服务封装HA切换系统,实时探测主节点的异常情况,可以有效解决磁盘IO故障,CPU故障等问题导致的服务异常,及时进行主从切换,从而保证服务高可用。主从复制机制 阿里云针对Redis主从复制机制...

无法连接Linux实例的排查方法

为了便于您解决问题,列举Workbench工具使用时常见的异常问题:Workbench远程连接问题(Linux)如可以通过Workbench工具正常登录,说明目标实例上的SSH服务正常运行,即排除SSH服务端异常的可能,继续执行 步骤二:检查网络 进行排查。...

使用ASM构建分布式系统的容错能力

分布式系统存在高度复杂的特点,在基础设施、应用逻辑、运维流程等环节都可能存在稳定风险而导致业务系统的失效。因此构建一个具有容错能力的分布式系统非常重要。本文介绍如何通过ASM设置超时、重试、隔板和熔断机制构建分布式系统的...

使用ASM构建分布式系统的容错能力

分布式系统存在高度复杂的特点,在基础设施、应用逻辑、运维流程等环节都可能存在稳定风险而导致业务系统的失效。因此构建一个具有容错能力的分布式系统非常重要。本文介绍如何通过ASM设置超时、重试、隔板和熔断机制构建分布式系统的...

使用SysOM定位容器内存问题

为解决因容器引擎层的不透明而导致的故障排查困难问题,阿里云 容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)团队推出操作系统内核层的容器监控可观测能力,为您提供更可靠、透明的容器引擎层,助力您更顺利地进行...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 商标服务 轻量应用服务器 云服务器 ECS 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用