功能发布记录

2022-04 全部 支持的可信服务 资源共享 新增支持共享服务目录的产品组合。2022-04 全部 支持资源共享的云服务 资源组 在资源组页面,新增支持为资源组中的资源绑定标签,实现资源组、标签统一管理。2022-04 全部 为资源组中的资源绑定标签 ...

响应云盒维修事件

背景信息 配置云盒计算资源时,您需要配置一定的冗余资源或购买SLA服务包,以便在硬件故障时,可以迁移业务。关于如何更好地配置计算资源,请参见 云盒计算资源配置最佳实践。流程说明 运行中的ECS实例出现故障风险时,会向您发送ECS故障 ...

专家成长计划服务内容说明

阿里云容器服务故障处理与疑难处置 30人 阿里云大数据技术运维 16 MaxCompute和DataWorks大数据产品的操作和使用,掌握如何通过大数据产品解决实际问题。30人 云存储问题处理详解专题 8 全面介绍磁盘的基础知识,Linux和Windows操作系统的...

API概览

本产品(计算巢-服务商侧/2021-05-21)的OpenAPI采用 RPC 签名风格,签名细节参见 签名机制说明。我们已经为开发者封装了常见编程语言的SDK,...AddServiceSharedAccounts 新增服务共享账号 调用AddServiceSharedAccounts新增服务的共享账号。

AddServiceSharedAccounts-新增服务共享账号

service-63b8a060e9d54cxxxxxx Type string 否 服务共享类型,默认值为 SharedAccount。可选值:SharedAccount:普通共享类型。Reseller:分销共享类型。SharedAccount 返回参数 名称 类型 描述 示例值 object RequestId string 请求 ID。E...

基本概念

更多请查看 什么是事件 故障 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时...

共享自定义镜像

自定义镜像支持共享到ECS。当轻量应用服务器的配置不能再满足您的业务需要、或者您期望使用云服务器ECS部署业务时,您可以通过共享镜像将业务从轻量应用服务器转移至云服务器ECS。前提条件 已创建自定义镜像。具体操作,请参见 创建自定义...

功能特性

轻量应用服务器 轻量应用服务器(Simple Application Server)是可以快速搭建且易于管理的轻量级云服务器,面向单台服务器提供了一键部署应用、一站式域名解析、安全管理以及运维监控等服务。轻量应用服务器操作简单便捷,能让您快速上手...

云盒计算资源配置最佳实践

背景信息 云盒的硬件设计中,各类硬件设备的保障如下:网络设备:采用双机冗余双上连设计,确保云盒内网络的高连续性,且不存在单点故障。存储设备:可以 确保在两台存储服务器同时宕机的情况下,数据的安全可靠。计算设备:支持宕机迁移和...

通过控制台配置多应用共享公网带宽

本文为您介绍如何在控制台组合使用公网NAT网关和共享带宽,实现多个不同应用服务共享一份公网带宽对外提供服务,以节省公网成本。场景示例 本文以上图场景为例。某公司在阿里云华北1(青岛)创建了一个专有网络VPC(Virtual Private Cloud...

资源观测

数据传输服务 您可以查看数据传输服务共享资源组与包年包月独享资源组的资源使用情况,并根据项目和需要观测的时间区间观测各个指标的使用情况。操作步骤 登录 MaxCompute控制台,在左上角选择地域。在左侧导航栏单击 资源观测。在 资源...

接入无侵入服务观测

例如设置 EnvKey 为 NGINX_SERVICE_PORT,设置 EnvValue 为^(80|6379)$,表示排除服务端口为80、6379的容器。多个黑名单之间为或关系,即只要容器的环境变量满足任一键值对即可被排除。高级配置 丢弃本地网络数据包 打开 丢弃本地网络数据...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

可观测性的设计原则

通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求中,并在整个系统中传递。每个组件都可以将标识符添加到它们的日志中,以便在...

实时分析链路数据

如果异常请求分散在多台机器,那么大概率可以排除单机故障因素,可以重点分析下游依赖服务或程序逻辑是否异常。在 调用链分析 页面筛选错误调用或慢调用,并设置按IP进行分组统计,如果异常调用集中出现在特定机器,则有较大概率是机器故障...

共享带宽服务条款

详细信息,请参见 共享带宽服务条款。

查询密钥和凭据的使用记录

KMS支持和操作审计、日志服务集成,记录密钥和凭据使用过程中的各种事件,用于故障排除、安全监控等。本文介绍如何查询密钥以及凭据的使用记录。背景信息 通常我们将密钥和凭据的事件分为两部分,一部分是管控类操作,例如密钥的创建、删除...

网络类场景

排除端口 无需注入网络延迟调用故障的端口,与本地服务端口和远程服务端口功能互斥。可以指定多个,使用逗号分隔,使用连接符表示范围。例如80,8000-8080。远端服务IP 指定演练对象访问的远端服务IP。可以通过子网掩码来指定一个网段的IP...

设备显示离线

如果是静态路由接入,尝试通过交换机,能否 ping 通设备的每个接口IP,如果其中有无法 ping 通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第二个和第三个灯是否为...

故障基础数据管理

服务组与故障业务线的关系:一个服务组对应故障中一个角色,但可以服务多条故障业务线 服务组与工单问题分类的关系:一个服务组可以服务工单多个问题分类 服务组与组织架构的关系:一个服务组可以服务多个组织架构,一个组织架构可以拆分为...

无法连接到同一个云连接网内的本地客户端

如果是静态路由接入,尝试通过交换机,能否 ping 通设备的每个接口IP,如果其中有无法 ping 通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第2和第3个灯是否为黄色...

常见问题-FAQ

GTM是集成了DNS的智能解析功能、云监控的应用服务监控功能,为客户输出不同网络或地区用户访问实现就近接入、应用服务运行状态的健康检查、故障自动切换等能力。全局流量管理(GTM)的CNAME接入域名是否能直接通过URL访问?答:不可以使用 ...

ping不通云服务ECS(SAG-1000)

如果是静态路由接入,尝试通过交换机,能否ping通设备的每个接口IP,如果其中有无法ping通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第2和第3个灯是否有红色的。...

FAQs

GTM是集成了DNS的智能解析功能、云监控的应用服务监控功能,为客户输出不同网络或地区用户访问实现就近接入、应用服务运行状态的健康检查、故障自动切换等能力。GTM 是现有云解析DNS中全局负载均衡(GSLB)的升级和替代产品,GTM比GSLB支持...

共享实例问题

共享实例上的服务必须订购才能访问吗?是的。出于安全考虑,共享实例上的服务,必须发起订购申请,经服务拥有者审批通过后才允许访问。共享实例上的服务的流控阈值是多少?共享实例是为试用、开发和测试所使用的,系统内置了流控约束。目前...

API概览

UpdateProblemEffectionService 更新故障影响服务 GetProblem 查询故障详情 ListProblems 查询故障列表 ListProblemTimeLines 查询故障时间线列表 GenerateProblemPictureLink 获取故障图片链接 GenerateProblemPictureUploadSign 故障图片...

什么是故障演练

适用场景 故障演练可适用于以下典型场景:衡量微服务的容错能力 通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

什么是消息演练

这些消息服务之前并没有在系统中实际经历过真实流量考验,其中某些隐患或缺陷很难被发现,急需通过故障演练来评测高可用性。AHAS提供了强大且高灵活度的故障演练功能,可以根据不同的场景注入对应的故障类型。为了使您的演练服务更便捷,...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

如何在共享实例上发布和订阅服务

共享实例支持的后端服务分为VPC后端服务和公网后端服务。VPC后端服务 需要在VPC内部署服务和设置VPC安全组规则。在VPC内部署服务:CSB共享实例只能访问实例所在区域(Region)的VPC服务,故请在当前CSB共享实例所在区域VPC的ECS上部署后端...

设置Fallback服务

当路由的目标服务出现故障时,通过设置Fallback服务可以将流量降级到指定的容灾服务,保障业务的高可用性。前提条件 添加服务。创建云原生网关。使用限制 Fallback服务功能仅适用于网关版本为1.2.5及以上。Fallback服务工作原理 如图所示,...

如何配置流转规则

选择 触发故障 需要配置故障影响服务故障等级覆盖。配置完成之后点击 提交即可。仅触发报警:确定 报警触发规则:设置触发的持续时长和次数对报警进行收敛降噪;如,某个规则在持续5分钟内触发3次才会触发报警,只要将时长和次数分别设置...

共享集群产品功能发布记录

2023年02月 华南1(深圳)地域开通共享集群服务。2022年12月 从 2022年12月26日 起,Hologres共享集群正式发布1.3版本,所有新购用户默认购买的共享集群实例为该版本,已有实例会逐步灰度升级到V1.3,在未升级之前,如您需要使用1.3版本的...

NAS存储卷概述

您可以在容器服务Kubernetes集群中使用阿里云NAS存储卷。本文介绍NAS存储卷的功能介绍、存储规格、适用场景、使用限制及计费说明等。功能介绍 阿里云文件存储NAS(Apsara File Storage)是面向阿里云ECS实例、E-HPC和容器服务等计算节点的...

故障协同处理(基于钉钉)

故障状态:展示故障实时状态变化,PC端和移动端故障状态保持一致,分为四个故障操作节点记录故障状态变换,方便用户查询操作记录。时间线:展示故障的时间线记录,其中有7个节点必须完善详细内容,节点已用红星标注,包含:故障发生、故障...

OSS存储卷概述

使用说明 配置OSS静态存储卷的说明如下:OSS为共享存储,可以同时为多个Pod提供共享存储服务。bucket:目前只支持挂载存储空间Bucket,不支持挂载Bucket下面的子目录或文件。url:OSS的Endpoint,挂载OSS的接入域名,挂载节点和存储空间的...

运维事件中心的审计事件

运维事件中心已与操作审计服务集成,您可以在操作审计中查询用户操作运维事件中心产生的管控事件。操作审计支持将管控事件投递到日志服务SLS的LogStore或对象存储OSS的存储空间中,满足实时审计、问题回溯分析等需求。操作审计记录了用户...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

NAS存储卷概述

注意事项 NAS为共享存储,可以同时为多个Pod提供共享存储服务,即一个PVC可以同时被多个Pod使用。在没有卸载NAS文件系统前,务必不要删除NAS挂载点,否则会造成操作系统无响应。NAS挂载点创建后,等待一定时间,待挂载点 状态 为 可用 时才...

什么是全局流量管理?

产品概述 全局流量管理(Global Traffic Manager),简称GTM,它可以帮助企业实现用户访问应用服务的就近接入、高并发负载均摊、应用服务的健康检查,并能够根据健康检查结果实现故障隔离或流量切换,方便企业灵活快速的构建同城多活和异地...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
共享带宽 共享流量包 负载均衡 文件存储 CPFS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用