K8s应用运维管理最佳实践

重要 禁止从负载均衡控制台直接修改SLB实例的监听配置(含监听+证书),可能导致SLB控制台修改的配置回退,引发应用入口相关的故障。请勿配置私网SLB进行集群内部服务的访问。Pod实例之间无法直接访问私网SLB地址,私网SLB只是用来提供VPC...

创建演练

背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止演练 操作步骤 登录 AHAS控制台,在左侧导航栏中选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练。选择 新建空白演练 或 从经验库新建。...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

GxP欧盟附录11标准合规包

他要求涵盖了计算机化系统的开发、验证、操作、维护和监测等方面,以确保这些系统符合相关法规和标准,用于生产、控制和保证产品质量和可靠性。Annex 11是GMP(Good Manufacturing Practice)的一部分,作为药品生产过程中的重要指导标准之...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

控制台首页

阿里云全局控制台首页,跨产品多场景管理利器 阿里云全局控制台首页,是连接客户和阿里云产品的重要桥梁,它将云产品的能力通过 GUI(PC&App)的方式提供给用户,降低客户使用阿里云的门槛,同时提升对云上资产进行资源管理、运维监控、...

运维服务内容说明

因客户自身原因导致的问题故障,不属于阿里云运维服务范围。如客户有不定期现场服务需求,可按天购买运维专家现场服务。运维服务专家可帮助客户进行疑难问题现场处理,故障现场救援,变更现场保障、现场运维培训等服务。运维专家现场服务需...

混沌工程缓存实战系列-Redis

登录 AHAS控制台,在左侧栏选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练>新建空白演练。在 演练配置 页面,填写相关参数,选择 演练内容 为 主机内网络延迟。更多参数信息,请参见 创建演练。单击 主机内网络延迟,在 本地...

DDH常见问题

如果您因为过保迁移等原因被分配了一台新的物理服务器,您的DDH会对应一个新的机器码,该机器码就是这台新物理服务器的唯一识别码。DDH故障时是否会自动迁移到健康的DDH?阿里云为您提供DDH故障迁移服务,开启服务后,DDH因故障停机时,会...

上下文查询

开发人员无需登录服务器,在大量日志中通过关键字检索日志,日志服务支持通过控制台查看指定日志在原始文件中的上下文信息。前提条件 已通过Logtail采集到日志。具体操作,请参见 通过Logtail采集日志。重要 如果您使用了Logtail插件处理...

使用ACK AI助手进行故障排查和智能问答

若ACK AI助手无法定位问题的根因并提供可用的解决方案,您可以发起进一步发起诊断,对异常的Pod、Node节点发起基于ACK技术专家诊断经验的深度故障诊断功能。更多信息,请参见 使用集群诊断。前提条件 已开通 容器服务 Kubernetes 版 并已...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

如何配置通知订阅

登录 运维事件中心控制台;左侧导航栏 策略中心>通知订阅 页面配置通知订阅;在 通知订阅 页面点击 新增通知订阅 进入 新增通知订阅 的配置页面;4.在 新增通知订阅 的配置页面,设置 订阅名称、订阅范围、通知对象、订阅时效。订阅设置 ...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

用户窃电识别

④ 通过 预测 组件预测该模型在预测数据集上的效果,并通过 二分类评估 组件评估该模型预测的准确性。运行工作流并查看输出结果。单击画布上方的运行按钮。工作流运行结束后,右键单击画布中的 相关系数矩阵,在快捷菜单,单击 可视化分析...

开启健康检查

开启健康检查是指对地址池中的地址配置健康检查策略,开启后可监测应用服务的可用性状态,并最终帮助企业实现自动故障隔离和自动故障切换的功效。健康检查的类型包括:Ping监控、TCP监控、HTTP(S)监控。前提条件 已完成 创建实例、创建...

ListCampaigns-获取预测式外呼活动列表

Draft Name string 否 按预测式外呼活动名称过滤,不支持模糊匹配,非必填,默认为空,表示不过滤。test-campaign PlanedStartTimeFrom string 否 外呼活动计划开始时间,非必填,默认查询所有时间范围。2021-10-14 00:00:00 ...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

访问控制常见问题

报错信息:X-Tengine-Error:denied by req auth:expired timestamp 问题原因:鉴权过期,CDN 开启了鉴权,并且URL携带了鉴权参数,但是鉴权参数过期。解决方案:如果鉴权过期,请参见 URL鉴权,重新生成鉴权URL。报错信息:X-Tengine-Error...

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

ListCases-获取预测式外呼名单列表

调用ListCases获取指定实例下指定ID对应的预测式外呼活动的外呼名单执行详情列表。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂...

管理访问控制权限

数据管理DMS提供了全方位细粒度的数据安全管理功能,支持对实例、数据库、表、数据列、数据行、元数据等进行访问控制权限管理。本文对DMS提供的访问控制权限进行介绍。权限类别说明 权限分类 权限类别 权限说明 实例是否开启安全托管 操作...

管理区块链子链

说明:当节点数小于4时,会弹出以下提示信息:当前共识机制为PBFT,当N>=3F+1(N为链节点数,F为故障节点数)链可以正常运行,请您根据对可用性的要求合理选择节点数。参与机构 为将要创建的子链添加联盟机构,被添加为子链参与机构的联盟...

指标含义与异常处理建议

指标异常原因 监控期间,当区间慢查询耗时,查询数量增大时,服务异常,常见原因如下:指标异常原因 说明 QPS 查询QPS 或 写入QPS 流量突增或波动较大,集群压力大,相对单条查询耗时久。有agg查询或者有脚本查询 聚合查询场景,需要耗用...

归档存储服务等级协议

用户可以调用归档存储提供的API或者SDK通过网络进行数据的上传和下载,并可通过Web控制台进行有限功能的管理。归档存储的存储容量支持弹性扩容,并提供基于云计算模式的按使用量付费的结算功能。2.服务等级指标 2.1.数据持久性 数据持久性...

高级模板支持的AE功能及插件

预览 VE Fast Blur 快速模糊插件,您可以快速设置模糊效果,简单快捷。预览 VE Glow 辉光插件,通过改变Threshold(阈值)、Size(大小)、Intensity(强度)、Blend Mode(混合模式),可以达到不一样的效果。VE Linear Wipe 线性擦除插件...

智能文创解决方案

阿里云PAI提供智能文创解决方案,帮助您快速搭建囊括模型离线训练、离线预测和在线部署的端到端全链路构建流程。旨在从冗长、重复的文本序列中抽取、精炼或总结出要点信息,实现各类文本生成任务,包括文本摘要生成、新闻标题生成、文案...

风险视图

查看风险 登录 AHAS控制台,从左侧导航栏选择 故障演练>架构感知。在 场景视图 区域,单击 风险视图 的 查看视图,进入详情页。默认进入的是 缩略图 视图模式。将鼠标悬浮在图标上,可查看该产品需重点关注的TOP5风险和风险总数。在页面右...

功能架构

作为一个企业级产品,系统提供资源租户隔离、访问鉴权控制和监控配置模板等企业级特性。并且提供数据高可用、服务高可靠、双机房容灾部署等平台特性。基于系统丰富数据和强大功能,可以支撑容灾巡检、故障重放、弹性扩缩、微服务治理和全...

未收到告警通知的排查思路

排查流程 操作步骤 登录 日志服务控制台。在Project列表区域,单击目标Project。该Project为您告警监控规则所属的Project。在左侧导航栏中,单击 告警。在 告警中心 页面的 告警规则 页签中,单击目标告警监控规则。在页面底部的 告警历史 ...

智能基线

重要 指标折线图中不出现智能基线值的常见原因有:创建智能基线尚未达到14天,未开始训练智能基线模型。创建智能基线已达到14天,但因指标数据量不足,或指标数据的平均值未达到训练的最低标准,尚未训练成功。创建智能基线已达到14天,...

数据库性能

背景信息 数据库自治服务DAS(Database Autonomy Service)是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,可以帮助您消除数据库管理的复杂性及人工操作引发的服务故障,有效保障数据库服务的...

DescribeCriteria-查询资产时的查询条件

查询资产时能显示的资产属性模糊匹配的查询条件。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限...

冷备操作手册

在后续运行中,如一体机发生硬件故障,本文档描述如何一键替换主机,快速恢复现场业务。一 支持声明 冷备支持机型 物业管理一体机-停车版、物业管理一体机-人行版、物业管理一体机-视频版、物业管理一体机-EBA版、物业管理一体机-通行版、...

便宜易用

对于业务具有间歇性定时任务,负载有波动或不可预测的需求,云数据库RDS支持 Serverless 计费方式,实例会根据业务情况对计算资源自动弹性伸缩,存储资源根据数据量自动扩容,避免闲置资源,降低数据库运维成本。更多信息,请参见 计费方式...

控制台介绍

您可以在图像搜索控制台上创建实例、新增图片、搜索图片。本文为您介绍图像搜索控制台的主要功能及页面布局。说明 如需了解更多产品详情和获取技术支持,请单击 在线咨询 或通过钉钉群(35035130)联系我们。概览 标号 功能介绍 ① 左侧...

查看血缘关系

通过节点名称搜索 查看血缘信息 当血缘关系图很复杂时,您可以通过节点名称模糊搜索,快速定位到目标节点,查看目标节点的信息。登录 实时计算控制台。在 Flink全托管 页签,单击目标工作空间 操作 列下的 控制台。在 作业运维 页面,单击...

阈值检测

配置阈值检测 登录 ARMS控制台。在左侧导航栏中选择 应用监控>应用监控告警规则。在告警规则页面选择 创建告警规则>创建应用性能监控ARMS告警规则。在 创建应用监控告警规则 页面自定义 告警名称,并选择 告警检测类型 为 阈值检测。说明 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 时间序列数据库 TSDB 智能语音交互 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用