ack-node-problem-detector是ACK基于社区开源项目进行改造和增强的集群节点异常事件监控组件,同时支持对接第三方监控平台,承载ACK集群的节点异常发现以及事件中心的功能。您可以根据需求使用该组件加入定制化的节点监控插件,扩大节点...
为了提升集群的稳定性,建议您将ACK NPD(ack-node-problem-detector)组件升级到1.2.8版本以上。背景信息 低于v1.2.8版本的ack-node-problem-detector组件会默认开启文件系统句柄巡检项(check_fd),check_fd的进程在读取大内核数据时,...
PROBLEM_UPDATE 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 返回数据 名称 类型 ...
cancelReason Long Body 否 取消原因 取消原因 problemNotifyType Long Body 否 PROBLEM_NOTIFY PROBLEM_NOTIFY 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 ...
NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 clientToken String Body 否 FD200FAE-E98F-496E-BFE6-...
故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 problemId Long Body 否 1312 故障Id clientToken String Body 否 4361a0e1-6747-4834-96ce-0c4840fd3812 幂等校验Id ...
PROBLEM_IN_REVIEW 完结 PROBLEM_REOPENED 取消 PROBLEM_CANCEL 更新故障通告 PROBLEM_UPDATE_NOTIFY 添加故障小计 PROBLEM_ADD_SUBTOTAL 更新故障 PROBLEM_UPDATE problemId Long 12312 故障Id problemName String 这是一个故障 故障名称 ...
RESTORE 复盘 PROBLEM_IN_REVIEW 完结 PROBLEM_REOPENED 取消 PROBLEM_CANCEL 更新故障通告 PROBLEM_UPDATE_NOTIFY 添加故障小计 PROBLEM_ADD_SUBTOTAL 更新故障 PROBLEM_UPDATE snapshotData String {“userName”:"小明"} 快照数据 {...
PROBLEM_INJECTION_CODE_RELEASE</code> <parentCode>PROBLEM_INJECTION_MODE</parentCode> <name>代码发布</name><require>0</require><id>29</id><value>代码发布</value><key>1</key></PROBLEM_INJECTION_MODE></data></...
data":{"effectionServiceId":6442430,"serviceName":"哈哈","serviceId":170000000,"description":"ew","picUrl":["[\"problem/axxxxxx2-1xxxx4565-be92-f44ae2xxxxx\",\"problem/7xxxxxxe314-49998-b9e7-399e78b41fbd\",\"problem/xxxxx...
UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 problemLevel String Body 否 P2 故障等级 effectServiceIds Array of Long Body ...
问题事件 事件code 事件名称 事件等级 云监控事件名称 事件说明和影响 用户侧处理建议 公网实例 problem-internetBandwidthOverlimit 公网带宽超限丢包 严重 实例带宽超限丢包 公网实例的实际带宽流量超出了当前带宽规格,出现丢包情况。...
UPDATE","desc":"故障更新"},{"code":"PROBLEM_UPGRADE","desc":"故障升级"},{"code":"PROBLEM_DEGRADE","desc":"故障降级"},{"code":"PROBLEM_RECOVER","desc":"故障恢复"},{"code":"PROBLEM_REISSUE","desc":"故障补发"},{"code":...
50002021 故障id 返回数据 名称 类型 示例值 描述 requestId String c26f36de-1ec8-496a-a828-88067879ef81 requestId data Object data links Array of urls 图片链接列表 key String problem/xxxxxxxxxx-484d-4242-b9cf-xxxxxxxxxx oss ...
方法一:已安装node-problem-detector并创建事件中心 如果您在创建集群时,已选中 安装node-problem-detector并创建事件中心,请按照以下步骤查看Kubernetes事件中心。关于通过创建集群,安装node-problem-detector并创建事件中心的详细...
recentActivity String Body 否 2 最近活动码表:PROBLEM_RECENT_ACTIVITY injectionMode String Body 否 1 注入方式码表:PROBLEM_INJECTION_MODE recoveryMode String Body 否 2 恢复方式码表:PROBLEM_RECOVERY_MODE discoverSource ...
PROBLEM_RECENT_ACTIVITY injectionMode String 3 注入方式码表:PROBLEM_INJECTION_MODE recoveryMode String 2 恢复方式码表:PROBLEM_RECOVERY_MODE discoverSource String 1 发现来源码表:PROBLEM_DISCOVER_SOURCE userReport Long 1 ...
name:node-problem-detector-config namespace:kube-system node-problem-detector.yaml apiVersion:apps/v1 kind:DaemonSet metadata:name:node-problem-detector namespace:kube-system labels:app:node-problem-detector spec:selector:...
PROBLEM_KEY_NODE content String Body 否 故障分析 节点内容 time String Body 否 2021-01-08 10:10:10 发生时间 problemId Long Body 否 234 故障id clientToken String Body 否 c26f36de-1ec8-496a-a828-880676c5ef81 幂等标识 返回数据...
HttpCode 错误码 错误信息 描述 400 ProblemStatusError The problem status is abnormal.故障状态异常 404 ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。
故障复盘 调试 您可以在OpenAPI Explorer...4361a0e1-6747-4834-96ce-0c4840fd3212 幂等token 返回数据 名称 类型 示例值 描述 requestId String B81E84B5-8FD1-45F3-969A-B5067AADCFFF Id of the request 示例 请求示例 POST/problem/replay ...
status String Body 否 UN_RECOVERED 影响状态 0 未恢复 1已恢复 description String Body 否 erdwcdc 影响描述 pictureUrl Array of String Body 否 problem/xxxxxxxssxxxa2c8-40b9-9162-08a6c2e338e2 图片key problemId Long Body 是 ...
INJECTION,PROBLEM_HAPPEN 关键节点 码表:PROBLEM_KEY_NODE(逗号分隔)content String 内容 内容 isKey Boolean true 是否是关键字 true是 false不是 默认 false updateTime String 2020-08-08 15:38:38 修改时间 time String 2020-08-08 15...
status String Body 否 UN_RECOVERED 影响状态 0 未恢复 1已恢复 description String Body 否 xxxx大厦 影响描述 picUrl Array of String Body 否 problem/xxxxxxxx-a2c8-40b9-9162-08a6c2e338e2 图片key problemId Long Body 否 190000000...
HttpCode 错误码 错误信息 描述 404 ProblemNotExisted The problem does not exist.故障不存在 404 ProblemMeasureNotExisted The problem measure does not exist.故障措施不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多...
PROBLEM_KEY_NODE content String Body 否 时间线内容XXXX 节点内容 time String Body 否 2021-06-06 12:11:22 发生时间 clientToken String Body 否 601FA6A2-AC5C-4B59-BE11-378FTOKENA11 幂等标识 返回数据 名称 类型 示例值 描述 ...
阿里云Kubernetes配置方式 如果是ACK集群,则对应阿里云Kubernetes组件中的ack-node-problem-detector组件已集成eventer和node-problem-detector功能,您只需要部署该组件。更多信息,请参见 事件监控。如果是 ACK Serverless集群,您需要...
步骤二:新增报警媒介 登录 Dynatrace控制台,在左侧导航栏选择 setting>Integration>Problem notifications。在 Problem notifications 页面单击 Add notifications,添加一个事件通知,设置相关参数,然后单击 Save 进行保存。Display ...
步骤二:新增报警媒介 登录 Dynatrace控制台,在左侧导航栏选择 setting>Integration>Problem notifications。在 Problem notifications 页面单击 Add notifications,添加一个事件通知,设置相关参数,然后单击 Save 进行保存。Display ...
请求语法 POST/problem/delete HTTP/1.1 请求参数 名称 类型 位置 是否必选 示例值 描述 Object Body 否 A short description of struct problemId Long Body 否 1231 故障Id clientToken String Body 否 4361a0e1-6747-4834-96ce-0c4840fd...
新增故障 调试 您可以在OpenAPI Explorer中直接运行该接口,...示例值 描述 requestId String E789D869-DB13-4933-BAA8-A1F56F94B94D Id of the request data Object data problemId Long 321331 故障Id 示例 请求示例 POST/problem/upgrade ...
onectl ram-user grant-addon ack-node-problem-detector 预期输出:Ram policy ack-one-registered-cluster-policy-ack-node-problem-detector granted to ram user ack-one-user-ce313528c3 successfully.通过控制台配置 在注册集群中...
67876 故障id 返回数据 名称 类型 示例值 描述 requestId String e2d4306a-bf4d-4345-9ae6-158223c85dbd requestId data Object data bucketName String xxxx-xxxx-xxxx oss bucket name key String problem/xxxxxxxxxxxxxxxx1-b3185d...
876 故障id clientToken String Body 否 e0b6735e-1a04-4d6b-a625-d2350612492c clientToken 返回数据 名称 类型 示例值 描述 requestId String e0b6735e-1a04-4d6b-a625-d2350612492c Id of the request 示例 请求示例 POST/problem/...
4361a0e1-6747-4834-96ce-0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3812 Id of the request 示例 请求示例 POST/problem/improvement/measure/delete ...
取值:CLIENT_PROBLEM_CHECK:客户端任务 CLIENT_DEV_OPS:云运维任务 ASSET_SECURITY_CHECK:资产采集任务 说明 TaskType 和 RootTaskId 不能同时为空 CLIENT_PROBLEM_CHECK RootTaskId string 否 根任务 ID。说明 TaskType 和 RootTaskId...
6747-4834-96ce-0c4840fd3814 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd381A Id of the request data Object object subtotalId Long 123 小计id 示例 请求示例 POST/problem/save...
删除故障事件线节点。...601FA6A2-AC5C-4B59-BE11-378FTOKENA11 幂等标识 返回数据 名称 类型 示例值 描述 requestId String 10REQUES-AC5C-4B59-BE11-378F117A6A88 Id of the request 示例 请求示例 POST/problem/process/timeline/delete ...
故障小计列表。调试 您可以在OpenAPI Explorer中直接运行该接口,...} 错误码 HttpCode 错误码 错误信息 描述 404 ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。
批量创建时间节点。调试 您可以在OpenAPI Explorer中直接运行...AC5C-4B59-BE11-378F117A6A88 id of the request data Object data problemTimelineIds Array of Long 435 时间线id 示例 请求示例 POST/problem/process/timeline/batchCreate ...