监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

ECS系统事件汇总

系统事件用于记录和通知云资源信息,例如运维任务执行情况、资源是否出现异常和资源状态变化等。您可以通过系统事件获取ECS资源的风险和异常信息,例如 某一实例到期、实例因底层升级需迁移或因系统维护重启了某一实例等,然后及时响应和...

创建演练

背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止演练 操作步骤 登录 AHAS控制台,在左侧导航栏中选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练。选择 新建空白演练 或 从经验库新建。...

数据类型

3.0 DingRtcAudioSessionOperationRestriction SDK对AudioSession的控制权限(仅适用于iOS系统)。3.0 DingRtcVideoStreamType 相机流类型。3.0 DingRtcDeviceVolumeType 设备音量类型(仅适用于iOS系统)。3.0 DingRtcVideoSource 视频裸数据...

混沌工程缓存实战系列-Redis

Redis是一个开源高性能的Key-Value存储系统,虽然Redis本身具备了非常高的可用性,但是在实际应用中也会随着系统业务的复杂性以及不合理的使用,而导致很多的问题。本文将讲述如何通过混沌工程来暴露可能存在的使用风险,提升缓存问题的...

GTM如何实现异地容灾

两地三中心容灾架构,是指在同城双中心的基础上,在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。目标读者 企业网络部、业务运维部工作...

Kafka单表实时入湖OSS(HUDI)

说明 报警原因 为 DLL通知 时,适用的DDL 只允许选择 新增列,在同步任务解析出新的动态列时将触发报警(触发条件不是在OSS表加列)。管理报警规则。对于已创建的报警规则,您可以通过报警开关控制报警规则是否开启,同时,您可以根据报警...

链路追踪简介

req.Header.Get('x-fc-tracing-jaeger-endpoint')自定义采样规则 如果您需要自定义采样规则,您可以登录 链路追踪控制台 设置远程采样规则。更多信息,请参见 使用Jaeger进行远程采样策略配置。配置完成后,函数计算会使用您设置的远程...

混合云应用双活容灾最佳实践

背景信息 A企业是一个零售行业电商交易平台,业务系统部署在自建IDC机房,存在以下痛点:业务仅在IDC单机房部署,缺少容灾能力。IDC容量不足,物理机器升级替换周期长,不足以支撑业务的快速发展。业务在快速发展过程中,多次遇到容量不足...

接口说明

使用须知 支持的输入格式:PCM编码文件、16 bit采样位数、单声道(mono)。支持的音频采样率:16000 Hz。服务地址 访问类型 说明 URL 外网访问 所有服务器均可使用外网访问URL(SDK中默认设置了外网访问URL,无需您设置)。wss:/nls-...

归档存储服务等级协议

阿里云将对不可用时间进行赔偿,但不包括以下原因所导致的服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)...

Kafka实时ETL同步至Hologres

说明 报警原因 为 DLL通知 时,适用的DDL 只允许选择 新增列,在同步任务解析出新的动态列时将触发报警(触发条件不是在Hologres表加列)。管理报警规则。对于已创建的报警规则,您可以通过报警开关控制报警规则是否开启,同时,您可以根据...

运维服务内容说明

1.服务概述 阿里云运维服务(Alibaba Cloud Managed Services),基于阿里巴巴数字化运维解决方案,提供专属运维服务专家,帮助企业客户做好云上运维管理,降低运维开销和风险,提升运维效率和业务连续性,增强系统安全性和合规性,助力...

创建JMeter场景

高级设置开启的状态下:日志采样率设置 可自定义采样日志的采样率,默认采样率为1%。若需降低采样率,请填写(0,1]区间的值;若需提升采样率,请填写(1,50]区间内可被10整除的数,例如20。重要 当指定大于1%的采样率时,会额外收取rate%的...

语音识别FAQ

可以在 智能语音交互控制台 中项目功能配置里查看具体的模型种类,目前有8k和16k两种采样率的模型,每个采样率下面又有多个领域模型,可以按需选择。语音识别是否可以混合识别极少量英文单词和字母?可以的,中文普通话模型支持对中英文...

创建JMeter场景

高级设置开启的状态下:日志采样率设置 可自定义采样日志的采样率,默认采样率为1%。若需降低采样率,请填写(0,1]区间的值;若需提升采样率,请填写(1,50]区间内可被10整除的数,例如20。重要 当指定大于1%的采样率时,会额外收取rate%的...

Arthas诊断(新版)

操作系统信息:操作系统的相关信息,包括平均负载情况,操作系统名称、操作系统版本、Java版本等。变量信息:变量的相关信息,包括系统变量和环境变量。线程耗时分析 线程耗时分析支持显示该应用的所有线程和查看线程的堆栈信息,帮助您...

功能架构

作为一个企业级产品,系统提供资源租户隔离、访问鉴权控制和监控配置模板等企业级特性。并且提供数据高可用、服务高可靠、双机房容灾部署等平台特性。基于系统丰富数据和强大功能,可以支撑容灾巡检、故障重放、弹性扩缩、微服务治理和全...

配置自定义业务监控

用鼠标在日志样本中选中目标一个关键词,系统会根据该关键词的位置自动生成一个 列值选取规则,并在下方的列值采样表格中显示根据这一选取规则采样得到的列值。在最下方填入列名,点 提交,完成白名单列的选取。要了解 日志筛选 对话框左下...

错误信息查询

实时记录常见错误码 状态码 状态消息 原因 解决方案 40000004 Gateway:IDLE_TIMEOUT:Websocket session is idle for too long time 请求建立链接后,长时间没有发送任何数据,超过10s后,服务端会返回此错误信息。请在建立链接后和服务端...

ANALYZE和AUTO ANALYZE

配置参数 开启Auto Analyze后,系统默认会自动周期性巡检,决定需要执行Analyze的表,并进行采样计算,收集统计信息,对系统资源有一定的消耗。在某些业务场景下,默认的机制可能不适用于业务场景,例如数据写入更新不频繁场景,可以通过...

数据结构

systemCpu unsigned int 系统CPU使用率。appCpu unsigned int RTC进程CPU使用率。videoRcvdKBitrate long long 视频接收码率。videoSentKBitrate long long 视频发送码率。callDuration unsigned long long 通话时长,单位:秒。...

ADP底座介绍

ADP底座包含了两个部分:ADP容器底座:整个应用运行时的公共底座,是一个K8s为基础的容器云平台,他是应用自有组件和中间件的部署、运维的基础设施,为上层业务应用的运行和管理维护提供必要的系统支持。ADP-Local:跟随软件产品交付部署到...

AIOps 解决方案专家服务内容说明

调研的服务范围包含:基础资源调研、业务现状调研、应用系统调研《调研报告》2 智能故障发现方案设计 基于业务数据、资源组维度建立业务组单元,将业务组单元指标通过智能AI算法进行实时分析,帮助企业快速发现故障,列出可疑根因事件,并...

接口说明

目前系统支持以下声音类型:Music:纯背景音乐 Singing:唱歌 Laughter:笑声 Knock:敲门声(敲桌子声)Keyboard:键盘声 Cry:哭泣声 Explosion:爆炸声 Water:水声 SirenAlarm:警笛声 使用须知 支持的输入格式:PCM编码(无压缩的PCM...

数据结构

systemCpuUsage float 系统CPU使用率。cpu_usage float RTC进程CPU使用率。video_rcvd_kbitrate long 视频接收码率。video_sent_kbitrate long 视频发送码率。call_duration long 通话时长,单位:秒。sent_loss_rate long 客户端到服务器...

功能特性

数据库管理 功能集 功能 功能描述 参考文档 实例管理 创建与释放实例 支持通过Lindorm管理控制台创建和释放Lindorm实例。创建实例 释放实例 管理存储空间 管理存储空间是数据库管理的一部分,涉及到如何规划、分配、配置、监控、维护和扩展...

数据类型

systemCpuUsage float 系统CPU使用率。cpu_usage float RTC进程CPU使用率。video_rcvd_kbitrate long 视频接收码率。video_sent_kbitrate long 视频发送码率。call_duration long 通话时长,单位:秒。sent_loss_rate long 客户端到服务器...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行原盘恢复或者创建新盘操作来实现数据恢复。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。背景信息 云盘恢复...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行恢复原盘或者创建新盘操作实现数据恢复。本文介绍云盘恢复的相关操作。前提条件 已创建云盘备份。更多信息,请参见 创建云...

强弱依赖治理概述

强弱依赖治理的应用 强弱依赖治理主要可以被应用到以下场景:系统改造验收:对于分布式系统,至少在运行态中,不会因为依赖的系统后台出现故障,引起当前应用出现系统级可用性的故障,例如进程挂掉、频繁FullGC、负载飙高等,何时何地都应...

什么是故障演练

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的...

流水单据型业务场景多活实践

验证爆炸半径是否控制故障单元内:预期:UserID为2000的用户路由到杭州单元,不受北京单元故障的影响。结果:下单正常,符合预期。切流恢复 验证故障场景下的容灾恢复能力。在北京单元发生故障的情况下,可以使用MSHA切流功能将受影响的...

权限管理

在ADP中,主要包括三类权限:功能权限:控制系统菜单的可见性权限。功能权限属于前端权限,对其进行控制,可以避免用户看到不属于自己的功能。接口权限:控制服务端的接口请求权限。接口权限是后台安全保障中最为基础的权限,主要由服务端...

光模块故障

本文介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

XGBOOST回归

训练的子样本占整个样本集合的比例 subsample 降采样控制训练数据采样的比例,通常取值在0.5-1之间,可以避免过拟合。在建立树时对特征采样的比例 colsample_bytree 控制每棵树随机采样的列数的比例,通常取值在0.5-1之间。权重的L1正则...

XGBOOST多分类

训练的子样本占整个样本集合的比例 subsample 降采样控制训练数据采样的比例,通常取值在0.5-1之间,可以避免过拟合。在建立树时对特征采样的比例 colsample_bytree 控制每棵树随机采样的列数的比例,通常取值在0.5-1之间。权重的L1正则...

XGBOOST二分类

训练的子样本占整个样本集合的比例 subsample 降采样控制训练数据采样的比例,通常取值在0.5-1之间,可以避免过拟合。在建立树时对特征采样的比例 colsample_bytree 控制每棵树随机采样的列数的比例,通常取值在0.5-1之间。权重的L1正则...

终端访问控制系统FAQ

本文档介绍了使用终端访问控制系统的常见问题和对应的解决方案。有线网络可以通过添加Mac白名单的方式来放行打印机等哑终端设备,无线网络如何支持无法安装客户端的终端入网?终端访问控制系统支持管理哪些类型的终端?管理员在推送Windows...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云消息队列 RocketMQ 版 云安全中心 负载均衡 文件存储 CPFS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用