监控服务概览

OpenAPI访问监控数据 OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:云监控SDK参考 访问监控数据 监控、诊断和故障排除 监控诊断和故障排除 通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行...

可观测性的设计原则

通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求中,并在整个系统中传递。每个组件都可以将标识符添加到它们的日志中,以便在...

故障排除

CC API在调用时可能会遇到一些错误,遇到错误时以错误码为依据进行故障排除,本文为您介绍 常见错误码的解决方案。云产品运行时错误码 云产品API运行时返回的错误码。以下两个错误码为云产品运行时错误,如想获取云产品详细错误信息,需...

常见问题FAQ

4.HDMI无信号 故障示意图如下:故障排除方案如下:1.见下遥控器说明,按电源键,重启魔盒。2.重复插拔HDMI线 3.重启屏幕 屏幕操作指南由屏幕供应商给出。4.屏幕的信号源切换到HDMI输入。屏幕操作指南由屏幕供应商给出。如无法排除故障:...

诊断网页加载过慢的问题

针对这类问题,ARMS前端监控的慢会话追踪功能提供页面静态资源加载的性能瀑布图,可深入定位页面资源加载情况,全方位地诊断故障根源,从而快速排除故障。问题描述 网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类...

故障发现

对于完成监控覆盖的核心业务场景,在异常上报时,通过工具自动检测或值班人员人工判断,及时识别风险或故障,以风险预警和故障通告的形式快速调度应急负责人上线处理,避免业务受损或降低业务受损程度。之所以设立7*24监控值班,是因为报警...

故障应急

故障管理体系是围绕故障生命周期采取的一系列控制流程,包括故障基础数据管理(故障等级定义、应急场景监控覆盖、服务组&值班表管理、故障订阅管理),故障发现(7*24监控值班、智能基线告警),故障应急协同(故障通告及更新、故障应急...

支持计划

配置指导以及故障排除 配置指导以及故障排除 配置指导以及故障排除 专属技术服务经理 不支持 不支持 专属技术服务经理(TAM)健康检查 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor。专属技术服务经理...

故障演练

重要 故障演练会通过将被演练的资源关闭,使资源处于人工构造的故障状态,请确保您已将演练资源进行冗余配置,否则会导致业务中断.故障演练过程中控制台的资源状态显示存在一定的时延,但不影响底层资源状态切换的时效性。使用限制 每个...

产品优势

智能高效 计算巢集成了阿里云一系列底层产品能力,为服务商提供了一个智能简捷的服务发布和管理平台,覆盖了服务的整个生命周期,包括服务的交付、部署、运维等。提升了服务的交付、部署和运维效率,解决了传统模式下依赖人工经验带来的...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

什么是事件

支持将影响恶化的事件一键升级为故障,实现事件全生命周期的在线化管理。核心功能 流转灵活、事件分级处理、全生命周期动态记录。流转灵活:触发的事件支持处理人灵活的响应、转交、升级故障并完结处理故障;事件分级:事件支持根据其影响...

故障止损恢复

快恢能力主要包含人工梳理快恢预案、通用垂直专项快恢能力:人工梳理预案:通过全面梳理故障场景及风险场景的可用降级预案来达到该场景触发故障时,系统自动推荐前期关联的预案,提供故障群内一键执行的方式,也提供设定执行条件,符合条件...

用户窃电识别

背景信息 传统防窃漏电主要通过定期巡检、定期校验电表及用户举报等方法发现窃电或计量装置故障,该方法强依赖于人工手段,且抓窃查漏的目标不明确。通常供电局通过计量异常报警功能和电能量数据查询功能,人工在线监督用户用电情况。例如...

网络类场景

排除端口 无需注入网络延迟调用故障的端口,与本地服务端口和远程服务端口功能互斥。可以指定多个,使用逗号分隔,使用连接符表示范围。例如80,8000-8080。远端服务IP 指定演练对象访问的远端服务IP。可以通过子网掩码来指定一个网段的IP...

AI助手使用说明

安装AI助手并开启PAI的作业监控和恢复功能后,当训练任务发生故障或异常时,能自动上报故障信息、隔离问题节点,无需人工干预即可快速恢复任务。本文为您介绍AI助手的具体配置方法。前提条件 已创建带有ACK灵骏托管版的集群。具体操作,请...

设置宕机自动迁移

注意事项 如果本地SSD型DDH出现故障,您可以 提交工单 申请人工迁移,但迁移后本地盘数据会丢失。DDH因故障迁移完成后,DDH ID及ECS实例的元数据(例如实例ID、私有IP地址、公网IP地址)均保持不变,但是由于更换了物理服务器,DDH的机器码...

创建DDH

如果本地SSD型DDH出现故障,您可以 提交工单 申请人工迁移,但迁移后本地盘数据会丢失。计算型 c7 宿主机名称 输入宿主机名称。长度为2~128个字符,必须以大小写字母或中文开头,可包含数字、半角句号(.)、下划线(_)、半角冒号(:)或...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统后,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

人工辅助

人工辅助(Customer Service Assistant)产品采用阿里云的人工智能技术,在客服或销售的对话过程中,为客服坐席或销售人员提供实时语音转写、知识随行、实时SOP(Standard Operating Procedure,标准作业流程)引导、实时服务质量检测等...

人工智能平台 PAI

人工智能平台 PAI(Platform of Artificial Intelligence)面向企业客户及开发者,提供轻量化、高性价比的云原生人工智能,涵盖DSW交互式建模、Designer拖拽式可视化建模、DLC分布式训练到EAS模型在线部署的全流程。

人工智能众包(文档停止维护)

人工智能众包(AI Crowdsourcing)基于共享人力资源模式,为人工智能算法提供数据采集、清洗、标注等服务,帮助企业快速构建算法数据集。

应用场景

故障跟踪:支持对故障进展、故障影响面、舆情反馈、Timeline进行在线化管理、协同,提升故障处理效率。故障复盘:基于最佳实践经验,沉淀了对故障进行深度复盘的结构化要求,形成了线上检查点,以产品的方式承载流程落地。故障改进:支持对...

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

任务节点人工干预

任务节点状态 任务节点的生命周期如下:在拓扑任务中,单个任务节点可能处于以下状态之一:未执行:该节点未实例化。执行中:该节点正在执行中。执行成功:节点执行成功。在无其它人工干预操作的情况下,后续节点将被自动触发。执行失败:...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

故障排查

Service无法正常工作 在排除网络插件自身的问题外,最可能的是 label 配置有问题,您可以通过查看 endpoints 进行故障排查。具体操作,请参见 检查Service。如何升级集群?升级集群的Kubernetes版本,具体操作,请参见 手动升级ACK集群。从...

产品正式商业化发布

事件全生命周期管理:核心报警通过事件跟进到底,更好的协同处理;沉淀研发运维处理经验,形成知识体系,更好的复用。故障管理闭环:事件影响恶化,将升级为故障故障管理形成闭环,持续提升业务连续性。云钉一体的运维协同:基于钉钉打通...

什么是人工辅助

人工辅助(Customer Service Assistant)产品采用阿里云的人工智能技术,在客服或销售的对话过程中,为客服坐席或销售人员提供实时语音转写、知识随行、实时SOP(Standard Operating Procedure,标准作业流程)引导、实时服务质量检测等...

什么是人工智能平台PAI

阿里云人工智能平台PAI(Platform For AI),提供一站式的机器学习解决方案。本文为您介绍什么是人工智能平台PAI。什么是机器学习 机器学习是一门多学科交叉专业,涵盖概率论知识、统计学知识、近似理论知识和复杂算法知识,它使用计算机...

应用场景

本文介绍人工辅助的应用场景。热线客服场景 针对热线客服场景,人工辅助与阿里云呼叫中心形成联合解决方案,提供实时语音转写、知识随行、实时SOP引导、实时服务质量检测等功能,为客服提供实时通话辅助,规范服务流程和业务知识。在线客服...

应用场景

人工智能众包可以为如下业务场景提供服务。人工智能众包可以为如下业务场景提供服务:人工智能行业 智能家居的指定唤醒词语音收集、数字串朗读,可通过阿里巴巴集团的语音识别接口自动为语音质量打分,只交付合格的数据。智慧医疗领域:X光...

InstanceLifeCycle

名称 类型 描述 示例值 object 数据集加速实例生命周期 Type string 数据集加速实例生命周期类型 Running Config string 数据集加速实例生命周期配置

迁移有潜在故障风险的DDH

如果一台DDH有潜在故障风险,其物理机处于可用状态,但随时可能出现故障,导致DDH中的ECS实例出现问题。您可以自主迁移有潜在故障风险的DDH到其他物理机,避免相关业务因DDH故障受到影响。前提条件 请先将DDH上的ECS实例全部停机,否则迁移...

基础设施安全

可用区间故障隔离 可用区是指在同一地域内,电力和网络互相独立的物理区域。在同一地域内,可用区与可用区之间内网互通。各可用区之间可以实现故障隔离,即如果一个可用区出现故障,不会影响其他可用区的正常运行。每个地域完全独立,不同...

DDH生命周期

专有宿主机DDH的生命周期是指DDH从创建到释放的整个过程。在这个过程中,DDH会经历不同的状态。本文介绍DDH整个生命周期内的所有状态。DDH状态详情,如下表所示。状态 属性 说明 控制台上可见 启动中 中间状态 创建成功后,一台DDH进入 ...

产品计费

人工辅助产品目前处于公测阶段,免费使用。

产品优势

本文介绍人工辅助产品的优势。人工辅助具备实时语音或文本的辅助功能,具有以下优势:客服服务提效 实时知识推荐:使客服精准快速回复客户问题。自动SOP流程辅助:使客服按照标准业务流程进行服务。提高服务质量 实时检测敏感词。实时检测...

SlotLifeCycle

名称 类型 描述 示例值 object 数据集加速槽生命周期 Type string 数据集加速槽生命周期类型。KeepAlive:保持运行,不会被释放 RelativeTime:运行一段时间后释放,单位为秒 AbsoluteTime:运行到该时间点时,将会自动释放 ...

什么是智能众包

人工智能众包(AI Crowdsourcing)基于共享人力资源模式,为人工智能算法提供数据采集、清洗、标注等服务,帮助企业快速构建算法数据集。人工智能众包(AI Crowdsourcing)基于共享人力资源模式,为人工智能算法提供数据采集、清洗、标注等...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 智能语音交互 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用