故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

如何管理故障

可对故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...

事件告警

告警的处理方式 元数据空间不足 告警原因 元数据空间指的是SMB或NFS共享所对应的缓存盘中用于存储元数据的空间,主要包括目录结构等信息,文件数目越多,使用的元数据空间也就越大。共享使用的缓存盘由数据空间和元数据空间组成,默认20%的...

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

OOM常见问题排查指南

关于该问题产生的原因、主要影响和解决方法具体如下:产生原因 元数据占用内存多 表现为Meta内存使用率高:表数据量增加,数据总量也随之增加,元数据占用内存多,当没有任务运行时,内存水位也会高,通常建议一个Table Group下不要超过...

0011-00000004

问题原因 自定义元数据是一组键值对,元数据名称必须以 x-oss-meta-开头。该报错原因是用户自定义元数据(User Meta)的Key中 x-oss-meta-*包含非法字符。问题示例 用户自定义元数据的Key为:x-oss-meta-*,其中*需要填写正确的字符。例如...

0011-00000005

问题原因 自定义元数据是一组键值对,该报错是因为键值对中的Value包含非法字符。问题示例 正确示例:x-oss-meta-last-modified:20210506。解决方案 检查自定义元数据的Value,确认是否包含非法字符。使用PutObject接口时,如果配置以 x-...

Dataphin给计算源上的物理表添加了字段,Dataphin中...

问题原因 目前元数据更新是15分钟一次,如果不是在Dataphin上做的更新操作,15分钟后也还是查不到,有可能是环境中表比较多,比对所有项目的所有表有无更新的时间会较长,导致每轮更新元数据的时间较长。解决方案 1.继续等待,等待元数据...

故障协同处理(基于钉钉)

5.故障应急场景群:事件升级故障后自动创建故障应急场景群,在原有群聊和生成的故障场景群都支持操作故障,且故障关联数据和消息卡片实时同步推送。故障场景群包含以下三部分功能:(1)消息卡片自动推送:场景群创建成功后,群机器人自动...

0041-00000111

问题描述 无法解析自定义元数据。问题原因 请求触发镜像回源时,源站解析自定义元数据格式错误。问题示例 解析x-oss-persistent-headers内容不合法。其他情况 解决方案 排查源站异常。相关文档 镜像回源

Dataphin数据集成Oracle组件下拉表清单提示无法获取...

问题原因 数据源中绑定的账号没有数据库元数据的相关表权限,涉及的表如下:ALL_TABLES ALL_TAB_COMMENTS ALL_VIEWS ALL_TAB_COLUMNS ALL_COL_COMMENTS 解决方案 在Oracle中对绑定在Dataphin数据源中的账号授予相关表的查询权限。...

0024-00000507

问题原因 您启动元数据转换任务时,任务状态不为空闲。问题示例 该功能为邀测功能,未对全部用户开放,暂不提供示例。解决方案 检查当前任务状态,如不为空闲状态,请等任务执行完成,状态为空闲后再启动任务。相关文档 OSS-HDFS服务的...

单实例快速恢复

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

Dataphin修改表结构查询报错字段不存在

问题描述 用户修改了表结构,新增了某字段,即席查询发现查询单个字段报错字段...问题原因 用户资产元数据未及时更新导致的。解决方案 1.等待30分钟即可自动更新。2.手动更新,资产搜该表,点击右侧更新元数据按钮即可。适用于 Dataphin 资产

数据湖加速查询

基于阿里云数据湖构建(Data Lake Formation,DLF)和对象存储(Object Storage Service,OSS)推出的Hologres数据湖加速服务,提供了灵活的数据访问和分析能力以及高效的数据处理能力,显著加快了对OSS数据湖的查询和分析过程。...

产品优势

支持企业级管理组件,降低运维复杂度和运维能力要求 更专业的数据安全和治理,满足数据合规要求 提供完整一套基于元数据的安全和治理技术 简化多用户的数据访问和分析,对数据访问进行授权、跟踪和审核 符合法规要求,以减少安全原因导致的...

CopyObject

重要 如果拷贝操作的源Object地址和目标Object地址相同,且未开启版本控制时,则无论x-oss-metadata-directive为何值,都会忽略源Object的元数据,目标Object将直接采用请求中指定的元数据。x-oss-server-side-encryption 字符串 否 AES256...

使用Tablestore作为存储后端

JindoFS元数据服务支持不同的存储后端,本文介绍使用Tablestore(OTS)作为元数据后端时需要进行的配置。前提条件 已创建EMR集群。详情请参见 创建集群。已创建Tablestore实例,推荐使用高性能实例。详情请参见 创建实例。说明 需要开启...

使用Tablestore作为存储后端

JindoFS元数据服务支持不同的存储后端,本文介绍使用Tablestore(OTS)作为元数据后端时需要进行的配置。前提条件 已创建EMR集群。详情请参见 创建集群。已创建Tablestore实例,推荐使用高性能实例。详情请参见 创建实例。说明 需要开启...

数据容灾

当断网、断电或者发生灾难事件导致某个机房不可用时,仍然能够确保继续提供强一致性的服务能力,整个故障切换过程用户无感知,业务不中断、数据不丢失,可以满足关键业务系统对于“恢复时间目标(RTO)”以及“恢复点目标(RPO)”等于0的...

DLA Lakehouse实时入湖

全量建仓或直连数据库进行分析对源库造成的压⼒较大,需要卸载线上压⼒规避故障。建仓延迟较⻓(T+1天),需要T+10m的低延迟入湖。更新频繁致小文件多,分析性能差,需要Upsert⾃动合并。海量数据在事务库或传统数仓中存储成本高,需要低...

0026-00000004

问题描述 并发修改对象的元数据或标签。问题原因 您执行的对象元数据修改操作或对象标签修改操作产生冲突。问题示例 无。解决方案 请勿执行对象元数据或对象标签的并发修改操作。相关文档 StaleFile

0024-00000505

问题描述 元数据转换任务...问题原因 您创建的元数据转换任务数量超过了上限。问题示例 该功能为邀测功能,未对全部用户开放,暂不提供示例。解决方案 检查任务是否超过上限,删除不使用的多余任务后重试。相关文档 OSS-HDFS服务的元数据转换

0024-00000506

问题原因 您创建的元数据转换任务中,Path数量超过了上限。问题示例 该功能为邀测功能,未对全部用户开放,暂不提供示例。解决方案 检查Path是否超过上限,删除多余的Path任务后重试。相关文档 OSS-HDFS服务的元数据转换

0024-00000501

问题原因 您发起了元数据转换相关的管理请求,请求中XML格式或参数不正确。问题示例 该功能为邀测功能,未对全部用户开放,暂不提供示例。解决方案 该功能为邀测功能,如果发现此错误,请联系 技术支持。相关文档 OSS-HDFS服务的元数据转换

0037-00000002

问题原因 您发起OpenMetaQuery请求为Bucket开启元数据管理功能,但是请求的Bucket已开启或者正在关闭元数据索引库。问题示例 例如,您发起OpenMetaQuery请求为Bucket(oss-example)开启元数据管理功能。如果该Bucket已开启或者正在关闭...

三可用区概述

数据节点和元数据节点容灾能力 单可用区故障 存储节点和元数据节点均为三节点,创建时强制打散在三个可用区。如果Leader节点故障,内核重新选主,短暂影响实例可用性,但是不会丢失数据(RPO=0)。如果Follower或Logger故障,不影响实例...

424错误

Read body from mirror host failed,please check your mirror host 问题原因:无法从镜像源站读取数据。解决方案:请检查是否能正常访问镜像回源地址中的文件。Bytes read is not equal to expected 问题原因:从镜像源站读取的数据缺失或...

0037-00000003

问题原因 您发起了DoMetaQuery或GetMetaQueryStatus请求,但是请求的目标Bucket没有开启元数据管理功能。问题示例 例如,你发起了DoMetaQuery请求,但是请求的Bucket(oss-example)未开启元数据管理功能,导致请求错误。POST/?metaQuery&...

Hive元数据基本操作

本文为您介绍Hive元数据的基本操作,包括新建库、删除库、新建表和删除表。前提条件 已创建集群,详情请参见 创建集群。新建库 进入元数据管理页面。登录 阿里云E-MapReduce控制台。在顶部菜单栏处,根据实际情况选择地域 和资源组。单击...

0024-00000502

问题原因 您发起了管理元数据转换任务请求(修改或删除),并设置了RoleID。问题示例 该功能为邀测功能,未对全部用户开放,暂不提供示例。解决方案 管理元数据转换任务(修改或删除)不需要填写RoleID。相关文档 OSS-HDFS服务的元数据转换

0024-00000503

问题描述 创建元数据转换任务请求中的RoleID...问题原因 您发起了创建元数据转换任务请求,请求中的RoleID为空。问题示例 该功能为邀测功能,未对全部用户开放,暂不提供示例。解决方案 填写正确的RoleID。相关文档 OSS-HDFS服务的元数据转换

0024-00000504

问题原因 您发起了创建元数据转换任务请求,命中前缀参数含有OSS-HDFS的特殊路径。命中前缀不支持设置为..d、.dl、.dls、.dlsd、.dlsda、.dlsdat、.dlsdata其中之一。问题示例 该功能为邀测功能,未对全部用户开放,暂不提供示例。解决...

0016-00000836

问题描述 SelectObject请求体XML中设置了Range标签,但是目标文件的Select元数据与请求体XML中设置的元数据不匹配。问题原因 您发起了SelectObject请求,并在请求体XML中通过设置了要查询的文件内容范围,但是查询的目标文件对应的Select ...

EMR Kafka磁盘写满运维

此时,可以通过ECS实例层面的操作,将分区副本数据挪到当前Broker的其他磁盘并修改相应Kafka数据目录元数据的方式来解决故障盘空间不足的问题。适用场景 故障磁盘所在Broker使用容量不均衡、存在空间使用率较低的磁盘。注意事项 该方法只能...

迁移元数据上云

元数据存储于RabbitMQ集群的内部数据库,在集群的各个节点之间自动复制。集群内各节点的元数据内容都相同。使用限制 由于RabbitMQ和 云消息队列 RabbitMQ 版 在权限管控机制等方面存在差异,rabbit_version、users、permissions、...

0011-00000002

问题原因 以PutObject作为例子,使用PutObject接口时,如果配置以 x-oss-meta-*为前缀的参数,则该参数视为元数据,例如 x-oss-meta-location。一个Object可以有多个类似的参数,但所有的元数据总大小不能超过8 KB。问题示例 无 解决方案 ...

0011-00000007

问题原因 请求中指定了文件元数据,但是文件元数据中的Content-Disposition字段包含非法字符。问题示例 例如,您发起了PostObject请求,并通过表单域中的Content-Disposition字段声明上传的文件的展示形式。如果该字段的值包含不允许的字符...
共有167条 < 1 2 3 4 ... 167 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 数据库备份 DBS 云数据库 RDS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用