常见问题旧版索引

本文介绍容器服务ACK的常见问题。您在使用容器服务ACK时如果收到容器服务ACK返回的错误信息,可查阅 容器服务ACK错误码 匹配解决方案。如果您没有收到具体的错误信息,可根据以下问题分类匹配问题场景和解决方案。入门FAQ 方案规划 容器...

Pod诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查...

Pod诊断

容器服务平台构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查、...

Pod诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查...

使用负载感知调度

ACK集群Pro版 调度器的负载感知调度功能会根据节点的实际负载情况,将Pod优先调度到负载较低的节点,以实现节点负载均衡,降低节点故障风险。前提条件 已安装ack-koordinator组件,且版本为1.1.1-ack.1及以上。具体操作,请参见 ack-...

资源伸缩和系统扩展

不同的应用部署方式需要使用不同的伸缩方案,常见的伸缩方案主要有以下几种:云服务自动扩缩 在阿里云上进行自动伸缩依赖的云服务是 弹性伸缩 ESS(Auto Scaling),是指根据业务需求和策略自动调整计算能力(即实例数量)的服务。...

什么是SCDN

多级调度:支持多级的调度策略,节点故障不会造成用户服务不可用。多系统联动:和阿里云其他产品形成多系统联动,与安全防御系统、刷新系统、内容管理系统等协调工作,达到各模块的最优性能。流量预测:数据化实时调度,支持节点级别流量...

DDoS高防和CDN或DCDN联动

通过流量调度器的智能调度,业务正常访问期间,流量不经过DDoS高防清洗就近使用加速产品的节点加速,仅在业务被攻击时流量切换到DDoS高防进行清洗,由高防将清洁流量直接转发给源站,保证业务平稳运行。本文介绍如何配置DDoS高防和加速产品...

资源使用优化

云原生资源调度通过应用负载合理调度资源 为了实现精准、实时的实例伸缩和放置,必须把应用负载的特征作为资源调度依据,使用弹性调度策略,云平台负责管理应用所需的弹性计算资源。调度平台可以识别应用特征,在应用负载快速上升时,及时...

ACK集群概述

调度:支持不同弹性资源的混合调度、异构资源的精细化调度、批量计算的任务调度等,提升应用的性能和集群整体资源的利用率。多集群管理:支持线下IDC和多云多区域的集群统一接入实现混合云应用管理。授权管理:支持RAM授权和RBAC权限管理。...

产品简介

延时极度敏感业务场景 延时极度敏感的业务场景,例如高性能网络服务器、网关系统和中间件系统等业务,使用绑核的独享型实例,确保业务负载的稳定无扰动。支持秒级启动和大规模弹性伸缩,稳定承载流量突发的业务请求,避免流量损失或者提前...

产品架构

高可用管理平台 HAS 在蚂蚁 SOFA 中间件以及 Café 应用发布平台的基础上,为用户应用及蚂蚁应用提供日常巡检、风险管理、应急预案、故障演练等技术风险管理能力,满足用户应用巡检、故障处置、应急管理、故障演练等多种应用运维场景。系统...

什么是故障演练

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的...

强弱依赖治理概述

强弱依赖治理的应用 强弱依赖治理主要可以被应用到以下场景:系统改造验收:对于分布式系统,至少在运行态中,不会因为依赖的系统后台出现故障,引起当前应用出现系统级可用性的故障,例如进程挂掉、频繁FullGC、负载飙高等,何时何地都应...

产品优势

P2P方案的一大优势是技术上支持单节点故障容错,且拥有百万量级边缘节点,P2P调度系统可以随时获知节点当前状态,并实时调度最优节点为您提供数据,因此单节点不可用不会影响PCDN服务质量。PCDN SDK接入难易程度如何?您只需要根据PCDN SDK...

数据开发常见问题

Spark:Spark常见问题 外部表:外部表常见问题 安全管理相关:权限管理常见问题 安全配置常见问题 运维管理:Information Schema常见问题 小文件优化及作业诊断常见问题 其他运维常见问题 下载数据相关:如何下载超过1万条的表数据?...

DCDN节点运维下线说明

节点流量调度:阿里云DCDN节点的运维操作有一套规范的处理流程,对于需要运维的节点,阿里云DCDN的调度系统会在下线节点之前把流量调度到周边正常运行的节点上。异常情况监测:阿里云DCDN节点也可能会因为一些少量的异常情况(例如:运营商...

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

故障管理

系统软件故障:包括操作系统死机、数据库的各类故障。硬件故障:包括硬盘、网卡损坏。相关设备故障:包括UPS失效引起的电力中断。自然灾害,包括洪水、火灾、地震。这里以阿里集团为例。为降低故障的影响,阿里集团故障管理体系从整体体系...

公交出行:启迪公交

票务管理工作台通过用户检录数据,实时同步到阿里云AnalyticDB分析型数据库,分析出实时客流,结合公交汽车机具上传的监控信息进行实时统一分析支持指挥车辆调度。客户价值 启迪公交通过北京公交智能化业务系统,为首都人民提供了更加绿色...

故障演练

常见故障类型都可以映射到这个故障模型中,模拟故障的演练系统及方案也可以基于该模型进行设计。在设计演练方案的过程中,可以考虑在模型中每个环节进行故障注入,验证故障应急方案。不同演练类型和目标 根据演练过程对线上业务的影响,...

应用故障自动诊断

常见故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...

服务定时自动部署

如果您在步骤一中引入了Designer全局变量,请参考 示例2:定时调度参数替换,在节点调度配置中将全局变量的配置替换成所需的系统变量。步骤三:部署后查看定时更新的服务版本 查看定时部署的模型服务版本,具体操作步骤如下。登录 PAI控制...

单实例快速恢复

为了能够快速恢复系统故障,Hologres提供了单实例快速恢复的机制。本文为您介绍单实例快速恢复的触发条件和行为。实例快速恢复逻辑说明 Hologres在 V2.0版本之前,Hologres计算节点均为容器调度(即下图中的Worker Node),资源管理器...

产品简介

移动调度中心(Mobile Dispatch Center,MDC)是基于客户端用户业务属性进行用户分组的精细化移动调度服务产品,能快速有效帮助客户达成业务分组灰度测试、A/B 测试、故障调优等目标。产品优势 移动调度中心的产品优势如下:用户级精准调度...

故障排查与常见问题

控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...

设置Pod故障处理策略

以库存不足创建ECI Pod失败为例,当Pod的故障处理策略为fail-fast时,Pod status condition为ContainerInstanceCreated的示例如下:说明 如果Pod的故障处理策略为fail-back,Pod创建失败后系统会自动尝试重调度。此时,Pod status.reason...

功能概览

当节点出现故障时,通过智能调度,实现秒级容灾切换,保障网络的稳定性。IPv6支持 支持IPv4和IPv6双栈。丰富的报表日志 阿里云注册用户,接入系统后可查看历史域名访问日志报表;可查询域名、子域名的请求量信息以及排名信息。用户隐私保护...

管理MySQL集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

调度周期:小时调度

小时调度即每天指定的时间段内,调度任务按 N*1小时 的时间间隔运行一次。例如,每天00:00~03:00的时间段内,每1小时运行一次。注意事项 时间周期根据左闭右闭原则计算。例如,配置调度任务在0点~3点的时间段内,每隔1个小时运行一次。表示...

DataWorks On CDP/CDH使用说明

DataWorks支持基于CDH(Cloudera's Distribution Including Apache Hadoop,以下简称CDH)和CDP(Cloudera Data Platform,以下简称CDP)集群创建Hive、MR、Presto和Impala等节点,实现CDP/CDH任务工作流的配置、定时调度和元数据管理等...

DataWorks On Hologres使用说明

DataWorks基于 实时数仓Hologres 轻松构建实时数仓与即席分析系统。Hologres可通过DataWorks提供的可视化方式配置任务工作流、周期性调度执行任务及元数据管理,保障数据生产及管理的高效稳定。本文为您介绍在DataWorks上开发Hologres任务...

什么是阿里云CDN

链路质量系统 链路质量探测系统会实时监测缓存系统中的所有节点和链路的实时负载以及健康状况,并将结果反馈给调度系统调度系统根据用户请求中携带的IP地址解析用户的运营商和区域归属,然后综合链路质量信息为用户分配一个最佳接入节点...

DataWorks On MaxCompute使用说明

DataWorks基于 云原生大数据计算服务MaxCompute 轻松构建离线数仓分析系统。MaxCompute可通过DataWorks提供的可视化方式配置任务工作流、周期性调度执行任务及元数据管理,保障数据生产及管理的高效稳定。本文为您介绍在DataWorks上开发...

任务运行诊断

常见的同步任务执行问题如下:数据同步日志长时间打印WAIT 若数据同步日志长时间打印WAIT,表示DataWorks的调度系统已将同步任务下发,由于当前任务所使用的同步资源组剩余资源无法支持当前任务执行,正在等待其他任务执行完成释放资源。...

管理集群

主机故障处理策略 设置主机故障系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 设置主机故障系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

时间属性配置说明

说明 当选择该类型时,如果系统故障,在故障恢复后,系统也不会自动重跑相应节点。不支持配置 出错自动重跑。出错自动重跑 出错自动重跑(即任务运行失败后会自动触发重跑)的配置参数说明如下表所示。参数 描述 重跑次数 周期任务调度...

阿里云CDN的五大竞争力

基于内容调度,提高访问命中率:在大文件下载和视频点播这两个应用场景上经常使用302调度这种基于内容的调度技术,302调度是一种中心调度方案,用户在请求某一个资源的时候,在完成域名DNS解析之后,用户请求将会先访问到中心调度系统上,...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 音视频通信 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用