设计方案

基于稳定性支柱设计原则,整体稳定性设计方案可参考如下:架构设计原则 软件系统从所有的功能都在一个应用程序内运行的单体应用架构,到不同的功能模块分别部署在不同的服务器上的传统分布式应用架构,再到服务细分通过轻量级的通信机制...

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

本文介绍Linux系统的ECS实例系统无响应,在/var/log/messages、/var/log/dmesg 等日志中出现“BUG:soft lockup – CPU#0 stuck for 61s”错误的问题原因和解决方案。问题现象 Linux系统的ECS实例出现系统无响应,在/var/log/messages、/var...

服务运维

这个问题最终通过调度层修改启动逻辑来解决:Pod 内需要优先等待所有 Sidecar 启动完成。但是,这导致了下述第二所述的新问题。Sidecar 启动慢了,上层超时。此问题仍在解决中。Sidecar 中,MOSN 提供了更为灵活的平滑升级机制:由 ...

附录:SOFAStack 产品目录

分布式链路跟踪系统能迅速定位到有问题的服务,协助快速解决问题。查看完整的应用调用拓扑关系:自动发现该服务之前的调用以及对所有中间件的调用,绘制整个系统的完整调用拓扑关系。快速定位不健康应用:在调用关系拓扑中,对不健康应用...

运维服务内容说明

在阿里云提供运维服务的过程中,如出现含有第三方软件的问题,客户须负责与第三方厂商交涉,协助阿里云解决问题。客户在阿里云提供服务结束后,应及时进行服务验收,签署服务验收报告。8.验收标准 客户阿里云提供以下交付物,视为服务验收...

阿里云CDN的五大竞争力

基于内容调度,提高访问命中率:在大文件下载和视频点播这两个应用场景上经常使用302调度这种基于内容的调度技术,302调度是一种中心调度方案,用户在请求某一个资源的时候,在完成域名DNS解析之后,用户请求将会先访问到中心调度系统上,...

使用实例时镜像相关问题

在使用ECS实例过程中,可能会遇到一些与镜像有关的问题或咨询,比如实例启动慢、系统负载高、如何编译内核等。本文介绍在使用ECS实例过程中遇到的镜像相关问题解决方案。Windows镜像问题 如何手动更新Windows实例的virtio驱动?Windows ...

共享GPU调度概述

节点选卡策略Binpack和Spread 在共享GPU调度中,如果节点存在多张GPU卡,从节点中挑选GPU卡分配给Pod时,有两种策略可以考虑:Binpack:默认策略,调度系统先分配完节点的一张GPU卡后,再分配节点上另一张GPU卡,避免节点出现GPU资源碎片。...

调度概述

ACK Scheduler是ACK基于Kubernetes Scheduling Framework扩展机制,针对不同任务负载、不同弹性资源的统一调度系统。ACK Scheduler支持不同弹性资源的混合调度、异构资源的精细化调度、批量计算的任务调度等,提升应用的性能和集群整体资源...

调度参数

由于调度参数仅经过调度系统才能被自动替换,因此,如果您需通过数据开发测试调度参数在调度系统的替换情况,可选择开发环境冒烟测试。说明 由于数据集成任务没有开发环境测试功能,所以如果您需测试该类任务调度参数替换情况,建议新建...

基于AnalyticDB实现城市公交系统智能化

启迪公交基于 AnalyticDB MySQL版 和DRDS建设的完整解决方案,将人、车、线、站的大数据资源及相关配套资源进行商业化转换,引领行业提升公交系统的创新能力和服务水平,助力“互联网+城市公交”的提升发展。业务挑战 启迪公交(北京)科技...

应急响应服务

应急响应服务是由经验丰富的安全专家为您提供一对一专业的应急响应服务,在服务过程中使用规范的服务流程和项目管理流程,为您制定完整的安全解决方案,帮助您在最短的时间内使用最低的成本解决紧急安全事件。什么是应急响应服务 背景信息 ...

依赖关系

因为依赖关系解析是基于已经提交和发布的节点信息来进行搜索,如果节点B提交成功后,您又删除了节点B的输出名称且未提交至调度系统,则在节点A上仍然能搜到节点B已删除的输出名。为什么节点删除报错当前节点存在子节点,下线失败,但是在...

公交出行:启迪公交

PolarDB-X 专注解决海量数据存储、超高并发吞吐、大表瓶颈以及复杂计算效率等数据库瓶颈问题,历经各届天猫双十一及阿里云各行业客户业务的考验,助力企业加速完成业务数字化转型。本文介绍启迪公交如何通过 PolarDB-X 应对业务挑战。所属...

数据开发概述

代码在重复运行时若希望获取到运行环境的一些信息,例如日期、时间等,可根据DataWorks调度系统的调度参数定义,动态为代码中的变量赋值。业务日期 指昨天,在离线计算场景下,交易日期为业务发生的日期。DataWorks默认取调度时间内,任务...

什么是阿里云CDN

链路质量系统 链路质量探测系统会实时监测缓存系统中的所有节点和链路的实时负载以及健康状况,并将结果反馈给调度系统调度系统根据用户请求中携带的IP地址解析用户的运营商和区域归属,然后综合链路质量信息为用户分配一个最佳接入节点...

离线同步能力说明

费用说明 数据集成同步任务运行会占用数据集成任务执行资源,DataWorks会根据您使用的资源进行收费,此外,离线同步任务通过调度系统下发至对应资源组运行时,还会产生调度相关费用。详情请参见 资源费用明细:数据集成。说明 调度费用详情...

权限管理与规范化数据开发

开发角色可以不经过任何人审批,随时新增、修改代码并提交至调度系统,给生产环境带来不稳定因素。面向MaxCompute计算引擎时,开发角色默认拥有当前MaxCompute项目所有表的读写权限,可随意对表进行增加、删除和修改等操作,存在数据安全...

节点伸缩概述

当集群的容量规划无法满足应用Pod调度时,您可以使用ACK提供的节点伸缩功能,自动扩缩节点资源以进行调度容量的补充。ACK目前提供 节点自动伸缩 与 节点即时弹性 两种弹性方案,后者相较于前者有着更快的弹性速度、更高的交付效率和更低的...

通过OpenAPI创建、修改、删除离线同步任务

由于DataWorks调度系统的规则,cron表达式有以下限制:最短调度间隔时间为5分钟。每天最早调度时间为0点5分。CycleType String 否 NOT_DAY 调度周期的类型,包括NOT_DAY(分钟、小时)和DAY(日、周、月)。该参数与 DataWorks控制台 中,...

通过OpenAPI创建、修改、删除离线同步任务

由于DataWorks调度系统的规则,cron表达式有以下限制:最短调度间隔时间为5分钟。每天最早调度时间为0点5分。CycleType String 否 NOT_DAY 调度周期的类型,包括NOT_DAY(分钟、小时)和DAY(日、周、月)。该参数与 DataWorks控制台 中,...

HTTP触发器节点

其他调度系统的触发配置 在外部调度系统中进行触发配置时,您可以通过以下三种方式:Java方式、Python方式或API调用方式。Java方式 安装Java SDK,详情可参见 开始使用。其中,DataWorks的SDK请用下面的pom配置。groupId>...

使用Gang scheduling

ACK基于新版的Kube-scheduler框架实现Gang scheduling的能力,解决原生调度器无法支持All-or-Nothing作业调度问题。本文介绍如何使用Gang scheduling。重要提示 请预留足够资源:使用弹性节点池时请保证弹性节点池的最大资源量以及节点...

使用Gang scheduling

ACK基于新版的Kube-scheduler框架实现Gang scheduling的能力,解决原生调度器无法支持All-or-Nothing作业调度问题。本文介绍如何使用Gang scheduling。重要提示 请预留足够资源:使用弹性节点池时请保证弹性节点池的最大资源量以及节点...

功能发布记录(2023年)

所有DataWorks用户 SQL查询 2023-03 功能名称 功能描述 发布时间 发布地域 使用客户 相关文档 数据治理中心支持使用消息通知治理问题 管理员及个人用户,可将治理工作台中每日治理的待解决问题,以消息通知的形式,通过系统提示、邮件、...

节点诊断

节点系统出现AUFS mount hung问题,请收集节点日志并 提交工单 处理。关于收集节点日志操作,请参见 一键采集节点的诊断日志。节点内核BufferIOError情况 检查节点内核是否出现BufferIOError。节点内核出现BufferIOError情况,请收集节点...

使用负载热点打散重调度

ack-koordinator组件提供负载热点打散重调度能力,可以感知集群内节点负载的变化,自动地优化超过负载水位安全阈值的节点,防止出现负载极端不均衡的情况。本文介绍如何使用负载热点打散重调度及其高级配置参数。使用限制 仅支持ACK Pro版...

Pod诊断

节点系统出现AUFS mount hung问题,请收集节点日志并 提交工单 处理。关于收集节点日志操作,请参见 一键采集节点的诊断日志。节点内核BufferIOError情况 检查节点内核是否出现BufferIOError。节点内核出现BufferIOError情况,请收集节点...

应用场景

分布式调度(支持非微服务场景)MSE ZooKeeper提供了丰富的分布式锁,分布式队列等功能,可以为自建分布式应用提供多种分布式协调解决方案,提升系统高可用能力,快速高效实现分布式应用系统的构建。如果你使用的是Hadoop、HBase、Kafka和...

文档修订记录

任务调度属性配置概述 2023年2月更新记录 时间 特性 类别 描述 产品文档 2023.2.28 新增功能 数据治理中心 DataWorks支持您根据业务需要,将 治理工作台>治理项问题 页面待解决的治理项问题以通知的形式,通过系统提示、邮件、钉钉群消息等...

从Spring Cloud到服务网格体系的结合与迁移

其根本原因是两套服务发现导致的不一致问题,因此解决办法较为简单,统一服务发现即可。也就是说,Kubernetes已经在Pod调度的同时维护了服务和Endpoint间的数据,则没有必要再单独使用一套命名服务的机制进行服务注册,统一收敛到...

可运维性咨询服务内容说明

评估系统是否具备故障演练和逃逸能力,并基于阿里巴巴多年业务的真实线上故障库的积累,通过模拟调用延迟、服务不可用、机器资源满载等,真实检验应用的高可用能力,同时考察相关人员对问题的应急能力,以及问题上报、处理流程是否合理,...

什么是企业级分布式应用服务EDAS

快鱼服饰FASTFISH 借助EDAS搭建起业内一个成熟的分布式业务系统,帮助快鱼解决原有多套系统之间商品、渠道等数据不一致等问题,保障系统的快速迭代和敏捷开发,降低研发周期及成本。微服务架构下,很好地支持海量数据及应用的并发,系统...

智能边缘一体机产品介绍

但是如何对智能化系统进行标准化交付集成和持续运维,集团提出了“边缘小闭环、云端大闭环”的系统建设思路。基于这个思路,进一步的对系统改造提出了如下需求:边缘自治要求:小区的业务系统能够在不连云的情况下,完成基础功能,以防总部...

安全管家服务

2.服务范围 编号 服务范畴 工作范围 备注 1 安全咨询服务 基于云上安全最佳实践、结合客户业务的特点,为客户定制云上安全建议方案,在线解答客户安全问题 阿里云为主,需要客户配合 2 安全评估 全面评估甲方阿里云上资产的安全性,包括云...

常见问题

此时,您可以编辑kube-proxy、coredns的YAML解决问题,需要增加的YAML如下:affinity:nodeAffinity:requiredDuringSchedulingIgnoredDuringExecution:nodeSelectorTerms:matchExpressions:key:type operator:NotIn values:virtual-kubelet ...

全场景解决方案

平滑迁移异构治理 方案架构 双模微服务平台通过 SOFA 微服务和 Service Mesh 微服务,提供了既支持 SOFA 框架又支持 Service Mesh 架构的微服务管理和治理能力,解决用户在技术转型期间与未改造的遗留系统相互之间的打通和过渡问题,帮助...

启用节点自动伸缩

当集群的容量规划无法满足应用Pod调度时,您可以使用 节点自动伸缩 方案实现节点的自动扩缩。节点自动伸缩 适用于扩容规模较小(例如开启弹性的节点池数量少于20,或对应节点池中的节点数量少于100),工作负载批次较为稳定,以单次伸缩为...

产品优势

一直秉承引领和拥抱业界先进标准和实践,同时亦能满足传统金融架构的平滑迁移、融合适配,以稳妥应对业务升级变更,并积极应对金融交易系统所面临的服务和数据扩展性、事务一致性、秒级容灾、弹性供给与调度等关键技术挑战。微服务平台 ...

什么是容器服务 Kubernetes 版

调度:支持不同弹性资源的混合调度、异构资源的精细化调度、批量计算的任务调度等,提升应用的性能和集群整体资源的利用率。多集群管理:支持线下IDC和多云多区域的集群统一接入,实现混合云应用管理。授权管理:支持RAM授权和RBAC权限管理...
共有124条 < 1 2 3 4 ... 124 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
批量计算 音视频通信 视觉计算服务 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用