自助诊断GPU节点问题

应用程序遭遇到GPU不可纠正的显存ECC错误时,NVIDIA错误抑制机制会尝试将错误抑制在发生硬件故障应用程序,避免该错误影响GPU节点上运行的其他应用程序。当抑制机制成功抑制错误时,会产生该事件,仅出现不可纠正ECC错误的应用程序受到...

连接保持

通常的解决办法是重启应用程序或保证应用程序具备重连机制,但由于开发周期等原因,在开发设计应用程序的前期可能并未考虑到该问题,导致出现大量的非预期行为甚至应用程序的服务不可用。因此 PolarDB 新增支持连接保持功能,避免由于一些...

混合云应用双活容灾最佳实践

步骤二:应用故障注入 这里使用阿里云故障演练产品,对阿里云-北京地域的商品应用注入故障。登录 AHAS控制台。在左侧导航栏选择 故障演练>我的空间,并在顶部选择地域。在 我的空间 页面搜索配置好的演练(50%概率网络丢包),然后在该演练...

轻量应用负载均衡概述

该功能扩展了应用程序的吞吐能力,并且可以消除服务器的单点故障,提升应用程序的可用性。功能架构如下图所示:功能组件说明:轻量应用负载均衡:提供七层流量负载均衡能力,操作简单,性价比高。监听:默认采用HTTP协议,监听80端口。转发...

功能架构

分布链路 分布链路帮助运维人员、开发人员和架构师看清楚复杂的大规模微服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、...

什么是可观测链路 OpenTelemetry 版

应用性能实时汇总:通过追踪整个应用程序的用户请求,来实时汇总组成应用程序的单个服务和资源。分布拓扑动态发现:用户的所有分布微服务应用和相关PaaS产品可以通过 可观测链路 OpenTelemetry 版 收集到分布调用信息。多语言开发...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

开始监控除Java之外的应用

应用性能实时汇总:通过追踪整个应用程序的用户请求,来实时汇总组成应用程序的单个服务和资源。分布拓扑动态发现:针对您的分布微服务应用和相关PaaS产品,可观测链路 OpenTelemetry 版 均可收集到分布调用信息。开源社区兼容:基于...

绑定 OIDC 身份提供方

重定向URI为上面第一步添加OIDC身份提供方时,步骤3中获取的“IDaaS 授权回调 Redirect URI”3、完成新应用程序基本配置(1)创建新应用程序后,默认进入 概述 页面。您可以在 应用注册>所有应用程序 下查看您所创建的应用程序。注意:此处...

套餐定价

该功能扩展了应用程序的吞吐能力,并且可以消除服务器的单点故障,提升应用程序的可用性。负载均衡实例支持的套餐如下表所示。重要 不同地域支持的套餐不同,具体价格以控制台购买页面显示为准。套餐内资源 60元/月套餐 最大连接数 10000 ...

什么是无影云应用

无影云应用 是一种基于公有云托管的应用程序虚拟化流式传输服务,实现了多生态应用免部署、快速构建、即点即用,能够为您提供安全、易用、高效且低成本的云上应用管理与使用体验。应用场景 无影云应用 适用于在线教育、高端设计、大型渲染...

Windows Server实例防火墙策略的配置方法

如果在该标签下没有查看到指定的应用程序,可以单击 浏览,在文件系统中查找到指定应用程序文件,双击该文件即可。功能二:允许或禁止特定本地端口访问 远程连接Windows轻量应用服务器。具体操作,请参见 远程连接Windows服务器。单击 开始...

最佳实践概览

该功能扩展了应用程序的吞吐能力,并且可以消除服务器的单点故障,提升应用程序的可用性。具体最佳实践如下表所示。场景 说明 部署高可用架构应用集群 基于轻量应用负载均衡,您可以部署高可用架构应用集群。相较于使用单台轻量应用服务器...

新功能发布记录

该功能扩展了应用程序的吞吐能力,并且可以消除服务器的单点故障,提升应用程序的可用性。2021-07-28 轻量应用负载均衡概述 2021年04月 功能名称 功能描述 发布时间 相关文档 地域 中国站新增2个地域:华南3(广州)、西南1(成都)2021-04...

什么是轻量应用服务器

您可以选择适用于业务的应用镜像或系统镜像,并通过套餐指定服务器的性能,最后利用其他阿里云服务高效地搭建开发环境或应用程序。轻量应用服务器主要由以下功能组件构成:套餐配置 轻量应用服务器将计算资源、存储资源以及网络资源打包,...

HSF概述

高速服务框架HSF(High-speed Service Framework),是在阿里巴巴广泛使用的分布RPC服务框架。概述 HSF连通不同的业务系统,解耦系统间的实现依赖。HSF从分布应用的层面,统一了服务的发布与...应用程序编译为可运行的JAR包并部署即可。

应用监控与可观测链路 OpenTelemetry 版的区别

应用程序语言支持 Java Java、Go、Python、JS、.NET、C++等主流编程语言 计费模式 按观测数据量收费,详情参见 产品计费(新版)。按观测数据量收费,详情参见 产品计费(新版)。智能洞察 支持 不支持 内存快照 支持 不支持 线程和内存...

基本概念

应用通常在一个或者多个实例上运行,应用可以拥有多个部署版本,不同实例上运行着不同版本的应用程序。微服务应用 提供服务注册发现和服务治理的能力,例如使用SpringCloud、Dubbo、Motan、Mesh以及K8s Service框架来开发和通信的应用。更...

如何接入链路追踪

在微服务分布场景下,全链路追踪功能给业务提供了各个服务点执行情况的可视化快速分析定位能力。在定时任务场景下,业务执行链路可能比常规实时业务的执行链路更长,接入全链路追踪有助于查询任务执行耗时、分析执行异常等问题。本文介绍...

HSF概述

高速服务框架HSF(High-speed Service Framework),是在阿里巴巴广泛使用的分布RPC服务框架。概述 HSF连通不同的业务系统,解耦系统间的实现依赖。HSF从分布应用的层面,统一了服务的发布与...应用程序编译为可运行的JAR包并部署即可。

灾备规划

云上容灾 为减少因应用故障导致的业务损失,当数据中心出现严重故障无法快速恢复时,混合云容灾服务可以高效地在ECS上快速恢复您的应用。RTO和RPO要求 应用容灾有两个核心的指标:RPO:指应用发生故障时可以容忍的数据丢失量。数据越重要,...

常见问题FAQ

4.HDMI无信号 故障示意图如下:故障排除方案如下:1.见下遥控器说明,按电源键,重启魔盒。2.重复插拔HDMI线 3.重启屏幕 屏幕操作指南由屏幕供应商给出。4.屏幕的信号源切换到HDMI输入。屏幕操作指南由屏幕供应商给出。如无法排除故障:...

产品对比

相似产品简介 ZooKeeper ZooKeeper 是一个分布式应用程序协调服务,是 Google Chubby 的开源实现。它是一个为分布应用提供一致性服务的软件,提供的功能包括配置维护、域名服务、分布同步、组服务等。在 Hadoop 集群等场景下,...

异地应用双活切流

说明 用户应用出现故障,将故障应用对应的单元(地域)流量切0,由正常单元(地域)承担全部流量。a.选择 故障单元,代表此时,该单元当前出现故障,无法承接流量,MSHA会自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入...

镜像介绍

选用应用镜像创建服务器后,您可以直接使用预置的应用程序,也可以根据实际的业务需求自定义应用配置。减少了应用的上传、安装等环节,做到了应用的开箱即用。使用应用镜像创建轻量应用服务器的具体操作,请参见 快速搭建WordPress个人博客...

权限管理概述

通过设置 权限策略(Policy),您可以集中管理您的用户(例如员工、系统或应用程序),以及控制用户可以访问哪些资源,例如限制您的用户只拥有对某一个EDAS应用的读权限。更细粒度的鉴权 EDAS内置权限管理 RAM权限管理 阿里云账号为子账号...

应用托管概述

在 SAE 上,您可以低门槛拥抱容器技术,无需管理和维护集群与服务器,专注于设计和构建应用程序,最大化利用资源完成应用的生命周期管理,以及监控、运维等服务。本文介绍 SAE 支持的应用类型、部署方式和托管功能。应用部署方式 当应用...

历史记录

表示Schedulerx启动失败是否block应用程序启动,默认 true。新增查询工作流运行状态接口。接口为 GetWorkflowInstanceRequest。JobContext上下文新增jobName字段。这样用户可以运行期间获取到任务名称。问题修复 通过Hessian反序列化 ...

网站耗资源(客户程序故障)常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

功能特性

OIDC 应用 应用授权 将应用的访问权限授权给用户、组织或组 OIDC 应用 自研应用 自研应用 简化了单点登录配置的 OIDC 应用,适用于大部分企业自研应用接入 自研应用 应用 API(DeveloperAPI)基础管理能力 启用/禁用 DeveloperAPI 能力 ...

功能发布记录(2018~2022年)

优化 选择注册中心运维方式 支持为多语言应用配置故障注入 通过给应用注入特定故障,来检测该应用的消费者处理异常情况的能力。新增 已下线 支持为多语言应用配置服务超时 服务超时机制可以在请求的处理时间超过设置的时间时直接返回错误...

Windows镜像辅助打包

鉴于Windows镜像打包有诸多不便,平台提供了镜像打包工具,用于帮助简单应用自动完成Docker镜像的生成。...对于原生应用,您需要将应用程序及依赖文件打包在一个zip文件中,并保证后面指定的“启动文件”,位于文件夹的一级目录下。

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

基本概念

概念 描述 故障转移(Fail Over)即容灾恢复,指您的 IDC 应用出现故障时,在阿里云上恢复应用的过程。故障恢复(Fail Back)当您的 IDC 内的环境恢复以后,将应用数据迁回自有 IDC 恢复应用运行的过程。RPO Recovery Point Objective(数据...

功能优势

应用级别的故障注入,目前只支持 Java 应用,后续将陆续推出对于 NodeJs 和 C++ 的应用故障注入。云原生领域的演练场景。无论您是需要设置集群级别的大规模故障还是应用级别的请求级别细粒度故障,都可以在 AHAS Chaos 找到适合的场景,下...

将HSF应用托管到SAE

应用程序须以WAR包方式部署。Pandora Boot:依赖Pandora,提供了比较完整的HSF功能,包括服务注册与发现、异步调用。应用程序编译为可运行的JAR包并部署即可。操作步骤 开发应用。方法一:下载Demo工程。microservice-doc-demo项目内包含了...

流水单据型业务场景多活实践

在 读多写少型业务场景多活实践 中,已经将导购链路进行了异地多读改造,而该业务后续在一次大促期间,遭遇了一次订单应用大面积故障,导致大促期间下单业务长时间无法使用,于是下单业务的容灾建设也提上了议程。下单业务是典型的流水单据...

Cloud Toolkit概述

您在本地完成应用程序的开发、调试和测试后,可以使用在IDE(如IntelliJ IDEA或Eclipse)中安装的Cloud Toolkit插件,通过图形配置的方式连接到云端部署环境并将应用程序快速部署到云端。功能概览 功能 描述 文档 安装Cloud Toolkit 在...

产品优势

具备 不具备 无影云应用 的优势 作为一款完全托管的应用程序虚拟化流式传输服务产品,无影云应用 具备以下优势:高效管理 在云上集中管理应用,有效简化应用全生命周期管理,实现新应用、新版本快速上线使用。快速分发 无需重写即可将传统...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
Web应用防火墙 轻量应用服务器 负载均衡 域名 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用