消息队列Kafka

背景信息 Apache Kafka是一款开源的分布式消息队列系统,广泛用于高性能数据处理、流式分析、数据集成等大数据领域。Kafka连接器基于开源Apache Kafka客户端,为阿里云实时计算Flink提供高性能的数据吞吐、多种数据格式的读写和精确一次...

分布式链路概述

帮助运维人员、开发人员和架构师轻松应对复杂的大规模微服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运维开发工作...

应用场景

服务网格 ASM主要适用于需要对应用服务进行流量管理、安全管理、故障恢复、观测监控以及微服务架构迁移的应用场景。本文介绍ASM的常见应用场景。流量管理 通过ASM,可以轻松实现基于配置的流量管理:将流量管理与基础设施管理分隔开来,并...

什么是业务实时监控

分布式链路:提供应用拓扑和链路查询功能,观测应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运维开发工作。日志查询和日志关联...

智能分析-异常根因定位分析利器

日志服务Trace应用提供智能分析功能,用于分析可观测性数据和定位系统的异常根因。本文介绍可观测性数据的必要性、优势以及使用智能分析功能的方法。系统必要属性-可观测性 随着IT系统几十年的飞速发展,开发模式、系统架构、部署模式和...

功能架构

分布式链路 分布式链路帮助运维人员、开发人员和架构师看清楚复杂的大规模微服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、...

订阅事件通知

数据传输服务DTS(Data Transmission Service)已接入云监控平台,您可以通过事件订阅对重要的事件设置定制化的报警通知,让您及时了解事件的发生与进展,帮助您实时掌握事件动态,便于您在业务故障时快速分析并定位问题。背景信息 云监控...

产品简介

安全、稳定、高鲁棒性 服务稳定运行,并以在线工单等方式提供技术支持,具备完善的故障监控、自动告警、快速定位等一系列故障应急响应机制。基于阿里云的AccessKeyId和AccessKeySecret安全加密对,从访问接口上进行权限控制和隔离,保证...

Windows实例通过外部访问网络不通的处理

方法二:网络抓包分析 通过Wireshark工具进行网络抓包分析,分别在客户端、阿里IDC入口处和Windows实例三个抓包点,进行抓取网络包,并提交全部抓取的网络包给阿里云技术支持分析,包括客户端MTR到Windows实例的输出结果和Windows实例MTR到...

错误码

按性能分析报告与DBA建议优化业务SQL语句;使用 PolarDB-X 读写分离将跨库查询转发至读库处理;升级更高规格的 PolarDB-X,提升后端处理能力;联系技术支持调整 PolarDB-X 后端连接数。PXC-4104 ERR_ATOM_CREATE_CONNECTION_TOO_SLOW 描述...

新功能试用申请

使用Schema功能后,SQL语法上需要识别 project.schema.table 的语义,通过此开关决定SQL语义。此开关支持租户级别和作业级别。使用Schema功能,必须使用 set odps.namespace.schema=true;命令打开Schema语法开关。将SQL中 a.b.c 格式的语句...

文件存储NAS

许多分析工作负载通过文件接口与数据进行交互,依赖于文件锁等文件语义,并要求能够写入文件的部分内容。NAS支持文件锁定的文件系统语义,并且能够弹性扩展容量和性能。性能 单个文件系统的吞吐性能上限(峰值)与文件系统的当前使用容量...

概述

Apache Druid是一个分布式内存实时分析系统,用于解决如何在大规模数据集下快速的、交互式的查询和分析问题。基本特点 Apache Druid具有如下特点:支持亚秒级的交互式查询。例如,多维过滤、Ad-hoc的属性分组和快速聚合数据。支持实时的...

目标规则(Destination Rule)CRD说明

consecutiveLocalOriginFailures UInt32Value 否 触发排除需要的连续本地故障数。默认为5。该字段仅在 splitExternalLocalOriginErrors 设置为true时生效。consecutiveGatewayErrors UInt32Value 否 将主机排除出连接池需要的网关错误数。...

在Windows实例无法访问外部网络如何处理?

运行Windows Update程序,安装最新版本的补丁 该操作可以排除操作系统TCP/IP协议栈自身问题,操作步骤如下:在桌面左下角,单击 图标,在搜索框输入 update,然后单击 检查更新。在 Windows更新 页面,单击 下载,安装最新版本的补丁。重新...

作业智能诊断

Flink Advisor作业智能诊断服务能够帮您监控作业健康状况,分析和诊断错误日志、异常运行和风险情况,并提供可理解和可操作的诊断建议,全面保障您的业务稳定可靠运行。本文为您介绍如何使用作业智能诊断服务。背景信息 Flink Advisor作业...

Pod诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查...

Pod诊断

容器服务平台构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查、...

基本概念

如果一个SQL分析任务的输出表是另一个分析任务的查询对象,则后一个分析任务是前一个分析任务的下游指标。指标定义 通过设置指标要素、业务描述、所属主题域、所属实体、度量单位等信息,明确指标的作用。指标配置 为定义好的指标,配置...

实时数据集成(Flink版)

物联网平台数据服务中的产品属性时序表、产品事件表和自定义存储表(时序表)数据,可以集成到阿里云实时计算Flink版中计算和分析,以便您实时分析和诊断设备的运行状况,实时检测运行故障等。本文介绍使用实时计算Flink版的连接器功能集成...

极氪汽车云成本精细化治理实践

应用工作负载难以预估,缺乏数据可见性 Kubernetes为容器资源管理提供了资源请求(Request)的语义描述。容器的Request一般基于人工经验填写,管理员会参考容器的历史利用率情况、应用的压测表现,并根据线上运行情况的反馈持续调整。但...

配置DDoS高防后访问网站提示502错误

根据分析可知,发生报错的可能原因如下:DDoS高防回源IP被源站拦截或限速 源站本身出现异常 网络出现拥塞或抖动 解决方案 DDoS高防回源IP被源站拦截或限速 只要在源站放行所有的DDoS高防的回源IP,即可解决出现的502错误。设置放行DDoS高防...

Pod诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查...

功能发布记录

全部 使用ACK AI助手进行故障排查和智能问答 支持操作系统内核层的容器监控可观测能力 阿里云提供了链路追踪服务,为分布式应用的开发者提供了完整的调用链路还原、调用请求量统计、链路拓扑等,以快速分析和诊断分布式应用架构下的性能...

ECI Pod Annotation

在Kubernetes集群中创建ECI类型的Pod(即ECI实例)时,为充分使用ECI提供的功能,在不改变Kubernetes语义的前提下,您可以根据需求为Pod添加Annotation。本文为您介绍创建ECI Pod时支持添加的Annotation,以及ECI Pod调度完成后会追加的...

操作指南

设置语义规则时,可单纯进行文本内容的设置,也可在文本内容的基础上进一步使用条件符号达到多样化处理的目的,其中【】符号代表可选条件、|符号代表逻辑或条件、()符号代表必选条件。单击 查看规则说明,新开页面显示规则使用案例在输入...

通过ES机器学习实现智能问答

本文使用文本嵌入模型(text_embedding)对用户查询进行深度语义解析,突破传统关键词匹配的局限,从海量数据中准确提取高度相关的内容。使用问答模型(question_answering)对关联文本进行精细解读,精准抽取答案,回答与文本相关的问题。...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

设备无法连接SSID

问题症状 无线终端连接SSID,显示未连接,无法关联SSID。解决方案 检查AP配置中的最大连接数,最大可设置为128.2.DHCP不在AP上要检查一下地址池的使用情况,检查可用地址是否够用。3.更换新的AP,排除是否是AP故障。适用于 云AP

功能特性

堆内(total 和 used)和堆外内存统计 堆内各个内存空间占用内存统计 垃圾回收(GC)占整个进程运行时间比例 QPS 按 1s、15s、30s、60s 的 CPU 统计 libuv 句柄,定时器统计 …… 安全提醒 npm 模块安全漏洞提醒 故障排查 热点函数分析,...

场景管理

通过对语音和语义特征的综合分析,情绪识别可以更精准地识别用户的多样化情绪,从而实现对不同情绪的个性化回应。与纯文本的情绪识别相比,情绪识别的整合能力可以提供更高的准确率。统计 数据 数据概况查阅 在场景详情界面,选择“统计...

过滤VPC流日志公网流量

在专有网络VPC控制台上开通流日志功能后,流日志将被采集到日志服务中,您可以通过日志服务对流日志进行查询、分析和排查网络故障。本文介绍通过日志服务数据加工对流日志进行公网流量过滤的操作方法。前提条件 已开通VPC流日志功能。具体...

什么是云网管

观测平台(Observation Platform)基础设施运行状态维护和管理,包含性能数据和告警数据,实现对各类监控对象的异常数据判定,网络故障的发现、分析、定位等维护管理。高效采集,分钟级故障定位发现。自定义采集方式和分析过程,兼容所有...

基本概念

故障管理 网络故障的发现、分析、定位等维护管理,包括告警信息的收集入库、规则匹配、关联分析以及告警清除等一系列流式处理过程。Netconf netconf协议一般用于网络业务配置,使用结构化可描述语言实现快速的网络设备下发。gRPC 高性能、...

监控与日志

例如您可以根据通过捕获的流量信息分析带宽使用情况、排查网络故障、优化流量使用成本、分析异常流量等。云企业网流日志 流日志会在指定的捕获窗口捕获转发路由器之间的跨地域流量信息和边界路由器VBR(Virtual border router)连接的流量...

EasyCkpt:AI大模型高性能状态保存恢复

通过对众多故障失败案例的分析,对于训练集群而言:GPU易损坏,但机器的CPU和内存通常仍可正常使用。以节点为单位,内存的闲置空间很大(通常远大于模型状态)。在节点上,通常很难出现所有网卡都损坏的情况,即使节点出现故障,它通常仍然...

阿里云ES机器学习

ES提供了多种内置的文本分析器和分词器,如标准分词器、N-gram分词器、拼音分词器等,主要基于文本的字面形式进行分析和索引,缺乏语义理解,上下文感知,歧义消除等能力。为了克服这些限制,可以将ES与text embedding模型相结合,这些模型...

Quick BI即席分析中“小计(排除)”“小计(包含)”...

概述 Quick BI即席分析中“小计(排除)”“小计(包含)”的含义。详细信息 排除是对维值进行的操作,在表格中做了排除操作后,小计(包括)和小计(排除)会自动显示出来。小计(包括)是排除后剩下的值的和,小计(排除)是排除的值的和...

AIOps 解决方案专家服务内容说明

智能故障发现解决方案 基于调研与评估的结果,为客户设计智能故障发现解决方案,包含:多账号统一监控数据接入,并根据应用分组为客户设计AI算法能力用于实时故障发现,并根据分析结果智能定位根因,提供实时异常检测的稳定性方案,保障...

功能概览

按单机、机房、单元化等多视角进行聚合,实现从应用>服务>实例>主机的上卷下钻的多维关联分析,迅速找到异常故障点。告警 告警规则 支持灵活的为监控对象配置告警规则。当规则条件被触发时,系统将产生告警事件,例如为告警规则订阅通知...
共有140条 < 1 2 3 4 ... 140 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 负载均衡 智能开放搜索 OpenSearch 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用