可观测性的设计原则

每个组件都可以将标识符添加到它们的日志中,以便在出现问题时进行故障排除分布式跟踪可以使用开源工具Jaeger、Zipkin、skywalking或CAT等,阿里云上有ARMS服务来实现。日志记录 系统需要记录关键事件和故障,以帮助诊断问题和解决故障。...

组件参考:所有组件汇总

经验概率密度图 该组件是采用经验分布和内核分布两种算法。全表统计 该组件用于统计全表,或某些选中的列。卡方拟合性检验 该组件用于变量为类别型变量的场景,旨在检验单个多项分类型变量在各分类间的实际观测次数与理论次数是否一致,其...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

使用OpenAPI诊断工具进行故障排查

阿里云OpenAPI平台提供使用诊断工具。本文介绍如何使用OpenAPI诊断工具进行故障排查。您可以登录 OpenAPI使用诊断,输入完整的RequestID或SDK报错信息,然后...如果诊断工具仍未能解决您的问题,您可以参考 故障排除、常见问题 获取解决方案。

监控服务概览

OpenAPI访问监控数据 OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:云监控SDK参考 访问监控数据 监控、诊断和故障排除 监控诊断和故障排除 通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行...

Lasso回归训练

Lasso(Least absolute shrinkage and selection operator)回归算法是一种压缩估计算法。Lasso回归训练组件基于该算法,支持稀疏、稠密两种数据格式,且支持带权重样本的训练。本文为您介绍Lasso回归训练组件的配置方法。使用限制 支持的...

支持计划

配置指导以及故障排除 配置指导以及故障排除 配置指导以及故障排除 专属技术服务经理 不支持 不支持 专属技术服务经理(TAM)健康检查 可免费使用应用高可用服务(AHAS)应用架构核心巡检规则,使用受限节点架构可视化功能 可免费使用智能...

梯度提升回归树算法(GBRT)

简介 GBRT算法是集成学习Boosting家族的成员,使用了前向分布算法,但是弱学习器限定了只能使用CART回归树模型。前向分布算法的思想是基于当前模型和拟合函数来选择合适的决策树函数,从而最小化损失函数。GBRT主要有以下两部分组成:回归...

故障排除

CC API在调用时可能会遇到一些错误,遇到错误时以错误码为依据进行故障排除,本文为您介绍 常见错误码的解决方案。云产品运行时错误码 云产品API运行时返回的错误码。以下两个错误码为云产品运行时错误,如想获取云产品详细错误信息,需...

常见问题FAQ

4.HDMI无信号 故障示意图如下:故障排除方案如下:1.见下遥控器说明,按电源键,重启魔盒。2.重复插拔HDMI线 3.重启屏幕 屏幕操作指南由屏幕供应商给出。4.屏幕的信号源切换到HDMI输入。屏幕操作指南由屏幕供应商给出。如无法排除故障:...

诊断网页加载过慢的问题

针对这类问题,ARMS前端监控的慢会话追踪功能提供页面静态资源加载的性能瀑布图,可深入定位页面资源加载情况,全方位地诊断故障根源,从而快速排除故障。问题描述 网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

光伏发电异常检测提效

同时,无法有效排除环境因素的干扰,例如一天不同的时段发电量不同,也受天气影响巨大,按照该检测方法无法动态适应各个变化的情况,为运维工作增加了不确定性,并带来运维负担。解决方案 物联网平台的数据服务提供数据智能功能,可以基于...

目标规则(Destination Rule)CRD说明

consecutiveLocalOriginFailures UInt32Value 否 触发排除需要的连续本地故障数。默认为5。该字段仅在 splitExternalLocalOriginErrors 设置为true时生效。consecutiveGatewayErrors UInt32Value 否 将主机排除出连接池需要的网关错误数。...

监控、诊断和故障排除

故障排除:提供常见的问题场景和故障排除方法。服务监控 监视总体运行状况 可用性和有效请求率 可用性和有效请求率是有关系统稳定性和用户是否正确使用系统的最重要指标,指标小于100%说明某些请求失败。可能因为一些系统优化因素出现暂时...

产品功能

分布式架构,单节点故障业务不受影响 云数据库Memcache版采用分布式集群架构,每个节点均由双机热备架构组成,具备自动容灾及故障迁移能力。多种规格可适配不同的业务压力,数据库性能支持无限扩展。支持数据持久化及备份恢复策略,有效的...

数据可靠性

日志服务底层存储采用三副本机制来保证数据的可靠性,即每份数据都有3个副本,副本按照一定的分布式存储算法保存在集群中的不同机器。通过该机制,存储系统确保3个数据副本分布在不同服务器的不同物理磁盘上,单个硬件设备的故障不会造成...

设备显示离线

如果是静态路由接入,尝试通过交换机,能否 ping 通设备的每个接口IP,如果其中有无法 ping 通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第二个和第三个灯是否为...

ping不通云服务ECS(SAG-1000)

如果是静态路由接入,尝试通过交换机,能否ping通设备的每个接口IP,如果其中有无法ping通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第2和第3个灯是否有红色的。...

故障演练

故障隶属于单机或是分布式系统之一,分布故障包含单机故障。对于单机或同机型的故障,以系统为视角,故障可能是当前进程内的故障,比如:如FullGC,CPU飙高;进程外的故障,比如其他进程突然抢占了内存,导致当前系统异常等。对于大多数...

自动机器学习(AutoML)

什么是AutoML AutoML是PAI产品的机器学习增强型服务,集成了多种PAI平台支持的算法分布式计算资源,支持多种方式访问。在模型超参调优领域,它可以帮助您自动寻找最优化超参值,大幅提高模型调优效率。AutoML工作原理 AutoML实现自动化...

概述

支持单时序序列的预测、异常检测、变点检测、折点检测、多周期估计算法。支持单时序序列的分解操作。支持多时序序列的多种聚类算法。支持多字段(数值列、文本列)的模式挖掘。使用限制 使用日志服务机器学习函数须遵循以下限制:输入的...

云盒计算资源配置最佳实践

冗余的算力配置,可以大幅提升硬件风险应对能力 云盒提供的IaaS层稳定性,依赖于云上提前预测硬件故障算法能力,以及宕机迁移和热迁移能力。这些能力可以有效提升云盒IaaS层的故障和风险应对能力,但也需要一定的冗余资源,以便在硬件...

LightGBM算法

简介 LightGBM(Light Gradient Boosting Machine)是一个基于决策树算法分布式梯度提升框架。设计初衷是提供一个快速、高效、低内存、高准确度、支持并行和大规模数据处理的工具。LightGBM可以减少数据对内存的使用、减少通信代价以及...

新建实验

AutoML是PAI提供的机器学习增强型服务,集成了多种算法分布式计算资源,无需编写代码,通过创建实验即可实现模型超参数调优,提高机器学习效率和性能。本文为您介绍如何新建实验。背景信息 AutoML的工作机制:实验会根据算法配置自动生成...

采集客户端数据的高可用方案

背景 在单集群环境下,日志服务存储采用三副本机制来保证数据的可靠性,即每份数据都有3个副本,副本按照一定的分布式存储算法保存在集群的不同机器中。通过该机制,存储系统确保3个数据副本分布在不同服务器的不同物理磁盘上,单个硬件...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

智能负载均衡

什么是智能负载均衡 智能负载均衡表示为WAF实例配备至少三个不同地域的防护节点,以实现异地多节点自动容灾,同时通过智能DNS解析能力和Least-time回源算法,保证业务流量从接入防护节点到转发回源站服务器整个链路的路径和时延最短。...

智能负载均衡

功能原理 开通智能负载均衡后,WAF实例将拥有至少三个不同地域的防护节点实现异地多节点自动容灾,同时通过智能DNS解析能力和Least-time回源算法,保证业务流量从接入防护节点到转发回源站服务器整个链路的时延最短。说明 中国内地 WAF实例...

什么是向量检索服务

超大规模索引构建和检索:引入复合性检索算法,精于工程实现和算法底层优化,低成本实现高效率的检索方法,单片索引可达几十亿的规模。标签+向量检索:在索引算法层实现了“带条件的向量检索”,解决了传统多路归并召回结果不理想的情况,...

概览

本文汇总了PAI的最佳实践。热点文章 通义千问Qwen全托管灵骏最佳实践 5分钟使用EAS一键部署LLM大语言模型应用 PAI+向量检索快速搭建大模型知识库对话 5分钟使用EAS一键部署...TF 使用TensorFlow实现分布式DeepFM算法 模型仓库(FastNN)

政企安全加速

阿里云政企安全加速依托阿里云全球分布的加速网络,承载全面的安全防护能力。为政府、金融、传媒、零售和交通等企业,提供边缘安全和加速一站式服务。使用场景 场景 事件 政府 发生突发社会事件时,政府网站及应用产生高并发访问请求。面对...

推荐解决方案综述

深度学习推荐算法 在PAI-TensorFlow基础上,PAI开发了经典的深度学习推荐算法,即源码级开源的DeepFM代码,详情请参见 使用TensorFlow实现分布式DeepFM算法。DeepFM中详细描述了读取MaxCompute数据表、特征处理、构造Graph、训练及评估等...

什么是云工作流(CloudFlow)

方便您快速识别故障位置,并快速排除故障问题。支持长时间运行流程 云工作流 可以跟踪整个流程,持续长时间执行确保流程执行完成。有些流程可能要执行几个小时、几天、甚至几个月。例如运维相关的Pipeline和邮件推广流程。流程状态管理 云...

什么是Serverless工作流

方便您快速识别故障位置,并快速排除故障问题。支持长时间运行流程 Serverless 工作流 可以跟踪整个流程,持续长时间执行确保流程执行完成。有些流程可能要执行几个小时、几天、甚至几个月。例如运维相关的Pipeline和邮件推广流程。流程...

技术原理

PolarDB-X优化器会基于代价估计将请求区分为TP与AP负载,其中AP查询会被进一步改写为分布式执行计划,发往只读实例进行计算,避免它对主实例的TP查询造成影响。MySQL生态兼容 PolarDB-X将兼容MySQL以及周边生态作为核心设计目标之一。本文...

什么是三维空间重建

产品优势 开放与兼容 提供平台侧的API和SDK接口 兼容市面上所有的全景相机 算法能力 基于全景图像深度学习的空间结构预测 基于移动终端的自动化建模能力 基于全景图像的单目深度估计与融合算法 建模高效 平均100平米室内空间拍摄及制作时间...

HTAP中的行列混存查询优化

cardinality estimation:根据查询表的分布情况,估计查询执行过程中的数据量、数据分布情况等。cost model:根据执行计划以及数据库内部的状态,计算按照各个执行计划执行所需要的代价。在查询优化器中,最为广泛研究的是查询计划中的join...

数据智能概述

功能简介 算法实例 通过配置算法实例,来分析光伏电站运维数据或设备运行数据,使您能及时监测和掌控光伏电站或设备的运行状态和故障情况。算法模板 物联网平台提供算法模板供您使用,您可以查看算法模板的详情信息,如:算法详细介绍、...

行业算法版介绍

行业算法版简介 快速接入教程 OpenSearch-行业算法版 是基于阿里巴巴自主研发的大规模分布式搜索引擎搭建的一站式智能搜索业务开发平台,目前为包括淘宝、天猫在内的阿里集团核心业务提供搜索服务支持。通过内置各行业的查询语义理解、机器...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
风险识别 数据库自治服务 负载均衡 智能开放搜索 OpenSearch 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用