实时分析链路数据

如果异常请求分散在多台机器,那么大概率可以排除单机故障因素,可以重点分析下游依赖服务或程序逻辑是否异常。在 调用链分析 页面筛选错误调用或慢调用,并设置按IP进行分组统计,如果异常调用集中出现在特定机器,则有较大概率是机器故障...

LightGBM

它可以说是分布式的,高效的,有以下优势:更快的训练效率 低内存使用 更高的准确率 支持并行化学习 可以处理大规模数据 与常见的机器学习算法对比,速度是非常快的。计算逻辑原理 LightGBM 通过叶分裂(Leaf-wise)策略来生长树。每次从当前...

产品优势

行业算法版 智能 内置丰富的定制化算法模型,并结合不同行业搜索特点,推出行业召回、排序算法,保障更优搜索效果。灵活、可定制 开发者可基于自身业务特性与数据,定制相应的算法模型、应用结构、数据处理、查询分析、排序等配置,满足...

PS-SMART回归

参数服务器PS(Parameter Server)致力于解决大规模的离线及在线训练任务,SMART(Scalable Multiple Additive Regression Tree)是GBDT(Gradient Boosting Decision Tree)基于PS实现的迭代算法。PS-SMART支持百亿样本及几十万特征的训练...

逻辑回归

本质是假设数据服从这个分布,然后使用极大似然估计做参数的估计。参数说明 IN端口 参数名 参数描述 是否必填 输入数据类型 数据源类型 特征变量 配置模型特征列 是 整数或浮点数 说明 若存在非数值数据,则会抛出异常。CSV组件。...

工作原理

日志被广泛地应用在系统监控和故障定位中,传统的日志分析手段以分析日志风险等级和匹配关键字为主,例如监控Error级别日志的内容和数量、监控含有Failed、Unsuccessfully等关键词的日志。但是在分布式环境和微服务架构下,以传统的人工...

评分卡训练

优化算法 在高级选项中可以配置训练过程中使用的优化算法,系统支持如下四种优化算法:L-BFGS:是一阶的优化算法,支持较大规模的特征数据集。该算法属于无约束的优化算法,会自动忽略约束条件。Newton's Method:牛顿法是经典的二阶算法,...

什么是AI分布式训练通信优化库AIACC-ACSpeed

AIACC-ACSpeed(AIACC 2.0-AIACC Communication Speeding)是阿里云推出的AI分布式训练通信优化库AIACC-Training 2.0版本。相比较于分布式训练AIACC-Training 1.5版本,AIACC-ACSpeed基于模块化的解耦优化设计方案,实现了分布式训练在兼容...

什么是云原生数据库PolarDB分布式版

本文介绍什么是 云原生数据库PolarDB分布式版,也称为 PolarDB分布式版,本手册中简称为 PolarDB-X。产品简介 PolarDB分布式版(PolarDB for Xscale,简称“PolarDB-X”)。PolarDB-X 是阿里云面向高吞吐、大存储、低延时、易扩展和超高...

产品简介

产品简介 阿里巴巴通义实验室千寻搜索算法,基于达摩院长期积累的自然语言处理技术,专注企业统一搜索场景,提供精准的多源异构搜索,以PaaS服务形式提供离线数据处理和搜索服务API。同时支持公有云、专有云、基于云原生的基础架构下混合云...

网络资源

分布式系统中,网络资源的主要作用是支持节点之间的通信和数据传输。网络资源需要支持安全的数据传输和通信协议,以保护分布式系统的敏感数据和通信内容的机密性和完整性。网络资源还需要提供高带宽、低延迟和稳定的网络连接,以确保节点...

模型配置

前提条件 算法模型需要依赖行为数据集、商品标签数据集作为训练数据,经算法引擎学习后生成可用的模型。算法模型的优劣依赖于训练数据,数据质量越高,数据量越大,算法效果越好。算法模型使用的行为数据集、商品标签数据集的数据要求与...

SQL优化技术

数据库上执行的SQL千差万别,且伴随着业务快速迭代、数据分布特征变化、热点变化、数据库版本升级等持续动态变化,这些都使得SQL优化如同三餐般不可或缺。挑战 如何利用综合手段实现快速准确的问题定位?例如问题SQL,仅仅从慢日志中分析是...

高性能检索版介绍

高性能检索版简介 OpenSearch-高性能检索版 是基于阿里巴巴自主研发的大规模分布式搜索引擎搭建的一站式智能搜索业务开发平台,在大数据场景下实现千亿数据毫秒级响应,提供订单、物流、保单等场景检索方案。OpenSearch-高性能检索版架构 ...

功能特性

同时,通过大规模RDMA网络部署实践,阿里云自主研发了基于端网协同的RDMA高性能网络协议和HPCC拥塞控制算法,并通过智能网卡实现了协议硬件卸载,降低了端到端网络延时,提升了网络IO吞吐能力,并有效规避和弱化了网络故障、网络黑洞等传统...

什么是设备诊断

设备诊断是阿里云物联网平台针对设备运行数据提供的一系列运维场景智能服务,帮助您分析判断设备故障、探测设备潜在风险并及时预知业务异常。服务架构 服务优势 丰富的数据诊断指标 提供网络连接成功率、设备离线原因、云对接次数等丰富的...

生产者负载均衡

背景信息 了解生产者负载均衡策略,可以帮助您解决如下问题:消息发送的容灾策略:您可以根据生产者负载均衡策略,明确当局部节点出现故障时,消息发送如何进行容灾切换。消息发送的顺序性机制:通过生产者负载均衡策略,您可以进一步了解...

PS-SMART多分类

参数服务器PS(Parameter Server)致力于解决大规模的离线及在线训练任务,SMART(Scalable Multiple Additive Regression Tree)是GBDT(Gradient Boosting Decision Tree)基于PS实现的迭代算法。PS-SMART支持百亿样本及几十万特征的训练...

PS-SMART二分类训练

参数服务器PS(Parameter Server)致力于解决大规模的离线及在线训练任务,SMART(Scalable Multiple Additive Regression Tree)是GBDT(Gradient Boosting Decision Tree)基于PS实现的迭代算法。PS-SMART支持百亿样本及几十万特征的训练...

阈值检测

应用场景 当您发现经常收到某条告警,但是系统又没有发生任何故障时,可能是因为当前的阈值设置得不够合理,或者是该阈值不适合某些应用或接口。这种场景下,您可以使用 建议阈值 功能,对告警规则的阈值进行调整,或对部分应用、接口的...

阈值检测

应用场景 当您发现经常收到某条告警,但是系统又没有发生任何故障时,可能是因为当前的阈值设置得不够合理,或者是该阈值不适合某些应用或接口。这种场景下,您可以使用 建议阈值 功能,对告警规则的阈值进行调整,或对部分应用、接口的...

阈值检测

应用场景 当您发现经常收到某条告警,但是系统又没有发生任何故障时,可能是因为当前的阈值设置得不够合理,或者是该阈值不适合某些应用或接口。这种场景下,您可以使用 建议阈值 功能,对告警规则的阈值进行调整,或对部分应用、接口的...

条件随机场

本文为您介绍 Designer 提供的条件随机场算法组件。条件随机场CRF(conditional random field)是给定一组输入随机变量条件下,另一组输出随机变量条件的概率分布模型,其特点是假设输出随机变量构成马尔可夫随机场。条件随机场可用于不同...

结构化文档推送Demo

适用客户:开箱即用,适合有高性能检索诉求的中小企业及开发者向量检索版版本特性:大规模分布式高性能公有云向量检索解决方案,支持多种检索算法,实现精度和性能之间的平衡,支持索引流式构建、即增即查。img src=\...

什么是OceanBase

OceanBase是由蚂蚁集团、阿里巴巴完全自主研发的分布式关系型数据库,始创于2010年。OceanBase具有数据强一致、高可用、高性能、在线扩展、高度兼容SQL标准和主流关系型数据库、低成本等特点。OceanBase至今已成功应用于支付宝全部核心业务...

Multi-Master基础架构

AnalyticDB PostgreSQL版 Multi-Master通过水平扩展Master节点突破了原架构单Master的限制,配合...对全局死锁处理、DDL支持以及分布式表锁支持等方面的算法进行创新和修改。重新设计了 AnalyticDB PostgreSQL版 的集群容错和高可用能力。

2024年

2024-03-27 全部地域 镜像管理 MaxCompute分布式计算框架MaxFrame发布 MaxFrame是由阿里云自研的分布式计算框架,支持Python编程接口、兼容Pandas接口且自动进行分布式计算,同时可直接使用MaxCompute计算资源及数据接口,与MaxCompute ...

产品架构

服务熔断 服务熔断主要目的是当某个服务故障或者异常时,如果该服务触发熔断,可以防止其他调用方一直等待所导致的超时或者故障,从而防止雪崩。产品架构如下:Provider App:指服务提供端发布服务,并向注册中心注册。Consumer App:指...

部分索引

通常,本数据库会对索引使用做出合理的选择(例如,它会在检索公值时避开索引,这样前面的例子只能节约索引尺寸,它并非是避免索引使用所必需的),非常不正确的规划选择则需要作为故障报告。记住建立一个部分索引意味着我们知道的至少和...

NVMe协议介绍

NVMe共享盘可以帮助应用实现高可用、高并发、可扩展的业务,可以帮助基于传统SAN的业务无缝上云,共享盘常见的应用场景包括数据共享、高可用故障转移、分布式缓存加速、机器模型训练等。数据共享 NVMe最简单的应用场景为数据共享,当数据被...

AIOps 解决方案专家服务内容说明

智能算法列表 类型 算法名称 算法逻辑 异常诊断类算法 One-Class SVM 基于历史批量数据的做算法学习并进行异常诊断 异常诊断类算法 孤立深林 基于历史批量数据的做算法学习并进行异常诊断 异常诊断类算法 Robust Covariance 基于历史批量...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

应用场景

服务网格 ASM主要适用于需要对应用服务进行流量管理、安全管理、故障恢复、观测监控以及微服务架构迁移的应用场景。本文介绍ASM的常见应用场景。流量管理 通过ASM,可以轻松实现基于配置的流量管理:将流量管理与基础设施管理分隔开来,并...

集群高可用架构推荐配置

节点池高可用配置 您可以基于节点的弹性伸缩、部署集、多AZ,结合K8s调度的拓扑分布约束,确保服务在不同的故障域(failure-domain)资源充足且有所隔离,从而当某一故障域出现问题时,服务仍然可以保持运行,减少单点故障的风险,提高系统...

什么是故障演练

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的...

AutoML使用限制及规格

AutoML的使用限制以及规格,包括当前支持的地域,支持的搜索算法TPE、GridSearch(网络搜索)、Random(随机搜索)、Evolution(演化算法)、GP(贝叶斯优化)、PBT(异步优化算法),以及对应的应用场景。支持地域(region)当前AutoML...

开发流程

支持多种算法框架,超大规模分布式深度学习任务的运行以及自定义算法框架。DLC概述 ⑤ 为了方便您在提交任务时指定所需的数据集和代码仓,PAI支持添加文件系统NAS或对象存储OSS的数据集以及Git代码仓。准备工作 ⑥ 模型管理模块统一管理...

如何不间断地进行时序异常检测

异常检测状态 介绍 异常检测状态是指在单次查询异常的检测过程中算法分析出的数据分布状态与统计信息。该状态决定了时序异常检测算法检测结果的精确性。不同场景中异常检测状态的影响如下:默认情况下,在不间断检测场景中为了保持异常检测...

应用场景

设备行业:企业使用物联网与算法模型技术提前预测风机故障。通过温度传感器对整个风机的温度测点进行实时监控,并对海量温度数据进行深度学习,构建风机故障检测与感知预测模型,最终做到提前1-2周识别风机微小故障并预警,单台风机单次...

配置算法实例

算法实例是根据算法模板创建的具体实例,可以根据您设置的检测参数结合算法模型,完成对相关数据中异常信息的检测及诊断,协助您更好地解读设备数据,监测设备运行状态,及时发现潜在故障。前提条件 已创建算法实例。具体操作,请参见 创建...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
风险识别 数据库自治服务 负载均衡 智能开放搜索 OpenSearch 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用