系统运维工具集SysAK使用说明

SysAK(System Analyse Kit)是阿里云操作系统提供的一个全方位的系统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。本文为您介绍SysAK的安装部署和使用方法。运维场景 阿里云通过对百万服务器运维经验...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断项,并提供了详细的诊断范围及建议操作供您参考。诊断项...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,分钟级的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障

ECS整机恢复

当ECS整机发生系统故障或者错误操作时,您可以通过备份点的克隆和恢复功能,实现ECS整机回退和创建新的ECS整机。本文介绍整机恢复的相关操作。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。重要 当源ECS存在时,支持直接...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行原盘恢复或者创建新盘操作来实现数据恢复。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。背景信息 云盘恢复...

围绕混沌工程的平台实践

原则3在生产环境中运行实验 混沌工程推荐故障演练是在生产环境中进行,主要的原因有以下两点:系统的行为会根据环境和流量模式的变化,例如系统依赖的组件在测试环境和生产环境会有比较大的差异。系统的监控和人员的应急响应在测试环境和...

推荐解决方案综述

推荐系统和搜索引擎是现代App解决信息过载的标配系统,如果从零开发推荐系统,不仅需要耗费大量金钱和时间,而且很难满足快速上线推荐系统及不断迭代各种算法的业务要求。本文为您介绍如何使用阿里云产品创建推荐系统的数据和模型,从而...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行恢复原盘或者创建新盘操作实现数据恢复。本文介绍云盘恢复的相关操作。前提条件 已创建云盘备份。更多信息,请参见 创建云...

什么是推荐全链路深度定制开发平台PAI-REC

推荐全链路深度定制开发平台PAI-REC(PAI是Platform of AI的缩写,Rec即Recommendation的简称),是适用于企业开发者自主搭建、开发、迭代、运维的一整套推荐系统平台级服务。推荐系统是一个比较复杂的系统化工程,推荐系统分为离线、在线...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障的发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

Contextual Bandit 算法

然而推荐系统并不能提前知道用户在观察到商品之后如何反馈,也就是不能提前获得本次推荐的收益,唯一能做的就是不停地尝试,并实时收集反馈以便更新自己试错的策略。目的是使得整个过程损失的收益最小。这一过程就类似与一个赌徒在赌场里玩...

概述

优势 容灾备份,降低业务中断风险 主DNS系统故障,辅助DNS可继续提供域名解析服务,保障业务可用性。稳定可靠,保障业务稳定运行 云解析DNS提供100%SLA服务,全球DNS集群互相备份,服务永不宕机。全球节点,提升域名解析效率 节点遍布全球...

关于开通云产品的方案建议

对于DAU小于5万的客户 推荐系统可以用相对简单的方案,以便控制成本并提高业务的推荐效果:召回模型:使用etrec、swing、分组热门等;不使用向量召回模型,可以节约在线的向量召回。排序模型:使用相对简单的单目标多塔模型,推理速度快...

捷顺

DAS服务自动SQL限流和自动SQL调优,帮助DBA从救火员转向数据库架构师,有更多时间和精力帮助研发优化系统架构,审核数据库的变更和各种操作,进一步降低系统故障的概率。DAS服务自动对数据库实例进行治理,帮助捷顺科技把数据库的运维成本...

疲劳度(原曝光过滤)规则使用说明

结果展示逻辑:即10天之内终端用户浏览过的物品(以智能推荐系统接收到的您回传的终端用户曝光行为数据为准)不会被推荐出来,除非终端用户将物品池刷到只剩3000个物品未浏览的情况下可能出现重复推荐。注意事项:正确回传曝光行为数据。...

操作指南

新手引导 准备工作 数据埋点指南 数据规范 推荐全链路深度定制开发平台 PAIRec 推荐系统搭建 AB实验平台 实验指标管理 数据诊断 智能召回引擎BE 实例管理 访问控制 数据管理 服务管理 个性化算法开发平台TPP 实例基础配置 创建方案 创建...

备份和恢复数据

当出现系统故障或错误操作时,如果在此之前已经创建了快照,您可以使用该快照恢复数据。本文以Windows客户端为例,为您介绍如何利用系统快照和自定义快照备份和恢复数据。背景信息 自定义快照:您可以根据业务需要在某一时间点创建快照,...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

效果测试期及控制台中的问题

注:10小时内依据智能推荐系统记录行为,10小时以后依据用户回传行为。举例5.1用户A通过userid=1查询推荐系统,召回了itemid=N的数据。此时,智能推荐系统会记录该推荐行为,10小时内不再对userid=1推荐itemid=N的数据。如果用户A没有把...

一键诊断

相关文档 通过一键诊断了解数据库性能情况的全貌后,您可以使用如下功能对数据库进行全面细致的诊断,准确定位故障原因,并解决故障。会话管理 性能趋势 锁分析 慢SQL 空间分析 常见问题 Q:一键诊断中,如何计算会话的线程使用率、连接数...

价格说明

预估搭建整套推荐系统资源消耗参考(包含1、2、3收费项):业务规模 资源消耗预估中位数(目录价/月)备注 DAU5万以内 4万 推荐方案的复杂性导致费用相差比较大,例如物品和用户的数量,是否使用向量召回、物品冷启动算法、复杂的排序模型...

创建数据源

目前智能推荐的全量数据源只支持ODPS,您需要先将全量启动数据...3、注意:MaxCompute中的全量数据,智能推荐系统只会在初始化时读取一次,后续增量等相关信息不会回写该项目,后续用户对里面的数据进行增删改查,都不会影响智能推荐服务。

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

全量数据管理概述

数据源相关概念 目前智能推荐系统的数据源只支持MaxCompute(ODPS),后续会陆续开放OSS,RDS等其他方式。MaxCompute:大数据计算服务(MaxCompute,原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案,详情参见 MaxCompute 表:表...

快速入门

服务接入步骤导览 新手引导 准备工作 数据埋点指南 数据规范 推荐全链路深度定制开发平台 PAIRec 若您首次搭建推荐系统,缺乏相关技术经验,且前期存在算法、工程人力不足的情况,我们建议您优先启用端到端行业推荐服务AIRec服务对接,待您...

什么是用户体验监控

完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用性能表现情况,并支持日志数据查询,帮助您快速跟踪定位故障原因,提升用户体验。...

选型指导

二、资源选型 构建完整的推荐系统,需要一些相对划分独立的数据模块、算法模块、在线链路模块等,需要按照开发习惯、现有业务系统的数据架构,选择合适的资源拼装选型。基于大数据开发实践,我们建议的选型为:序号 模块/用途 云服务 1 ...

功能概览

生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障。更多信息,请参见 跨地域容灾。跨可用区容灾 当生产站点因为不可抗力因素(比如机房...

配额相关的问题

配额相关的问题 1、超过了设置quota后,推荐系统会如何处理?如果查询QPS超过了购买的配额,智能推荐会做限流处理,禁止掉超过流量部分的访问。如果用户数和物品数超过了购买的配额,所有通过SDK的ADD和UPDATE消息会失败,DELETE消息正常。...

产品概述

什么是智能推荐AIRec 推荐全链路 深度定制 开发平台 PAIRec 推荐全链路深度定制开发平台PAIRec(PAI是Platform of AI的缩写,REC即Recommendation的简称),是适用于企业开发者自主搭建、开发、迭代、运维的一整套推荐系统平台级服务。...

使用快照(公测)

在执行可能影响云电脑稳定性的关键操作之前,例如修改注册表、修改关键系统文件等,建议您提前创建快照,一旦出现系统故障,就可以使用快照恢复数据。本文介绍如何使用快照。背景信息 快照是某一时间点某一块云盘的数据状态文件,可用于...

设计原则

因此,数据容灾对于企业来说是非常必要的,数据灾备是企业保护核心数据的重要手段,能有效降低勒索病毒、系统故障、自然灾害和运维事故导致的数据丢失和损坏问题,同时满足行业安全和合规要求,可以保障企业的正常运行和稳定发展。...

畅捷通

畅捷通通过日志服务的异常预测函数,从海量指标中快速定位异常,将有问题的地方显示出来,快速发现系统故障。畅捷通通过日志服务将各块汇集过来的数据进行标记后,与应用的配置信息进行关联和整合,通过时序发现故障的根因,从而可以实现...

功能特性

此外,在数据库实例发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。智能压测 搜索分析 查询并导出SQL语句对应的日志信息。搜索 SQL洞察 SQL洞察聚类分析,用作深度异常的排查。SQL洞察 安全审计 内置了...

基本概念

这种情况非常常见:当用户自己已有推荐系统的时候,在刚开始会把这个场景从切10%到20%的推荐流量给PAI-REC系统。当PAI-REC的推荐效果达到预期之后再逐渐增加流量。HomePageRec的默认流量是走PAI-REC的,而selfhold表示用户自持的流量,...

数据埋点指南

需要将此4条行为分别记录,并按要求上传到智能推荐系统中。埋点数据 曝光行为埋点 什么是曝光行为 曝光对应的是行为(behavior)表的bhv_type字段,是上传用户行为的一种类型。一条数据展示给用户一次,就算做一条曝光行为。如何埋点 曝光...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
智能推荐 AIRec 数据库自治服务 负载均衡 云安全中心 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用