通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

云盒计算资源配置最佳实践

说明 云盒中的硬件设备出现故障时,业务会迁移到冗余资源上来确保业务连续性,同时阿里云向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。关于如何授权维修以及维修相关流程,请参见 响应云盒维修事件 和 云盒...

应用场景

如果现有计算资源突然出现故障导致业务受到影响,很难及时进行故障修复或者替换。您可以利用弹性伸缩的高可用优势,开启健康检查模式。阿里云自动检查实例的健康状态,当发现存在实例不健康时,自动增加实例替换不健康的实例,确保...

遗嘱消息

使用场景 设备异常分析 物联网设备接入物联网平台,当设备状态发生变化如设备上线、设备下线时,物联网平台会业务服务器或规则引擎推送设备状态消息 topic:/as/mqtt/status/${productKey}/${deviceName},该消息中只包含设备的连接状态...

什么是先知(安全众测)

先知(安全众测)是一个帮助企业建立私有应急响应中心的平台。产品介绍 先知(安全众测)是一个帮助企业建立私有应急响应中心的...协助漏洞修复 先知平台会协助用户进行修复漏洞,若可以提供修复方案,平台会给企业提供参考的漏洞修复方案。

补数据

什么补数据选择业务时间昨天和今天,也会出现等待时间的情况?为什么补数据选择补0点~1点生成了多个实例?为什么进行大量补数据操作时,会出现等待资源情况(实例显示黄色,实例状态为等待资源)?为什么补数据报错调起的节点运行时间不...

功能特性

与云端交付平台联动 线上集成、验证、出包,一步到位。柔性版本管理、故障回流差异。中间件统一供应 提供足够丰富的中间件(包括数据库),帮助产品加速实现完全容器化。对接入的中间件进行可运维、可观测的统一规范化治理,实现统一运维...

概述

TRaaS 技术风险防控平台,是以蚂蚁内部 SRE 长期实践方法论和内部工具沉淀为依托,形成的解决用户上云和分布式改造过程中,可观测、故障应急、容灾、混沌工程、资金安全、压测等运维问题平台产品。高可用管理平台 高可用管理平台(High ...

CoAP连接相关问题

如果发送到云端的数据不是JSON会出现什么错误?目前除了支持JSON格式外,也可以支持CBOR格式。设备与云端通信,需要使用指定格式,否则可能会出现无法解析的问题。调用IOT_CoAP_Init方法时,coap_malloc返回NULL,是什么原因引起的?请查看...

杭州幻熊:从一周发版一次到每日交付

面临的问题 经过进一步接触,我们了解到为了支撑快速发展的行业业务,企业内部正在调研、并准备搭建持续集成和持续交付平台。云效的出现恰好在时机上契合了企业流程升级的需求。企业现状 流程升级首先要洞悉当前流程遇到了什么问题,找出...

EMR Kafka磁盘故障运维

业务场景 Kafka将日志数据存储到磁盘中,当磁盘出现故障时,导致磁盘IO能力下降、集群吞吐下降、消息读写延时或日志目录offline等问题。这些情况有可能影响到线上业务平稳运行、数据丢失、Kafka集群容错能力下降,单块盘故障甚至有可能...

标准版-双副本

当主节点出现故障,自研的HA系统自动进行主从切换,保证业务平稳运行。数据可靠 默认开启数据持久化功能,数据全部落盘。支持数据备份功能,用户可以针对备份集回滚实例或者克隆实例,有效地解决数据误操作等问题。同时,在支持容灾的...

什么是云原生应用交付平台ADP

云原生应用交付平台ADP(Application Delivery Platform)是一个“软件产品”的本地化交付和运维工具。它借助容器等云原生技术带来的标准化交付和IaaS解耦能力,一站式的帮助软件厂商解决在本地化环境进行交付时的异构环境适配、部署复杂、...

标准架构

当数据库节点发生故障时,数据丢失,系统重新拉起一个 Tair 进程(没有数据),当节点故障业务自动切换完成后,应用程序需要将数据重新预热。单副本架构不支持以下功能:自动或手动备份、离线全量Key分析 和 实例回收站。若您对数据有...

外呼机器人常见问题解决方式

3)检查当前业务是否有绑定外呼号码(一般控制台内发起外呼时会进行校验业务下号码,但代码上传过程中会出现此状况);到号码管理中查看号码绑定情况。4)检查当前业务并发是否为0,业务并发为0时任务也无法正常发起;4、业务管理中,新建...

什么是云效

什么是测试管理 应用交付平台 Appstack 云效应用交付平台 AppStack 是以应用为核心的云原生应用交付平台,提供对开发者友好的应用编排、环境管理、部署运维、资源管理、应用发布等一站式应用交付能力,帮助企业建立应用持续交付整体解决...

使用说明

背景信息 设备基于物联网平台的消息通信能力开展业务,由于不同设备业务的复杂性,以及业务需要定期变更升级,导致设备的业务程序容易出现故障,导致设备不可用。如果设备的业务程序与远程登录程序在同一进程,导致设备不可使用远程登录...

快速体验ADP

云原生应用交付平台ADP(Application Delivery Platform)帮助软件产品完成企业级专有环境交付。当您有软件产品交付的需求,可以使用 ADP云端交付管控平台,完成软件产品的在线化集成。欢迎使用云原生应用交付平台ADP(Application ...

如何制定科学有效的需求流程规范

1.需求流程的常见问题 问题1:反馈需求的渠道太多,难以集中管理 如果团队没有使用协作平台一般会采用多人在线编辑的文档,在IM聊天工具中进行协同编辑。这种方法在短期的协作中是非常高效的,但是随着业务的发展,客户的增多,这种协同...

出包管理

部署安装包解决了以下问题:保障部署动作的顺畅进行,不受环境外因素的影响(如网络抖动导致的外网镜像拉取失败的问题)是离线环境下部署所必须采取的方式,通过移动存储设备将部署安装包拷贝至对应环境内即可 降低部署交付的成本,只需要...

问题汇总

等待资源 为什么会出现等待资源?为什么任务一直在等待gateway调度资源?为什么数据集成任务一直显示wait?为什么会空跑 什么是空跑?为什么会空跑?场景一:周月实例空跑周期 场景二:实时生成的过期实例 场景三:设置成功实例 场景四:...

使用限制

外呼产品使用过程中,平台对开展的业务有一定限制,具体限制内容如下:本平台不支持发送涉及以下非法或敏感业务:反对宪法所确定的基本原则的;危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一的;损害国家荣誉和利益的;煽动民族...

应用场景

出现这些故障时,如果用户业务部署在单个地区,那么就因为地区故障导致服务不可用,且不可用时间完全依赖故障恢复时间。通过构建灾备库,使用数据同步服务实时增量同步主库数据以确保主库与灾备库数据的完全一致,当业务中心发生地区...

产品简介

核心优势 加速业务价值交付 云构建通过平台工具提效,结合协同机制,全面加速用户业务价值的交付速度。轻松进行集成 云构建采用开放式架构(支持各种研发期组件定义与集成)、插件化管理、工作流自定义,可与客户现有工具集成。节省更多的...

加速上云服务

一般情况下,阿里云将在5个工作日内通知您,阿里云是否可以受理您的业务需求,并与您协商交付期限。通常,服务交付周期需要30个工作日;如遇特殊情况,阿里云与您进行协商。4.资源查勘 阿里云将向多个运营商发出查勘单,并将通过合适的...

业产技融合分层协作方案

这三个部门的部分人员可能形成虚拟团队进行项目协作,完成产品研发和业务交付。业产技分层协作方案就是描述这三个职能团队的协作过程,实现从业务到技术的完整的价值单元交付过程。业产技分层协作模式与SCRUM有什么关系?SCRUM是一种被...

应用集成

部署策略 在真实的上线过程中,如果采用全量发布,给开发运维团队带来未知的风险,为了减少发布对线上业务的影响,在应用部署过程中,建议采用灰度发布,分批发布这种模式,可以最大限度的避免不稳定发布对用户的影响,保障业务交付稳定...

实例概述

物联网平台提供公共实例和企业版...设备接入物联网平台实例时的常见问题,请参见:设备接入物联网平台相关问题 设备认证相关问题 Link SDK相关问题 MQTT连接相关问题 设备与物联网平台通信常见问题,请参见:物模型相关问题 消息通信相关问题

创建局点与交付内容管理

配置完交付内容之后,在交付参数模块可以继续在底座配置栏中调整ADP底座的相关参数以及ADP底座组件的配置参数,同样在产品名称对应的Tab页下可以编辑产品对应的全局交付参数以及某些组件的交付参数 交付参数配置说明 产品交付参数配置主要...

示例项目简介

全渠道业务中台一般会由用户中心、客户中心、商品中心、交易中心、支付中心、库存中心、促销中心等数个共享能力中心构成。因此,BizWorks团队从商品中心和用户中心里面截取少部分模型和能力作为示例项目,帮助您快速了解如何使用BizWorks...

小微企业两步快走实现持续交付

1 背景 小型企业一般是指研发人数少于30人的企业,这些企业有的处于生存期,有的处于发展期,要求产品迭代速度要赶上市场更新速度。对于研发流程,一般没有专职的管理人员,希望引进成熟的方案把游击队改造成正规军,用小而精的技术团队...

账号体系:如何用同一套账号接入整个研发过程?

应用交付平台场景实践。前言“君子和而不同,小人同而不和。孔子 我们认为,对于任何一个有研发诉求的企业,账号体系都是需要尽早考虑、慎重对待,且不应该随意变更的。问题类型 研发团队在设计账号体系和管理账号的时候经常遇到各种问题...

移植问题

本文介绍编译3.x和2.3.0版本的C Link SDK时,可能遇到的问题和解决方法。背景信息 如果您尚未接入物联网平台,推荐使用最新版本的SDK。更多信息,请参见 概述。在Linux系统编译SDK后,运行Demo时,为何出现如core dump等错误?SDK提供的HAL...

1、什么是敏捷研发?

敏捷研发历史 敏捷软件开发的实践最早出现在上世纪 90 年代。当时,一批轻量的软件工程方法和框架相继诞生,它们共同的特点是,相对传统软件工程,都遵循演进和迭代的模型,过程更加轻量灵活。其中 Scrum 和极限编程(ExtremeProgramming)在...

内网访问安全常见问题

本文梳理了 SASE 内网访问安全的常见问题,如果您的业务中遇到相关问题可以参考解决。访问一个域名网站,如何配置内网DNS才能正常访问?如果您的业务组网中接入了PrivateZone,则 SASE 自动同步PrivateZone的解析数据,您无需在 SASE ...

局点交付环境管理

为了帮助产品顺利地交付到客户线下环境,我们提供了一套交付工勘流程,可以帮助客户检查线下环境是否满足产品的交付要求,检查完成后,还自动获取环境里所有节点的详细信息,供正式交付使用。工勘获取交付环境节点信息 我们提供了一套...

实例运维常见问题

本文汇总了Lindorm实例在扩缩容、升降配、实例重启、版本升级等实例运维场景中的常见问题,包括但不限于操作耗时、业务影响及费用说明,帮助您快速了解运维操作中的相关细节和注意事项。问题导览 扩容、升配、服务开通 实例扩容节点需要...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

常见问题

本文汇总了使用多活容灾时的常见问题。MSHA基础常见问题 什么是...同城多活单元格流量切零后,企业版RocketMQ的ons.log中为什么会出现日志brokerName=msha_mock_queueBrokerName?异地多活如何查看MSHA-agent是否从HTTP流量中提取出了路由标?

商米:DevOps转型实现精益开发与自动化运维

采用Scrum工作模式,引入Scrum Master 和四次Scrum会议(计划、每日站、评审会议、回顾会议)跨职能团队恰好能解决当时商米遇到的团队协作上的问题,但却无法兼顾职能团队的优势,于是增加技术委员团队来支持业务交付团队:遇到的问题 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云服务器 ECS 云数据库 Redis 版 Web应用防火墙 商标服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用