RPC

服务网格(Service Mesh)是蚂蚁集团下一代架构的核心,在蚂蚁集团当前的体量下,将现有的 SOA 体系快速演进至 Service Mesh 架构,犹如给奔跑的火车换轮子。本文以 RPC 层面的设计和改造方案为中心,分享蚂蚁集团在双十一大促面临大流量...

调用链采样配置最佳实践

调整采样是目前解决这类问题最高效且主流的方式,但具体配置什么样的采样策略,能够在可控的资源开销和费用成本内,最大程度保证错、慢、异常等链路被采集,从而最大限度保障性能监控和问题排查的使用需求。本文将重点围绕不同业务场景下...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的计算服务状态、存储服务状态、网络服务状态、实例配置管理和实例操作系统内相关配置进行全方位的诊断,帮助您了解实例的健康情况,及时发现并解决常见的问题。本文介绍轻量应用服务器支持...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断项,并提供了详细的诊断范围及建议操作供您参考。诊断项...

性能测试技术指南

理想的情况下,当系统压力上不去的时候,资源成为瓶颈(正常情况下,非其他瓶颈情况下导致),这样的话加资源,系统处理能力还会上升的,但是遗憾的是,很多系统性能测试资源都没达到瓶颈的时候,压力就上不去了。业务模型 分析 系统有很多...

号码百科使用FAQ

什么情况会返回操作受限?什么情况会返回运营商限制?运营商限制和操作受限有什么区别?是否需要实际呼叫?如何计费?套餐包剩余资源支持退款吗?购买的套餐包支持退款吗?查询准确性如何?通过信令返回运营商核心网中号码实时状态,查询...

什么是故障

“服务中断、服务品质下降”说明即使用户没有投诉(甚至没有用户使用),但是如企业提供的服务问题,也是故障;“无论什么原因”指无论是企业自身原因,还是第三方如供应商、运营商的原因,只要影响到了用户,就都是故障。故障等级 每...

故障管理

“服务中断、服务品质下降”说明即使用户没有投诉(甚至没有用户使用),但是如企业提供的服务问题,也是故障;“无论什么原因”指无论是企业自身原因,还是第三方如供应商、运营商的原因,只要影响到了用户,就都是故障。故障管理 ...

数据问答功能概述

数据问答支持如下核心能力:能力 解释 示例问题 单/多列查询 SELECT多column 列油耗大于8但是功率低于200的名称和价格 聚合函数查询 SELECT子句支持选择不同的聚合函数,包括:COUNT、SUM、AVG、MAX、MIN等 金奖的获奖记录是什么,...

Operator

Service Mesh 是蚂蚁集团下一代技术架构的核心,也是蚂蚁集团内部双十一应用云化的重要一环,本文主要分享在蚂蚁集团当前的体量下,如何支撑应用从现有微服务体系大规模演进到 Service Mesh 架构,并平稳落地。为什么需要 Service Mesh?...

服务商星级考核标准公示通知

我们也希望通过考核的评估细项能帮助服务商诊断店铺目前的核心问题,能针对性进行提升和改善,以此达到更好的服务水平及成交销量。后台不同星级对应的权益会持续进行丰富,敬请期待。2022年Q1考核结果将于4月初在云市场进行公示,届时请您...

鲜丰水果:3个月夯实基建,85%的需求两周内发布上线

我们会明确定义各阶段的流转规则,尤其是需求准入开发和准出开发的规则,因为这两个是产品、开发和测试这三个角色的需求抛接过程,而需求的抛接过程是最容易出问题的。4、明确需求优先级机制 明确需求优先级机制在团队共识环节特别重要,...

创建压测场景

请求成功率:您不仅需要查看全局的请求成功率,还需要关注一些核心API的成功率,避免整体成功率达标,但核心API成功率不足的情况。请求响应时间:您需要关注99、95、90、80等一些关键分位的指标是否符合预期,相对来说平均响应时间对您没有...

JVM监控内存详情说明

Java进程占用内存分布 Java进程在运行期间,内存分布的大致情况如下图所示:说明 JVM的运行机制比较复杂,此图仅列了主要的内存分布区域。ARMS获取JVM内存详情的原理 ARMS应用监控探针通过JDK提供的MemoryMXBean获取JVM运行期间内存详情...

Alibaba Cloud Linux 3镜像发布记录

支持ACPU(Assess CPU)(自研)ACPU可统计任务运行时HT对端空闲的时间,并提供per-cgroup统计,可以用于评估任务运行时共享CPU核心的硬件资源竞争情况。支持HT-aware-quota特性(自研)基于cfs带宽控制和core scheduling的算力稳定方案,...

强弱依赖治理概述

如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的时候,将导致商品详情页部分内容加载不全,出现如下图的情况,但核心业务流程仍可继续推进,用户体验并未受到太多影响。通过以上对比可以看出,当下游依赖...

App端性能体验功能说明

产品介绍 产品概述 应用性能稳定是良好用户体验中非常关键的一环,而现实情况却是应用崩溃、卡顿、加载缓慢、页面白屏等问题,频频出现在用户的真实体验之中,成为影响业务表现的直接杀手。为了更好保障应用性能稳定,产研团队在整个开发...

业产技融合分层协作方案

什么是业产技分层协作?业产技」是 业务团队、产品团队、技术团队 的缩写,代表研发流程中的三个典型的职能团队。在经典的研发协作流程定义中,更偏向于技术相关职能角色的分工定义,例如需求管理、迭代排期、缺陷跟踪等协作流程,即使这些...

如何处理Windows Server 2003/2008...虚拟内存不足问题...

本文介绍Windows Server 2003/2008系统的ECS实例虚拟内存不足导致的问题及解决方案。问题现象 一般而言,Windows Server 2003/2008系统的ECS实例缺少虚拟内存时会引起很多问题,包含但不限于如下现象:操作系统运行缓慢,甚至出现宕机,...

自治中心

功能介绍 DAS会对数据库的核心指标进行异常检测,如发现异常会自动进行会话诊断、SQL诊断、容量诊断,确认造成异常的原因,并给优化或止损的建议,并且在您授权的情况下,自动进行优化或止损操作。相关功能:异常检测 SQL限流 自动SQL限...

关闭IPVS的estimation功能

IPVS(IP Virtual Server)是Linux内核的一个组件,可将基于TCP和UDP服务的请求定向到真实服务器,实现内核四层负载均衡。在Kubernetes中,IPVS可作为其组件Kube-proxy的一种代理模式,将Service的请求转发到后端Pod,来实现Kubernetes...

DAS Auto Scaling弹性能力

面对这种情况,通常采用扩容数据库规格的方式来解决问题,而专业运维人员(DBA)在准备扩容方案时会至少思考如下三个问题:扩容是否能解决资源不足的问题?在数据库场景下,CPU打满只是计算资源不足的一个表征,导致这个现象的根因很多,...

Prompt最佳实践

Prompt 工程简介 Prompt(提示词)是一个指令、问题或者语句,能被 用来引导或指示一个语言模型生成特定的文本输出。Prompt是用户与语言模型交互的起始点,它告诉模型用户的意图,并且期望模型能以有意义且相关的方式回应。通过精心设计的...

IDaaS CIAM产品白皮书

2、追求更好的用户体验 作为顾客,我们经常会遇到一些影响用户体验的访问情况,常见问题举例:a.流程不合理 一些C端服务在注册页面没有找回密码的能力,没有辅助认证手段、不提供社交身份登录、甚至仍然依赖于邮箱登录。b.填写过多内容 ...

测试与验证

功能测试及联调测试依赖企业自己的测试团队及流程工作,不作过多描述,仅在此建议,对应用功能点进行分级,优先测试验证核心功能点,对不同级别功能点测试问题,制定不同紧急程度的问题跟踪。性能测试 性能测试方案 性能测试流程 业务测试...

全场景解决方案

平滑迁移异构治理 方案架构 双模微服务平台通过 SOFA 微服务和 Service Mesh 微服务,提供了既支持 SOFA 框架又支持 Service Mesh 架构的微服务管理和治理能力,解决用户在技术转型期间与未改造的遗留系统相互之间的打通和过渡问题,帮助...

服务运维

元数据不一致:元数据平台维护了 Pod 粒度的 Sidecar 版本信息,但是由于 Operator 是面向终的,会出现元数据与底层实际不一致的情况,当前仍依赖巡检发现。缺少完善的 Sidecar ops 支撑平台:缺少多维度的全局视图。缺少固化的灰度发布...

南京银行:借助云效完成敏捷转身,实现新金融DevOps...

如果发现有问题有一个需求不能上,全部回滚回来把正确的两个打集成再往下走。所有的这些自动化非常的快,不需要在里边摘代码,不需要查看冲突,都能快速的完成。“鑫云+”项目测试效能提升 在2016年新核心上线的时候上了一个新的系统,...

客户案例

而 OceanBase 提供的丰富的分区方式及 OLAP 能力有效地解决了不同场景下,业务指标的构建问题,这对于我们业务开发工作者来说可以更多的关注我需要什么样的指标,而不用考虑如何从存储系统中得到这些数据。大数据处理能力:随着阿里巴巴...

智能异常分析概述

描述一个机器的状态,则对应的黄金指标为每分钟用户CPU的利用率、每分钟内核CPU的利用率、每分钟系统驻留内存的大小、每分钟磁盘IO次数、每分钟系统的平均负载。描述一个OSS Bucket的状态,则对应的黄金指标为每分钟该Bucket写入的次数...

告警规则指标说明

Full GC耗时的瞬时值可以反映当前JVM的垃圾回收性能,通常情况下,Full GC耗时越短,JVM的性能越好。如果Full GC耗时过长,可能会导致应用程序出现明显的停顿,从而影响用户体验。JVM YoungGC次数(瞬时值)无 是 最近N分钟JVM执行Young ...

升级ASM实例

原地升级实例时,ASM会对您的实例进行升级预检查,但无法保证检查所有不兼容的功能配置和API。您可以根据帮助文档、控制台信息、站内信等渠道关注版本发布情况,在实例升级时提前了解相应版本的升级注意事项。基于安全原因,ASM有以下...

故障复盘

经验总结:剖析出来深层次原因之后,需要切实给可落地的Action,包括给短期治标Action,长期治本Action,以及沉淀经验和教训。定级定责:完成原因和改进方案后,针对本次故障做最终的等级认可和故障责任划分。责任团队分为主要责任团队...

如何基于LSM-tree架构实现一写多读

LSM-tree数据库引擎 LSM-Tree全称是Log Structured Merge Tree,是一种分层、有序,面向磁盘设计的数据结构,其核心思想是利用磁盘批量的顺序写要比随机写性能高的特点,将所有更新操作都转化为追加写方式,提升写入吞吐。LSM-tree类的存储...

技术面临的挑战与革新

分布式事务与集中式事务的优劣 事务处理是数据库保证ACID语义的核心功能,因为数据库系统需要处理大量的并发事务,为了保证并发事务能够尽可能高效的并发执行而又互不干扰,发展若干种技术,比如多版本并发处理(MVCC),乐观并发处理(OCC)...

售前常见问题

本文介绍使用云防火墙前的常见问题解决方案。功能特性相关 为什么使用云防火墙需要授予服务关联角色(AliyunServiceRoleForCloudFW)?云防火墙最多支持几个跨账号部署?金融云基础版云防火墙与其他版本有哪些差异?云防火墙是否有抗APT...

消息 Mesh

作为蚂蚁集团向下一代云原生架构演进的核心基础设施,Service Mesh 在 2019 年得到了大规模的应用与落地。截止目前,蚂蚁集团的 Service Mesh 数据平面 MOSN 已接入应用数百个,接入容器数量达数十万。同时,在双十一大促中,Service Mesh ...

使用ACK Net Exporter定位网络问题

这些问题往往在集群中难以无法复现,以偶然发生的方式干扰正常的业务,缺乏有效的定位手段,其中部分如下:网络数据报文被丢弃引发的连接失败,响应超时等问题。网络数据处理耗时久引发的偶发性能问题。TCP、conntrack等状态机制异常引发的...

附录:SOFAStack 产品目录

汇总聚合调用链路:所有的调用信息会被聚合汇总,方便对各个应用的调用情况和响应情况进行分析。定位关键路径:快速发现整个系统调用拓扑中的关键应用路径。优化不合理调用:及时发现某些不合理的调用并进行处理,如频繁进行数据库操作等。...

序言

什么是云原生 许多行业的领导者和新兴创业机构,其技术架构都有普遍的共同点:以移动为核心增强用户体验、快速敏捷创新、服务持续可用、基础架构可扩展。这也是以金融为代表的传统机构 IT 数字化转型的目标,恰好也是云原生架构定位的价值...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云防火墙 Web应用防火墙 DDoS防护 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用