代码逻辑场景

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

JVM注入动态脚本

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

EasyCkpt:AI大模型高性能状态保存恢复

EasyCkpt是PAI为PyTorch大模型训练场景而开发的高性能Checkpoint框架,通过实现接近0开销的模型保存机制,提供了大模型训练全过程进度无损的模型保存与恢复的能力。目前EasyCkpt支持当前流行的两种大模型训练框架Megatron和DeepSpeed,本文...

什么是物模型

设备发生故障时的温度、时间信息;设备告警时的运行状态等。事件可以被订阅和推送。物联网平台支持为产品定义组功能(属性、服务和事件)。一组功能定义的集合,就是一个物模型模块。个物模型模块,彼此互不影响。物模型模块功能,解决...

应用故障自动诊断

故障定界:这一部分包含了诊断模型推测出的导致应用故障的浅层原因,一般包含以下3种情况:应用的某个实例故障导致的整体故障。应用的某个接口或者服务故障导致的整体故障。应用的下游应用故障导致本应用故障。根因分析:这一部分包含了...

云端运行日志

物联网平台控制台提供云端运行日志,包含物联网平台、设备、您的应用程序三者之间的交互通信记录。通过日志记录的消息内容、业务类型、操作类型和状态码等信息,可以了解设备状态、通信情况,并定位操作失败的原因,帮助您监控和管理设备,...

测试协议

提示条款 欢迎您与杭州耘点科技有限公司(下称“我们”)共同签署本《通义万相大模型API测试协议》(下称“本协议”)并测试体验通义万相大模型API!协议中条款前所列索引关键词仅为帮助您理解该条款表达的主旨之用,不影响或限制本协议...

测试协议

提示条款 欢迎您与杭州耘点科技有限公司(下称“我们”)共同签署本《通义万相大模型API测试协议》(下称“本协议”)并测试体验通义万相大模型API!协议中条款前所列索引关键词仅为帮助您理解该条款表达的主旨之用,不影响或限制本协议...

服务协议

提示条款 欢迎您与杭州耘点科技有限公司(下称“我们”)共同签署本《通义千问大模型API服务协议》(下称“本协议”)并使用通义千问大模型API!协议中条款前所列索引关键词仅为帮助您理解该条款表达的主旨之用,不影响或限制本协议条款的...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

流水单据型业务场景活实践

在北京单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复。说明 这里区别于传统的解决思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦。容灾切换...

写少型业务场景活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

单实例快速恢复

该方案为当前每个实例内部默认启用,当系统发生故障时,无需手工运维介入,系统可以自动恢复。在恢复期间,如果查询算子需要访问恢复中的节点,则查询会立即失败。节点恢复速度在一分钟左右,当表数量明显增加时,恢复时间会更长。Hologres...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

什么是故障演练

适用场景 故障演练可适用于以下典型场景:衡量微服务的容错能力 通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

同城活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

如何开启模型训练

多维度评估:支持单模型、多模型对比等多维度评估方式。训练前的数据准备 训练集:训练所用的数据集,格式一般为Prompt+Completion的文本数据,可通过excel/json进行编辑和上传,最小训练数据条数为20,最大训练数据条数为10000,一条训练...

快速开始

示例代码 说明 以下以Dashscope SDK调用通义万相-文本生成图像模型为例,其他更多模型的调用与示例代码,请查看其对应的API详情文档。设置API-KEY export DASHSCOPE_API_KEY=YOUR_DASHSCOPE_API_KEY Python from ...

快速开始

示例代码 说明 以下以Dashscope SDK调用通义万相-文本生成图像模型为例,其他更多模型的调用与示例代码,请查看其对应的API详情文档。设置API-KEY export DASHSCOPE_API_KEY=YOUR_DASHSCOPE_API_KEY Python from ...

模型体验介绍

支持top-p、system、自定义随路参数及自定义停止符等多种自定义模型配置,支持多模型多配置差异化效果对比。说明 system:系统人设,例如“你是一个AI助手”。top_p:控制核采样方法的概率阈值,取值越大,生成的随机性越高。temperature:...

多点位模型

多点位模型是三维城市构建器创建模型的图层,支持独立的样式配置,包括多点位模型的通用样式、图形样式、动效样式和交互样式等。本文介绍多点位模型各配置项的含义。在场景编辑器左侧图层列表中,单击 多点位模型 图层,进入配置面板配置 ...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更信息,请参见 云...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制功能对主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件 反向复制前,请确保源云盘(主盘)已经从对应的ECS实例上卸载,即主盘处于未挂载状态。具体...

通过控制台使用时序模型

如果要通过控制台进行更时序模型的功能操作,请参见 通过控制台使用时序模型。基于时序模型可以实现 基于Tablestore时序模型构建车联网数据存储、基于设备接入平台与Tablestore搭建车辆轨迹数据平台 等方案。更方案介绍,请参见 场景...

实时分析链路数据

单机故障每时每刻都在频繁发生,特别是核心集群由于节点数量比较,从统计概率来看几乎是一种“必然”事件。单机故障不会造成服务大面积不可用,但是会造成少量的用户请求失败或超时,持续影响用户体验和答疑成本,需要及时处理。单机故障...

通过一致性复制组实现容灾恢复

当生产站点发生故障时,将开启读写权限的容灾站点中云盘挂载到临时创建的ECS实例上继续运行业务,直到生产站点故障修复完成。警告 故障切换功能会暂停异步复制功能,您需要确保您的生产站点发生故障时再使用故障切换功能,避免数据丢失。...

产品优势

深厚的模型原始积累和有针对性的独立工作区 自学习平台的工作区基于阿里云深厚的算法模型迭代生成的框架,能够保证用户在模型还未生成之前就比同等的初始模型多出一定比例的准确性,缩短模型优化时间,提升模型准确率。基于丰富的成功案例...

模型服务网格

模型服务网格(Model Service Mesh)提供了一个可扩展的、高性能的基础架构,用于将多个模型服务进行管理、部署和调度,以此更好地...相关功能 使用模型服务网格进行多模型推理服务 使用模型服务网格自定义模型运行时 为大语言模型LLM提供服务

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

响应云盒维修事件

当云盒中的硬件设备发生故障需要更换时,阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。本文为您介绍云盒维修相关的流程,以及如何响应云盒维修事件。背景信息 配置云盒计算资源时,您需要配置一定的...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

异地应用双活切流

在⼀个数据中心发生故障或灾难的情况下,将流量切换到其他数据中心,其他数据中心可以正常运行并对关键业务或全部业务进行接管,实现故障灾难场景的业务快速恢复。本文将介绍在异地应用双活中如何创建切流任务并查看切流详情。前提条件 ...

编辑任务

替换模型:单击模型文件右上角的 替换模型,可以为当前图例更换模型。配置模型 转码配置:在配置项输入框输入需配置的公式。轻量化:拖动滑块或设置轻量化程度。材质填充:在下拉列表中选择需要填充的材质。材质优化:拖动滑块或设置材质...

设计方案

风险预测:风险预测是指在发生故障前,通过数据分析、机器学习等方式,预测系统的风险情况,提前进行预防和处理。在故障应急响应中,风险预测可以作为重要参考,帮助快速识别问题的根本原因,提高故障处理效率和精度。故障响应 在发现故障...

语言版本分片模型

SchedulerX可以对多重任务进行调度(定时、编排、重刷历史数据等),提供Java、Python、Shell和Go等语言分片模型,帮助您处理大数据业务需求。背景信息 分片模型主要包含静态分片和动态分片。静态分片:主要场景是处理固定的分片数,例如...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
表格存储 数据库自治服务 智能语音交互 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用