2024年

您可以以更熟悉、高效、便捷的方式利用MaxCompute的海量计算资源及数据进行大规模数据处理、可视化数据探索分析及科学计算、ML/AL开发等工作。MaxFrame功能介绍和使用说明请参见 MaxFrame概述。您有任何相关问题或需要协助,可以通过您的专...

数据科学计算概述

MaxFrame是由阿里云自研的分布式科学计算框架,是对历史相关产品功能(PyODPS、Mars)的重大升级,在MaxCompute之上提供一套完全兼容Pandas接口的API,让用户用更为熟悉、更符合Python社群习惯的方式使用MaxCompute。本文为您介绍...

环境说明

4.5.4.58 numpy 科学计算库 1.21.4 scipy 科学计算库 1.7.2 matplotlib 绘图库 3.4.3 scrapy 数据抓取库 2.5.1 Python 3.6 模块名称 模块介绍 模块版本 oss2 OSS SDK 2.9.1 tablestore Tablestore SDK 5.1.0 aliyun-fc2 FC SDK 2.3.0 ...

MaxFrame概述

您可以用更熟悉、高效、便捷的方式利用MaxCompute的海量计算资源及数据进行大规模数据处理、可视化数据探索分析以及科学计算、ML/AI开发等工作。本文为您介绍MaxFrame背景信息、功能介绍及使用场景。版本说明 当前MaxCompute MaxFrame功能...

环境说明

4.5.4.58 numpy 科学计算库 1.21.4 scipy 科学计算库 1.7.2 matplotlib 绘图库 3.4.3 scrapy 数据抓取库 2.5.1 Python 3.6 模块名称 模块介绍 模块版本 oss2 OSS SDK 2.9.1 tablestore Tablestore SDK 5.1.0 aliyun-fc2 FC SDK 2.3.0 ...

按需集群

该类型集群适用于绝大部分业务波峰明显的场景,阿里云批量计算服务依托强大的弹性计算能力,在渲染、基因、金融、游戏、科学计算等领域有极为广阔的应用。2.限制 各账号按需实例均存在配额限制,您可以直接打开 批量计算控制台,切换到对应...

开源支持

使用Mars进行科学计算,不仅使大规模科学计算任务的实现从MapReduce上的数千行代码降低到Mars上的数行代码,更在性能上有大幅提升。Mars已经在Github上开源代码,您可以一起参与共建Mars。详情请参见GitHub开源代码 Mars。关于Mars的更多...

镜像管理

MaxCompute提供镜像管理功能,内置数据分析、科学计算、机器学习(如Pandas、Numpy、Scikit-learn、Xgboost)等各类常用镜像,并已对镜像进行预先加热,您可在SQL UDF、PyODPS开发等场景中直接引用已有镜像,无需执行繁琐的镜像打包、上传...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

功能概览

fold 将输入objects聚合成list<object>group 分组 groupCount 分组并计算组内的数量 identity 返回输入自身 label 返回表名或者图label loops 返回当前循环的次数 math 科学计算 max 计算最大值 mean 计算平均值 min 计算最小值 order 排序...

公告

计算成本优化功能在原计算资源优化功能(对 包年包月一级Quota 类型的计算资源生成更优的资源配置方案)的基础上增加支持查看使用 按量付费计算资源 调整为使用 包年包月计算资源 的资源配置推荐方案及效果推演,帮助您进一步优化计算成本...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

为函数安装第三方依赖

例如,Python的科学计算库 numpy 对底层环境有依赖,如果使用M1芯片的Mac系统,不能使用本地构建方式安装依赖。使用Dockerfile文件构建层 如果依赖包含底层动态链接库,或者在本地安装依赖失败,可以使用Dockerfile的方式安装。具体操作,...

为函数安装第三方依赖

例如,Python的科学计算库 numpy 对底层环境有依赖,如果使用M1芯片的Mac系统,不能使用本地构建方式安装依赖。使用Dockerfile文件构建层 如果依赖包含底层动态链接库,或者在本地安装依赖失败,可以使用Dockerfile的方式安装。具体操作,...

如何管理故障

可对故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

集群概述

软件 E-HPC提供了业界主流的科学计算应用、编译器运行时库、MPI通信库等软件,您可以根据需求安装使用。更多信息,请参见 软件概述。集群状态 创建中:集群创建初始状态,对应ECS实例创建。安装中:集群处于安装软件状态。初始化中:集群...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

监控指标

您可以在 函数计算 控制台查询 函数计算 资源概览指标以及资源所在地域和函数维度的监控指标详情。具体的监控指标通过指定MetricName参数实现。本文介绍 函数计算 各类监控指标对应的MetricName参数的取值和含义。资源概览指标 您可以登录 ...

监控指标

您可以在 函数计算 控制台查询 函数计算 资源概览指标以及资源所在地域、服务和函数维度的监控指标详情。具体的监控指标通过指定MetricName参数实现。本文介绍 函数计算 各类监控指标对应的MetricName参数的取值和含义。资源概览指标 您...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

单实例快速恢复

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

2024年

跨地域灾备 2024-02-08 新增镜像管理 新说明 MaxCompute提供镜像管理功能,内置数据分析、科学计算、机器学习(如Pandas、Numpy、Scikit-learn、Xgboost)等各类常用镜像,并已对镜像进行预先加热,您可在SQL UDF、PyODPS开发等场景中直接...

故障演练常见问题

仅对下发成功的故障规则进行计费,所以执行一次演练的费用是在演练执行成功后进行计算的,会去除下发失败的故障规则。故障不生效是否计费?计费。故障不生效的原因较多,可能是参数配置不正确或无对应的请求命中,但故障规则已成功下发,故...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

2024年

2024-03 功能名称 功能描述 发布时间 发布地域 相关文档 镜像管理功能发布 MaxCompute提供镜像管理功能,内置数据分析、科学计算、机器学习(如Pandas、Numpy、Scikit-learn、Xgboost)等各类常用镜像,并已对镜像进行预先加热,您可在SQL ...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

监控指标说明

该指标协助您进行作业诊断,排查作业Task级别的故障原因。次数 TM GC Time 每次TM GC时间。长时间GC会导致占用过大内存空间,从而影响作业性能。该指标协助您进行作业诊断,排查作业级别的故障原因。毫秒(ms)TM ClassLoader/...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障计算节点宿...

设计方案

故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...

配置网络

您在 函数计算 创建的函数,默认可以访问公网,无法访问VPC内的资源。如果您需要函数能够访问VPC内的资源,或允许指定的VPC来调用函数,那么您需要手动为函数配置网络和权限。本文介绍如何通过 函数计算 控制台为函数配置网络。注意事项 ...

故障取消

故障取消 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST/problem/...

配置网络

您在 函数计算 创建的函数,默认可以通过公网调用,无法通过VPC调用。如果您需要函数能够访问VPC内的资源,或允许指定的VPC来调用函数,那么您需要手动为服务配置网络访问能力。网络配置为服务级别,即对服务下的所有函数生效。本文介绍...

服务条款

服务条款 本服务条款是阿里云计算有限公司(以下简称“阿里云”)与您就批量计算服务(Batch Computing Service,简称BatchCompute)的相关事项所订立的有效合约。您通过盖章、网络页面点击确认或以其他方式选择接受本服务条款,包括但不...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括Pod诊断、Service诊断、Ingress诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACS集群中使用集群诊断功能。前提条件 已创建ACS集群。具体操作,请参见 创建ACS集群。确保ACS集群运行...

快速创建函数

如果您使用的是阿里云账号或者RAM用户已有创建函数计算FC默认角色的权限,授权失败的原因可能是由于一些功能无法授权造成的。但 函数计算 仍可以正常使用。如果您仍需授予系统默认角色,请加入钉钉用户群(钉钉群号 11721331)咨询。关于...

更新故障详情

P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
函数计算(旧版) 云数据库 RDS 轻量应用服务器 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用