基本概念

实例 实例是指用户创建的针对多个数据进行同一类型AI计算所创建的一个计算任务。设备 设备指IPC、NVR等能产生视频数据的相关设备,该设备同时符合GB/T28181-2016、GA/T1400协议,或者集成阿里云VCS SDK。设备接入 设备接入是指用户需要计算...

创建ClickHouse数据

ClickHouse数据源创建完成后,可用于进行数据同步、计算任务开发与调度、生成API提供数据服务等应用场景中,各应用场景需要分别使用DataWorks的数据集成资源组、调度资源组、数据服务资源组。您需要根据数据源的应用场景提前准备好对应的...

数据质量保障原则

例如,从在线业务库加工到数据仓库,再到各个数据应用节点,用户ID必须保持同一种类型,且长度也要保持一致。因此,您需要设计数仓的公共层以确保数据的一致性,详情请参见 CDM公共维度层设计规范。及时性 保障数据的及时产出才能体现数据...

分区表达式介绍

第二步,计算DELTA,DELTA为-1M,将计算上月同一天的数据计算得到20220403。最终结果为20220403。当补4月3日数据时就会触发规则执行,如果补5月3日,或者3月3日,则不会触发规则,$[]主要用于实现与执行日期相关的分区表达。内置分区表达...

分区表达式介绍

第二步,计算DELTA,DELTA为-1M,将计算上月同一天的数据计算得到20220403。最终结果为20220403。当补4月3日数据时就会触发规则执行,如果补5月3日,或者3月3日,则不会触发规则,$[]主要用于实现与执行日期相关的分区表达。内置分区表达...

数据质量教程概述

一致性 对于不同的业务流程和节点,同一数据必须保持一致性。例如表 province 字段中如果有 浙江、ZJ 两种表述,在您 group by province 时会出现两条记录。及时性 及时性主要体现在最终ADS层的数据可以及时产出。为保证及时性,您需要...

2024年功能发布记录

数据库MongoDB版(副本集架构)云数据库MongoDB版(分片集群架构)RDS MySQL数据库触发器 新增 您可以在数据传输服务DTS(Data Transmission Service)控制台创建数据同步任务,实时或定时将 云数据库 RDS MySQL 版 实例的增量数据同步至...

数据分布策略

CREATE TABLE table_name(.)[DISTRIBUTED BY(column[,.])|DISTRIBUTED RANDOMLY|DISTRIBUTED REPLICATED]哈希分布 DISTRIBUTED BY(column,[.])数据将根据分布列的哈希值将各个行分布到指定计算节点上,相同的哈希值会始终散列到同一计算...

表分布定义

建表语句 CREATE TABLE 支持如下三个分布策略的子句:分布方式 说明 哈希分布 DISTRIBUTED BY(column,[.])数据将根据分布列的哈希值将各个行分布到指定计算节点上,相同的哈希值会始终散列到同一计算节点。为保障数据可以均匀分布在各个...

数据传输作业:数据集成

离线同步 离线(批量)的数据通道通过定义数据来源和去向的数据源和数据集,提供一套抽象化的数据抽取插件(Reader)、数据写入插件(Writer),并基于此框架设计一套简化版的中间数据传输格式,从而实现任意结构化、半结构化数据源之间...

温度平均值计算

本文以计算五秒温度平均值为例,详细说明如何使用数据分析预置的算子(统计、窗口等)实现五秒温度平均值的计算并存入数据库中。本文操作中,步骤至步骤四主要说明如何计算平均温度,步骤五主要说明如何将计算结果保存到数据库中,步骤...

Information Schema常见问题

MaxCompute的租户级别Information Schema从租户角度提供项目元数据及使用历史数据等信息,您可以一次性拉取您一个元数据中心下所有Project的某类元数据,从而进行各类元数据的统计分析:MaxCompute元数据使用实践-作业统计 MaxCompute...

TableTunnel

Session中,使用同一Block ID多次打开RecordWriter的行为会导致数据覆盖,最后一个调用 close()的RecordWriter上传的数据会被保留。该特性可用于Block的上传失败重传。TableTunnel的UploadSession中:如果没有指定 boolean overwrite ...

数据上云工具

DTS(Tunnel通道系列)什么是数据传输服务DTS 是阿里云提供的种支持RDBMS(关系型数据库)、NoSQL、OLAP等多种数据源之间数据交互的数据服务。它提供了数据迁移、实时数据订阅及数据实时同步等多种数据传输功能。DTS可以支持RDS、MySQL...

连续查询

连续查询是种简化的流计算能力,能够定期执行SQL查询,将查询结果存储在指定的数据表中,可用于预降采样和预计算,实现数据降精度长期存储以及查询性能提升。本文介绍Lindorm时序引擎连续查询的概念、使用方法和常见场景。背景信息 在...

数据

本文介绍写数据表算子的使用方法。用途 写数据表 算子用于将模型上游节点处理之后的出具写入指定的数据表中。适用场景 计算链路 计算引擎 是否支持 离线 MaxCompute 是 Hive 是 HiveStorage 是 RDS/MySQL 是 使用说明 离线链路 输入节点 ...

数据分析作业

MaxCompute是适用于数据分析场景的企业级SaaS模式云数据仓库,支持在多种工具上使用MaxCompute运行大数据计算分析作业。如果您需要进行简单的查询等数据分析作业,推荐您使用SQL查询或DataWorks的临时查询等工具,高效便捷地完成数据分析...

DataWorks新版数据源公告

尊敬的DataWorks用户:为了给您带来更为统一的产品使用体验,我们计划于 2023年10月20日 开始逐步将DataWorks内的MaxCompute、Hologres、AnalyticDB for PostgreSQL、AnalyticDB for MySQL、ClickHouse计算引擎合并入数据源管理;...

数据风险点监控

为确保数据完整性,每天任务通常都是0点开始执行,计算天的数据。这些任务大多在深夜运行,要确保数据按时产出,需要考虑任务的执行优先级以及任务执行失败或时间过长时的报警问题。任务优先级 MaxCompute平台上任务优先级都一样,无法...

数据上云场景

MaxCompute平台提供了丰富的数据上传下载工具,可以广泛应用于各种数据上云的应用场景,本文为您介绍三种经典数据上云场景。Hadoop数据迁移 您可使用MMA、Sqoop和DataWorks进行Hadoop数据迁移。使用DataWorks结合DataX进行Hadoop数据迁移的...

计算费用(按量付费)

MaxCompute按照压缩后的数据量计算数据扫描量。查询分区表时,您可以应用分区过滤条件,减少数据扫描量并提升查询性能。华东1(杭州)、华东2(上海)、华北2(北京)、华北3(张家口)、华南1(深圳)和西南1(成都)区域已开通MCQA作业...

使用DataWorks

当您需要将MaxCompute中的数据导出至其他数据源执行后续数据处理操作时,您可以使用数据集成功能导出数据。本文为您介绍如何将MaxCompute的数据导出至其他数据源。背景信息 数据集成的导出方式有如下两种:向导模式:创建离线同步节点后,...

产品简介

多方安全建模控制台作为多方安全建模的可视化操作平台,提供了站式端到端的数据安全计算服务,服务包括安全计算环境安装、数据连接、数据探查、数据分析、模型研发、模型投产和模型监控,同时可根据您的业务需求配置安全策略。...

E

返回 e 的值。此函数为MaxCompute 2.0扩展函数。命令格式 double e()返回值说明 返回DOUBLE类型。使用示例-返回2.718281828459045。select e();相关函数 E函数属于数学函数,更多数据计算数据转换的相关函数请参见 数学函数。

PI

返回π的值。此函数为MaxCompute 2.0扩展函数。命令格式 double pi()返回值说明 返回DOUBLE类型。使用示例-返回3.141592653589793。select pi();相关函数 PI函数属于数学函数,更多数据计算数据转换的相关函数请参见 数学函数。

实例介绍

背景信息 PolarDB-X 1.0计算资源只读实例 与主实例可以共享同一数据,通过物理资源隔离的方式,缓解主实例的负载压力,降低业务架构的链路复杂度,无需进行额外的数据同步操作,节省运维及预算成本。可直接在RDS只读实例或RDS主实例上...

概述

是 函数计算 TUPLE/BLOB 实时 否 Hologres TUPLE 实时 否 使用说明 用户使用数据同步时尽可能的进行同一Region的云产品之间的数据同步,方面避免跨Region网络不通问题,另方面也减少不同Region之间数据同步的网络时延。由于阿里云的...

POSITIVE

返回表达式的值。命令格式 TINYINT|SMALLINT|INT|BIGINT|DOUBLE|DECIMAL positive(TINYINT|SMALLINT|INT|BIGINT|DOUBLE|DECIMAL)参数说明 expr:必...相关函数 POSITIVE函数属于数学函数,更多数据计算数据转换的相关函数请参见 数学函数。

NEGATIVE

返回表达式的负值。命令格式 TINYINT|SMALLINT|INT|BIGINT|DOUBLE|DECIMAL negative(TINYINT|SMALLINT|INT|BIGINT|DOUBLE|DECIMAL)参数说明 expr:...相关函数 NEGATIVE函数属于数学函数,更多数据计算数据转换的相关函数请参见 数学函数。

ISNAN

判断表达式的值是否为 NaN,如果值为 NaN,返回True,否则返回False。命令格式 boolean isnan()参数说明 expr:必填。DOUBLE类型。...相关函数 ISNAN函数属于数学函数,更多数据计算数据转换的相关函数请参见 数学函数。

RDS搭配大数据计算服务实现大规模数据计算

本文介绍RDS MySQL如何结合大数据计算服务MaxCompute使用。开放数据处理服务又称为大数据计算服务(MaxCompute,原名ODPS),可服务于批量结构化数据的存储和计算,提供海量数据仓库解决方案以及针对大数据的分析建模服务。通过 数据集成 ...

资源规划及规格选型

计算资源规划依据 方式:按照计存比规划计算资源 先预估数据存储量及计存比,然后再预估最低需要购买的计算资源数量。方式二:按照项目实际消耗的计算资源数量规划计算资源 在项目正式上线前或在项目正式上线运行小段时间之后,评估...

UNHEX

返回十六进制字符串所代表的字符串。此函数为MaxCompute 2.0扩展函数。命令格式 binary unhex(string)参数说明 number:必填。为十六进制字符串。...相关函数 UNHEX函数属于数学函数,更多数据计算数据转换的相关函数请参见 数学函数。

ATAN2

计算 expr1/expr2 的反正切函数。命令格式 double atan2(,)参数说明 expr1:必填。DOUBLE类型。输入为STRING、BIGINT、DECIMAL类型时,会隐式转换为...相关函数 ATAN2函数属于数学函数,更多数据计算数据转换的相关函数请参见 数学函数。

使用DataWorks(离线与实时)

MaxCompute支持通过DataWorks的 数据集成 功能将其他数据源的数据以离线或实时方式导入MaxCompute,也支持将部分类型的本地文件数据导入MaxCompute。本文为您介绍使用DataWorks将数据导入MaxCompute的主要操作流程与注意事项。前提条件 已...

Tunnel SDK常见问题

对于一个UploadSession,一个BlockId打开RecordWriter,写入数据后,调用Close,写入成功后不可以再该BlockId打开另一个RecordWriter写入数据。Block默认最多20000个,即取值范围为0~19999。Block大小是否存在限制?每次上传至...

长周期指标的计算优化方案

您可以通过增量累计方式计算长周期指标的方式,不需要读取N个分区的数据,而是把N个分区的数据压缩合并成一个分区的数据,让一个分区的数据包含历史数据的信息。场景示例 计算最近1天店铺商品的老买家数。老买家是指过去一段时间有购买的...

什么是边缘流数据分析

数据分析是使用流的方法快速实时处理数据计算方式。边缘计算中的流数据分析,继承了物联网平台的流数据分析能力。在数据分析控制台创建 流数据分析任务,并将该任务下发到边缘端,通过边缘设备实时运行。运行结果可以存储在边缘端...

参考:渐进式计算

例如在范围查询(Range Query)场景下(即查询一段时间范围内的数据),使用传统批处理方式和渐进式计算方式每次统计过去周的产品总销量,渐进式计算方式除首次执行外,其余每次执行的计算量减少了70%。如下所示:传统批处理方式:第n(n...

MaxCompute数据迁移至OSS

本文为您介绍如何使用DataWorks的数据同步功能将MaxCompute数据迁移至对象存储OSS(Object Storage Service)。前提条件 开通MaxCompute和DataWorks。在DataWorks上完成创建业务流程,本例使用DataWorks简单模式。详情请参见 创建业务流程...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云原生大数据计算服务 MaxCompute 数据库备份 DBS 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用