产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

用户价值

数据资源平台为用户提供了一站式数据资产定义、生产、管理与服务平台,提供企业级数据资产构建能力和一致性使用体验,助力客户快速构建数据智能平台,实现数据资源统一管理,挖掘潜在规律,优化业务决策,让大数据真正的驱动客户业务。...

TSDBConfig

int getBatchPutTimeLimit()获取最大写数据提交限制。单位:毫秒 int getHttpConnectionLiveTime()获取连接的生命时长。单位:秒 int getHttpConnectionPool()获取连接池最大连接数量 int getHttpConnectTimeout()获取HTTP连接超时时间,...

数据服务入门

开发数据服务API时,数据服务将访问该数据源获取数据表的Schema信息,帮助您进一步设置请求和返回参数。调用数据服务API时,数据服务将访问该数据源来执行查询请求。步骤二:创建API分组 数据服务基于API网关对外提供服务。在API网关中,...

ClickHouse数据

ClickHouse数据源为您提供读取和写入ClickHouse双向通道的功能,本文为您介绍DataWorks的ClickHouse数据同步的能力支持情况。支持的版本 支持阿里云ClickHouse的20.8、21.8内核版本。您需要确认驱动和您的ClickHouse服务之间的兼容能力,...

从RDS同步至MaxCompute

大数据计算服务(MaxCompute,原名ODPS)是一种快速、完全托管的EB级数据仓库解决方案。通过数据传输服务DTS(Data Transmission Service),您可以将 RDS MySQL 或RDS MySQL Serverless 的数据同步至MaxCompute,帮助您快速搭建数据实时...

从RDS同步至MaxCompute

大数据计算服务(MaxCompute,原名ODPS)是一种快速、完全托管的EB级数据仓库解决方案。通过数据传输服务DTS(Data Transmission Service),您可以将 RDS MySQL 或RDS MySQL Serverless 的数据同步至MaxCompute,帮助您快速搭建数据实时...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

堡垒机的审计事件

GetOperationDatabaseToken 获取数据库运维令牌。GetOperationToken 获取主机运维令牌。GetOssPolicyToken 获取OSS签名直传令牌。GetPasswordTask 获取改密任务详情。GetPolicy 获取控制策略详情。GetRule 获取授权规则。GetShareKey 获取...

全量备份数据上云(SQL Server 2008 R2本地盘)

RDS SQL Server提供了将本地SQL Server数据库迁移到阿里云RDS SQL Server的数据库上云方案。您只需将本地SQL Server数据库的全量备份数据上传至阿里云的对象存储服务(OSS),然后通过RDS控制台将全量备份数据迁移至指定RDS SQL Server数据...

云产品集成

常见云产品如下:大数据开发治理平台 DataWorks 实时计算 Flink 版 数据库管理 DMS DataV 数据可视化 Quick BI 数据分析与展现 前提条件 已获取 OceanBase 数据库的基本连接信息,详细步骤请参见 获取连接参数。大数据开发治理平台 ...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

API概览

通用服务 API 标题 API概述 GetRegionStatus 获取数据湖构建服务开通状态 获取数据湖构建指定地域的服务开通状态。GetServiceStatus 获取某个用户的服务开通状态 获取数据湖构建某个用户的服务开通状态。DescribeRegions 获取开通的地区 ...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

外部数据

一个外部数据包装器是一个库,它可以与一个外部数据源通讯,并隐藏连接到数据源和从它获取数据的细节。在 contrib 模块中有一些外部数据包装器。其他类型的外部数据包装器可以在第三方产品中找到。要访问外部数据,我们需要建立一个外部...

Github实时数据同步与分析

本文以使用DataWorks实时同步公共数据至Hologres,并通过Hologres进行实时数据分析为例,为您示例DataWorks的数据同步能力与Hologres的实时分析能力。本教程以申请免费资源为例为您示例详细操作步骤,您也可以使用付费资源,操作类似。教程...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

时空数据库版本发布记录

本文介绍PolarDB PostgreSQL版时空数据库(Ganos)的版本更新说明。6.X 6.3 类别 说明 新增特性 Trajectory SQL 新增 ST_InsertAttr 函数,支持为轨迹增加新的属性。GeomGrid SQL 新增 ST_Degeneralize 函数,支持将低层级网格分解成高层级...

时空数据库版本发布记录

本文介绍PolarDB PostgreSQL版(兼容Oracle)时空数据库(Ganos)的版本更新说明。6.X 6.3 类别 说明 新增特性 Trajectory SQL 新增 ST_InsertAttr 函数,支持为轨迹增加新的属性。GeomGrid SQL 新增 ST_Degeneralize 函数,支持将低层级...

大数据安全治理的难点

存储 众所周知,大数据系统以数据类型多(结构化、非结构化、半结构化)、数据(动辄PB级别)著称,某些巨头组织一天就能新增数十万甚至数百万张表,如此体量给数据分级分类带来了极挑战,通过人工进行数据分级分类显然是不现实的,...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

使用数据镜像保护尚未写入完整的数据

使用场景 创建数据镜像,可确保在数据大批量写入更新期间,所有读请求从数据镜像获取数据。从而确保数据在完整写入前不会被应用程序读取到。数据镜像的读取性能与先前非镜像数据的读取性能完全保持一致。说明 数据更新完成后,可将数据正式...

DTS订阅通道

数据源参数 通过数据传输服务DTS控制台获取数据源参数。单击目标DTS任务在 任务管理 页面获取以下参数:topic:DTS订阅Topic名称(图示中①)。proxyAddr:DTS订阅地址(图示中②)。单击目标DTS任务在 数据消费 页面获取以下参数:sid:...

数据标准

数据是由特定的环境产生的,这些环境因素包括生产者、时间、系统等,从而造成了同一个语义的数据,有...说明 目前使用DDM进行数据建模可以进行逻辑建模和物理建模,但物理建模仅支持MaxCompute和Hive两种大数据引擎,不支持自定义数据源类型。

API概览

数据统计 API 标题 API概述 GetIndexCurrentValue 获取当前数据统计指标 调用GetIndexCurrentValue接口获取当前数据统计指标(实时数据)。GetAgentIndexRealTime 获取热线坐席实时数据详情 调用GetAgentIndexRealTime接口获取坐席详情实时...

常用管理

报错类型 说明 组件数据获取失败 组件请求数据源发生错误时,产生该报错。数据源的请求可能发生在组件首次加载时、组件自动更新时和全局变量触发更新时等。过滤器执行错误 组件请求数据源成功返回数据后,经过过滤器时产生报错,将记录为...

API概览

碳排管理 API 标题 API概述 报送碳排放活动数据 报送碳排放活动数据 GetDataItemList 获取数据项详情列表 本接口用于获取数据项详情列表。PushItemData 推送数据项数据 推送数据项数据。RecalculateCarbonEmission 碳盘查重新计算 重新计算...

MAX_PT

返回分区表的一级分区中有数据的分区的最大值,按字母排序,且读取该分区下对应的数据。注意事项 max_pt 函数也可以使用标准SQL实现,select*from table where pt=max_pt("table");可以改写为 select*from table where pt=(select max(pt)...

代码评审报告

数据完整性 数据获取是否完整 代码中的数据获取逻辑是否完整。例如累计客户数,是否完整包含了历史上有效存在,但当前不存在的客户。是 边界值检查 代码中对于边界值的处理是否正确。例如最近30天包含今天但不包含第前30天的。例如日期...

API概览

GetDataset 获取数据获取数据集。UpdateDataset 更新数据集 更新数据集,支持更新名称,描述等。PublishDataset 发布数据集 将私有数据集在工作空间内公开。ListDatasets 获取数据集列表 获取某个工作空间下的数据集列表。DeleteDataset...

API概览

ListDataDiagnoseReports 获取数据诊断报告 获取数据诊断报告(包括用户手动触发的诊断、每天产出的周期报告、数据启动时诊断的报告)。ListDataDiagnoseSampleDetails 获取数据诊断报告抽样明细 获取数据诊断报告抽样明细。

DataWorks模块使用说明

使用流程概览:参考文档:数据集成概述 数据建模与开发 子模块:数据建模 功能说明:数据建模是全链路数据治理的第一步,沉淀阿里巴巴数据中台建模方法论,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行...

配置数据

开发数据服务API时,数据服务将访问该数据源获取数据表的Schema信息,帮助您进一步设置请求和返回参数。本文为您介绍如何配置数据源。前提条件 为了保障数据源和服务资源组之间的正常数据访问,需要完成网络连通与白名单的配置,否则将无法...

添加DTS数据

数据源参数 通过数据传输服务DTS控制台获取数据源参数。单击目标DTS任务在 任务管理 页面获取以下参数:topic:DTS订阅Topic名称(图示中①)。proxyAddr:DTS订阅地址(图示中②)。单击目标DTS任务在 数据消费 页面获取以下参数:sid:...

羲和分析计算引擎

理解数据感知存储 作为完整数据仓库的一部分,羲和分析计算引擎,相比单纯的计算引擎,具备感知数据的优势。比如:利用数据分布,直接进行基于特定数据的计算,避免分布式系统中数据和命令流交互的开销。利用数据存储的能力,下推谓词、...

创建GreenPlum数据

通过创建GreenPlum数据源能够实现Dataphin读取GreenPlum的业务数据或向GreenPlum写入数据。本文为您介绍如何创建GreenPlum数据源。背景信息 Greenplum是一款大数据分析引擎,作用于分析、机器学习和AI等领域。其架构主要针对管理规模分析...

API概览

GetDataArchiveCount 获取数据归档工单量统计 获取数据归档工单量统计,包括:归档成功的工单数目,归档失败的工单数目,正在进行归档的工单数目,归档工单的总数目。SQL任务 API 标题 API概述 ListDBTaskSQLJob 获取SQL任务列表 获取SQL...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 数据库备份 DBS 数据库自治服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用