应用场景

使用阿里云对象存储OSS作为云上存储,DDI集群提供灵活的计算资源,OSS上的数据可以被多个DDI集群共享,减少数据冗余。同时,DataInsight Notebook支持多用户同时协同工作,您可以在Notebook中完成作业编辑、提交和结果查看。实时数仓 利用...

数据集成概述

背景信息 面对各行各业对大数据的应用数据集成会有很多的诉求,包括能够简单高效的配置大量数据表的同步任务、能够集成多种异构数据源、能够实现对数据源的数据进行轻度预处理、能够实现数据同步任务的调优(例如容错,限速,并发)等。...

数据集成概述

背景信息 面对各行各业对大数据的应用数据集成会有很多的诉求,包括能够简单高效的配置大量数据表的同步任务、能够集成多种异构数据源、能够实现对数据源的数据进行轻度预处理、能够实现数据同步任务的调优(例如容错,限速,并发)等。...

升级

在阿里云官网,鼠标悬停至 产品 后,再将鼠标悬停至左侧导航栏的 大数据 ,单击 数据开发和治理 列下的 Dataphin。在Dataphin产品详情页,单击 产品控制台,进入Dataphin管理控制台页面。在Dataphin管理控制台页面,单击已开通版本详情后...

文档修订记录

附录:DataWorks访问其他引擎产品的服务关联角色 2023.5.11 新增功能 数据开发 您可通过关联远程仓库云效的方式,将Function Studio上的代码迁移至一站式BizDevOps平台云效统一管理。为您介绍如何将Function Studio中的代码迁移至云效服务...

架构

订阅者数据上的应用进程总是将 session_replication_role 设置为 replica 运行,这会产生触发器和约束上通常的效果。逻辑复制应用进程当前仅会引发行触发器,而不会引发语句触发器。不过,初始的表同步是以类似一个 COPY 命令的方式实现...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

概述

DataWorks的安全中心作为云上大数据体系的安全门户,致力于向您提供面向数据安全生命周期全过程的安全能力,同时在符合安全规范要求的前提下,提供各类安全诊断的最佳实践。其核心功能如下:数据权限管理 安全中心为您提供精细化的数据权限...

基于MaxCompute进行大数据BI分析

本实践以电商行业为例,通过MaxCompute、DataWorks对业务数据和日志数据进行ETL处理,并同步至分析型数据库MySQL(AnalyticDB MySQL)进行实时分析,再通过Quick BI进行可视化展示。背景信息 MaxCompute:用于进行规模数据计算,详情请...

数据资产等级定义

本文为您介绍数据资产等级的定义,以及如何定义生产链路上的相关数据的资产等级。数据资产等级定义 根据数据质量不满足完整性、准确性、一致性、及时性时,对业务的影响程度划分数据的资产等级。通常,划分为5个性质的等级:毁灭性质:数据...

受众与核心能力

产品定位 DataWorks致力于为数据开发者、数据分析师、数据资产管理者,打造一个具备开放自主开发与全栈数据研发能力的一站式、标准化、可视化、透明化的智能大数据全生命周期云研发平台。DataWorks赋予用户仅通过单一平台,即可实现数据...

Napatech案例

Napatech公司的用户可以将数据包采集和分析的能力提升至200G,然而上层软件产生的流量数据包元数据也爆增,给后台数据库(比如开源的HBase/ElasticSearch)的存储和索引能力带来极大的挑战。增加过多的节点会带来极大的成本开销及管理复杂...

数据资产定级

数据流转链路,您需要整理消费各个表的应用业务。通过给这些应用业务划分数据资产等级,结合数据下游依赖关系,将整个链路打某一类资产等级的标签。在本教程中,互联网在线运营分析平台只存在一个应用,统计并展现网站的PV和UV,...

数据资产定级

数据流转链路,您需要整理消费各个表的应用业务。通过给这些应用业务划分数据资产等级,结合数据下游依赖关系,将整个链路打某一类资产等级的标签。在本教程中,互联网在线运营分析平台只存在一个应用,统计并展现网站的PV和UV,...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

数据质量管理流程

数据质量管理是通过划分数据资产等级和分析元数据的应用链路,对不同资产等级的数据采取相对应的质量管理方式。数据质量管理流程图如下。数据管理流程说明如下:分析业务场景,根据应用的影响程度,确定当前以及生产链路上的数据资产等级。...

资产质量概述

背景信息 面对各行各业日趋强烈的大数据建设、管理及应用的诉求,Dataphin应用场景的多样性及复杂性随之增加。因业务系统的原始数据的规范性无法得以保障,所以Dataphin需要定义数据分析的质量,以满足资产质量的时效性、准确性、完整性、...

资产质量概述

背景信息 面对各行各业日趋强烈的大数据建设、管理及应用的诉求,Dataphin应用场景的多样性及复杂性随之增加。因业务系统的原始数据的规范性无法得以保障,所以Dataphin需要定义数据分析的质量,以满足资产质量的时效性、准确性、完整性、...

创建Hologres数据

新建Hologres数据源用于实现Dataphin能够读取Hologres的业务数据,及能够向Hologres写入数据。在引入Hologres的业务数据至Dataphin和将Dataphin的数据写入至Hologres的场景中,您需要先创建Hologres数据源。本文为您介绍如何新建Hologres...

数据质量保障原则

一致性 一致性通常体现在跨度很大的数据仓库中。例如,某公司有很多业务数仓分支,对于同一份数据,在不同的数仓分支中必须保证一致性。例如,从在线业务库加工到数据仓库,再到各个数据应用节点,用户ID必须保持同一种类型,且长度也要...

数据服务概述

DMS数据服务支持将企业托管在DMS上的数据快速迁移至外部。设计理念 数据服务作为DMS的模块,其基于DMS上受控的数据定义API,与SQL Console中执行SQL时的权限控制、数据脱敏等功能检查保持一致。数据服务基于Serverless架构,您无需关注...

Presto概述

应用场景 Presto是定位在数据仓库和数据分析业务的分布式SQL引擎,适合以下应用场景:ETL Ad-Hoc查询 海量结构化数据或半结构化数据分析 海量多维数据聚合或报表分析 重要 Presto是一个数仓类产品,因为其对事务支持有限,所以不适合在线...

基本概念

阿里云ECS自建数据库:阿里云ECS自建数据库是部署在阿里云ECS上的数据库实例。集群:集群是一个或者多个相同数据库引擎(如MySQL、Oracle、SQL Server等)的数据库实例集合。DBGateway:DBGateway是部署在用户环境中的守护进程,负责数据库...

DescribeColumns-查询数据资产表中列的数据

调用DescribeColumns接口查询数据安全中心连接授权的MaxCompute、RDS等数据资产表中列的数据。接口说明 本接口一般用于敏感数据资产信息表中列数据的查看,便于用户准确的对敏感数据进行分析。注意事项 DescribeColumns 接口已修订为 ...

数据模型

基本概念 物联网、应用监控、工业互联网等典型的时序场景下,数据源(Data Source)通常按一定的周期持续产生时序数据,一条时序数据由Tag、Timestamp、Field等元素共同来描述,具有相同特征的一类数据存放在同一张表中,表的时序数据元素...

Trino概述

支持丰富的数据源:Hive Cassandra Kafka MongoDB MySQL PostgreSQL SQL Server Redis Redshift 本地文件 支持高级数据结构,具体如下:数组和Map数据 JSON数据 GIS数据 颜色数据 功能扩展能力强,提供了多种扩展机制:扩展数据连接器 ...

时序引擎应用开发简介

使用OpenTSDB或时间序列数据库TSDB的应用开发步骤 Lindorm时序引擎兼容相关接口,对于已有使用OpenTSDB或者时间序列数据库TSDB的应用程序,您可以按照以下步骤进行应用迁移:应用适配 修改应用程序中的连接字符串,连接的目标从原有的...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

基本介绍

云原生多模数据库Lindorm宽表引擎 提供的、完全兼容HBase的云托管数据库,从2011年开始云数据库HBase增强版正式承载阿里内部业务的海量数据实时存储需求,支撑服务了淘宝、支付宝、菜鸟、优酷、高德等业务中的大量核心应用,历经双十一、...

安装Agent

Agent程序是数据库审计系统提供的功能插件,您需要在用户终端、目标数据库服务器或连接数据的应用服务器安装Agent,用于将数据库访问流量转发到审计系统。本文介绍安装及卸载Agent的具体操作。安装位置 根据待审计的数据库类型,您需要...

DataWorks On EMR使用说明

背景信息 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。阿里云...

产品优势

本文介绍 云原生数据库PolarDB 的产品优势,帮助您更好地了解 PolarDB。简单易用 PolarDB 兼容多款流行的关系型数据库引擎,完全兼容MySQL和PostgreSQL,高度兼容Oracle语法,代码/应用无需修改或只需少量修改。降低成本 计算节点和存储...

教程概述

本文档通过一个案例,演示了如何基于阿里云产品和服务实现设备数据在大屏展示。本案例的原理如下:在设备端模拟两个字段,通过MQTT协议向阿里云物联网平台设备(高级版)发送数据。物联网平台接收到数据后通过规则引擎转发至DataHub。在...

产品优势

本文介绍云原生关系型数据库 PolarDB PostgreSQL版(兼容Oracle)的产品优势,帮助您更好地了解 PolarDB PostgreSQL版(兼容Oracle)。简单易用 PolarDB PostgreSQL版(兼容Oracle)高度兼容Oracle语法,代码/应用无需修改或只需少量修改。...

什么是EMR on ACK

对于已经将大数据任务(例如,Spark和Presto等)执行在ACK集群上的用户,EMR on ACK提供了自动部署和管理集群的能力。EMR on ACK与EMR Shuffle Service相结合,可以显著提升Spark任务的性能。形态 描述 EMR on ECS EMR负责将开源Hadoop生态...

应用评估

应用评估用于衡量应用数据库整体迁移改造的情况,可以展示...不兼容:无法运行在目标数据上的SQL,需要根据改造建议,修改应用代码或者SQL。应用改造点:展示应用需要改造的地方,并给出改造建议。目前提供了改造点摘要信息和改造点详情。

应用场景

可以将访问频度非常高的数据存储在云数据库 Memcache 版中,底层数据存储在 RDS 中。大型促销类业务 大型促销秒杀系统,系统整体访问压力非常。一般的数据库根本无法承载这样的读取压力,可选用云数据库 Memcache 版存储。带有计数器的...

添加宜搭数据

在宜搭应用 应用设置 中 应用数据 页签获取应用编码,如下图所示。应用密钥(必填)宜搭应用平台中已创建表单的应用密钥。在宜搭应用 应用设置 中 应用数据 页签获取应用密钥,如下图所示。表单ID(非必填)宜搭应用平台中已创建...

技术发展趋势

企业机构正在云中部署新的应用程序,并以更快的速度迁移现有的数据资产。这一趋势将会持续。数据库管理系统的部署和创新越来越倾向于“云优先”或“纯云”。挑选DBMS 解决方案的数据和分析负责人慢慢接受这样一个事实,即云DBMS是未来的...

用户价值

数据资源平台为用户提供了一站式数据资产定义、生产、管理与服务平台,提供企业级数据资产构建能力和一致性使用体验,助力客户快速构建数据智能平台,实现数据资源统一管理,挖掘潜在规律,优化业务决策,让大数据真正的驱动客户业务。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据库备份 DBS 数据传输服务 数字证书管理服务(原SSL证书) 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用