数据安全治理的难点

流转 大数据系统通常是端到端的一整套数据开发和治理服务,不仅要采集数据、加工数据,更要将数据提供给业务使用。因此,其存在错综复杂的数据流转链路,包括但不限于即席查询链路、离线传输链路、实时传输链路、数据服务API链路、其他...

创建Impala数据

通过创建Impala数据源能够实现Dataphin读取Impala的业务数据或向Impala写入数据。本文为您介绍如何创建Impala数据源。背景信息 Impala是用于处理存储在Hadoop集群中大量数据的SQL查询引擎。如果您使用的是Impala,在导出Dataphin数据至...

新建补数据任务

对于经常补数据的节点,但补数据时间及补数据业务日期不确定的场景,您可以通过创建手动运行的补数据任务进行补数据。本文将为您介绍如何新建补数据任务。操作步骤 请参见 补数据任务页面入口,进入 补数据任务 页面。在 补数据任务 页面,...

创建MaxCompute数据

通过创建MaxCompute数据源能够实现Dataphin读取MaxCompute的业务数据或向MaxCompute写入数据。本文为您介绍如何创建MaxCompute数据源。背景信息 MaxCompute即阿里云大数据计算服务,适用于数据分析场景的企业级SaaS(Software as a Service...

确定需求

本教程中以A公司的电商业务为例,梳理出业务数据框架如下图所示。A公司的电商业务板块分为招商、供应链、营销和服务四个模块,每个板块的需求和数据应用都不同。您在构建数据仓库之前,首先需要明确构建数据仓库的业务板块和需要具体满足的...

新建补数据任务

对于经常补数据的节点,但补数据时间及补数据业务日期不确定的场景,您可以通过创建手动运行的补数据任务进行补数据。本文将为您介绍如何新建补数据任务。操作步骤 在Dataphin首页,单击顶部菜单栏的 研发。按照下图操作指引,进入 新建补...

创建Microsoft SQL Server数据

通过创建Microsoft SQL Server数据源能够实现Dataphin读取Microsoft SQL Server的业务数据或向Microsoft SQL Server写入数据。本文为您介绍如何创建Microsoft SQL Server数据源。使用限制 Dataphin仅支持 超级管理员、数据源管理员、板块...

确定需求

本教程中以A公司的电商业务为例,梳理出业务数据框架如下图所示。A公司的电商业务板块分为招商、供应链、营销和服务四个模块,每个板块的需求和数据应用都不同。您在构建数据仓库之前,首先需要明确构建数据仓库的业务板块和需要具体满足的...

创建MaxCompute数据

通过创建MaxCompute数据源能够实现Dataphin读取MaxCompute的业务数据或向MaxCompute写入数据。本文为您介绍如何创建MaxCompute数据源。背景信息 MaxCompute即阿里云大数据计算服务,适用于数据分析场景的企业级SaaS(Software as a Service...

资产安全概述

应用场景 基于Dataphin实现数据安全保护的一些典型的场景:场景1:业务数据中敏感数据保护 您可以使用资产安全的敏感数据识别和保护功能,脱敏明文敏感数据,保证业务数据安全。例如,姓名张三脱敏后*三。场景2:开发环境数仓建设 敏感数据...

资产安全概述

应用场景 基于Dataphin实现数据安全保护的一些典型的场景:场景1:业务数据中敏感数据保护 您可以使用资产安全的敏感数据识别和保护功能,脱敏明文敏感数据,保证业务数据安全。例如,姓名张三脱敏后*三。场景2:开发环境数仓建设 敏感数据...

常见问题

非插件报错原因及解决方案 如何处理编码格式设置/乱码问题导致的脏数据报错?任务存在SSRF攻击Task have SSRF attacks如何处理?离线同步任务执行偶尔成功偶尔失败。离线同步源表有加列(修改)如何处理?如何处理表列名有关键字导致同步...

无感数据集成(Zero-ETL)

方案概述 在大数据时代,企业面临着大量分散在不同的系统和平台上的业务数据,为了有效地管理和利用这些数据,企业往往需要依赖于ETL工具对数据进行集中式管理。ETL是将上层业务系统的数据经过提取(Extract)、转换清洗(Transform)、...

创建Impala数据

通过创建Impala数据源能够实现Dataphin读取Impala的业务数据或向Impala写入数据。本文为您介绍如何创建Impala数据源。背景信息 Impala是用于处理存储在Hadoop集群中大量数据的SQL查询引擎。如果您使用的是Impala,在导出Dataphin数据至...

无感集成(Zero-ETL)

方案概述 在大数据时代,企业面临着大量分散在不同的系统和平台上的业务数据,为了有效地管理和利用这些数据,企业往往需要依赖于ETL工具对数据进行集中式管理。ETL是将上层业务系统的数据经过提取(Extract)、转换清洗(Transform)、...

新零售:杭州数云信息技术有限公司

单机存储瓶颈,传统数据库单个实例只能存3T数据,单实例业务数据量大,维护成本高,代码配置复杂。高并发写诉求,对高并发状态下的写能力有较高要求。解决方案 PolarDB 在大促期间可以在20分钟内完成10TB级数据的集群升配,快速弹升IOPS的...

开通Dataphin

增值功能包 智能运维(选购)智能运维包含 基线监控 及 限流配置 功能,为业务数据产出时效性及系统稳定性提供保障,同时能降低人工运维成本,提升运维效率。系统默认赠送 3条基线+1条限流(免费),如果您希望开通更高规格,可选择:10条...

支持的云服务

数据集成 MaxCompute可以通过数据集成功能加载不同数据源(例如MySQL数据库)的数据,也可以通过数据集成把MaxCompute的数据导出到各种业务数据库。数据集成功能已集成在DataWorks上,您可以直接在DataWorks上配置MaxCompute数据源并读写...

数据库高级特性管理

如果用户的业务数据分布不均匀,或者执行了大量的删除或更新操作但更新量不足20%,或者出现其他SQL Server内置自动更新统计信息无法覆盖的场景时,您可以通过该功能来提升查询性能。说明 SQL Server默认会启用自动更新统计信息的机制,但在...

数据页面管理

在管理数据页面中,数据的类型分为 矢量、栅格、地理服务、三维模型、三维瓦片 和 业务数据 六种。本文介绍数据页面中各个数据功能的使用方法。数据页面分为两大模块,包括 我的数据分组 和 数据管理 页面。我的数据分组 在 我的数据分组 ...

数据页面管理

在管理数据页面中,数据的类型分为 矢量、栅格、地理服务、三维模型、三维瓦片 和 业务数据 六种。本文介绍数据页面中各个数据功能的使用方法。数据页面分为两大模块,包括 我的数据分组 和 数据管理 页面。我的数据分组 在 我的数据分组 ...

产品简介

数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

集群资源规格评估建议

Core节点组(Kafka Broker)资源评估 评估业务需求 您需要根据业务情况,评估以下参数:扇出因子:业务数据会被下游消费的次数,不包含Kafka本身副本复制产生的消费次数。数据峰值流入:业务数据的峰值流量,单位MB/s。数据平均流入:业务...

新建Doris数据

通过创建Doris数据源能够实现Dataphin读取Doris的业务数据或向Doris写入数据。本文为您介绍如何创建Doris数据源。背景信息 Doris即Apache Doris,是一个基于MPP架构的高性能、实时的分析型数据库,仅需亚秒级响应时间即可返回海量数据下的...

逻辑数仓

应用场景 不同用户角色使用逻辑数仓支持的应用场景:数据库及数仓开发人员:跨库查询与开发,业务数据逻辑归档、数据准备与供应、轻量数仓、数仓构建模拟、敏捷建仓、入仓等。运营分析及BI人员:数据准备与分析、跨库查询、查询与分析加速...

新建Doris数据

通过创建Doris数据源能够实现Dataphin读取Doris的业务数据或向Doris写入数据。本文为您介绍如何创建Doris数据源。背景信息 Doris即Apache Doris,是一个基于MPP架构的高性能、实时的分析型数据库,仅需亚秒级响应时间即可返回海量数据下的...

创建元数据

列字段配置 新建列字段 字段名称:配置为业务数据中实际的字段名称,且后续需要基于该字段创建服务单元。支持多层嵌套,使用点(.)分隔。字段类型:根据业务数据的字段类型选择对应的字段类型。支持选择的字段类型包括Double、Float、...

高压缩引擎(X-Engine)介绍

挑战和诉求:历史数据归档 历史数据归档的挑战 大部分业务数据的读写特征,都是最新产生的数据会被更频繁地读取或更新,而更久之前的数据(如1年前的聊天记录或订单信息)很少被访问。随着业务发展,数据库系统中会积累大量访问频率很低...

确定需求

建议您思考下列问题,对后续的数据建模将有巨大的帮助:业务数据是根据什么(维度、统计粒度,简称“粒度”,是维度或维度组合)汇总的,衡量标准是什么?例如,“省份”或者“类目”是维度,订单数是原子指标。基于上个问题,进一步思考...

数据质量管理流程

数据质量的管理流程包括业务数据资产定级、加工卡点、风险点监控和及时性监控,您可以构建属于自己的数据质量保障体系。数据质量管理的流程图如下。数据质量管理的流程说明如下:分析业务场景,对数据流转链路上的整个依赖关系,进行资产...

数据质量管理流程

数据质量的管理流程包括业务数据资产定级、加工卡点、风险点监控和及时性监控,您可以构建属于自己的数据质量保障体系。数据质量管理的流程图如下。数据质量管理的流程说明如下:分析业务场景,对数据流转链路上的整个依赖关系,进行资产...

创建Teradata数据

通过创建Teradata数据源能够实现Dataphin读取Teradata的业务数据或向Teradata写入数据。本文为您介绍如何创建Teradata数据源。背景信息 Teradata是一款大型数据仓库系统。如果您使用的是Teradata,在对接Dataphin进行数据开发或导出...

创建DataHub数据

通过创建DataHub数据源能够实现Dataphin读取DataHub的业务数据或向DataHub写入数据。本文为您介绍如何创建DataHub数据源。背景信息 DataHub即阿里云流式数据服务DataHub,如果您使用的是阿里云流式数据服务DataHub,在对接Dataphin进行数据...

创建SAP HANA数据

通过创建SAP HANA数据源能够实现Dataphin读取SAP HANA的业务数据或向SAP HANA写入数据。本文为您介绍如何创建SAP HANA数据源。背景信息 SAP HANA是一款具有高性能内存的应用平台。如果您使用的是SAP HANA,在对接Dataphin进行数据开发或将...

创建MySQL数据

通过创建MySQL数据源能够实现Dataphin读取MySQL的业务数据或向MySQL写入数据。本文为您介绍如何创建MySQL数据源。背景信息 MySQL是一种关系型数据库。常用于网站、应用程序和商业产品,是一种常见的主要关系数据存储系统。更多详情请参见 ...

创建Teradata数据

通过创建Teradata数据源能够实现Dataphin读取Teradata的业务数据或向Teradata写入数据。本文为您介绍如何创建Teradata数据源。背景信息 Teradata是一款大型数据仓库系统。如果您使用的是Teradata,在对接Dataphin进行数据开发或导出...

创建HDFS数据

如果您使用的是HDFS,在引入HDFS的业务数据至Dataphin中或将Dataphin数据导出至HDFS的场景中,您需要先完成HDFS数据源的创建。更多HDFS信息,请参见 HDFS官方介绍。使用限制 Dataphin仅支持超级管理员、数据源管理员、板块架构师、项目管理...

创建MongoDB数据

背景信息 如果您使用的是MongoDB,在引入MongoDB的业务数据至Dataphin中或将Dataphin数据导出至MongoDB的场景中,您需要先完成MongoDB数据源的创建。更多阿里云MongoDB信息,请参见 云数据库MongoDB-什么是云数据库MongoDB版。使用限制 ...

创建ClickHouse数据

背景信息 如果您使用的是数据库ClickHouse,引入ClickHouse的业务数据至Dataphin中或将Dataphin数据导出至ClickHouse的场景中,您需要先完成ClickHouse数据源的创建。阿里云数据库ClickHouse的更多信息,请参见 云数据库 ClickHouse-什么是...

创建MySQL数据

通过创建MySQL数据源能够实现Dataphin读取MySQL的业务数据或向MySQL写入数据。本文为您介绍如何创建MySQL数据源。背景信息 MySQL是一种关系型数据库。常用于网站、应用程序和商业产品,是一种常见的主要关系数据存储系统。更多详情请参见 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 DataV数据可视化 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用