创建OSS数据

通过创建OSS数据源能够实现Dataphin读取OSS的业务数据或向OSS写入数据。本文为您介绍如何创建OSS数据源。背景信息 OSS即阿里云对象存储OSS。如果您使用的是阿里云对象存储OSS,在对接Dataphin进行数据开发或将Dataphin的数据写入至OSS时,...

轮播页面

数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

购买流程

数据传输服务DTS(Data Transmission Service)支持先配置再购买和先购买再配置两种创建任务方式。若您需要随用随配,建议您选择先配置再购买的方式;若您需要先锁定财务预算而不需要配置任务,建议您选择先购买再配置的方式。本文介绍数据...

基本概念

DTS 数据传输服务(Data Transmission Service,简称DTS)支持关系型数据库(RDBMS)、非关系型数据库(NoSQL)、数据多维分析(OLAP)等数据源间的数据交互,集数据同步、迁移、订阅、集成、加工于一体,帮助您构建安全、可扩展、高可用的...

常见问题

3.高质量的数据模型优化效果最好,那高质量的数据是什么样的,有没有模板?高质量数据首先是要准确率高,训练数据的问题要是清晰的,答案是能准确回答问题的。其次是要有多样性,不能所有的数据都是关于一类问题或者都是一些简单的问题。...

创建Log Service数据

说明 通常情况下,生产数据源和开发数据源需配置非同一个数据源,以使开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 LogHub Endpoint Log Service的...

迁移 PolarDB-X 2.0 数据库的数据至 OceanBase 数据库...

本文为您介绍如何使用数据传输迁移 PolarDB-X 2.0 数据库的数据至 OceanBase 数据库 MySQL 租户。重要 如果数据迁移项目长期处于非活跃状态(项目状态为 失败、已暂停 或 已完成),受增量日志保留时长等影响,项目可能无法恢复。数据传输...

创建Log Service数据

说明 通常情况下,生产数据源和开发数据源需配置非同一个数据源,以使开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 LogHub Endpoint Log Service的...

技术发展趋势

这表明注重数据价值的时代已经来临,并逐渐取代了从模拟数据数字化转变的时期;产生、使用和管理对生活产生重要影响的数据信息,对于消费者、政府和企业的正常生活和运转必不可少。消费者和企业将持续在不同设备和云之间产生、分享和访问...

什么是Databricks数据洞察

Databricks数据洞察(简称DDI)是基于Apache Spark的全托管大数据分析平台。产品内核引擎使用Databricks Runtime,并针对阿里云平台进行了优化。DDI为您提供了高效稳定的阿里云Spark服务,您无需关心集群服务,只需专注在Spark作业的开发上...

Presto FAQ

什么同一个SQL从HDFS同步数据到OSS,在DLA中查询是11万数据量,自建的集群查询是19万数据量?性能相关问题 如何解决查询报错:“Query exceeded distributed user memory limit of 2.00TB or Query exceeded per-node user memory limit ...

确定需求

建议您思考下列问题,对后续的数据建模将有巨大的帮助:业务数据是根据什么(维度、粒度)汇总的,衡量标准是什么?例如,成交量是维度,订单数是成交量的度量。明细数据层和汇总数据层应该如何设计?公共维度层该如何设计?是否有公共的...

确定需求

建议您思考下列问题,对后续的数据建模将有巨大的帮助:业务数据是根据什么(维度、粒度)汇总的,衡量标准是什么?例如,成交量是维度,订单数是成交量的度量。明细数据层和汇总数据层应该如何设计?公共维度层该如何设计?是否有公共的...

整体架构

云原生数据仓库AnalyticDB MySQL版 是阿里巴巴自主研发、经过超大规模以及核心业务验证的PB级实时数据仓库。概述 自2012年第一次在集团发布上线以来,AnalyticDB MySQL版 至今已累计迭代发布近百个版本,支撑起集团内的电商、广告、物流、...

数据库管理常见问题

删除数据库的操作是在后台异步执行的,如果数据库较,删除可能需要一定的时间。如果经过较长时间仍未删除成功,可能是因为存在MDL锁导致删除操作被阻塞或删除失败,排查方法请参考 查看DDL执行状态和MDL锁状态。集群存在某个数据库,为...

索引优化

大数据集场景下优先考虑稀疏索引:如果您的数据量非常地大,并且您的查询限定条件为<、、=、>=、>,需要从大数据量的表中取出少于50%的数据,那么使用稀疏索引(BRIN Index或者AOCS表的metascan)可以极地减少无效数据的加载。...

新建Amazon S3数据

通过创建Amazon S3数据源能够实现Dataphin读取Amazon S3的业务数据或向Amazon S3写入数据。本文为您介绍如何创建Amazon S3数据源。背景信息 Amazon S3(Simple Storage Service)是亚马逊公司提供的一种云存储服务。它允许个人、组织和企业...

新建Amazon S3数据

通过创建Amazon S3数据源能够实现Dataphin读取Amazon S3的业务数据或向Amazon S3写入数据。本文为您介绍如何创建Amazon S3数据源。背景信息 Amazon S3(Simple Storage Service)是亚马逊公司提供的一种云存储服务。它允许个人、组织和企业...

数据集成概述

离线(批量)的数据通道通过定义数据来源和去向的数据源和数据集,提供一套抽象化的数据抽取插件(Reader)、数据写入插件(Writer),并基于此框架设计一套简化版的中间数据传输格式,从而实现任意结构化、半结构化数据源之间数据传输。...

创建PolarDB-X数据

通过创建PolarDB-X数据源能够实现Dataphin读取PolarDB-X的业务数据或向PolarDB-X写入数据。本文为您介绍如何创建PolarDB-X数据源。背景信息 PolarDB-X(原DRDS升级版)是由阿里巴巴自主研发的云原生分布式数据库。如果您使用的是PolarDB-X...

创建PolarDB-X数据

通过创建PolarDB-X数据源能够实现Dataphin读取PolarDB-X的业务数据或向PolarDB-X写入数据。本文为您介绍如何创建PolarDB-X数据源。背景信息 PolarDB-X(原DRDS升级版)是由阿里巴巴自主研发的云原生分布式数据库。如果您使用的是PolarDB-X...

创建 MySQL 数据库

我们将在 tutorial_mysql 租户下,创建名为 tutorial_database 的数据库。云数据库 OceanBase 的 MySQL 模式兼容 MySQL 5.7/8.0 的绝部分功能和语法,更多内容参见 与 MySQL 兼容性对比。操作步骤 单击左侧导航栏 租户管理,进入租户列表...

基于MaxCompute进行大数据BI分析

本实践以电商行业为例,通过MaxCompute、DataWorks对业务数据和日志数据进行ETL处理,并同步至分析型数据库MySQL(AnalyticDB MySQL)进行实时分析,再通过Quick BI进行可视化展示。背景信息 MaxCompute:用于进行规模数据计算,详情请...

常见问题

推荐您阅读 从开源到云原生,不得不知的大数据实战。MaxCompute作为大数据平台,对业务数据是否有好的监控手段?MaxCompute仅支持通过DataWorks的数据质量功能 配置数据监控规则。无法监控外部数据源的字段变化。MaxCompute的项目发挥...

元数据抽取

在业务运行中,经常会沉淀到大量数据数据湖中这部分数据可能是没有像数据仓库一样经过严格的数据管理流程或沉淀规范明确的元数据信息。元数据抽取可以分析数据湖中特定格式的数据,并自动生成元数据信息,通过周期性或手动执行,实现数据...

Db2 for LUW迁移至RDS MySQL

如为增量迁移任务,DTS要求源数据库的数据日志保存24小时以上,如为全量迁移和增量迁移任务,DTS要求源数据库的数据日志至少保留7天以上(您可在全量迁移完成后将数据日志保存时间设置为24小时以上),否则DTS可能因无法获取数据日志而导致...

应用场景

可以将访问频度非常高的数据存储在云数据库 Memcache 版中,底层数据存储在 RDS 中。大型促销类业务 大型促销秒杀系统,系统整体访问压力非常。一般的数据库根本无法承载这样的读取压力,可选用云数据库 Memcache 版存储。带有计数器的...

SQL Console初体验

当您成功在DMS上登录数据库后,可在SQL Console中进行创建数据库、创建表、查询表数据、变更表数据等操作。本文以在RDS MySQL数据库中进行操作举例。创建数据库 在RDS控制台创建数据库 访问 RDS实例列表,在上方选择地域,然后单击目标实例...

Oracle数据

Oracle数据源为您提供读取和写入Oracle双向通道的功能,方便您后续可以通过向导模式和脚本模式配置数据同步任务。本文为您介绍DataWorks的Oracle数据同步能力支持情况。支持的版本 离线读写 版本 离线读(Oracle Reader)离线写(Oracle ...

大数据安全治理的难点

如此多类型的用户,授权、管理难度加大,什么样的人员需要授予什么样的权限?如果他们离职、换部门了怎么办?这其中很有可能出现 权限蠕变、过度授权、离职撤权不彻底 的情况,这些都为数据安全事件埋下了隐患。入口 由于大数据系统要服务...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

其他问题

任务与实例 周期任务与周期实例、补数据实例、测试实例是什么关系?资源组 日志和实例保留多长时间?为什么不能在调度资源组上进行大数据计算?其他 如何设置任务优先级?如何查看任务优先级?周期任务与周期实例、补数据实例、测试实例...

创建MongoDB数据

通过创建MongoDB数据源能够实现Dataphin读取MongoDB的业务数据或向MongoDB写入数据。本文为您介绍如何创建MongoDB数据源。背景信息 如果您使用的是MongoDB,在引入MongoDB的业务数据至Dataphin中或将Dataphin数据导出至MongoDB的场景中,您...

创建MongoDB数据

通过创建MongoDB数据源能够实现Dataphin读取MongoDB的业务数据或向MongoDB写入数据。本文为您介绍如何创建MongoDB数据源。背景信息 如果您使用的是MongoDB,在引入MongoDB的业务数据至Dataphin中或将Dataphin数据导出至MongoDB的场景中,您...

Memcache(OCS)数据

Memcache(原名OCS)数据源为您提供其它数据源向Memcache写入数据的功能,目前仅支持脚本模式配置同步任务,本文为您介绍DataWorks的Memcache(OCS)数据同步的能力支持情况。使用限制 当前仅支持使用脚本模式将数据写入Memcache(OCS)。...

离线同步并发和限流之间的关系

在一些数据同步场景,脏数据的出现会导致任务同步效率下降,以关系数据库写出为例,默认是执行batch批量写出模式,在遇到脏数据时会退化为单条写出模式(以找出batch批次数据具体哪一条是脏数据,保障正常数据正常写出),但单条写出效率会...

什么是SSL证书

更多信息,请参见 SSL证书支持的加密算法 和 什么是公钥和私钥?HTTP协议无法加密数据数据传输可能产生泄露、篡改或钓鱼攻击等问题,SSL证书部署到Web服务器后,可帮助您的Web服务器和网站间建立可信的HTTPS协议加密链接,为您的网站安全...

检查索引使用

使用测试数据来建立索引将会告诉测试数据需要什么样的索引,但这并不代表真实数据的需要。使用非常小的测试数据集是特别致命的。在从 100000 行中选出 1000 行时可能会用到索引,但是从 100 行里选出 1 行是很难用到索引的,因为 100 行...

创建数据库和账号

授权数据库的步骤如下:在 未授权数据库 栏中,选中要授权的数据库。单击,将数据库添加到 已授权数据库 栏中。为该账号设置数据库权限,可设置为 读写(DML)、只读 或 所有者。说明 拥有 所有者 权限的账号才可以在对应数据库内进行创建...

OSS/OSS-HDFS概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括 JindoFS 存储系统(原JindoFS Block模式)...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 DBS 数据传输服务 云数据库 Redis 版 云数据库 RDS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用