数据分析概述

功能概述 SQL查询 SQL查询是使用标准的SQL语句,来查询和分析存储在MaxCompute中的大数据,详情请参见 SQL查询。您可以通过编写SQL语句,对有查询权限的数据源进行快速的数据查询与分析操作,详情请参见 功能概览。DataWorks SQL查询提供了...

配置数据网络

本文主要介绍Serverless Spark如何配置数据源网络来访问用户VPC网络中的数据。这些数据包括RDS系列、ADB系列、PolarDB系列、MongoDB、Elasticsearch、HBase、E-MapReduce、Kafka以及用户在ECS上自建的各种数据服务等。背景信息 Serverless ...

创建Impala数据

通过创建Impala数据源能够实现Dataphin读取Impala的业务数据或向Impala写入数据。本文为您介绍如何创建Impala数据源。背景信息 Impala是用于处理存储在Hadoop集群大量数据的SQL查询引擎。如果您使用的是Impala,在导出Dataphin数据至...

创建HBase数据

通过创建HBase数据源能够实现Dataphin读取HBase的业务数据或向HBase写入数据。本文为您介绍如何创建HBase数据源。背景信息 HBase是用于处理存储在Hadoop集群大量数据的SQL查询引擎。如果您使用的是HBase,在导出Dataphin数据至HBase,您...

区域热力层

无值:系统在获取区域热力边界数据时,如果缺少了某个区域的数据(当区域热力图数据中没有对应的地理边界数据中的adcode值时),这个区域的颜色就会展示为无值的颜色。面透明度:区域面的透明度。边线颜色:区域边界线的颜色,请参见 颜色...

大数据安全治理的难点

通常,大数据系统中的工作流涉及多部门、多责任人且跨系统的数据,如何才能协调好这些业务系统准时、保质保量地产出数据,避免出现因业务系统宕机/脏数据导致数据延时产出、产出脏数据,关乎到企业数据业务的连续性问题甚至高层的信任问题...

数据质量评估标准

准确性 准确性是指数据中记录的信息和数据是否准确、是否存在异常或者错误的信息。例如,成绩单中分数出现负数或订单中出现错误的买家信息等,这些都是准确性不好的数据。确保记录的准确性也是保证数据质量必不可少的一部分。一致性 一致性...

基本概念

数据资产:数据资源平台存在大量的数据表、标签、API等各类数据资产,数据管理者通过数据汇聚、数据治理、数据分析后,需要对整个平台数据进行统一管控,了解平台的核心数据资产,提供对应的数据资产管理规范。统一服务 应用:是调用API...

什么是DataWorks

从2009年起,DataWorks不断沉淀阿里巴巴数据建设方法论,支撑数据中台建设,同时与数万名政务、央国企、金融、零售、互联网、能源、制造、工业等行业的客户携手,不断提升数据应用效率,助力产业数字化升级。产品架构 DataWorks十多年...

数据授权

您授权允许 数据安全中心(DSC...部署在经典网络中的阿里云数据产品外网地址未放行流量的访问控制,导致网络不通。MaxCompute连接授权失败有哪些原因?MaxCompute项目名称输入错误。MaxCompute项目中添加 DSC 账号失败。相关文档 数据资产授权

创建全球数据库网络

全球数据库网络(Global Database Network,简称GDN)是由分布在同一个国家不同地域的多个 PolarDB 集群组成的网络,网络中所有集群的数据均保持同步。当您的业务部署在多个地域时,利用GDN可以实现应用访问数据库的低延迟和高稳定性。本文...

DataWorks数据服务对接DataV最佳实践

注意事项 DataWorks数据服务与DataV进行无缝对接后,无需使用DataV中的API数据源去填写一个URL调用API,直接新建一个DataWorks数据服务作为数据源,便可直接选用数据服务中的API。无需每个API都设置AppKey和AppSecret认证信息,且支持通过...

应用场景

访问频度极高业务 如社交网络、电子商务、游戏、广告等。可以将访问频度非常高的数据存储在云数据库 Memcache 版,底层数据存储在 RDS 。大型促销类业务 大型促销秒杀系统,系统整体访问压力非常。一般的数据库根本无法承载这样的...

路网轨迹层

最大值颜色:数据中value值最大的线的颜色,请参见 颜色选择器说明 进行修改。最小值颜色:数据中value值最小的线的颜色,请参见 颜色选择器说明 进行修改。点间距(km):轨迹层内轨迹点与点之间的距离,距离越轨迹线分段数越少,分段样式...

功能特性

无锁结构变更概览 开启无锁结构变更 通过无锁变更工单实现无锁结构变更 数据变更 普通数据变更 支持INSERT、UPDATE、DELETE、TRUNCATE、CREATE TABLE等SQL语句,可以对数据中的数据进行变更操作,用于数据初始化、历史数据清理、问题修复...

安装Agent

连通经典网络中的ECS和数据库审计系统VPC的具体操作,请参见 审计经典网络数据库实例。如果您要审计的数据库部署在线下IDC机房中,您需要先打通线下IDC机房和数据库审计系统所在VPC的网络连接。您可以通过阿里云高速通道服务打通线上线下的...

热力线层

最大值颜色:数据中value值最大的线的颜色,请参见 颜色选择器说明 进行修改。最大透明度:热力线的最大透明度,根据数据中每条线对应的value值来设置线透明度。数据源面板 每条线的value值可在 properties 字段中配置。说明 根据数据的...

表设计规范

单个分区中数据量较大的情况下,MaxCompute执行任务时会进行分片处理而不影响分区裁剪的优势。单个分区中文件数较多时,会影响MaxCompute Instance数量,造成资源浪费和SQL性能的下降。采用多级分区时,建议先按日期分区,然后按交易类型...

应用场景

互联网类应用 Cassandra能够支持并发低延时的访问需求,具备高...在一些需要应用大量数据对用户行为进行分析的场景,可以通过整合多种数据来源,存储用户行为数据,构建用户画像,实时存储在Cassandra,提供大数据风控、推荐等服务。

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

同步数据

分析型数据库MySQL版支持多种数据加载方式,包括但不限于:通过阿里云数据传输服务DTS将MySQL/DRDS中的数据导入分析型数据库MySQL版,其中MySQL可为RDS for MySQL、其他云厂商或线上IDC的自建MySQL以及ECS自建MySQL。详细操作步骤请参见 ...

区域下钻热力层(v2.x版本)

参数 说明 填充颜色 数据中最大、最小及为空的value值对应区域的颜色。边线样式 区域下钻热力层各区域边线的颜色、粗细和线类型。标注:设置区域下钻热力层的区域的标注显示字段、文本样式参数。单击 标注 左侧的 图标,可控制 标注 的显隐...

区域热力层(v2.x版本)

参数 说明 填充颜色 数据中最大、最小及为空的value值对应区域的颜色。边线样式 区域热力层各区域边线的颜色、粗细和线类型。标注:设置区域热力层的区域的标注显示字段、文本样式参数。单击 标注 左侧的 图标,可控制 标注 的显隐。参数 ...

自定义区域下钻层(v3.x版本)

参数 说明 填充颜色 数据中最大、最小及为空的value值对应区域的颜色。请参见 颜色映射器使用说明,配置不同区域的映射颜色样式。描边样式 自定义区域下钻层各区域边线的颜色、粗细和线的类型。说明 线型支持数字输入,如:4,4,第一个数字...

概述

DataWorks(数据工场,原大数据开发套件)是阿里云重要的PaaS(Platform-as-a-Service)平台产品,为您提供 数据集成、数据开发、数据地图、数据质量 和 数据服务 等全方位的产品服务,一站式开发管理的界面,帮助企业专注于数据价值的挖掘...

Catalog概述

基本概念 内部数据:保存在StarRocks中的数据。外部数据:保存在外部数据源(例如Apache Hive、Apache Iceberg和Apache Hudi)中的数据。Catalog StarRocks 2.3及以上版本支持Catalog功能,方便您轻松访问并查询存储在各类外部源的数据。...

相关的云服务

专有网络VPC 专有网络VPC可以为开源大数据平台E-MapReduce提供隔离、稳定、安全、快速交付、自主可控的网络环境。您可以自定义这个专有网络的拓扑和IP地址,适用于对网络安全性要求较高的用户。弹性公网IP 弹性公网IP位于阿里云的公网网关...

管理数据目录

在EMR Serverless Spark中,您可以通过该功能来查看绑定的数据目录中的数据库和表,还可以添加已有的数据目录。该功能适用于需要实现元数据隔离的场景。添加数据目录 进入数据目录页面。登录 E-MapReduce控制台。在左侧导航栏,选择 EMR ...

导入数据

本文为您介绍如何通过MaxCompute客户端,使用Tunnel Upload将本地数据文件中的数据导入创建好的表中。前提条件 请确认您已满足如下条件:已创建表。更多创建表操作,请参见 创建表。已将CSV或TXT数据文件下载至本地。本文提供的数据文件样...

ClickHouse数据

支持的字段类型 支持阿里云ClickHouse以下常见的数据类型,阿里云ClickHouse的数据类型全集请参见 数据类型,开源ClickHouse官方数据类型集合中的其他类型暂不支持,开源ClickHouse数据类型全集请参见 ClickHouse Doc。数据类型 ClickHouse...

审计经典网络数据库实例

如果需要审计经典网络数据库实例,您需要先通过ClassicLink功能实现经典网络的ECS与VPC中的数据库审计系统互通,并在经典网络的ECS上部署Agent程序。前提条件 VPC中启用ClassicLink时,需要满足限定条件,具体请参见ClassicLink概述的 使用...

配置VPC数据

本文介绍在DataV配置专有网络VPC(Virtual Private Cloud)内数据源的方法。通过专有网络VPC数据源的配置,您可以将专有网络VPC内的数据库接入到DataV,并作为组件的数据源进行大屏展示。背景信息 了解专有网络VPC,详情请参见 什么是...

数据源和项目协同

背景信息 项目管理员创建一个项目成员后,项目成员可以创建数据源,并在项目中添加数据中的数据库后,即可进行数据库变更任务。系统管理员在 Web 版 ODC 中创建项目,并为该项目指定成员。系统管理员或者拥有新建数据源角色权限的项目...

系统配置

您可在数据保护伞的系统配置页面,设置数据保护伞的识别内容、识别范围,水印文件保存时间,是否展示风险识别的数据安全等级,以及告警信息的接收邮件及WebHook地址,以便及时发现并处理潜在安全风险。进入系统配置页面 进入数据开发页面。...

什么是图数据库GDB?

例如,在一个典型的社交网络中,常常会存在“谁认识谁,上过什么学校,常住什么地方,喜欢什么餐馆”之类的查询,传统关系型数据库对于超过3张表关联的查询十分低效难以胜任,但图数据库可轻松应对社交网络的各种复杂存储和查询场景。...

查看数据迁移项目的详情

当源库不断有业务写入时,数据传输会在全量数据迁移启动前,启动增量拉取模块,以拉取源实例中的增量更新数据,对其进行解析、封装,并存储至数据传输中。当全量数据迁移完成后,数据传输会启动增量数据回放模块,从增量数据拉取模块中获取...

创建元数据

列字段配置 新建列字段 字段名称:配置为业务数据中实际的字段名称,且后续需要基于该字段创建服务单元。支持多层嵌套,使用点(.)分隔。字段类型:根据业务数据的字段类型选择对应的字段类型。支持选择的字段类型包括Double、Float、...

数仓规划概述

数据域 数据域是一个较高层次的数据归类标准,是对企业业务过程进行抽象、提炼、组合的集合,是企业业务人员在使用数据时第一个分组入口,可以帮助企业业务人员快速的从海量的数据中快速圈定到自己的业务数据。详情请参见 数据域。业务过程...

手动添加数据

您可以通过 数据库备份DBS 的手动添加数据源功能,将不同环境的数据库添加至 数据库备份DBS ,便于后续对数据源进行管理与备份。费用说明 添加数据源操作不会产生费用,只有在添加数据源后开启备份才会产生费用。如何开启备份,请参见 ...

查询诊断

您也可以根据需求选择按照占用内存、磁盘读取数据量、磁盘读取数据耗时、网络传输数据量、网络传输数据耗时对算子排序以及计算整体比例。算子统计信息介绍如下:名称 说明 算子名称 算子名称与编号,在计划树唯一。类型ID 算子类型编号。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 数据库备份 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用