大数据企业需求-大数据企业需求文档介绍内容-阿里云

创建GreenPlum数据源

通过创建GreenPlum数据源能够实现Dataphin读取GreenPlum的业务数据或向GreenPlum写入数据。本文为您介绍如何创建GreenPlum数据源。背景信息 Greenplum是一款大数据分析引擎，作用于分析、机器学习和AI等领域。其架构主要针对管理大规模分析...

客户案例

数据体系整体上云，使用少量组件即可实现流批一体、湖仓一体，完成从数据驱动到数智驱动，极大发挥数据价值。视频介绍社交媒体行业：欢聚时代大规模数据湖建设客户简介欢聚时代成立于2005年，是全球领先的社交媒体企业，旗下运营多款...

云数据库ClickHouse企业版兼容性指导

企业版架构云数据库 ClickHouse 企业版极大地简化了运营开销，并降低了大规模运行ClickHouse的成本。您不需要提前部署集群规格、设置高可用性的副本以及手动数据分片，当工作负载增加时扩展服务器或者工作负载降低时缩减服务器，这些都是...

快速体验

数据采集数据加工配置数据质量监控数据可视化展现目标人群开发工程师、数据分析师、产品运营等存在数仓数据获取与数据分析洞察人员。涉及产品本案例涉及以下产品：一站式大数据开发治理DataWorks 本案例通过DataWorks实现数据采集、...

发现并处理Redis的大Key和热Key

大Key和热Key产生的原因未正确使用Redis、业务规划不足、无效数据的堆积、访问量突增等都会产生大Key与热Key，如：大key 在不适用的场景下使用Redis，易造成Key的value过大，如使用String类型的Key存放大体积二进制文件型数据；...

Delta Lake概述

Delta Lake以数据为中心，围绕数据流走向（数据从流入数据湖、数据组织管理和数据查询到流出数据湖）推出了一系列功能特性，协助您搭配第三方上下游工具，搭建快捷、易用和安全的数据湖。背景信息通常的数据湖方案是选取大数据存储引擎...

明确统计指标

需求调研输出的文档中，含有原子指标与派生指标，此时我们需要在设计汇总层表模型前完成指标的设计。指标定义注意事项原子指标是明确的统计口径、计算逻辑：原子指标=业务过程+度量。派生指标即常见的统计指标：派生指标=时间周期+修饰词+...

明确统计指标

需求调研输出的文档中，含有原子指标与派生指标，此时我们需要在设计汇总层表模型前完成指标的设计。指标定义注意事项原子指标是明确的统计口径、计算逻辑：原子指标=业务过程+度量。派生指标即常见的统计指标：派生指标=时间周期+修饰词+...

功能概览

迁移不同企业版的SQL洞察和审计数据企业版 V2相对于企业版 V1，变更了底层存储架构，通过冷热混合存储实现降本增效，使用成本低。而企业版 V3，在冷热混合存储的基础上，按使用的功能细分计费项，计费更加灵活，使用成本更低。当您的数据...

MaxCompute数据源

MaxCompute数据源作为数据中枢，为您提供读取和写入数据至MaxCompute的双向通道。使用限制说明 DataWorks的MaxCompute数据源可使用 Tunnel Endpoint 地址访问相应MaxCompute项目的Tunnel服务，从而通过上传、下载等方式同步该项目的数据。...

数据分析整体趋势

综上所述，数据分析技术趋势主要包括：云原生分布式：无论是OLTP还是OLAP，如今单机数据已无法满足企业业务和数据快速增长的需求，分布式数据库成为主流，同时数据库市场未来主要在云上（"Gartner:The Future of the DBMS Market Is Cloud...

准备工作

开通企业数据智能平台 企业数据智能平台默认为关闭状态，使用前需要前往 AnalyticDB PostgreSQL版控制台开通。登录云原生数据仓库AnalyticDB PostgreSQL版控制台。在控制台左上角，选择实例所在地域。单击左侧导航栏中的数据平台。单击 ...

Tair扩展数据结构概览

云数据库 Redis 版与开源Redis相同，支持String、List、Hash、Set、Sorted Set、Stream等数据类型，能够满足大部分场景下的开发需求，但无法直接满足一些复杂场景的业务需求，需要通过开发大量代码、使用Lua脚本等复杂的方式实现。...

概览信息

在数据资产概览页面，根据数据需求查看或搜索相关资产。全局搜索：在搜索文本框，输入功能关键字，并单击目标功能的名称，可快速跳转至对应页面。资产搜索：选择需要搜索的资产，例如数据表，在资产搜索文本框中输入数据表的资产名称，...

查看敏感数据识别结果

仅支持在结构化数据、半结构化数据、非结构化数据或 大数据 分类下分别选择一个或多个数据类型，不支持跨分类同时选择多个数据类型。如果您未选中任意数据类型，数据安全中心默认展示所有数据类型下的敏感数据识别结果。数据模板：在 ...

新建TDengine数据源

在新建数据源对话框的 大数据存储区域，选择 TDengine。如果您最近使用过TDengine，也可以在最近使用区域选择TDengine。同时，您也可以在搜索框中，输入TDengine的关键词，快速搜索。在新建TDengine数据源对话框中，配置数据源的...

到期提醒与停机策略

本文将为您介绍企业数据智能平台的到期提醒与停机策略。到期提醒 企业数据智能平台实例到期前的168小时（7天）、72小时、24小时，系统将会给您发短信，提醒您所购买的实例即将到期。请您及时备份数据或续费，避免影响正常使用。停机策略 ...

外部表概述

但这两种方法都有不足之处：第一种方法需要在MaxCompute系统外部做一次中转，如果OSS数据量太大，还需要考虑如何并发来加速，无法充分利用MaxCompute的大规模计算能力。第二种方法通常需要申请UDF网络访问权限，还需要开发者自己控制作业...

新建Doris数据源

数据源配置基于业务数据源是否区分生产数据源和开发数据源：如果业务数据源区分生产数据源和开发数据源，则选择生产+开发数据源。如果业务数据源不区分生产数据源和开发数据源，则选择生产数据源。标签您可根据标签给数据源进行分类...

数据集成

数据源支持情况数据集成目前支持40种以上的数据源类型（包括关系型数据库、非结构化存储、大数据存储、消息队列等），通过定义来源与去向数据源，并使用数据集成提供的数据抽取插件（Reader）、数据写入插件（Writer），实现任意结构化、...

登录企业数据智能平台

本文介绍如何登录企业数据智能平台。前提条件已开通企业数据智能平台，具体操作，请参见准备工作。操作步骤登录云原生数据仓库AnalyticDB PostgreSQL版控制台。单击左侧导航栏中的数据平台。在基本信息区域，单击默认登录链接右侧...

RAM角色授权

如果您第一次进入CDP 管控台，首先进行RAM角色授权：说明使用CDP企业数据云产品之前需要主账号或权限管理员创建如下服务关联角色角色名称：AliyunServiceRoleForCDP 角色权限策略：AliyunServiceRolePolicyForCDP Cloudera企业数据云平台...

数据重排

在MaxCompute的使用过程中，如果已经积累了大量数据占用了大量存储资源，且已经通过削减数据存储生命周期和删除非必要数据等方式进行了治理，在您的存储预算有限，计算资源还有冗余的情况下，可以考虑使用数据重排方式对存储空间进行优化。...

Iceberg概述

您可以借助Iceberg快速地在HDFS或者阿里云OSS上构建自己的数据湖存储服务，并借助开源大数据生态的Spark、Flink、Hive和Presto等计算引擎来实现数据湖的分析。核心能力 Apache Iceberg设计初衷是为了解决Hive数仓上云的问题，经过多年迭代...

使用MaxCompute控制台（离线）

查看上传记录提交上传后，若数据量较大，需要耗费一些时间，您无需在提交页面一直等待，可后续通过单击数据上传页面右上角的查看上传记录查看通过该功能上传数据的详情记录。说明通过该页面的查看上传记录查询到的记录详情也包含...

存储类型

本地HDD盘 10ms~300ms 互联网行业、金融行业等有大数据计算与存储分析需求的行业，进行海量数据存储和离线计算的业务场景。宽表引擎、时序引擎、搜索引擎、文件引擎说明购买实例时，如果存储类型选择本地HDD盘，仅支持选择本盘节点...

服务关联角色

本文介绍Cloudera企业数据云平台服务关联角色AliyunServiceRoleForCDP以及如何删除该角色。背景信息 Cloudera企业数据云平台服务关联角色AliyunServiceRoleForCDP是Cloudera企业数据云平台在某些情况下，为了完成自身的某个功能，需要获取...

PolarDB PostgreSQL版（兼容Oracle）间的迁移

背景信息 PolarDB PostgreSQL版（兼容Oracle）作为一款企业级关系型数据库管理系统，具有广泛的应用和强大的社区支持。每个新版本的发布都带来了许多改进和新特性，以提高性能、可用性和安全性。目前，升级到 PolarDB PostgreSQL版（兼容...

数据安全

Lindorm 宽表引擎支持数据备份恢复功能，该功能基于数据生态服务中的数据迁移，将数据存储至阿里云对象存储服务OSS（Object Storage Service，简称OSS）中，定期全量备份数据，实时增量同步数据，来满足对数据备份和数据恢复的需求，可以...

IO加速

本文档将详细介绍该技术的优势、适用场景和工作原理，帮助您在面临大规模或频繁数据读写需求时显著提升数据库性能。背景 RDS PostgreSQL在数据处理过程中，数据会从磁盘读取到内存，在内存中处理完成后，数据再从内存写入到磁盘中。与内存...

数据仓库研发规范概述

在大数据时代，规范地进行数据资产管理已成为推动互联网、大数据、人工智能和实体经济深度融合的必要条件。贴近业务属性、兼顾研发各阶段要点的研发规范，可以切实提高研发效率，保障数据研发工作有条不紊地运作。而不完善的研发流程，会...

权限列表

支持查看 企业数据智能平台各组件的功能权限和数据权限。本文介绍如何查看各组件的权限内容。前提条件使用权限账号登录 企业数据智能平台。查看权限列表登录企业数据智能平台。在页面右上角，单击图标，选择系统设置。在页面左侧导航...

数据可视化概览

仪表盘和大屏是图表的组合布局，支持快速分析和自由可视化这两类主流场景，以满足大部分的数据可视化需求。场景支持安全自助式数据分析基于DMS安全管控底座，确保可视化所用的数据均经过授权访问。一次配置即可实现可视组件高级过滤、...

产品系列概述

大中型企业的生产数据库。互联网、物联网、零售电商、物流、游戏等行业的数据库。集群系列一主多备的高可用架构，支持自动故障切换。备节点可访问，提升读能力。可增加更多备节点进一步扩展读能力。大中型企业的生产数据库。互联网新零售...

数据查询

您可以查看云计算资源中物理表基本情况的概览能力，帮助您直观了解物理表基础信息、字段内容分布等情况，建立对数据表的宏观理解，为建立数据标准、定义数据模型、定义数据加工逻辑等工作提供基础依据。前提条件已根据快速入门教程完成...

终止补数据计划

操作步骤登录企业数据智能平台。在页面左上角，单击图标，选择协同。在顶部菜单栏，单击图标，选择目标工作组，单击运维监控。在左侧导航栏，单击图标，选择补数据计划。在补数据计划列表中，单击补数据名称左侧的图标展开计划，...

概述

数据是企业的核心资产。随着业务发展，企业数据呈现出规模化、爆炸式的增长，业务应用要求实时、在线的快速处理。对于数据库运维人员来说，保护企业核心数据的任务越来越具有挑战性，例如数据误删除、相关系统漏洞和勒索病毒、硬件故障，...

低成本RDS历史库

大数据生态无缝对接Spark、Hive、Flink、Presto等开源大数据生态产品，支持API访问和文件读取等多种对接方式，简单高效满足用户海量数据分析需求。典型应用用户交易记录通过App写入MySQL，LTS将MySQL中实时同步到Lindorm，近三个月状态...

应用场景：低成本历史库

大数据生态无缝对接Spark、Hive、Flink、Presto等开源大数据生态产品，支持API访问和文件读取等多种对接方式，简单高效满足用户海量数据分析需求。典型应用用户交易记录通过APP写入MySQL，LTS将MySQL中实时同步到Lindorm，近三个月状态...

导出数据字典

操作步骤登录企业数据智能平台。在页面左上角，单击图标，选择协同。在顶部菜单栏，单击图标，选择目标工作组，单击资产加工。说明若您已在资产加工页面，请跳过“单击资产加工”的操作。在左侧导航栏，单击图标，选择字段标准...

大数据 企业 需求

新品推荐

大数据企业需求