数据分析整体趋势

这些云原生数据仓库技术分别起源于数据和大数据,提供标准SQL接口和ACID保证,底层存储通过Share Everything或Share Nothing实现资源池化和横向扩展能力。资源隔离,数据共享是目前业务应用对云原生数据仓库的普遍需求。综上所述,数据...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、...,帮助用户构建持续优化的大数据体系架构...

操作指南

一、大数据专家服务流程指南 二、服务流程说明 用户可以根据自己实际需要,提前或者在问题发生时购买大数据专家服务,服务项包含大数据技术架构方案咨询、大数据解决方案POC、大数据搬站迁云方案咨询、跨地域迁移支持服务、大数据专家高阶...

产品优势

支持防护常见的结构化数据、非结构化数据和大数据产品,例如对象存储OSS、云数据库RDS、MaxCompute等。智能化 运用大数据和机器学习能力,通过智能化的算法,对敏感数据和高风险活动,例如数据异常访问和潜在的泄露风险进行有效识别和监控...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache HadoopApache Spark,让您可以方便地使用HadoopSpark生态系统中的其他周边系统分析处理数据。EMR还可以与阿里云...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache HadoopApache Spark,让您可以方便地使用HadoopSpark生态系统中的其他周边系统分析处理...

常见问题

数据湖后端存储使用OSS,用户使用数据湖构建面向大数据分析机器学习场景可以获得集中式权限管理统一的元数据视图,更容易对接云上大数据和分析产品。什么情况下我需要使用数据湖构建?在云上有数据分析机器学习需求,希望构建云上的...

OSS数据安全防护最佳实践

智能化:运用大数据和机器学习能力,通过智能化的算法,对敏感数据和高风险活动,诸如数据异常访问潜在的泄漏风险进行有效识别监控,并提供修复建议。提供定制化的敏感数据识别能力,便于客户自定义识别标准,实现精准识别高效防护。...

安全白皮书概述

Dataphin面向各行各业大数据建设、管理及应用诉求,一站式提供从数据接入到数据消费全链路的智能数据建设与资产治理的大数据能力,包括产品、技术和方法论等,可帮助企业一站式构建生产经济、质量可靠、安全稳定、消费便捷的企业级数据资产...

IO加速

本文档将详细介绍该技术的优势、适用场景工作原理,帮助您在面临规模或频繁数据读写需求时显著提升数据库性能。背景 RDS PostgreSQL在数据处理过程中,数据会从磁盘读取到内存,在内存中处理完成后,数据再从内存写入到磁盘中。与内存...

常见问题

1.售前咨询渠道 尊敬的“准”大数据专家服务用户您好:如果您准备购买阿里云大数据专家服务,但是遇到如服务范围、规格、服务选择等售前方面的问题,您可以通过钉钉与我们联系,您将“当面”获得阿里云大数据专家咨询专家的建议。...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

PGVector

背景信息 随着数据科学机器学习等技术的迅速发展,向量计算已经成为了大数据领域中最常见的计算任务之一。PolarDB PostgreSQL版 作为一种广泛使用的关系型数据库,结合PGVector插件后通过自定义的数据类型存储方法,使得高维向量计算变...

PGVector

背景信息 随着数据科学机器学习等技术的迅速发展,向量计算已经成为了大数据领域中最常见的计算任务之一。PolarDB PostgreSQL版(兼容Oracle)作为一种广泛使用的关系型数据库,结合PGVector插件后通过自定义的数据类型存储方法,使得...

PGVector

背景信息 随着数据科学机器学习等技术的迅速发展,向量计算已经成为了大数据领域中最常见的计算任务之一。PolarDB PostgreSQL版(兼容Oracle)作为一种广泛使用的关系型数据库,结合PGVector插件后通过自定义的数据类型存储方法,使得...

数据标准

数据是由特定的环境产生的,这些环境因素包括生产者、时间、系统等,从而造成了同一个语义的数据,有...说明 目前使用DDM进行数据建模可以进行逻辑建模物理建模,但物理建模仅支持MaxComputeHive两种大数据引擎,不支持自定义数据源类型。

JindoFS介绍使用

JindoFS提供兼容对象存储的纯客户端模式(SDK)缓存模式(Cache),以支持与优化HadoopSpark生态大数据计算对OSS的访问;提供块存储模式(Block),以充分利用OSS的海量存储能力优化文件系统元数据的操作。JindoFS纯客户端模式(SDK...

轮播页面

数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选一些简单的计算功能。单击 添加过滤器...

列存索引如何实现高效数据过滤

基本原理与方法 分区信息剪枝 IMCI的分区剪枝技术是指在查询时根据分区键的条件来过滤不需要查询的分区,从而减少查询的数据提高查询效率的技术。IMCI支持的分区类型包括RANGE、LIST、HASH三种。其中,RANGELIST分区会把数据表分成...

通用云盘IO加速功能

本文介绍IO加速功能的技术原理、使用方法性能测试详情等信息。背景 将数据从磁盘读取到内存,或将内存数据写入磁盘是数据库系统常见的IO操作。相比内存操作,磁盘IO操作运行速度相对较慢,需消耗较多的时间。当出现规模数据读写或频繁...

通用云盘IO加速功能

本文介绍IO加速功能的技术原理、使用方法性能测试详情等信息。背景 将数据从磁盘读取到内存,或将内存数据写入磁盘是数据库系统常见的IO操作。相比内存操作,磁盘IO操作运行速度相对较慢,需消耗较多的时间。当出现规模数据读写或频繁...

通用云盘IO加速功能

本文介绍IO加速功能的技术原理、使用方法性能测试详情等信息。背景 将数据从磁盘读取到内存,或将内存数据写入磁盘是数据库系统常见的IO操作。相比内存操作,磁盘IO操作运行速度相对较慢,需消耗较多的时间。当出现规模数据读写或频繁...

存储空间分析

您可以在 AnalyticDB for MySQL 空间总览页面查看集群表的总数据量、冷数据量、热数据量、索引数据量、分区数量、节点的磁盘使用率等指标。查看集群级别的数据量 通过 空间总览 可以查看当前集群的 总数据量、热数据量、冷数据量、以及 ...

列存索引技术架构介绍

简介 PolarDB In-Memory Column Index功能提供了列式存储以及内存计算能力,让用户可以在一套数据库上同时运行TPAP型混合负载,在保证现有 PolarDB 优异的OLTP性能的同时,大幅提升了在大数据量上运行复杂查询的性能。原理图如下:列存...

概述

Flink(VVR)完全兼容开源Flink,相关内容请参见如下文档:DataStream API Table API&SQL Python API 使用场景 Flink广泛应用于大数据实时化的场景,本文从技术领域企业应用场景进行介绍。技术领域 从技术领域的角度,Flink主要用于以下...

大数据安全治理的难点

流转 大数据系统通常是端到端的一整套数据开发治理服务,不仅要采集数据、加工数据,更要将数据提供给业务方使用。因此,其存在错综复杂的数据流转链路,包括但不限于即席查询链路、离线传输链路、实时传输链路、数据服务API链路、其他...

概述

技术原理 列存索引的构建 列存索引是由列存引擎节点来构造的,构建的数据最终会以CSV+ORC两种数据格式存储在共享对象上。其中CSV往往存储的是实时的增量数据,过多的增量数据会及时进行compaction,转储成ORC格式。不管是CSV还是ORC格式,...

概述

本文档介绍了 PolarDB MySQL版 数据与缓存一站式功能,如功能概览、适用场景、核心优势、技术原理等。简介 传统的数据与缓存一站式的解决方案通常为Cache Aside模式。Cache Aside模式下,持久化层缓存层的一致性问题主要是“双写”,即...

IoT数据自动化同步至云端解决方案

背景信息 物联网(The Internet of Things,简称IoT)是指通过信息传感器等各种装置和技术,实时采集任何需要的信息。通过各类网络的接入,实现物与物、物与人的连接,实现对物品和过程的智能化感知、识别和管理。物联网、大数据和云计算...

功能概述

实现原理 分析型数据库MySQL版的向量分析旨在帮助您实现非结构化数据的近似检索分析,其实现原理是通过AI算法提取非结构化数据的特征,然后利用特征向量唯一标识非结构化数据,向量间的距离用于衡量非结构化数据之间的相似度。...

基于MaxCompute进行大数据BI分析

本实践以电商行业为例,通过MaxCompute、DataWorks对业务数据和日志数据进行ETL处理,并同步至分析型数据库MySQL(AnalyticDB MySQL)进行实时分析,再通过Quick BI进行可视化展示。背景信息 MaxCompute:用于进行规模数据计算,详情请...

技术架构选型

本教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

自媒体:易撰

PolarDB-X 专注解决海量数据存储、超高并发吞吐、大表瓶颈以及复杂计算效率等数据库瓶颈问题,...通过 PolarDB-X 的高并发写能力和PolarDB的高性能读能力,最终完美解决了我们资讯数据入库和大范围查询的业务痛点。—— 长沙营智技术总监刘涛

技术架构选型

本教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。...

什么是数据库审计

数据库审计服务是一款专业、主动、实时监控数据库安全的审计产品,可用于审计阿里云原生数据自建数据库。数据库审计服务将数据库监控、审计技术与公共云环境相结合,针对数据库SQL注入、风险操作等数据库风险行为进行记录与告警,形成...

Napatech案例

Napatech公司的用户可以将数据包采集分析的能力提升至200G,然而上层软件产生的流量数据包元数据也爆增,给后台数据库(比如开源的HBase/ElasticSearch)的存储索引能力带来极的挑战。增加过多的节点会带来极的成本开销及管理复杂...

功能特性

本文介绍使用Spark SelectDB Connector同步数据至云数据库 SelectDB 版的基本原理和使用方式。通过Spark导入数据 通过DataX导入数据 本文介绍使用DataX SelectDB Writer同步数据至云数据库 SelectDB 版。通过DataX导入数据 OSS Load 云数据...

分析外部OSS上的数据

本文介绍了使用列存索引功能查询OSS上的外表数据技术原理和使用方法等内容。背景信息 业务存续期间,随着时间的推移,数据的规模不断增加导致存储成本上升。用户在应对激烈的市场竞争时,业务逻辑也在不断地发生变化,对应计算分析的复杂...

概述

AnalyticDB PostgreSQL版 向量分析可以通过AI算法提取非结构化数据的特征,并利用特征向量作为非结构化数据的唯一标识,帮您快速且低成本地实现对非结构化数据检索对结构化数据关联分析。向量数据库简介 在现实世界中,绝多数的数据都...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 数据库备份 DBS 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用