非结构化分析

向量分析作为 AnalyticDB PostgreSQL版 向量分析的高级特性目前已经服务阿里巴巴内外部多项业务,包括阿里巴巴数据中台,阿里巴巴电商新零售业务,阿里云城市大脑。典型架构 图 1.基于 AnalyticDB PostgreSQL版 实现非结构化数据向量分析...

发展历程

以MaxCompute为核心代表的阿里云数仓进入 Forrester Wave 2021 Q1云数据仓库卓越表现者象限,成为入选此次评测的唯一中国厂商。进入Gartner云数据库、数据分析第一象限Leader象限。连年获得TPCx-BB 30TB规模 和TPC-DS 10TB规模,性能与性价...

产品优势

协同分析 数据洞察Notebook为数据分析提供了可视化、交互式的平台。用户可以在Notebook中编辑、执行、查看Spark作业。不同角色的用户可以共享集群资源和Notebook内容,协同合作。数据共享 Databricks数据洞察采用数据湖分析的架构设计,...

什么是阿里云Logstash

通过Logstash将PolarDB-X(DRDS)数据同步至Elasticsearch 数据迁移 自建Elasticsearch数据迁移:通过阿里云Logstash将自建Elasticsearch数据迁移至阿里云 腾讯云Elasticsearch数据迁移:腾讯云Elasticsearch数据迁移至阿里云 日志分析 ...

迁移到专属集群

专属集群MyBase创建的实例可被数据传输服务DTS(下文简称DTS)正常读取,因此您可以将非专属集群内的数据库迁移到专属集群,例如从自建MySQL迁移至专属集群MyBase MySQL实例,详细内容请参见下表。DTS已支持读取MyBase实例数据,在配置源库...

迁移到专属集群

专属集群MyBase创建的实例可被数据传输服务DTS(下文简称DTS)正常读取,因此您可以将非专属集群内的数据库迁移到专属集群,例如从自建MySQL迁移至专属集群MyBase MySQL实例,详细内容请参见下表。DTS已支持读取MyBase实例数据,在配置源库...

添加数据源概述

数据源类型 数据源 说明 数据库类 说明 如果您在其它地域,或者没有使用阿里数据库,想连接自建数据库,那就需要暴露数据库的公网IP进行连接。DataV当前不支持IP白名单,如果您担心安全性问题,可以使用阿里云提供的数据库连接代理工具来...

概述

功能说明 向量数据库实现向量分析的原理是通过AI算法提取非结构化数据的特征,然后利用特征向量作为非结构化数据的唯一标识,向量间的距离用于衡量非结构化数据之间的相似度。AnalyticDB PostgreSQL版 向量检索分析基于MPP查询架构构建,...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的...历史离线数据存放于MaxCompute,实时分析数据存放于交互式分析。基于阿里云Quick BI或第三方数据分析工具(如Tableau)执行数据可视化,以及构建各业务板块数据服务门户应用。

产品架构

EMR自研能力 为让开源大数据组件和服务更好的运行在阿里云技术设施上,EMR自研了如下组件:数据应用平台,提供交互式开发、作业提交、作业调试和工作流一站式数据开发体验,详情请参见 EMR Studio概述。Shuffle Service是EMR在优化计算引擎...

功能概览

1.4 生态融合 系出飞天,与阿里大数据系统深度整合,无缝对接MaxCompute、实时计算、交互式分析等产品,打通整个大数据体系。2.产品功能 2.1 数据接入 提供多种SDK、API和Flume、Logstash等第三方插件,让您高效便捷的把数据接入到数据...

Iceberg概述

删除或更新数据 部分数仓都难以实现较为高效的行级数据删除或更新,通常需要启动离线作业把整个表原始数据读取出来,然后变更数据后,写入到一个原始表。而Iceberg成功把变更的范围从表级别缩小到了文件级别,从而可以通过局部变更来完成...

概述

本文介绍DMS数据分析的基本概念、设计理念和主要应用场景。背景信息 DMS数据分析提供典型的数据集、仪表盘和大屏模型,在仪表盘或大屏中提供丰富的可视化图表和组件来展示数据。您可以将数据库中的表或单条SQL查询结果作为数据集,在仪表盘...

最佳实践概览

场景 文档链接 Elasticsearch迁移 迁移方案选取指南 阿里云Elasticsearch间数据迁移 通过reindex迁移数据 基于reindex实现低版本多type数据迁移 自建Elasticsearch数据迁移 通过OSS将自建Elasticsearch数据迁移至阿里云 通过阿里云Logstash...

应用场景

大数据场景:海量数据存储与分析 Lindorm支持海量数据的低成本存储、快速批量导入和实时访问,具备高效的增量及全量数据通道,可轻松与Spark、MaxCompute等大数据平台集成,完成数据规模离线分析。优势 低成本:高压缩比,数据冷热分离...

背景信息以及准备工作

DLA可以对投递到OSS上的数据按年、按月、按日进行多维度的分区,提高数据的命中率,降低扫描量,从而以极低的成本、极高的性能来完成大数据量历史数据分析。DataV中有多种场景模板,解决您的设计难题。提供多种业务模块级别而非图表组件的...

什么是DataWorks

产品架构 DataWorks十多年沉淀数百项核心能力,通过 智能数据建模、全域数据集成、高效数据生产、主动数据治理、全面数据安全、数据分析服务六全链路数据治理的能力,帮助企业治理内部不断上涨的“数据悬河”,释放企业的数据生产力。...

DataWorks V3.0

E-MapReduce:E-MapReduce(Elastic MapReduce,简称EMR)构建在阿里云云服务器ECS上,基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其它周边系统(例如Hive),来分析和处理自己的数据大数据...

PolarDB-X历史

此时的阿里巴巴清晰的意识到,如果不通过技术创新平衡成本和增长需求,必将对未来发展产生影响。于是"去IOE"的说法被首次提出。去IOE"的目的绝不仅仅是摆脱几个传统IT厂商的产品,而是在互联网+、云计算快速兴起后,企业用户迫切需要能够...

通过DataWorks将RDS SQL Server数据同步到阿里云ES

如果您需要对RDS SQL Server中的数据进行搜索和分析,可借助阿里云Elasticsearch实现。本文介绍通过DataWorks的数据集成服务,快速将数据离线同步到阿里云ES中。背景信息 DataWorks是一个基于大数据引擎,集成数据开发、任务调度、数据管理...

什么是基因分析平台?

功能特性 基因分析平台具有以下主要功能特性:基因数据管理 基因数据安全存储在用户自己的阿里云对象存储OSS中,传输和存储过程中全程加密,数据可靠性99.999999999%,并且可以通过多版本、3AZ、跨区域复制等功能提供数据容灾服务。...

云产品集成

背景信息 云数据库 OceanBase 对接了多个阿里云常用云产品,您可以通过这些产品进行数据可视化、数据分析数据同步等操作。常见云产品如下:数据开发治理平台 DataWorks 实时计算 Flink 版 数据库管理 DMS DataV 数据可视化 Quick BI ...

应用场景

基因分析平台广泛用于基因数据从样本到报告的分析过程。典型应用场景包括基因数据分析、测序生产自动化和基因云平台开发等。基因数据分析 为任意规模用户,提供开箱即用的基因分析服务,效率高,成本低,灵活可靠,最快30分钟即可获取海量...

监控与日志

日志服务 阿里云日志服务SLS是云原生观测与分析平台,为Log、Metric、Trace等数据提供规模、低成本、实时的平台化服务。日志服务一站式提供数据采集、加工、查询与分析、可视化、告警、消费与投递等功能,全面提升您在研发、运维、运营、...

DataWorks on EMR Serverless StarRocks最佳实践

DataWorks支持StarRocks数据源,通过数据源对接EMR Serverless StarRocks,可实现EMR Serverless StarRocks的数据集成、开发、分析数据服务等功能。本文为您介绍EMR Serverless StarRocks在DataWorks上的操作流程。背景信息 了解EMR ...

Grafana接入阿里云时序数据库TSDB For InfluxDB®️...

阿里云时序数据库TSDB For InfluxDB®接入Grafana后,您可以利用Grafana的丰富易用的可视化工具更好地监控和分析来自阿里云时序数据库TSDB For InfluxDB®的数据。本文介绍如何将阿里云时序数据库TSDB For InfluxDB®接入Grafana。前置...

数据迁移方案概览

RDS提供了多种数据迁移方案,可满足不同上云或迁云的业务需求,使您可以在不影响业务的情况下将数据在其他数据库与阿里云云数据库RDS之间平滑迁移。适用场景 文档链接(迁移上云)自建数据库迁移至阿里云 MySQL 5.7、8.0自建数据库全量上云...

DataWorks On EMR使用说明

背景信息 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据阿里云...

数据中心隔离

阿里云电子政务云与阿里公共云的数据中心完全隔离,政务云采用独立的物理机房,为政务用户提供专属的云平台及云产品,保障政务用户在政务云上的业务数据不出政务云专属机房。独立的物理机房 为了满足国家法律法规和等保要求,阿里云电子...

数据源Alibaba LindormTSDB

添加LindormTSDB数据源用于连通阿里云数据库LindormTSDB与Quick BI,连接成功后,您可以在Quick BI上进行数据的分析与展示。...添加可视化图表并分析数据,请参见 新建仪表板 和 可视化图表概述。钻取并深度分析数据,请参见 钻取设置与展示。

分析实例简介

构建实时数仓成本太高,公司留给数据分析的预算有限,只能默默忍受越来越长的卡顿时间,殊不知在无限的忍受中公司错过了很多机会。为解决上述问题,您可以在RDS MySQL控制台上创建一个分析实例。分析实例的复杂分析性能约为RDS MySQL实例的...

Quick BI如何接入TSDB

本文为您介绍Quick BI如何接入TSDB。Quick BI是一个基于云计算致力于数据高效分析与展现的轻量级自助BI工具服务平台。...添加可视化图表并分析数据,请参见 新建仪表板 和 可视化图表概述。钻取并深度分析数据,请参见 钻取、联动、跳转。

注册EMR集群至DataWorks

背景信息 开源大数据开发平台 E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还...

使用MaxCompute控制台(离线)

MaxCompute控制台提供数据上传功能,支持您将本地文件或阿里云对象存储服务OSS中的文件数据离线(非实时)上传至MaxCompute进行分析处理及相关管理操作。使用限制 仅支持基于 本地文件 或 阿里云对象存储OSS 上传数据,具体如下。本地文件...

产品概述

什么是全密态数据库 全密态数据库是数据库与存储实验室与阿里数据库团队合作的自研产品,以技术为基石,最小化人员、平台管理等不可控因素造成的潜在数据安全隐患,可以有效杜绝云数据库服务(或应用服务等数据拥有者以外的任何人)接触...

产品概述

什么是全密态数据库 全密态数据库是数据库与存储实验室与阿里数据库团队合作的自研产品,以技术为基石,最小化人员、平台管理等不可控因素造成的潜在数据安全隐患,可以有效杜绝云数据库服务(或应用服务等数据拥有者以外的任何人)接触...

什么是EMR on ACK

阿里云E-MapReduce(简称EMR)on ACK提供了全新构建大数据平台的方式。您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注...

产品概述

什么是全密态数据库 全密态数据库是 达摩院数据库与存储实验室 与阿里数据库团队合作的自研产品,以技术为基石,最小化人员、平台管理等不可控因素造成的潜在数据安全隐患,可以有效杜绝云数据库服务(或应用服务等数据拥有者以外的任何...

DataWorks数据服务对接DataV最佳实践

DataV通过与DataWorks数据服务的对接,通过交互式分析Hologres连接DataWorks数据服务开发并生成API,快速在DataV中调用API并展现MaxCompute的数据分析结果。数据服务对接DataV产生背景 MaxCompute是阿里巴巴集团自主研究的快速、完全托管的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
阿里邮箱 云数据库 RDS 数据库备份 DBS 数据传输服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用