EMR Workbench

阿里云EMR Workbench是一个综合大数据分析和开发环境,作为阿里云E-MapReduce的一部分,它提供了EMR Notebook和EMR Workflow两个核心功能。通过EMR Workbench,您可以轻松进行数据开发,以及交互式数据分析,并设计复杂的数据处理工作...

AnalyticDB MySQL助力Flowerplus业务高速发展

由此可见,Flowerplus对大数据分析的实时要求较高,而传统的MySQL数据库无法满足这一需求。复杂数据查询性能 使用传统MySQL数据库对订单、商品流量、采购、业务转化率以及商品售罄报警等分析时速度较慢,数据达到千万级或者亿级时,复杂...

使用前须知

网络质量分析器是一款针对真实终端用户网络质量性能进行分析的SaaS服务。您可以将网络质量分析器的SDK插件集成到App中,实时感知所有App真实用户在线情况、访问互联网的网络质量情况。网络质量分析器提供从在线终端设备发起到您目标服务器...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

产品优势

协同分析 数据洞察Notebook为数据分析提供了可视化、交互式的平台。用户可以在Notebook中编辑、执行、查看Spark作业。不同角色的用户可以共享集群资源和Notebook内容,协同合作。数据共享 Databricks数据洞察采用数据湖分析的架构设计,...

通用数据开发

数据分析与处理:完成数据的同步后,可以对MaxCompute中的数据进行加工(MaxCompute SQL、MaxCompute MR)、分析与挖掘(数据分析数据挖掘)等处理,从而发现其价值。数据提取:分析与处理后的结果数据,需要同步导出至业务系统,以供...

数据质量教程概述

数据质量数据分析结论有效和准确的基础。本文为您介绍数据质量保障教程的业务场景以及如何衡量数据质量的高低。前提条件 在开始本教程前,请您首先完成 搭建互联网在线运行分析平台 教程,详情请参见 业务场景与开发流程。业务场景 ...

数据质量教程概述

数据质量数据分析结论有效和准确的基础。本文为您介绍数据质量保障教程的业务场景以及如何衡量数据质量的高低。前提条件 在开始本教程前,请您首先完成 搭建互联网在线运行分析平台 教程,详情请参见 业务场景与开发流程。业务场景 ...

典型场景

大数据分析平台 对于MaxCompute、Hadoop和Spark中保存的海量数据,可通过采用数据集成服务(DataX)或通过对象存储服务(OSS),快速批量导入到 云原生数据仓库AnalyticDB PostgreSQL版,帮助您实现高性能分析处理和在线数据探索。数据湖...

数据标准建模

数据字典和质量校验函数以及逻辑表物理化到数据库,帮助您在数据标准的约束下构建数据模型,将数据标准贯彻到数据质量分析、保障及检查的全过程中,将散乱的多源异构数据加工成标准、干净的数据。前提条件 已根据快速入门教程完成加载样...

常见问题

数据湖后端存储使用OSS,用户使用数据湖构建面向大数据分析和机器学习场景可以获得集中式权限管理和统一的元数据视图,更容易对接云上大数据分析产品。什么情况下我需要使用数据湖构建?在云上有数据分析和机器学习需求,希望构建云上的...

(邀测)MaxCompute Notebook使用说明

多引擎支持 支持MaxCompute SQL、PyODPS、Python等多种开发方式,您无需转变原有的开发方式可快速开始数据分析数据挖掘工作。与MaxCompute深度集成 MaxCompute Notebook可基于现有MaxCompute计算资源池快速创建实例,您无需进行复杂配置...

快速入门

产品使用 Elasticsearch Elasticsearch作为实时分布式搜索和分析引擎,可以快速地、近乎于准实时地存储、查询和分析超大数据集,可以快速构建日志分析、异常监控、企业搜索和大数据分析等各业务应用。Elasticsearch快速入门 Logstash ...

读写RDS MySQL数据

DLA支持连接RDS(MySQL、SQLServer、PostgreSQL)数据源,然后通过SQL语法查询和分析RDS数据,同时支持将分析结果回写入RDS。本文以RDS MySQL为例介绍如何通过DLA读写RDS数据。注意事项 如果您的RDS实例位于VPC网络内,默认情况下DLA无法...

大数据AI公共数据分析

本教程通过DataWorks,联合云原生大数据计算服务MaxCompute,使用大数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等公共数据),指导您如何快速进行大数据分析,快速熟悉DataWorks的操作界面与最基础的数据分析能力。DataWorks的更...

Flink VVP+DLF数据入湖与分析实践

并利用DLF统一元数据管理、权限管理等能力,实现数据湖多引擎分析数据湖管理等功能。本文为您介绍Flink+DLF数据湖方案具体步骤。背景信息 阿里云实时计算Flink版是一套基于Apache Flink构建的实时数据分析平台,支持多种数据源和结果表...

背景信息以及准备工作

背景信息 DLA作为无服务化的大数据分析服务,通过标准的SQL语句直接对存储在阿里云对象存储服务(Object Storage Service,简称 OSS)、表格存储(Table Store)中的数据进行清洗。例如,使用DLA对OSS中的历史数据按天进行清洗。DataWorks...

创建GreenPlum数据

背景信息 Greenplum是一款大数据分析引擎,作用于分析、机器学习和AI等领域。其架构主要针对管理规模分析数据仓库以及商业智能工作负载而设计。更多详情,请参见 GreenPlum官网。使用限制 Dataphin仅支持超级管理员、数据源管理员、...

创建GreenPlum数据

背景信息 Greenplum是一款大数据分析引擎,作用于分析、机器学习和AI等领域。其架构主要针对管理规模分析数据仓库以及商业智能工作负载而设计。更多详情,请参见 GreenPlum官网。使用限制 Dataphin仅支持超级管理员、数据源管理员、...

冷热分层

更多介绍请参见 结构化大数据分析平台设计、面向海量数据的极致成本优化-云HBase的一体化冷热分离 和 云上如何做冷热数据分离。冷热数据 数据按照实际访问的频率可以分为热数据、温数据和冷数据。其中冷数据数据量较,很少被访问,甚至...

实例画像

数据库自治服务DAS(Database Autonomy Service)提供实例画像功能,基于数据库实例的运行特征表现,通过AI大数据分析构建的一种“千人千面”画像服务。实例画像可以帮助您直观地了解数据库实例全貌,快速确认数据库实例是否存在异常与缺陷...

实例画像

数据库自治服务DAS(Database Autonomy Service)提供实例画像功能,基于数据库实例的运行特征表现,通过AI大数据分析构建的一种“千人千面”画像服务。实例画像可以帮助您直观地了解数据库实例全貌,快速确认数据库实例是否存在异常与缺陷...

实例画像

数据库自治服务DAS(Database Autonomy Service)提供实例画像功能,基于数据库实例的运行特征表现,通过AI大数据分析构建的一种“千人千面”画像服务。实例画像可以帮助您直观地了解数据库实例全貌,快速确认数据库实例是否存在异常与缺陷...

读写Elasticsearch数据

云原生数据分析DLA(Data Lake Analytics)中支持接入Elasticsearch,通过标准SQL语句读取Elasticsearch中的数据,从而实现Elasticsearch中的数据与其他数据源的数据联合查询等业务需求。本文档主要介绍了DLA读写Elasticsearch数据的操作...

规格及选型

案例二:互联网SaaS用户 用户为互联网SaaS客户,需要建立数据中台,涉及多数据源包括RDS、Flink、OSS等,期待在平台上完成数据的ETL流程,实现多源处理以及分析侧不同场景的混合负载支持,需要高稳定保证,同时平台对接数据应用支持报表...

MaxCompute账单用量明细分析

背景信息 MaxCompute是一款大数据分析平台,其计算资源的计费方式分为包年包月和按量付费两种。MaxCompute每天以项目为维度进行计费,账单会在第二天06:00前生成。更多MaxCompute计量计费信息,请参见 计费项与计费方式概述。MaxCompute会...

E-MapReduce弹性低成本离线大数据分析

大数据是一项涉及不同业务和技术领域的技术和工具的集合,海量离线数据分析可以应用于多种商业系统环境,例如,电商海量日志分析、用户行为画像分析、科研行业的海量离线计算分析任务等场景。离线大数据分析概述 主流的三分布式计算框架...

基本概念

数据资源平台中,可以通过对表级与字段级的数据质量任务运行,真实反映数据接入的唯一、准确、规范、一致、时效、完整数据开发 场景:场景定义数据输出的方式,一个场景包含一种或多种数据输出的方式。计算资源:可以执行...

MaxCompute表数据

查看数据统计信息和分布情况 数据探查通过分析数据的结构和取值,为您展示数据的统计信息和分布情况等探查结果。说明 数据探查的使用限制如下:仅支持探查分区表。仅支持探查生产环境的表。仅表的所有者有权限开启自动探查功能。仅上海地域...

基于MaxCompute进行大数据BI分析

方案优势 以AnalyticDB MySQL配合Quick BI快速、实时分析数据的核心能力为切入点,引导用户同步业务数据、日志数据至阿里云的分析型数据库。融合阿里云的日志服务的生态,增强用户体验。例如,无缝对接Blink、Elasticsearch、AnalyticDB ...

数据质量:全流程的质量监控

同时,数据质量提供历史校验结果的管理,以便您对数据质量进行分析和定级。详情请参见 数据质量数据质量为您解决以下问题:数据库频繁变更问题 业务频繁变化问题 数据定义问题 业务系统的脏数据问题 系统交互导致质量问题 数据订正引发的...

采集数据

重要 为方便您更好地体验DataWorks服务,本次模拟实验提供了仅有只读权限的AK供您试用,以上AK仅可用于模拟实验过程中读取样例数据真实数据生产环境请替换为您自己的数据源AK。资源组连通 在 连接配置 区域的独享数据集成资源组后,...

功能优势

分析数据库MySQL版向量分析功能在通用、性能优化和产品化上与普通向量检索系统相比有以下优势。高维向量数据的高准度和高性能 以典型的人脸512维向量为例,分析数据库MySQL版向量分析提供百亿向量100 QPS、50毫秒响应时间(RT)约束...

数据分析作业

MaxCompute是适用于数据分析场景的企业级SaaS模式云数据仓库,支持在多种工具上使用MaxCompute运行大数据计算分析作业。如果您需要进行简单的查询等数据分析作业,推荐您使用SQL查询或DataWorks的临时查询等工具,高效便捷地完成数据分析...

核心自治技术案例解析

传统的压测方案部分基于现有的压测工具,如sysbench、TPCC等,其最大的问题是这些压测工具对应的SQL与真实业务差距太,压测结果无法准确反映出真实业务的性能和稳定。DAS提供的智能压测服务是基于用户真实业务的workload,因此压测...

资产质量概述

因业务系统的原始数据的规范无法得以保障,所以Dataphin需要定义数据分析质量,以满足资产质量的时效、准确、完整、一致、有效,助您真正能够依赖数据进行经营决策。数据质量流程引导 数据质量流程引导帮助您从(可选)配置...

资产质量概述

因业务系统的原始数据的规范无法得以保障,所以Dataphin需要定义数据分析质量,以满足资产质量的时效、准确、完整、一致、有效,助您真正能够依赖数据进行经营决策。数据质量流程引导 数据质量流程引导帮助您从(可选)配置...

查看报表

从敏感数据态势、安全审计趋势、敏感数据保护、安全事件告警和数据风险评估五个维度针对您的数据库资产制定关于《数据安全法》的符合报告,可以帮助管理人员、数据安全负责人、数据安全管理员掌握数据整体情况和增长趋势,及时发现各种...

背景信息以及准备工作

或者对存储在 阿里云对象存储服务(Object Storage Service,简称 OSS)、表格存储(Table Store)上的大数据进行分析之后,通过DLA把结果数据回写到MongoDB,供前台业务使用。前提条件 使用DLA读写MongoDB数据前,您需要通过以下操作在...

需求阶段

分析需求 可行性分析数据产品经理主导,邀请设计、数据安全与合规人员,对需求进行评估。需求合理:评估该需求的合理。数据可行:评估当前已有数据能否支撑需求开发,如果缺少数据,则需要另行规划缺失数据的抽取方案。同时建议...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 数据库备份 DBS 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用