构建SaaS平台的事件总线

聚石塔沉淀的大量的电商数据有开放性需求,淘宝和天猫电商可以从这些数据中挖掘出大量的业务价值。为了帮助商家高效地利用聚石塔电商数据,在聚石塔SaaS平台上孵化出了大量的ISVs,这些ISVs为商家开发了一些应用,帮助商家消化电商数据。...

JindoData概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括JindoFS存储系统(原JindoFS Block模式)、...

自媒体:易撰

所属行业:自媒体 网站地址:易撰 客户介绍 长沙营智信息技术有限公司是专业的新媒体大数据服务商,其旗下知名品牌易撰,基于新媒体大数据挖掘技术及NLP算法分析,为各内容创客、广告主提供全面、科学、精准大数据分析服务以及大数据架构...

互联网、电商行业离线大数据分析

通过阿里云MaxCompute、云数据库RDS MySQL、DataWorks等产品,可以实现互联网、电商网站的离线数据分析,且支持通过DataV大屏展示分析后的业务指标数据。概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标...

生成测试数据

背景信息 OceanBase 开发者中心(OceanBase Developer Center,ODC)提供模拟数据功能供用户在测试数据库性能或者验证功能等需要大量模拟数据的场景,能够快速根据表中的字段类型生成数据。注意事项 单次模拟数据上限为 1 亿行。拥有检查...

明确统计指标

确定指标 本教程中,用户是A公司电商营销部门的营销数据分析师。数据需求为最近一天厨具类目的商品在各省的销售总额、该类目销售额前10的商品名称、各省用户购买力分布(人均消费额)等,用于营销分析。基于规范定义,确认业务过程为确认收...

概述

从应用视角看,全密态数据库可以解决不同应用场景下的数据安全问题,几种典型场景如下:平台安全运维:该场景主要针对在不可信环境(如第三方平台)下提供的数据库服务的安全防护,保证用户数据在运维过程中的安全。例如,业务将应用数据库...

某网约车公司车辆轨迹数据

解决方案 在原有的架构上引入了阿里云数据库,并将全量数据写到 云原生多模数据库 Lindorm 中,同时增量数据通过Kafka、Spark等实时同步到 云原生多模数据库 Lindorm,这样解决了客户线下数据数据大的问题。客户需要存储最近3年的数据...

表设计规范

单个分区中数据量较大的情况,MaxCompute执行任务时会进行分片处理而不影响分区裁剪的优势。单个分区中文件数较多时,会影响MaxCompute Instance数量,造成资源浪费和SQL性能的下降。采用多级分区时,建议先按日期分区,然后按交易类型...

什么是EMR Serverless StarRocks

EMR Serverless StarRocks是开源StarRocks在阿里云上的全托管服务,您可以通过其灵活地创建和管理实例以及数据。本文为您介绍StarRocks的核心特性,并详述EMR Serverless StarRocks在此基础之上所引入的诸多增强功能与服务优势。StarRocks...

数据服务入门

步骤一:创建数据源并配置网络连通性 使用数据服务创建API前,您需将数据库或数据仓库添加为DataWorks的数据源,并保障数据服务资源组与您的目标数据源网络连通,以便调用API时DataWorks可成功访问数据源。说明 DataWorks工作空间将集群或...

方案背景

大数据计算场景:推荐系统,订单类业务等 实时数据计算场景:监控系统,电商数字大屏等 样例场景 某电商公司为了完成电商运营数据的分析和展示,使用表格存储统一存储电商数据,通过Spark的流批处理离线聚合或实时统计电商数据,最终在...

电商网站智能推荐

电商网站智能推荐基于阿里巴巴的大数据和人工智能技术,结合在电商行业的多年积累,为开发者提供个性化推荐服务,提升商品的购买率和转化率。概述 本实践以电商网站为例,通过日志服务采集日志,将RDS作为后端数据服务、MaxCompute作为数据...

表格存储

表格存储(Tablestore)是阿里云自研的结构化数据存储,提供海量结构化数据存储以及快速的查询和分析服务。表格存储提供兼容HBase的WideColumn模型、消息模型Timeline以及时空模型Timestream,实现PB级存储、千万TPS以及毫秒级延迟的服务...

管理数据

更多操作 批量管理数据域 需要规模调整多个数据下的资产时,您可以使用批量导入功能。通过下载并修改数据域模板文件,快速管理数据域。仅支持阿里云账号和具有 AliyunYundunSDDPFullAccess 权限的RAM用户使用该功能。登录 数据安全中心...

如何对JSON类型进行高效分析

半结构化数据通常存在于Web页面、XML、JSON、NoSQL数据库等场景中,其灵活性和易扩展性使其成为大数据时代中不可或缺的一部分。PolarDB MySQL版 本身是一个关系型数据库管理系统,其存储的数据通常是结构化数据,但也原生支持存储和查询半...

快速体验

DataWorks的数据分析功能为企业提供了全面的数据分析和服务共享能力,可便捷地连接多种数据源、支持SQL查询,并提供电子表格等多样化的数据分析工具,以满足企业日常的数据提取和分析需求。本文将通过MaxCompute引擎在SQL查询中对公共数据...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

管理数据目录

数据目录是数据湖构建(Data Lake Formation)的元数据最上层实体,可以包含若干个数据库。在EMR Serverless Spark中,您可以通过该功能来查看绑定的数据目录中的数据库和表,还可以添加已有的数据目录。该功能适用于需要实现元数据隔离的...

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

JindoFS实战演示

视频发布时间 描述 Fluid+JindoFS对OSS上的数据进行训练加速 Fluid+JindoFS对OSS上的数据进行训练加速 2021-07-06 Fluid是一个开源的Kubernetes原生的分布式数据集编排和加速引擎,主要服务于云原生场景下的数据密集型应用,例如大数据应用...

表设计最佳实践

在单个数据通道写入量较大的情况,应该按照时间进行分区设计。在采集通道数据量较小的情况,适合采取非分区表设计,将终端类型和采集时间设计成标准列字段。采用DataHub进行数据写入时,应该合理规划Shard数量,避免出现由于Shard过多...

概述

解决方案 T+1全量同步一键建仓是指通过DLA控制台配置数据源(RDS、PolarDB for MySQL、MongoDB数据源、ECS自建数据数据)和目标OSS数据仓库,系统按照您设定的数据同步时间自动、无缝的帮您把数据源中的数据同步到目标数据仓库OSS中,...

文本分析器

举例:文档字段内容为"原神装备",分词结果为"原神 装备",则搜索"原神装备","原神","装备"等可以被召回 行业-英文电商通用分析 介绍:适用于英文场景下的电商行业的分析器。注意:仅适用于TEXT字段类型;仅限规格为电商行业增强的独享型应用...

文本分析器

举例:文档字段内容为"原神装备",分词结果为"原神 装备",则搜索"原神装备","原神","装备"等可以被召回 行业-英文电商通用分析 介绍:适用于英文场景下的电商行业的分析器。注意:仅适用于TEXT字段类型;仅限规格为电商行业增强的独享型应用...

受众与核心能力

产品受众 从事数据开发、算法开发等岗位的技术人员 从事销售运营、商业智能分析等岗位的业务人员 从事数据安全与合规工作的管理人员 从事数据应用开发的开发人员 把控公司核心数据资产的管理人员 核心能力 基于DataWorks,您可以获得如下...

大数据AI公共数据集分析

本教程通过DataWorks,联合云原生大数据计算服务MaxCompute,使用大数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等公共数据),指导您如何快速进行大数据分析,快速熟悉DataWorks的操作界面与最基础的数据分析能力。DataWorks的更...

典型场景

基于湖构建数据平台,支持BI、挖掘等业务 对象存储OSS可以作为湖存储,DLA基于OSS构建一站式的大数据平台。具体包括构建数据湖、数据ETL、交互式查询、机器学习等功能。构建数据湖 实时数据湖:支持DB的CDC与消息数据(如Kafka)入湖,构建...

产品优势

数字化精准营销:营销引擎云码 产品数字化地对接线上、线媒体资源,提供阿里巴巴集团的数据、三方数据、线IoT设备数据服务。通过阿里云智能算法平台,帮助客户深度洞察消费者需求和行为,构建面向各行各业不同营销场景需求的数字化、...

离线同步并发和限流之间的关系

限制和最佳实践:分布式执行模式,配置较大任务并发度可能会对您的数据存储产生较大的访问压力,请评估数据存储的访问负载。如果您的独享资源组机器台数为1,不建议使用分布式执行模式,因为执行进程仍然分布在一台Worker节点上,无法...

数据集成概述

数据集成是基于Dataphin构建的简单高效的数据同步平台,致力于提供具有强大的数据预处理能力、丰富的异构数据源之间数据高速稳定的同步能力。背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量...

冷热分层

背景信息 在海量大数据场景,随着业务和数据量的不断增长,性能和成本的权衡成为大数据系统设计面临的关键挑战。Delta Lake是新型数据湖方案,推出了数据流入、数据组织管理、数据查询和数据流出等特性,同时提供了数据的ACID和CRUD操作...

全景视角

阿里云DataWorks为您提供数据生产、数据使用、数据管理视角下的主要数据治理情况。您可以根据需求选择合适的视角,高效的进行数据治理工作。背景信息 为提高不同使用场景下的数据治理效率和质量,DataWorks为您提供以下视角:数据管理视角...

定义维度与构建总线矩阵

以本教程中A电商公司的营销业务板块为例,在交易数据域中,我们重点考察确认收货(交易成功)的业务过程。在确认收货的业务过程中,主要有商品和收货地点(本教程中,假设收货和购买是同一个地点)两个维度所依赖的业务角度。从商品维度...

数据迁移

本文为您介绍数据迁移的最佳实践,包含将其他业务平台的业务数据或日志数据迁移至MaxCompute,或将MaxCompute的数据迁移至其它业务平台。背景信息 传统关系型数据库不适合处理海量数据,如果您的数据存放在传统的关系型数据库且数据量庞大...

什么是数据库网关

DG相关服务 相关服务 说明 数据传输服务DTS 数据传输服务DTS(Data Transmission Service)是阿里云提供的实时数据流服务,支持关系型数据库(RDBMS)、非关系型的数据库(NoSQL)、数据多维分析(OLAP)等数据源间的数据交互,集数据同步...

定义维度与构建总线矩阵

以本教程中A电商公司的营销业务板块为例,在交易数据域中,我们重点考察确认收货(交易成功)的业务过程。在确认收货的业务过程中,主要有商品和收货地点(本教程中,假设收货和购买是同一个地点)两个维度所依赖的业务角度。从商品维度...

管理数据源权限

您可以在数据源管理页面,分享数据源权限给相应的工作空间,并进入被分享的工作空间查看该数据源。本文为您介绍如何管理数据源权限及查看分享的数据源。背景信息 通常数据源会承载数据的具体地址、账户和密码等敏感信息,但普通开发人员仅...

数据分析概述

DataWorks提供的数据分析平台,可以流畅地进行数据处理、分析、加工及可视化操作。在数据分析板块中,您不仅可以在线洞察数据,还可以编辑和共享数据。本文为您介绍数据分析平台的优势、功能、权限等概要信息。产品优势 与本地数据分析相比...

外部表概述

MaxCompute支持使用外部表功能查询和分析存储于OSS等外部存储系统的数据。该机制使得用户可以无需将数据导入到MaxCompute内部存储,直接对外部数据进行操作,从而提供了数据处理的灵活性和方便性。背景信息 MaxCompute SQL作为分布式数据...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库审计 数据库备份 DBS 云数据库 RDS 智能推荐 AIRec 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用