产品简介

服务内容 服务大类 服务类型 服务内容 大数据专家咨询服务 大数据技术架构方案咨询 为客户提供构建和优化大数据体系的技术架构方案咨询服务,覆盖离线/实时数仓体系建设管理、数仓建模管理,数据开发管理,数据安全管理、数据质量管理、...

行为模型学习配置

如果您的数据库业务有了较的调整,需要重新学习。您可以单击目标学习任务 操作 列的 重新学习,并配置行为模型学习任务。重要 执行重新学习操作会停止对数据库操作的检测,建议您在确认无需持续检测时,再执行重新学习操作。查询模型详情...

常见问题

数据湖后端存储使用OSS,用户使用数据湖构建面向大数据分析和机器学习场景可以获得集中式权限管理和统一的元数据视图,更容易对接云上大数据和分析产品。什么情况下我需要使用数据湖构建?在云上有数据分析和机器学习需求,希望构建云上的...

编辑数据

数据映射 一般情况下,系统能够自动匹配数据源中的类目和值,完成数据映射。如果数据复杂,则需要手动输入字段来完成数据映射。数据映射成功后,系统会自动显示 匹配成功。添加过滤器 您可以为数据源添加一个过滤器,使数据的展示更加清晰...

数据质量衡量

在了解保障基于MaxCompute的数据仓库数据质量的方案后,您还需要进一步学习如何制定一套标准度量方案,以及判断质量监控方案是否合适业务需求以及如何改进。例如,针对每一个数据质量事件,必须分析原因和处理过程,制定后续同类事件预防...

常见问题

MaxCompute的用户经常咨询和关注的一些问题如下:使用MaxCompute需要具备什么专业技能?如何理解开源与云原生的大数据技术与产品?MaxCompute作为大数据平台,对业务数据是否有好的监控手段?MaxCompute的项目发挥什么作用?如何获取...

添加静态数据

本文档介绍在DataV中添加静态数据文件的方法。前提条件 已准备好待添加的静态数据文件。操作步骤 登录 DataV控制台。在 工作台 页面中,将鼠标移动至需要编辑的数据看板上,单击 编辑。重要 如果您的 工作台 页面内还没有创建任何数据看板...

独享资源组

您在DataWorks使用独享资源组访问数据库,需要确保以下内容:购买独享资源时,需要选择数据源所在的可用区,并为独享资源组绑定专有网络。独享资源绑定的专有网络和交换机,需要数据源保持一致。如果数据库有白名单限制,您需要添加独享...

什么是DataWorks

中国国际大数据产业博览会十佳大数据案例 中国信通院:数据集成工具、数据管理工具、数据开发平台、数据脱敏工具、数据分类分级等评测 学习路径 您可以通过DataWorks文档首页的 学习路径,快速了解DataWorks的相关概念、基础操作及进阶操作...

数据导入方式介绍

为满足多样化的数据导入需求,云原生数据仓库AnalyticDB MySQL版 提供了多种数据导入方式,包括:通过外表导入数据、使用DataWorks导入数据和利用JDBC通过程序导入数据等。本文介绍各导入方式的特性及适用场景,帮助您选择正确的数据导入...

管理数据

企业管理员使用数据域可以基于业务属性、组织架构、数据特征等维度对数据资产进行分类管理。通过将拥有共同属性的数据资产集中到同一个数据域中,管理员可以高效管理数据资产及资产中的敏感数据。本文介绍首次使用数据域功能的具体操作。...

产品优势

学习成本低 非技术人员1~2小时即可掌握完整的数据开发、治理流程,告别传统命令行,节省巨大的学习成本。让您可以在同一DAG图中,构建异构计算引擎形成混编任务流(数据同步+SQL+MR+MaxCompute Spark+实时计算+ML),无需分别维护各技术栈...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

功能特性

安全性 OceanBase 数据库在调研了大量企业对于数据软件的安全需求,并参考了各种安全标准之后,实现了企业需要的绝部分安全功能,支持完备的权限与角色体系,支持 SSL、数据透明加密、审计、Label Security、IP 白名单等功能,并通过了...

确定需求

您在构建数据仓库之前,首先需要确定构建数据仓库的目标与需求,并进行全面的业务调研。您需要了解真实的业务需求,以及确定数据仓库要解决的问题。业务调研 充分的业务调研和需求分析是数据仓库建设的基石,直接决定数据仓库能否建设成功...

确定需求

您在构建数据仓库之前,首先需要确定构建数据仓库的目标与需求,并进行全面的业务调研。您需要了解真实的业务需求,以及确定数据仓库要解决的问题。业务调研 充分的业务调研和需求分析是数据仓库建设的基石,直接决定数据仓库能否建设成功...

什么是EMR on ACK

阿里云E-MapReduce(简称EMR)on ACK提供了全新构建大数据平台的方式。您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注...

IoT数据自动化同步至云端解决方案

物联网的体系结构包括设备、网络、平台、分析、应用和安全,其中分析部分的主要内容大数据分析。大数据分析是大数据完成数据价值化的重要手段之一,而进行大数据分析的第一步是让数据成功上云。解决方案 IoT数据自动化同步至云端解决方案...

实验介绍

数据采集 数据加工 配置数据质量监控 数据可视化展现 目标人群 开发工程师、数据分析师、产品运营等存在数仓数据获取与数据分析洞察人员。涉及产品 本案例涉及以下产品:一站式大数据开发治理DataWorks 本案例通过DataWorks实现数据采集,...

概述

如果您在2022年2月21日21点前使用过数据开发功能,需要继续在EMR上使用数据开发功能,建议您尽快迁移到EMR Workflow,详情请参见 EMR旧版数据开发迁移公告。您也可以迁移到大数据开发治理平台DataWorks,详情请参见 EMR数据开发停止更新...

软件概述

E-HPC提供了业界主流的科学计算应用、编译器运行时库、MPI通信库等软件,本文介绍E-HPC支持的软件,以及相关软件的应用场景等。E-HPC软件栈 本文列出支持自动部署的软件,您也可以通过自定义镜像的方式自行部署其他需要软件软件列表 ...

计费常见问题

通过DataWorks执行补数据操作后,为什么费用会产生较波动?通过DataWorks将调度任务的调度周期从天改为小时后,为什么费用会增加?运行全表扫描后,为什么费用会增加?下载费用 通过ECS云主机使用内网从MaxCompute下载数据,收取流量费用...

面临的业务挑战

数据来源上包含数据数据、日志数据、对象数据以及已有数仓上的存量数据等。这些不同来源、不同格式的数据,各自又有不同的访问和分析方式,而大量传统企业基于关系数据库构建自己的业务系统,已经非常熟悉按SQL的方式去使用数据,这无疑...

ECS实例说明

大数据型 使用本地SATA盘作存储数据,存储性价比高,是大数据量(TB级别的数据量)场景下的推荐机型。说明 Hadoop、Data Science、Dataflow和Druid类型的集群支持Core节点;Zookeeper和Kafka类型的集群不支持Core节点。本地SSD型 使用本地...

快速体验

数据采集 数据加工 配置数据质量监控 数据可视化展现 目标人群 开发工程师、数据分析师、产品运营等存在数仓数据获取与数据分析洞察人员。涉及产品 本案例涉及以下产品:一站式大数据开发治理DataWorks 本案例通过DataWorks实现数据采集、...

自媒体:易撰

所属行业:自媒体 网站地址:易撰 客户介绍 长沙营智信息技术有限公司是专业的新媒体大数据服务商,其旗下知名品牌易撰,基于新媒体大数据挖掘技术及NLP算法分析,为各内容创客、广告主提供全面、科学、精准的大数据分析服务以及大数据架构...

客户案例

迁移到大数据MaxCompute、实时计算、DataWorks后,部分任务有10倍以上的性能提升,存储从自建Hadoop 3PB降到900T,利用Flink实时数据处理能力,将宝宝树现有的场景实时化(“基于用户ID维度和内容类型的实时行为”、“获取用户的实时群聊ID...

产品优势

全托管的Databricks数据洞察大数据分析平台,可以让您从繁杂的环境运维、内核优化等工作中解脱出来,专注于开发Spark作业本身。本文介绍Databricks数据洞察的产品优势。高效稳定 产品内核使用Databricks商业版的Runtime和Delta Lake。与...

外部数据

本文介绍了外部数据的相关内容。简介 本数据库实现了部分的 SQL/MED 规定,允许我们使用普通 SQL 查询来访问位于本地数据库之外的数据。这种数据被称为外部数据。说明 这种用法不要和外键混淆,后者是数据库中的一种约束 外部数据可以在...

水波图

数据映射 当您需要自定义图表字段配置时,可以在 数据映射 模块设置不同的字段映射内容,将这些字段映射到组件对应的字段上。无需修改数据源中的字段,就可以实现数据的实时匹配。也可以单击 图标对字段分别样式配置。过滤器 打开 过滤器,...

大数据安全治理的难点

需要了解哪些资产需要被保护、资产存在的风险、企业/组织是否合规、如何处理内放攻防、如何落地安全运营等关键问题,才能有效落地数据安全治理。同时,大数据系统基于“存储、用户、入口、流转、交付”等多方面的特点,存在诸多安全治理...

Iceberg概述

实时机器学习 通常在机器学习场景中,需要花费大量的时间处理数据,例如,数据清洗、转换和提取特征等,还需要对历史数据和实时数据进行处理。而Iceberg简化了工作流程,整个数据处理过程是一条完整的、可靠的实时流,其数据的清洗、转换和...

独享数据服务资源组

为保证用户创建并封装在数据服务中的API在被外部应用调用时,能达到高QPS以及满足可用性保障,企业需要使用独享数据服务资源以确保调用的高效和可靠。独享数据服务资源给用户提供了专属的计算资源和环境隔离,提升企业高并发接口处理效率,...

产品优势

数据集成需要开发 数据集成需要开发 日志服务(SLS)通过 LTS(原BDS)服务介绍,支持实时订阅SLS数据到Lindorm。数据集成需要开发 数据集成需要开发 服务能力 可用性SLA 提供SLA保障,单集群99.9%,双集群高可用99.99%。...

账单数据订阅及查询分析

步骤二:订阅账单数据大数据分析>数据订阅管理 区域,根据需要订阅相应账单数据,订阅后,相关账单数据会同步至指定的MaxCompute表。说明 该操作需要当前登录账号为账单分析指定的DataWorks工作空间(即步骤一中,由平台统一创建的工作...

常见问题

什么Redis内存报警与监控的内存使用率不一致 如何解决Redis内存使用率突然升高 如何搜索Key 查看Redis集群实例的架构图和监控数据 查看Redis集群子实例内存 查看当前账号所有实例内存的使用信息 使用memtier-benchmark测试Redis集群版...

C100售前支持相关问题

数据库审计和其他产品的区别 数据库审计产品相对于自己安装Packetbeat抓取流量审计和RDS数据库自带的SQL洞察功能,有以下区别:支持的数据库协议:数据库审计产品是专注于数据库协议解析的,支持的数据库协议更丰富,解析的粒度更细。数据...

Catalog概述

本文为您介绍什么是Catalog(数据目录),以及如何使用Catalog查询内外部数据。基本概念 内部数据:保存在StarRocks中的数据。外部数据:保存在外部数据源(例如,Apache Hive、Apache Iceberg和Apache Hudi)中的数据。Catalog StarRocks ...

DataWorks V3.0

发布版本:DataWorks V3.0 发布时间:2019年12月18日 发布范围:全球所有已开通DataWorks的地域 发布内容:DataWorks V2.0仅支持MaxCompute计算引擎,DataWorks V3.0全新升级了多引擎架构,在MaxCompute的基础上,新增开源大数据引擎E-...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 数据传输服务 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用