DQL操作常见问题

说明 海量数据的全排序,对性能的影响非常,而且很容易造成内存溢出问题,请尽量避免执行该操作。MaxCompute是否支持ORDER BY FIELD NULLS LAST语法?MaxCompute不支持此语法。MaxCompute支持的语法请参见 与其他SQL语法的差异。执行...

什么是智能众包

人工智能众包(AI Crowdsourcing)基于共享人力资源模式,为人工智能算法提供数据采集、清洗、标注等服务,帮助企业快速构建算法数据集。人工智能众包(AI Crowdsourcing)基于共享人力资源模式,为人工智能算法提供数据采集、清洗、标注等...

DataWorks on EMR数据安全方案

大数据领域,阿里云为企业用户提供了一整套数据安全方案,包含用户认证、数据权限、大数据作业管理体系等。本文以联合使用DataWorks与EMR为例,为您介绍DataWorks on EMR场景下的数据安全方案。背景信息 DataWorks on EMR目前支持LDAP...

发展历程

关键性里程碑 2009年9月,ODPS(即现在的MaxCompute)大数据平台飞天项目正式启动。2010年10月,阿里巴巴集团自主研发的第一代云计算平台稳定运行。2013年8月,平台的单集群规模已达到5000台。2014年7月,平台开始对外提供服务,完全替换...

2021年

并行查询 排序加速计算 当您执行 SORT后,系统会对表数据进行排序,当数据完成排序后,AnalyticDB PostgreSQL 即可利用数据的物理顺序,将SORT算子下推到存储层进行计算加速。该特性可以基于SORT KEY加速SORT、AGG、JOIN算子。排序加速计算...

数据重排

在MaxCompute的使用过程中,如果已经积累了大量数据占用了大量存储资源,且已经通过削减数据存储生命周期和删除非必要数据等方式进行了治理,在您的存储预算有限,计算资源还有冗余的情况下,可以考虑使用数据重排方式对存储空间进行优化。...

实施步骤

本文主要介绍搭建DataV数据大屏的操作步骤。步骤一:购买DataV基础版 登录 DataV管理控制台,本教程使用 兼容MySQL 方式连接DLA服务,所以购买DataV基础版即可满足要求。步骤二:添加DLA数据源 在添加数据源之前,您必须先为您的DLA配置白...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

填充数据库

第一次填充数据库时可能需要插入大量的数据。本节包含一些如何让这个处理尽可能高效的建议。1.禁用自动提交 在使用多个 INSERT 时,关闭自动提交并且只在最后做一次提交(在普通 SQL 中,这意味着在开始发出 BEGIN 并且在结束时发出 COMMIT...

DAS Auto Scaling弹性能力

数据库自治服务DAS的Auto Scaling是以数据库实例的实时性能数据作为输入,由DAS完成流量异常发现、合理数据库规格建议和合理磁盘容量建议,使数据库服务具备自动扩展存储和计算资源的能力。背景信息 为业务应用选择一个合适的数据库计算...

客户案例

客户简介 狗打车则一直坚持通过“连接网络化”、“运力共享化”、“过程数据化”、“匹配智能化”等数字信息化解决方案,将闲散运力统一整合到平台上,通过大数据将运力精准匹配市场需求,实现运力的节能减排,降低空驶率,有效提升行业...

模型配置

算法模型的优劣依赖于训练数据数据质量越高,数据量越算法效果越好。算法模型使用的行为数据集的数据要求与一般数据集有所不同,请参见 行为数据集样例 准备数据数据存储于ADB3.0类型的数据源中,且数据源已接入Quick Audience,请...

模型配置

算法模型的优劣依赖于训练数据数据质量越高,数据量越算法效果越好。算法模型使用的行为数据集、商品标签数据集的数据要求与一般数据集有所不同,请分别参见 行为数据集样例、商品标签数据集样例 准备数据。行为数据集、商品标签数据...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

创建算法实例

背景信息 物联网平台数据服务针对每个数据智能算法提供以下额度,作为算法运行的规格资源。算法实例的总规格资源为 购买数量*单规格支持的额度。算法类型 单规格支持的额度 I-V曲线诊断 支持 100个 光伏阵列的I-V曲线诊断。功率时序曲线...

自媒体:易撰

所属行业:自媒体 网站地址:易撰 客户介绍 长沙营智信息技术有限公司是专业的新媒体大数据服务商,其旗下知名品牌易撰,基于新媒体大数据挖掘技术及NLP算法分析,为各内容创客、广告主提供全面、科学、精准的大数据分析服务以及大数据架构...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

数据智能概述

物联网数据服务提供数据智能功能,协助您更好的解读设备数据,了解设备运行状况。功能简介 算法实例 通过配置算法实例,来分析光伏电站运维数据或...后续步骤 查看算法实例运行记录,维护算法数据产出。具体操作,请参见 查看实例运行日志。

测试数据构建

数据管理DMS的测试数据构建功能拥有强大的算法引擎,支持批量生成各类随机值、地区名、虚拟IP地址等信息,可以大大减轻准备测试数据的负担。本文介绍构建测试数据的方法。前提条件 支持的数据库类型:MySQL:RDS MySQL、PolarDB MySQL版、...

快速开始

DataV-Card可视分析创作间是一款面向高频数据处理的业务人员、零代码的数据可视分析产品,提供简单、直观、易于使用的数据准备、洞察发现、可视化分析工具,通过具象、生动、有趣的方式快速理解数据,让更多用户能便捷高效地利用数据可视化...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

工作原理

日志服务提供时序预测功能,用于对时序数据进行自动化、智能化的预测。您可以根据预测结果判断时序数据未来的走势,提前感知系统或者业务关键指标的状态。本文介绍时序预测的背景信息、功能、调度与执行场景、使用建议等信息。背景信息 ...

恢复数据库

数据库备份DBS 提供数据恢复能力,通过创建恢复任务将已完成备份的数据恢复到云数据库、本地数据库或DBS沙箱中,可用于误操作后恢复以及分析历史数据等场景。前提条件 DBS备份计划的运行状态为 运行中。已完成数据库备份。相关操作,请参见...

云产品集成

您可以使用 DMS 录入云数据库 OceanBase 的数据,通过 DMS 的全域数据资产管理、数据治理、数据库设计开发、数据集成、数据开发和数据消费等功能,帮助企业高效、安全地挖掘数据价值,助力企业数字化转型。什么是数据管理DMS 支持的数据库...

东软案例

如下图所示,阿里Lindorm数据库在赋能政企数字运维团队更强大的运维大数据分析能力的同时,幅度提升了政府、企业数字系统性能和在线服务的客户数字体验,降低了低价值密度监控数据存储管理成本。图 1.阿里云Lindorm数据库驱动的IT运维...

概述

解决方案 T+1全量同步一键建仓是指通过DLA控制台配置数据源(RDS、PolarDB for MySQL、MongoDB数据源、ECS自建数据数据)和目标OSS数据仓库,系统按照您设定的数据同步时间自动、无缝的帮您把数据源中的数据同步到目标数据仓库OSS中,...

机器学习开发示例

数据展示%pyspark#数据展示 ml_data.show()ML算法数据打印 步骤四:建立模型、运行线性回归模 说明 在本部分中,您将使用不同的正则化参数运行两个不同的线性回归模型,以基于人口(features)确定这两个模型中的任何一个对销售价格(label...

数据仓库研发规范概述

大数据时代,规范地进行数据资产管理已成为推动互联网、大数据、人工智能和实体经济深度融合的必要条件。贴近业务属性、兼顾研发各阶段要点的研发规范,可以切实提高研发效率,保障数据研发工作有条不紊地运作。而不完善的研发流程,会...

逻辑备份、物理备份与快照

本文介绍逻辑备份、物理备份与快照的区别,以及使用 数据库备份DBS 控制台创建备份计划时如何选择备份方式。常用的数据备份方式为逻辑备份、物理备份与快照:逻辑备份:数据库对象级备份,备份内容是表、索引、存储过程等数据库对象,常见...

数据集成支持的数据

离线集成支持的数据数据源 读取 写入 大数据存储型数据源 MaxCompute 支持 支持 Hive 支持 支持 Hologres 支持 支持 IMPALA 支持 支持 TDH Inceptor 支持 支持 Kudu 支持 支持 StarRocks 支持 支持 Hudi 支持 支持 Doris 支持 支持 ...

功能简介

数据查询为用户提供对云计算资源中物理表基本情况的概览能力,帮助用户直观了解物理表基础信息、字段内容分布等情况,建立对数据表的宏观理解,为建立数据标准、定义数据模型、定义数据加工逻辑等工作提供基础依据。数据导入 支持512 MB...

数据导入概览

从阿里云对象存储OSS导入数据至图数据库GDB实例 图数据库GDB服务端集成有数据导入模块,可以获取您提供的.csv格式的OSS数据文件,并将其解析为图中的点数据和边数据,然后将点数据和边数据导入至图数据库GDB实例。步骤 步骤说明 ① 将需要...

Beam排序优化(7.0版)

设置多维排序键时,排序键列的基数不宜过高,同时数据量越时,多维排序的效果越明显。Beam组合排序键和多维排序键查询效果对比 以下是对数据量1 TB的SSB Benchmark中 lineorder_flat Beam表分别建立的组合排序键和多维排序键后,对比不同...

数据恢复方案概览

如果您误释放了RDS MySQL实例、误删除或修改了实例的数据、或有将备份文件恢复到云上或本地的需求等,可参考本文选择合适的MySQL数据恢复方案。场景一:恢复误释放的实例 回收站:进入 回收站,并 选择地域。如果在回收站里找到实例,可以...

数据查询

数据查询为用户提供对云计算资源中物理表基本情况的概览能力,帮助用户直观了解物理表基础信息、字段内容分布等情况,建立对数据表的宏观理解,为建立数据标准、定义数据模型、定义数据加工逻辑等工作提供基础依据。如果数据表格存储的是...

数据分析整体趋势

大数据数据库一体化:早期大数据技术以牺牲一定程度一致性为基础提供分布式能力,解决了传统单机数据库的扩展性不足问题,在MapReduce基础上提供了标准SQL接口,架构上也逐步采用了部分MPP数据库技术;另一方面,分布式数据库也快速发展...

Delta Lake概述

Delta Lake以数据为中心,围绕数据流走向(数据从流入数据湖、数据组织管理和数据查询到流出数据湖)推出了一系列功能特性,协助您搭配第三方上下游工具,搭建快捷、易用和安全的数据湖。背景信息 通常的数据湖方案是选取大数据存储引擎...

数据源和项目协同

背景信息 项目管理员创建一个项目成员后,项目成员可以创建数据源,并在项目中添加数据源中的数据库后,即可进行数据库变更任务。系统管理员在 Web 版 ODC 中创建项目,并为该项目指定成员。系统管理员或者拥有新建数据源角色权限的项目...

数据扫描和识别

支持扫描的数据源类型如下:结构化数据:RDS、PolarDB、PolarDB-X、MongoDB、OceanBase、自建数据库 非结构化数据:OSS 大数据:TableStore、MaxCompute、ADB-MYSQL、ADB-PG 数据源授权完成后需要多长时间完成扫描?DSC 完成数据源授权后,...

行业算法版介绍

通过内置各行业的查询语义理解、机器学习排序算法等能力,提供充分开放的引擎能力,助力开发者快速搭建智能搜索服务。OpenSearch-行业算法版架构 SAAS平台,开发者可以通过控制台或API与系统交互。场景化配置,开发者仅需创建应用实例,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 数据库备份 DBS 云原生大数据计算服务 MaxCompute 云数据库 RDS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用