Hash Clustering

这时的实现方法是:先按照Join Key做Hash Shuffle,然后再按照Join Key做排序(Sort),最后对Join双方做一个归并,具体流程如下图所示:实际上对于MaxCompute目前数据量和规模,绝大多数情况下都是使用的Sort Merge Join,但这其实是非常...

排序

但如果本身存储的数据已经按照某个字段预先排序,检索性能会有明显提升,在大数据量上的对比尤为明显。因此,使用预排序功能够大幅度提升数据检索性能,优化搜索引擎的服务能力。本章节介绍使用预排序功能的操作步骤。操作步骤 修改...

权重配置

返回 1.1.XX.XX Region5 访问,返回 2.2.XX.XX Region6 访问,返回 3.3.XX.XX …… 权重设置效果 权重配置开启后,进行权重设置,在DNS请求应答中,IP地址按照预先设置的权重进行返回,可以实现将解析流量按照权重进行分配。例如,将上述3...

排序和翻页

使用场景 分类 使用方式 功能 使用场景 排序 创建时指定排序方式 IndexSort(索引预排序)多元索引默认按照设置的索引预排序(IndexSort)方式进行排序,用于确定数据的默认返回顺序。查询时指定排序方式 ScoreSort(分数排序按照查询...

基本概念

DBGateway:DBGateway是部署在用户环境中的守护进程,负责数据库性能数据的采集和计算。但它不读取业务数据,且数据传输会进行加密压缩。更多关于DBGateway的信息,请参见 DBGateway简介。索引:索引是数据库管理系统对数据库表中一个或多...

JindoCube使用说明

Optional Step 设置每次触发构建任务的数据筛选条件,通过指定时间类型的字段,配合触发策略中的间隔时间,可以实现按照时间间隔增量的更新Cache。如果不选择,每次全量更新Cache。Step By:选择增量更新字段类型,只支持时间类型字段,...

JindoCube使用说明

Optional Step 设置每次触发构建任务的数据筛选条件,通过指定时间类型的字段,配合触发策略中的间隔时间,可以实现按照时间间隔增量的更新Cache。如果不选择,每次全量更新Cache。Step By:选择增量更新字段类型,只支持时间类型字段,...

JindoCube使用说明

Optional Step 设置每次触发构建任务的数据筛选条件,通过指定时间类型的字段,配合触发策略中的间隔时间,可以实现按照时间间隔增量的更新Cache。如果不选择,每次全量更新Cache。Step By:选择增量更新字段类型,只支持时间类型字段,...

JindoCube使用说明

Optional Step 设置每次触发构建任务的数据筛选条件,通过指定时间类型的字段,配合触发策略中的间隔时间,可以实现按照时间间隔增量的更新Cache。如果不选择,每次全量更新Cache。Step By:选择增量更新字段类型,只支持时间类型字段,...

JindoCube使用说明

Optional Step 设置每次触发构建任务的数据筛选条件,通过指定时间类型的字段,配合触发策略中的间隔时间,可以实现按照时间间隔增量的更新Cache。如果不选择,每次全量更新Cache。Step By:选择增量更新字段类型,只支持时间类型字段,...

JindoCube使用说明

Optional Step 设置每次触发构建任务的数据筛选条件,通过指定时间类型的字段,配合触发策略中的间隔时间,可以实现按照时间间隔增量的更新Cache。如果不选择,每次全量更新Cache。Step By:选择增量更新字段类型,只支持时间类型字段,...

JindoCube使用说明

Optional Step 设置每次触发构建任务的数据筛选条件,通过指定时间类型的字段,配合触发策略中的间隔时间,可以实现按照时间间隔增量的更新Cache。如果不选择,每次全量更新Cache。Step By:选择增量更新字段类型,只支持时间类型字段,...

实现动态数据加和

本文以 数字翻牌器 组件展示其他两个数字翻牌器组件的实时数据相加结果为例,实现动态数据加和效果。效果展示 操作步骤 登录 DataV控制台。选择任一可视化应用,单击编辑,进入画布编辑器页面。添加3个 数字翻牌器 组件到画布中。单击任一...

修改名单抽奖数据

本文为您介绍在DataV名单抽奖模板可视化应用中修改抽奖名单具体数据的方法。前提条件 已完成可视化应用的创建,详情请参见 创建模板可视化应用。背景信息 本案例默认使用的是静态数据源,因此可以直接在组件的数据配置区域粘贴准备好的数据...

修改名单抽奖数据

本文为您介绍在DataV名单抽奖模板可视化应用中修改抽奖名单具体数据的方法。前提条件 已完成可视化应用的创建,详情请参见 创建模板可视化应用。背景信息 本案例默认使用的是静态数据源,因此可以直接在组件的数据配置区域粘贴准备好的数据...

分组排序

本文介绍分组排序算子的使用方法和注意事项。用途 分组排序算子按照指定的字段进行分组,并对分组内的数据按照指定的顺序进行排序输出。适用场景 计算链路 计算引擎 是否支持 离线 MaxCompute 是 Hive 是 HiveStorage 是 RDS/MySQL 否 使用...

验证读写分离

在您开通并配置了数据库代理服务后,可通过本文介绍的方法验证读写请求是否按照配置的比例进行分流,实现读写分离。验证流程 在本例中,以ECS实例通过内网连接RDS MySQL实例为例进行验证。主要步骤如下:在RDS控制台将只读实例的读写分离...

排序

本文为您介绍推荐解决方案-排序实现方法。前提条件 已运行推荐解决方案-特征工程工作流模板生成排序需要的数据集,具体操作请参见 特征工程。rec_sln_demo_user_table_preprocess_all_feature_v2 rec_sln_demo_item_table_preprocess_all...

并行创建空间索引

本功能采用空间排序(GiST Sort)的方法,可将索引构建过程并行化,并大幅减少磁盘的读写操作,实现索引构建加速。注意事项 空间排序方法仅适用于点数据(Point),其他空间类型的数据使用此方法将会降低索引的查询性能。使用方法 说明 ...

排序和翻页

使用场景 分类 使用方式 功能 使用场景 排序 创建时指定排序方式 IndexSort(索引预排序)多元索引默认按照设置的索引预排序(IndexSort)方式进行排序,用于确定数据的默认返回顺序。查询时指定排序方式 ScoreSort(分数排序按照查询...

并行创建空间索引

本功能采用空间排序(GiST Sort)的方法,可将索引构建过程并行化,并大幅减少磁盘的读写操作,实现索引构建加速。注意事项 空间排序方法仅适用于点数据(Point),其他空间类型的数据使用此方法将会降低索引的查询性能。使用方法 说明 ...

算子

上下游Stage间传输数据的方法有如下几种:Broadcast:表示上游Stage中每个计算节点的数据都会复制到所有下游Stage的计算节点。Repartition:表示上游Stage中每个节点的数据会按照固定的规则切分后,再分发到下游Stage的指定计算节点。...

排序和翻页

使用场景 分类 使用方式 功能 使用场景 排序 创建时指定排序方式 索引预排序 多元索引默认按照设置的索引预排序(IndexSort)方式进行排序,用于确定数据的默认返回顺序。查询时指定排序方式 ScoreSort(分数排序按照查询结果的相关性...

排序文件

您可以通过拖动文件夹或文件夹内的文件位置,对文件夹或文件进行排序。操作步骤 点击左侧导航栏中的 自定义监控。在自定义监控区域,按照以下方法进行排序排序文件:选取目标数据源,点击进入文件夹,点击右上角的 文件排序,拖拽文件...

排序和翻页

使用场景 分类 使用方式 功能 使用场景 排序 创建时指定排序方式 IndexSort(索引预排序)多元索引默认按照设置的索引预排序(IndexSort)方式进行排序,用于确定数据的默认返回顺序。查询时指定排序方式 ScoreSort(分数排序按照查询...

动态修改schema

如果由于业务变更、性能优化等情况需要在多元索引中新增、更新或者删除索引列以及修改多元索引的路由键和预排序方式,您可以通过动态修改多元索引的schema实现。动态修改schema操作包括为源索引创建灰度索引并修改多元索引schema、等待表...

SET

某些UDF在内存计算、排序数据量比较大时,会报内存溢出错误,这时候可以调大该参数,但该方法只能暂时缓解,您需要从业务上去优化UDF代码。取值范围:256 MB~12288 MB。默认值为1024 MB。odps.sql.udf.timeout 设置UDF超时时间。取值范围...

全匹配查询

MatchAllQuery可以匹配所有行,常用于查询表中数据总行数,或者随机返回几条数据。前提条件 已初始化OTSClient。具体操作,请参见 初始化。已创建数据表并写入数据。已在数据表上创建多元索引。具体操作,请参见 创建多元索引。参数 参数 ...

排序和翻页

使用场景 分类 使用方式 功能 使用场景 排序 创建时指定排序方式 IndexSort(索引预排序)多元索引默认按照设置的索引预排序(IndexSort)方式进行排序,用于确定数据的默认返回顺序。查询时指定排序方式 ScoreSort(分数排序按照查询...

配置数据库代理连接地址访问策略

前提条件 已开通数据库代理 配置代理连接地址访问策略 说明 您可以通过使用不同代理连接地址ID绑定的内、外网地址来访问RDS MySQL数据库实例,以实现不同的业务逻辑。访问 RDS实例列表,在上方选择地域,然后单击目标实例ID。在左侧导航栏...

行转列及列转行最佳实践

数据开发、分析的过程中,您可能需要在不同维度下展示数据或为了符合某些数据表格式要求,此时需要对数据行转列或列转行。本文以一个具体示例为您介绍在MaxCompute中实现行转列、列转行的SQL。背景信息 行转列与列转行的示意图如下。行转...

负载均衡

在实际使用时,业务流量会根据用户所配置的权重逐步变化(相比完全按照权重轮询会需要更多的时间)。操作步骤 说明 初始时每个后端节点的权重默认相同,即均为1。权重的可配置范围为0~100。当权重为0时,正常情况下请求不会再路由到该节点...

设置列索引的排序

本文介绍了列存索引数据的排序流程、使用方法以及构建和查询有序列存索引数据的时间对比等内容。简介 列存索引数据是按照行组进行组织,默认包含64K行。每个行组中不同的列会各自打包形成列数据块,列数据块按照行存原始数据的主键次序并行...

创建多元索引

多元索引按照数据表主键进行预排序且数据永不过期。private static void createSearchIndex(SyncClient client){ CreateSearchIndexRequest request=new CreateSearchIndexRequest();设置数据表名称。request.setTableName("<TABLE_NAME>")...

事件中心

数据库日常运维中,您可以通过查看数据库实例中计划执行、正在执行和已执行完成的性能事件(例如异常事件、优化事件、弹性伸缩事件等),及时且全面地了解数据库的性能问题及相关的运维操作。本文介绍如何通过数据库自治服务DAS的性能...

pg_statistic

比如,一个柱面图槽位会用<操作符,该操作符定义了该数据的排序顺序。stacoll N oid 排序规则用于导出存储在第 N 个“槽”中的统计信息。例如,可排序列的直方图槽将显示定义数据排序顺序的排序规则。对于不可整理数据,为零。stanumbers N...

使用参考

注意 说明 事件监听根据监听的范围不同会产生一定的消耗,监听的范围越大,产生的消耗也越大监听事件触发时会返回 ref 下所有数据,请避免在会返回大量数据的 ref 上进行监听,如只关心变化事件,可使用 ref.orderByXXX().limitToFirst()等...

教育搜题

示例 1)OCR识别可能会把一些非题目要素识别进来干扰query分析的结果,这时候可以使用词权重干预的方式保证非题目要素字段被打标成低权重,保证召回和排序效果 2)用户可以自定义同义词来扩召回,例如"立方米"->"吨"排序定制 系统开放了两...

多元索引介绍

多元索引基于倒排索引和列式存储,可以解决大数据的复杂查询难题,包括非主键列查询、全文检索、前缀查询、模糊查询、多字段自由组合查询、嵌套查询、地理位置查询、统计聚合(max、min、count、sum)等功能。多元索引在车联网场景中主要...

管理域名策略

总体上会按照 用户白名单筛选>地域筛选>运营商筛选>优先级排序>加权随机选一个 这样的过滤顺序返回 IP 列表。修改域名调度策略 进入 移动开发平台 mPaaS 控制台,选择目标应用,完成以下步骤修改域名策略信息。在左侧导航栏点击 后台服务>...
共有197条 < 1 2 3 4 ... 197 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 智能开放搜索 OpenSearch 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用