网络连通方案 DataWorks资源组本质上为一组阿里云ECS实例,在运行数据集成、数据开发等任务时,需保障资源组与数据源之间的网络是连通的,且不会因为白名单等特殊安全访问设置阻断资源组与数据源之间的网络连通性。网络连通 公共资源组支持...
ApsaraDB for OceanBase数据源提供读取和写入ApsaraDB for OceanBase数据的双向功能,您可以使用ApsaraDB for OceanBase数据源配置同步任务同步数据。本文为您介绍DataWorks的ApsaraDB For Oceanbase数据同步能力支持情况。支持的版本 离线...
您需先将您的AnalyticDB for MySQL数据库创建为DataWorks的AnalyticDB for MySQL数据源并绑定至数据开发(DataStudio),才可通过AnalyticDB for MySQL数据源访问AnalyticDB for MySQL数据,进行后续的开发操作。详情请参见 创建AnalyticDB...
本文为您介绍如何使用独享数据集成资源,将您在ECS上自建的MySQL数据库中的数据,迁移到MaxCompute。前提条件 已拥有至少一个绑定专有网络VPC的ECS(请勿使用经典网络),并在ECS上安装好MySQL数据库,数据库中已创建好用户和测试数据。...
工作组是 数据资源平台 进行数据研发的基本单元,用于数据隔离的命名空间,通常为一个用户组、一个项目或一个应用。在使用 数据资源平台 时,可以通过创建工作组来隔离数据,对数据进行分域管理,以达到各工作组之间空间隔离的效果。本文...
数据资源平台提供了完善的权限管控机制,支持以租户或工作组为管控粒度,通过对用户授予不同的角色实现全局或工作组内的各组件功能权限管控。本文为您详细介绍租户、工作组粒度下的角色体系。背景信息 数据资源平台功能权限是基于角色的...
工作组是 企业数据智能平台 进行数据研发的基本单元,用于数据隔离的命名空间,通常为一个用户组、一个项目或一个应用。在使用 企业数据智能平台 时,可以通过创建工作组来隔离数据,对数据进行分域管理,以达到各工作组之间空间隔离的效果...
表组是一系列可发生关联的数据表的集合,分析型数据库MySQL版(AnalyticDB MySQL版)为管理相关联的数据表,引入表组的概念。说明 创建 AnalyticDB MySQL版 数据库时,系统自动创建维度表组。注意事项 表组名以字母开头,字母或数字结尾...
在 数据输出预览 窗口,您可以根据需要修改输入数据,或者单击 手工构造数据 按钮自定义输入数据,然后单击 预览 按钮,查看当前数据处理节点对数据的处理结果,当数据处理节点处理异常,或者产生脏数据时,也会实时反馈异常信息,能够帮助...
您可以选择其中一种方式,也可以将这三种方式结合起来使用:大数据量场景,可根据Logstash节点数乘以消费者线程数评估Kafka的topic分区数。说明 分区数并不是越多越好,分区本身也有自己的开销。使用相同的group_id运行多个Logstash实例,...
本文介绍如何在企业数据智能平台添加用户以及数据源。注意事项 请使用角色为 租户管理员 的账号进行 添加用户 和 添加数据源 操作。如果您是第一次使用企业数据智能平台,请使用阿里云账号进行 添加用户 和 添加数据源 操作。添加用户 登录...
一组EIU,也就是一个存储节点组,其中包含三个存储节点。您可以在创建集群时购买EIU,也可以在高吞吐写入或大数据量扫描时购买或扩容EIU。EIU的性能指标,请参见 弹性IO资源(EIU)扩容。ACU ACU,全称为AnalyticDB Compute Unit,是 ...
要访问外部数据,我们需要建立一个外部服务器对象,它根据它所支持的外部数据包装器所使用的一组选项定义了如何连接到一个特定的外部数据源。接着我们需要创建一个或多个外部表,它们定义了外部数据的结构。一个外部表可以在查询中像一个...
独享资源组使用场景 独享调度资源组使用场景 独享数据集成资源组使用场景 独享资源组网络配置 独享资源组访问VPC环境下数据的前提条件是什么?如何查看数据源的网络环境?添加独享资源组白名单 独享资源组商业化行为 如何对资源组进行续费...
背景信息 向量检索服务关联角色(AliyunServiceRoleForDashVector)是访问控制提供的一种服务关联角色,用于授权向量检索服务访问专有网络资源的权限,使用该权限查询专有网络、安全组和可用区信息,以便完成内网访问。更多关于服务关联...
性能数据展示 在2xlarge、4xlarge、8xlarge的ECS上测试DBFS性能,测试分为两组,一组在ESSD+ext4上构建MySQL,另一组在DBFS上构建MySQL。对两组采用相同的测试参数,从测试得出的数据中可以看出,MySQL on DBFS在性能的优势明显。下面是...
本文为您介绍如何使用独享数据集成资源,将您在ECS上自建的MySQL数据库中的数据,迁移到MaxCompute。前提条件 已拥有至少一个绑定专有网络VPC的ECS(请勿使用经典网络),并在ECS上安装好MySQL数据库,数据库中已创建好用户和测试数据。...
什么是倒排索引 倒排索引也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。通过倒排索引,可以快速定位单词所在...
什么是倒排索引 倒排索引也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。通过倒排索引,可以快速定位单词所在...
计费 使用DataWorks的数据服务功能创建数据API后,API调用请求需使用数据服务资源组,数据服务资源组包括公共资源组与独享资源组两类,您可以根据业务需要选用,对应资源组的计费详情请参见 独享数据服务资源组计费说明:包年包月、公共...
任务类型 所用资源组 资源组介绍及计费说明 调度任务 公共调度资源组 使用公共资源组 公共调度资源组计费说明:按量付费 数据集成任务 公共数据集成(调试)资源组 使用公共资源组 公共数据集成(调试)资源组:按量计费 调用数据服务API ...
工作组分析员:可使用工作组内的数据进行数据分析等操作。元数据读取:可访问工作组内云计算资源的元数据信息。数据读取:可访问工作组内云计算资源的元数据信息和数据信息。数据变更:可访问工作组内云计算资源的元数据信息和数据信息,...
工作组分析员:可使用工作组内的数据进行数据分析等操作。元数据读取:可访问工作组内云计算资源的元数据信息。数据读取:可访问工作组内云计算资源的元数据信息和数据信息。数据变更:可访问工作组内云计算资源的元数据信息和数据信息,...
大数据集场景下优先考虑稀疏索引:如果您的数据量非常地大,并且您的查询限定条件为<、、=、>=、>,需要从大数据量的表中取出少于50%的数据,那么使用稀疏索引(BRIN Index或者AOCS表的metascan)可以极大地减少无效数据的加载。...
您可以通过在数据库内使用smlar插件来高效计算数据相似度,smlar插件还提供了支持GiST和GIN索引的相似度运算符。前提条件 支持的 PolarDB PostgreSQL版 的版本如下:PostgreSQL 14(内核小版本14.5.1.0及以上)PostgreSQL 11(内核小版本1....
使用场景 云数据库HBase全面提供海量半结构/非结构化数据下的实时存储、高并发吞吐、轻SQL分析(参见 云原生多模数据库Lindorm)、全文检索(参见Lindorm产品)等能力,结合完备的工具服务,丰富的生态融合,一站式高效满足企业在大数据量...
通过创建多个消费组,您可以对同一个数据源的数据进行重复消费,从而降低数据订阅的使用成本,提升数据消费速度。注意事项 一个数据订阅实例最多可以创建20个消费组,通过创建多个消费组可以实现数据的重复消费。一个消费组只能创建一个...
您可以通过在数据库内使用smlar插件来高效计算数据相似度,smlar插件还提供了支持GiST和GIN索引的相似度运算符。简介 smlar是 PolarDB PostgreSQL版(兼容Oracle)的一款开源第三方插件,提供了可以在数据库内高效计算数据相似度的函数,并...
您可以通过在数据库内使用smlar插件来高效计算数据相似度,smlar插件还提供了支持GiST和GIN索引的相似度运算符。注意事项 由于smlar插件的%操作符与RUM插件的%操作符冲突,因此smlar与RUM两个插件无法同时创建在同一个schema中。简介 smlar...
您可以通过在数据库内使用smlar插件来高效计算数据相似度,smlar插件还提供了支持GiST和GIN索引的相似度运算符。注意事项 由于smlar插件的%操作符与RUM插件的%操作符冲突,因此smlar与RUM两个插件无法同时创建在同一个schema中。简介 smlar...
AnalyticDB PostgreSQL版 向量分析可以通过AI算法提取非结构化数据的特征,并利用特征向量作为非结构化数据的唯一标识,帮您快速且低成本地实现对非结构化数据检索和对结构化数据关联分析。向量数据库简介 在现实世界中,绝大多数的数据都...
时空检索是指基于空间元数据从空间和时间两个范围统一检索数据,检索结果支持查看详情和下载。前提条件 已添加空间元数据,具体操作,请参见 添加数据。操作步骤 登录 数据资源平台控制台。在页面左上角,单击 图标,选择 协同。在顶部菜单...
在数据集成任务高并发执行且无法错峰运行的情况下,需要专有的计算资源组来保障数据快速、稳定的传输时,建议您选择使用DataWorks的独享数据集成资源组。本文为您概要介绍独享数据集成资源组。功能介绍 独享数据集成资源组的功能亮点如下:...
前两个变体向一个组增加用户或者从一个组中移除用户(为了这个目的,任何角色都可以扮演“用户”或者“组”)。这些变体实际上等效于在被称为“组”的角色中授予或者回收成员关系,因此最好的方法是使用 GRANT 或者 REVOKE。第三种变体会...
操作流程 从购买至使用独享数据服务资源组,您需进行的主要操作流程如下:购买独享数据服务资源组 绑定归属工作空间 网络连通与白名单配置 网络联通测试 应用示例:独享数据服务资源组 购买独享数据服务资源组 登录 DataWorks管理控制台。...
本文介绍索引数据的描述文件(Ingestion Spec文件)。Ingestion Spec(数据格式描述)是Druid对要索引数据的格式以及如何索引该数据格式的一个统一描述,它是一个JSON文件,一般由三部分组成。{"dataSchema":{.},"ioConfig":{.},...
如果您需要使用独享数据集成资源组通过内网同步ECS自建的数据库,您需要为独享数据集成资源组做相关的网络配置,详情可参见 新增和使用独享数据集成资源组,连通方案核心点为:独享数据集成资源组绑定ECS所在VPC,会自动添加一个路由指向...
中数据场景 数据来源阿里巴巴智能引擎事业部团队,2022年11月 OpenSearch向量检索版VS开源引擎性能:大数据场景 数据来源阿里巴巴智能引擎事业部团队,2022年11月 优势二:低成本:采用多种方式优化存储成本、减少资源消耗 数据压缩:可将...
中数据场景 数据来源阿里巴巴智能引擎事业部团队,2022年11月 OpenSearch向量检索版VS开源引擎性能:大数据场景 数据来源阿里巴巴智能引擎事业部团队,2022年11月 优势二:低成本:采用多种方式优化存储成本、减少资源消耗 数据压缩:可将...
简介 从数据库中检索数据的过程或命令叫做查询。在 SQL 里SELECT命令用于指定查询。SELECT 命令的一般语法是[WITH with_queries]SELECT select_list FROM table_expression[sort_specification]下面几个小节描述选择列表、表表达式和排序...