个性化推荐基于用户的历史行为习惯,商品、电影本身的属性等数据集,这些数据之间相互关联,应用推荐策略时需要利用这些数据之间复杂的关联关系,因此使用图数据库来存储这些数据是非常合适的。建模 本文以书籍的个性化推荐举例,来说明...
DataWorks的数据上传功能支持将本地文件、数据分析的电子表格、OSS文件等数据上传至MaxCompute、EMR Hive、Hologres等引擎进行分析及管理,为您提供便捷的数据传输服务,助力您快速实现数据驱动业务。本文为您介绍如何使用数据上传功能上传...
工作流任务可以与其它工作流任务、节点任务配置依赖关系,组成DAG图。说明 从DataWorks V1.0升级的任务,仍保留工作流的概念。DataWorks V2.0及以上版本已无法创建工作流任务,您可选择创建 业务流程 进行后续操作。内部节点(innerNode)...
数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据。数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...
Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,一站式提供数据采、建、管、用全生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据中台。Dataphin兼容多种计算...
名词分类型数据示例图 数值连续 适用于给数值型数据分配连续渐变颜色的情况,且数值和颜色在映射空间内为一一对应的关系。图 3.数值连续颜色模板样式 图 4.数值连续型数据示例图 数值分区 适用于在数值连续型映射的基础上,对连续的数值...
限流:考虑到速度过高可能对数据库造成过大的压力从而影响生产,数据集成同时提供了限速选项,您可以通过限流控制同步速率,从而保护读取端数据库,避免抽取速度过大,给数据库造成太大的压力。限速最小配置为1MB/S,最高上限为30MB/s。离...
垂直胶囊柱图是柱状图的一种,与基本柱图相比,垂直胶囊柱图组件支持使用堆叠的方式展示多系列数据,因此可以在较小的可视化应用空间内,智能地展示多维的数据差异。本文介绍垂直胶囊柱图各配置项的含义。配置 重要 本文介绍v3.0以下版本的...
产品特点 稳定 对于绝大部分应用而言,关系型数据库所承担的职责是整个数据管理系统中最为核心和基础的,不光直接影响到终端用户的服务体验,同时也是业务数据的最后一道保险,所以稳定性是数据库最核心的选型因素。PolarDB-X 1.0 的稳定性...
模式识别E-R 模式识别(SchemaMatching)E-R整合了阿里巴巴内部的数据识别算法能力,该算法可在已有的数据资产中自动挖掘数据库内潜在的关联关系,即使没有对数据进行任何标识也会被挖掘出来,挖掘到的关系将用于构建数据资产知识图谱。...
图表样式 多维度饼图是饼图的一种,与基本饼图相比,多维度饼图支持自定义各系列的内外半径,使数据展示更富有层次感,能够更加清晰灵活地展示更多维度的数据占比情况。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,可在 搜索配置...
包括数据检索、数据预览、查看元数据详情、查看数据血缘关系、分类分组管理数据表等操作。本文为您介绍如何在数据地图查看和管理MaxCompute表。前提条件 已绑定MaxCompute引擎至当前工作空间,绑定后DataWorks会面向引擎自动采集元数据,...
图表样式 旭日图适合用于展示不同层级的数据,能在通过饼图表示占比关系的基础上,增加表达了数据的层级和归属关系,能清晰的表达具有父子层次结构类型的数据。旭日图不适用于数据分类过多、有负值和有零值的数据展示。样式面板 搜索配置:...
图表样式 斑马柱状图是柱状图的一种,与基本柱图相比,斑马柱状图中的柱子是由不连续的可配置的线条组成,能够更加智能美观地展示多维的数据差异,但在可视化应用中占的空间较大。样式面板 搜索配置:单击 样式 面板右上角的搜索配置项图标...
实例性能 混合存储型实例的性能与实例规格以及业务中数据被访问的概率有很大的关系:实例规格越高,内存数据的访问比重越高,性能就越强。理想的场景中,所有的访问都命中内存,此时实例性能与Redis社区版实例基本一致;反之,在内存命中率...
图表样式 标注对比饼图是饼图的一种,与基本饼图相比,标注对比饼图支持真实值和百分比值的切换、多系列数据配置以及标签、图例、动画等配置,适用于比较平面化的数据占比情况展示。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,...
如上图所示,Band与Layer的关系分为三种:一个Band对应一个Layer:对于一些单波段的栅格数据,如模型的输出结果,遥感影像分析结果,每个像素一般只包括一个值,在不构建金字塔模型的情况下,每个Band对应于一个Layer。多个Band构成一个...
DataV通过与DataWorks数据服务的对接,通过交互式分析Hologres连接DataWorks数据服务开发并生成API,快速在DataV中调用API并展现MaxCompute的数据分析结果。数据服务对接DataV产生背景 MaxCompute是阿里巴巴集团自主研究的快速、完全托管的...
图表样式 梯形柱状图是柱状图的一种,能够清晰智能地展示各类别之间和各类别内部的数据差异,但在数据看板中所占空间较大。支持自定义y轴区间、多系列数据配置,以及根据数据类目自动分组展示。样式面板 搜索配置:单击 样式 面板右上角的...
基本饼图是饼图的一种,支持通过极坐标来确定图表的大小,支持图表外部的标签展示,支持真实数值和百分比值的切换,支持自定义图形样式和多系列数据配置,能够清晰智能地展示各类别的占比情况。本文介绍基本饼图各配置项的含义。配置 重要 ...
本文以OSS数据源为例,为您介绍如何通过RAM角色授权模式配置数据源,提高云上数据的安全性。前提条件 如果您需使用RAM用户登录并完成本文操作流程,请先为RAM用户授予 AliyunDataWorksFullAccess 和 AliyunRAMFullAccess 权限策略,详情请...
图表样式 斑马柱状图是柱状图的一种,与基本柱图相比,斑马柱状图中的柱子是由不连续的可配置的线条组成,能够更加智能美观地展示多维的数据差异,但在可视化应用中占的空间较大。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,可...
配置DM(达梦)输出组件,可以将外部数据库中读取的数据写入到DM(达梦),或从大数据平台对接的存储系统中将数据复制推送至DM(达梦),进行数据整合和再加工。本文为您介绍如何配置DM(达梦)输出组件。前提条件 已创建DM(达梦)数据源...
您可以选择按位置匹配或按名称匹配两种方式来匹配待上传的数据与MaxCompute表字段的对应关系。完成后,界面提示数据导入成功,您即完成了从本地上传数据至MaxCompute表中,您可以在临时查询页面中查看已上传的数据,操作请参见 创建临时...
图表样式 垂直胶囊柱状图是柱状图的一种,与基本柱图相比,垂直胶囊柱状图组件支持使用堆叠的方式展示多系列数据,因此可以在较小的可视化应用空间内,智能地展示多维的数据差异。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,可...
配置DM(达梦)输出组件,可以将外部数据库中读取的数据写入到DM(达梦),或从大数据平台对接的存储系统中将数据复制推送至DM(达梦),进行数据整合和再加工。本文为您介绍如何配置DM(达梦)输出组件。前提条件 已创建DM(达梦)数据源...
说明 编辑点和边时,需要您同时在代码中维护点与边的关系。通过迭代对图进行编辑、演化,最终求解出结果。典型应用有 PageRank、单源最短距离算法、K-均值聚类算法 等。您可以使用MaxCompute Graph提供的接口Java SDK编写图计算程序。基本...
数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据。数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...
数据导入通道与表设计 通道类型有以下几种:DataHub 规划写入的分区与写入流量之间的关系。数据达到64 MB会执行1次Commit。数据集成或DataX 规划写入表分区的频率。数据达到64 MB会执行1次Commit,以免Commit空目录。DTS 规划写入的表存量...
图表样式 旭日图适合用于展示不同层级的数据,能在通过饼图表示占比关系的基础上,增加表达了数据的层级和归属关系,能清晰的表达具有父子层次结构类型的数据。旭日图不适用于数据分类过多、有负值和有零值的数据展示。配置面板 搜索配置:...
数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据。数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...
图表样式 梯形柱状图是柱状图的一种,能够清晰智能地展示各类别之间和各类别内部的数据差异,但在可视化应用中所占空间较大。支持自定义y轴区间、多系列数据配置,以及根据数据类目自动分组展示。配置面板 搜索配置:单击 配置 面板右上角...
一、数据集成 DataWorks的数据集成模块为您提供读取和写入数据至MaxCompute的能力,您可将其他数据源的数据同步至MaxCompute数据源,或将MaxCompute数据源的数据同步至其他数据源。同时,可根据需要选择离线同步、实时同步、全增量同步任务...
点热力组件 点热力组件根据点的分布疏密和值进行热力图的构建渲染,反映数据宏观特征,不支持交互与动画。该图元的主要特征:点分布越密集或者值越高的区域,颜色越趋近于高值颜色,而且高度越高。性能开销较小,支持千级数据。数据量较多...
关系数据库全量入湖:可以实现RDS MySQL或PolarDB数据库表数据全量同步到数据湖,选择在数据源管理中配置好的数据源,将数据源对应数据库中选定表的数据全量同步到OSS中,如果待同步表中数据量大,则所消耗的资源也会比较大,建议在业务...
一、数据集成 DataWorks的数据集成模块为您提供读取和写入数据至Hologres的能力,您可将其他数据源的数据同步至Hologres数据源,或将Hologres数据源的数据同步至其他数据源。同时,可根据需要选择离线同步、实时同步、全增量同步任务等场景...
在 新建数据源 对话框的 关系型数据库 区域,选择 ClickHouse。如果您最近使用过ClickHouse,也可以在 最近使用 区域选择ClickHouse。同时,您也可以在搜索框中,输入ClickHouse的关键词,快速筛选。在 新建ClickHouse数据源 对话框中,...
附录:空间级预设角色与MaxCompute引擎权限的映射关系 2023.8.25 新增功能 数据建模 用于帮助您快速构建数据仓库模型架构图,直观展示数据仓库中各模型之间的关系。一个关系图承载一个数据仓库模型,一个账号支持创建多个关系图。关系图 ...
开始使用 一、数据建模与开发 模块 说明 相关文档 数据建模 数据建模是全链路数据治理的第一步,沉淀阿里巴巴数据中台建模方法论,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行诠释,让企业内部实现“数...
在TairSearch中使用Msearch实现索引分片搜索 在TairSearch中使用bool进行组合条件查询 Graph 图数据库GDB RedisGraph 图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的...