基础术语

中文 释义 数据抓取延迟 数据抓取延迟是指数据同步服务抓取数据并写入产品存储的时间与数据实际写入至源数据库的时间差。数据抓取延迟仅在增量同步阶段有数值。数据写入延迟 数据写入延迟是指同步到目标实例的最新数据在源数据库执行的时间...

统计功能介绍

百度数据抓取:指百度搜索引擎的数据抓取访问您的网站的次数。Google数据抓取:指Google(谷歌)搜索引擎的数据抓取访问您的网站的次数。其他数据抓取:指其他搜索引擎(如搜搜、搜狗等)的数据抓取访问您的网站的次数。3.栏目统计 3.1 在...

查看同步任务详情

在任务详情页,您可以查看以下信息:数据来源信息:上游数据抓取延迟:数据同步服务抓取数据写入存储的时间与数据实际写入至源数据库的时间差。源端数据源配置信息:包括源端数据库主机、端口、名称,数据表及用户名等。数据去向信息:下游...

产品架构

如果源数据库为RDS MySQL,那么数据抓取模块通过Binlog dump协议连接源库。日志回放模块:日志回放模块从日志读取模块中请求增量数据,并根据用户配置的同步对象进行数据过滤,然后在保证事务时序性及事务一致性的前提下,将日志记录同步到...

网络抓包

最大字节数 设置抓取数据包的最大字节数。如果数据包超过该字节数则停止抓包。需要填写最大不超过1048576的整数。时长(s)设置抓包的最长时间。单位:秒。企业版的时长为300秒;旗舰版的时长为600秒。协议 设置抓包的协议类型。可选项:...

常见问题

如何处理:参见 配置数据源(来源为PolarDB)的操作授予权限,或者检查PolarDB是否是主节点(读写库),目前实时任务不支持从PolarDB备节点抓取数据。实时任务,运行报错:...

常见问题

如何处理:参见 配置数据源(来源为PolarDB)的操作授予权限,或者检查PolarDB是否是主节点(读写库),目前实时任务不支持从PolarDB备节点抓取数据。实时任务,运行报错:...

全增量同步任务常见问题

如何处理:参见 PolarDB数据源 的操作授予权限,或者检查PolarDB是否是主节点(读写库),目前实时任务不支持从PolarDB备节点抓取数据。实时任务,运行报错:...

故障诊断

抓取性能数据 进入应用控制台,点击想查看的应用 实例 按钮,进入对应的实例即可查看 Node.js 性能平台提供的 抓取性能数据 功能,如下图所示:一般来说,如果涉及到内存泄漏的,可以抓取 堆快照,如果是 CPU 异常飙高的,可以抓取 CPU ...

负载说明

测试结果:在Linux Kernel 3.2及以上的版本,DBGateway支持以PACKET_MMAP方式(在内核空间中分配一块内核缓冲区,然后用户空间程序调用mmap映射到用户空间)更快地抓取数据包。所以DBGateway支持全量SQL功能,在Linux Kernel 3.2及以上的...

如何排查移动网关调用错误

问题描述 前提条件:客户端已经正确接入移动网关组件(MGS)。MGS 控制台已经正确配置好后端应用 API 服务。问题表现:客户端通过代码发起 PRC 调用,但未能拿到预期结果。...网络包的抓取方法和工具:参见 如何抓取网络包。

网络异常时如何抓取数据包

如果-s为0,则表示自动选择合适的长度来抓取数据包。w:用于将抓包结果导出到文件,而不是在控制台进行分析和打印输出。i:用于指定需要监听的接口(网卡)。vvv:用于输出详细的交互数据。expression:是一个正则表达式,用于过滤报文,...

数据上云场景

MaxCompute平台提供了丰富的数据上传下载工具,可以广泛应用于各种数据上云的应用场景,本文为您介绍三种经典数据上云场景。Hadoop数据迁移 您可使用MMA...具体场景示例请参见 Flume收集网站日志数据到MaxCompute 和 海量日志数据分析与应用。

需求分析

ods_raw_log_d 网站访问日志明细表数:dwd_log_info_di 用户网站访问信息宽表:dws_user_info_all_di 用户画像数据:ads_user_info_1d 根据规范设计数据流:本实验使用数据集成离线同步任务将用户信息数据与用户网站访问记录数据分别同步至...

需求分析

ods_raw_log_d 网站访问日志明细表:dwd_log_info_di 用户网站访问信息宽表:dws_user_info_all_di 用户画像数据:ads_user_info_1d 根据规范设计数据流:本实验使用数据集成离线同步任务将用户信息数据与用户网站访问记录数据分别同步至...

采集数据

本文为您介绍如何新建OSS和RDS数据源来访问本教程所提供的用户信息与网站日志数据,配置数据同步链路至私有OSS数据源,并通过EMR Hive节点建表去查询同步后的数据,完成数据同步的操作过程。前提条件 开始本文的操作前,请准备好需要使用的...

使用tcpdump抓包分析网络问题

持续时长:设置抓取数据包的时长。单位为秒。网络协议 选择网络协议。支持TCP、UDP和ICMPv4。开启tcpdump后,系统将开始抓包,并生成一个对应的运维任务,任务的状态为 运行中。根据需要对目标ECI实例进行调试,然后关闭tcpdump。关闭...

Agent自动扩容能力说明

在左侧导航栏单击 大盘列表,单击名称为Prometheus Agent的大盘超链接,即可跳转至Prometheus Agent大盘页面查看Agent自身运行状态、实时和历史指标抓取耗时以及抓取数量、数据发送、资源占用等信息。Agent自监控大盘监控数据的详细信息,...

Agent自动扩容能力说明

在左侧导航栏单击 大盘列表,单击名称为Prometheus Agent的大盘超链接,即可跳转至Prometheus Agent大盘页面查看Agent自身运行状态、实时和历史指标抓取耗时以及抓取数量、数据发送、资源占用等信息。Agent自监控大盘监控数据的详细信息,...

如何抓取网络包

抓取网络包不再像 Charles/Fiddler 那样可以通过“中间人”代理模式来捕获报文,TCP 报文的抓取一般是非侵入式的,通过监听网卡接口数据,直接进行 TCP 报文的“镜像”捕获。在一般场景下,可以抓包的点比较多,可以在客户端抓(A),可以...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

实验介绍

数据采集 数据加工 配置数据质量监控 数据可视化展现 目标人群 开发工程师、数据分析师、产品运营等存在数仓数据获取与数据分析洞察人员。涉及产品 本案例涉及以下产品:一站式大数据开发治理DataWorks 本案例通过DataWorks实现数据采集,...

快速体验

数据采集 数据加工 配置数据质量监控 数据可视化展现 目标人群 开发工程师、数据分析师、产品运营等存在数仓数据获取与数据分析洞察人员。涉及产品 本案例涉及以下产品:一站式大数据开发治理DataWorks 本案例通过DataWorks实现数据采集、...

文档修订记录

DataWorks数据安全治理路线 2023年12月更新记录 时间 特性 类别 描述 产品文档 2023.12.29 新增功能 数据开发 若您要在DataWorks中进行数据建模、数据开发或使用运维中心周期性调度任务,需先将已创建的数据源或集群绑定至数据开发...

通过Robots协议屏蔽搜索引擎抓取网站内容

概述 Robots协议(也称为爬虫协议、机器人协议等)的全称是网络爬虫排除标准(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。若有些页面访问消耗性能比较高,不希望被搜索引擎抓取,...

使用NimoShake将Amazon DynamoDB迁移至阿里云

线程名称 说明 Fetcher 调用Amazon提供的协议转换驱动批量抓取源表的数据并放入队列中,直至抓取完源表的所有数据。说明 目前只提供一个Fetcher线程。Parser 从队列中读取数据,并解析成BSON结构。Parser解析完成后,将数据按条写入...

数据质量教程概述

数据质量是数据分析结论有效性和准确性的基础。本文为您介绍数据质量保障教程的业务场景以及如何衡量数据质量的高低。前提条件 在开始本教程前,请您首先完成 搭建互联网在线运行分析平台 教程,详情请参见 业务场景与开发流程。业务场景 ...

数据质量教程概述

数据质量是数据分析结论有效性和准确性的基础。本文为您介绍数据质量保障教程的业务场景以及如何衡量数据质量的高低。前提条件 在开始本教程前,请您首先完成 搭建互联网在线运行分析平台 教程,详情请参见 业务场景与开发流程。业务场景 ...

数据源管理常见问题

说明 如果接口数据需要被所有网站使用,您可以使用通配符*。数据库类问题 如何配置数据数据源?在DataV控制台,选择 我的数据>数据源管理,单击+添加数据,在 添加数据 对话框中输入数据库相关配置信息,单击 确定,即可创建数据数据源...

数据源管理常见问题

说明 如果接口数据需要被所有网站使用,您可以使用通配符*。数据库类问题 如何配置数据数据源?在DataV控制台,选择 我的数据>数据源管理,单击+添加数据,在 添加数据 对话框中输入数据库相关配置信息,单击 确定,即可创建数据数据源...

C100售前支持相关问题

数据库审计和其他产品的区别 数据库审计产品相对于自己安装Packetbeat抓取流量审计和RDS数据库自带的SQL洞察功能,有以下区别:支持的数据库协议:数据库审计产品是专注于数据库协议解析的,支持的数据库协议更丰富,解析的粒度更细。数据...

管理Agent

数据库审计提供了Agent管理功能,使用该功能您可以设置Agent占用服务器资源的阈值,根据您的需要进行挂起、唤醒或停止Agent等操作。本文介绍管理Agent支持的具体操作。前提条件 已在您的服务器中安装Agent。具体操作,请参见 部署Agent程序...

创建MySQL数据

常用于网站、应用程序和商业产品,是一种常见的主要关系数据存储系统。更多详情请参见 MySQL官网。使用限制 Dataphin仅支持 超级管理员、数据源管理员、板块架构师、项目管理员 角色创建数据源。操作步骤 在Dataphin首页,单击顶部菜单栏的...

创建MySQL数据

常用于网站、应用程序和商业产品,是一种常见的主要关系数据存储系统。更多详情请参见 MySQL官网。前提条件 若您需在Dataphin中创建基于阿里云产品的数据源,创建数据源前,需确保Dataphin的IP已添加至数据库白名单(或安全组)中,使数据...

什么是MaxCompute

MaxCompute适用于大型互联网企业的数据仓库和BI分析、网站的日志分析、电子商务网站的交易分析、用户特征和兴趣挖掘等。详细发展历程、产品荣誉及客户案例请参见 发展历程 和 客户案例。MaxCompute还深度融合了阿里云如下产品:DataWorks ...

配置数据质量监控

已通过数据集成将存储于OSS的网站访问日志(user_log.txt)同步至MaxCompute的ods_raw_log_d表。已通过数据开发DataStudio将数据加工为用户画像基本数据。背景信息 数据质量 是支持多种异构数据源的质量校验、通知、管理服务的一站式平台。...

配置数据质量监控

已通过数据集成将存储于OSS的网站访问日志(user_log.txt)同步至MaxCompute的ods_raw_log_d表。已通过数据开发DataStudio将数据加工为用户画像基本数据。背景信息 数据质量 是支持多种异构数据源的质量校验、通知、管理服务的一站式平台。...

DLF+EMR之统一权限最佳实践

DLF 数据权限:DLF所提供的数据湖的数据权限体系,支持配置数据库、数据表、数据列、函数四种维度细粒度权限控制。详见 数据权限概述。业务场景说明 某公司有一个EMR集群,期望Hive/Spark/Presto/Impala引擎可以通过统一的数据权限,控制...

客户案例

数据库网关提供安全、可靠、低成本的数据库接入服务。本文将例举一个客户案例为您介绍如何通过数据库网关解决自身业务上的挑战。百姓网股份有限公司 行业分类:分类信息服务商 公司网站:https://www.baixing.com/ 公司介绍 百姓网...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 DBS 数据传输服务 云数据库 RDS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用