博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Kafka笔记7(构建数据管道)
阅读量:6330 次
发布时间:2019-06-22

本文共 456 字,大约阅读时间需要 1 分钟。

 构建数据管道需要考虑的问题:

    及时性  可靠性 高吞吐量和动态吞吐量   数据格式  转换    安全性   故障处理能力  耦合性与灵活性

    数据管道的构建分为2个阵营,ETL和ELT

  ETL:提取-转换-加载   当数据流经管道时,数据管道负责处理他们

  ELT:提取-加载-转换:数据管道只做少量的转换,高保真

 

  数据管道最重要的作用是解耦数据源和数据池

    发生耦合情况: 临时数据管道    元数据丢失    末端处理

 

 

 

Connect工作原理

  连接器和任务

    连接器实现了ConnectorAPI ,API 包含以下2部分:

      连接器负责以下3件事: 决定运行多少任务,按照任务拆分数据复制,从worker进程获取任务配置并将其传递下去

    任务:负责将数据移入/移出Kafka

  work进程

    

  转化器和Connect数据模型

    

  偏移量管理器

    

  

转载于:https://www.cnblogs.com/zy1234567/p/10342913.html

你可能感兴趣的文章
BMP文件的读取与显示
查看>>
Flash文字效果
查看>>
各种排序算法总结篇(高速/堆/希尔/归并)
查看>>
使用c#訪问Access数据库时,提示找不到可安装的 ISAM
查看>>
Highcharts X轴纵向显示
查看>>
windows 注册表讲解
查看>>
【算法】论平衡二叉树(AVL)的正确种植方法
查看>>
基于DDD的现代ASP.NET开发框架--ABP系列之1、ABP总体介绍
查看>>
【原】东拼西凑PBR(1):PBR基础
查看>>
react 从零开始搭建开发环境
查看>>
scala recursive value x$5 needs type
查看>>
ps -ef |grep 输出的具体含义
查看>>
markdown编辑
查看>>
ASCII 在线转换器
查看>>
Linux内核同步:RCU
查看>>
Android逆向进阶——让你自由自在脱壳的热身运动(dex篇)
查看>>
Java设计模式之五大创建型模式(附实例和详解)
查看>>
60 Permutation Sequence
查看>>
主流的RPC框架有哪些
查看>>
Hive学习之路 (七)Hive的DDL操作
查看>>