南瓜慢说官网 敢一行,则予知。脚踏实地,知行合一。

Kafka详解

Kafka详解 Kafka概述 Kafka 是一个开源的分布式流处理平台和消息队列,最初由LinkedIn开发并开源。它具有高吞吐量、低延迟、可水平扩

LarryDpk LarryDpk 发布于 2024-08-05

Hadoop入门教程

Hadoop入门教程 基础概念 数据分析的类别: 离线分析(Batch Processing) 实时分析(Real Time Processing / Streaming) 机器学习(Machine Learning

LarryDpk LarryDpk 发布于 2023-08-10

安装Zookeeper和Kafka集群

安装Zookeeper和Kafka集群 本文介绍如何安装Zookeeper和Kafka集群。为了方便,介绍的是在一台服务器上的安装,实际应该安装在多台服务器

LarryDpk LarryDpk 发布于 2023-04-17

让Apache Beam在GCP Cloud Dataflow上跑起来

简介在文章《Apache Beam入门及Java SDK开发初体验》中大概讲了Apapche Beam的简单概念和本地运行,本文将讲解如何把代码运行在GCP Cloud Dataflow上。本地运行通过maven命令来创建项目:mvn archetype:generate \ -Darchet

LarryDpk LarryDpk 发布于 2022-11-03