南瓜慢说官网 敢一行,则予知。脚踏实地,知行合一。

Kafka详解

Kafka详解 Kafka概述 Kafka 是一个开源的分布式流处理平台和消息队列,最初由LinkedIn开发并开源。它具有高吞吐量、低延迟、可水平扩

LarryDpk LarryDpk 发布于 2024-08-05

Hadoop入门教程

Hadoop入门教程 基础概念 数据分析的类别: 离线分析(Batch Processing) 实时分析(Real Time Processing / Streaming) 机器学习(Machine Learning

LarryDpk LarryDpk 发布于 2023-08-10

Flink Sink to ClickHouse with Table API with Connector

Flink Sink to ClickHouse with Table API with Connector Build flink-connector-clickhouse Get the code: git clone git@github.com:itinycheng/flink-con

LarryDpk LarryDpk 发布于 2024-12-25

Flink Read CSV and Sink to Parquet File

Flink Read CSV and Sink to Parquet File 1. Setup Environment Prerequisites Apache Flink 1.16.3 installed JDK 11 installed Maven or Gradle for dependen

LarryDpk LarryDpk 发布于 2024-12-24

安装Zookeeper和Kafka集群

安装Zookeeper和Kafka集群 本文介绍如何安装Zookeeper和Kafka集群。为了方便,介绍的是在一台服务器上的安装,实际应该安装在多台服务器

LarryDpk LarryDpk 发布于 2023-04-17

让Apache Beam在GCP Cloud Dataflow上跑起来

简介在文章《Apache Beam入门及Java SDK开发初体验》中大概讲了Apapche Beam的简单概念和本地运行,本文将讲解如何把代码运行在GCP Cloud Dataflow上。本地运行通过maven命令来创建项目:mvn archetype:generate \ -Darchet

LarryDpk LarryDpk 发布于 2022-11-03