VicWen - Blog about my life

ClickHouse 系列：分區策略與 Partition Pruning 技術，如何加速大數據查詢

2025-08-11

software development

ClickHouse

/

Database

/

鐵人賽

當面對數億、數十億筆資料時，若每次查詢都必須掃描全表，效率勢必崩潰。ClickHouse 提供了靈活的分區 (Partitioning) 與 Partition Pruning (分區裁剪) 技術，讓你在查詢時僅需掃描「真正相關的資料區塊」，大幅減少 I/O 與查詢延遲。

1810 字

|

9 分鐘

Cover Image of the Post

ClickHouse 系列：Materialized Views 即時聚合查詢

2025-08-10

software development

ClickHouse

/

Database

/

鐵人賽

在 OLAP 系統中，「即時聚合」與「預先計算」是加速查詢、降低資源消耗的核心策略。ClickHouse 提供了強大的 Materialized Views (物化視圖)，能將複雜查詢結果實時寫入表中，並大幅減輕查詢時的運算壓力。

1559 字

|

8 分鐘

Cover Image of the Post

ClickHouse 系列：SummingMergeTree 進行資料彙總的應用場景

2025-08-09

software development

ClickHouse

/

Database

/

鐵人賽

有一天你工作工作，在當社畜的時候，發現你現在需要大量的「數值加總」、「分組彙總統計」，例如每日活躍使用者數量、每小時流量統計、即時計數器 (Counter) 等，ClickHouse 提供了一個極致高效的資料彙總利器 —— SummingMergeTree。

1420 字

|

7 分鐘

Cover Image of the Post

ClickHouse 系列：ReplacingMergeTree 與資料去重機制

2025-08-08

software development

ClickHouse

/

Database

/

鐵人賽

在大數據環境中，「資料重複」是常見且麻煩的問題，尤其是在 ETL Pipeline 或實時資料流匯入（如 Kafka Stream）時，重複資料會嚴重影響統計結果與查詢性能。ClickHouse 提供了一套簡單卻強大的去重機制：ReplacingMergeTree 儲存引擎。

1713 字

|

9 分鐘

Cover Image of the Post

ClickHouse 系列：壓縮技術與 Data Skipping Indexes 如何大幅加速查詢

2025-08-07

software development

ClickHouse

/

Database

/

鐵人賽

在 ClickHouse 的高性能查詢背後，除了列式存儲與向量化執行外，「壓縮技術」與「資料跳過索引（Data Skipping Indexes）」也是讓它能夠應對 PB 級數據的核心關鍵。本文將深入解析這兩項技術的原理與應用，並說明如何有效提升查詢效率、降低儲存成本。

1886 字

|

9 分鐘

Cover Image of the Post

ClickHouse 系列：ClickHouse 儲存引擎 - MergeTree

2025-08-06

software development

ClickHouse

/

Database

/

鐵人賽

ClickHouse 能夠支撐高性能資料查詢的核心秘密之一，就是其強大的儲存引擎 — MergeTree。這一篇將帶你深入理解 MergeTree 是什麼、它解決了哪些問題，以及如何透過不同的變種引擎 (ReplacingMergeTree, SummingMergeTree 等) 應對不同資料處理場景。

1988 字

|

10 分鐘

Cover Image of the Post

ClickHouse 系列：ClickHouse 為什麼選擇 Column-based 儲存？講解 Row-based 與 Column-based 的核心差異

2025-08-05

software development

ClickHouse

/

Database

/

鐵人賽

在過去兩篇文章中有提到「Row-based Storage」與「Column-based Storage」是 OLTP 與 OLAP 系統架構選擇的根本差異。本文將從行列存儲的原理出發，說明 ClickHouse 為什麼選擇列式架構，以及它帶來的效能優勢與適用場景。

1655 字

|

8 分鐘

Cover Image of the Post

ClickHouse 系列：ClickHouse 是什麼？與傳統 OLAP/OLTP 資料庫的差異

2025-08-04

software development

ClickHouse

/

Database

/

鐵人賽

ClickHouse 是由 Yandex 開發的開源分布式列式資料庫管理系統（Column-oriented DBMS）。

1138 字

|

6 分鐘

Cover Image of the Post

1 2 3

4

5 6