ClickHouse 系列:Materialized Views 即時聚合查詢
2025-08-10
在 OLAP 系統中,「即時聚合」與「預先計算」是加速查詢、降低資源消耗的核心策略。ClickHouse 提供了強大的 Materialized Views (物化視圖),能將複雜查詢結果實時寫入表中,並大幅減輕查詢時的運算壓力。
1559 字
|
8 分鐘

ClickHouse 系列:SummingMergeTree 進行資料彙總的應用場景
2025-08-09
有一天你工作工作,在當社畜的時候,發現你現在需要大量的「數值加總」、「分組彙總統計」,例如每日活躍使用者數量、每小時流量統計、即時計數器 (Counter) 等,ClickHouse 提供了一個極致高效的資料彙總利器 —— SummingMergeTree。
1420 字
|
7 分鐘

ClickHouse 系列:ReplacingMergeTree 與資料去重機制
2025-08-08
在大數據環境中,「資料重複」是常見且麻煩的問題,尤其是在 ETL Pipeline 或實時資料流匯入(如 Kafka Stream)時,重複資料會嚴重影響統計結果與查詢性能。ClickHouse 提供了一套簡單卻強大的去重機制:ReplacingMergeTree 儲存引擎。
1713 字
|
9 分鐘

ClickHouse 系列:壓縮技術與 Data Skipping Indexes 如何大幅加速查詢
2025-08-07
在 ClickHouse 的高性能查詢背後,除了列式存儲與向量化執行外,「壓縮技術」與「資料跳過索引(Data Skipping Indexes)」也是讓它能夠應對 PB 級數據的核心關鍵。本文將深入解析這兩項技術的原理與應用,並說明如何有效提升查詢效率、降低儲存成本。
1886 字
|
9 分鐘

ClickHouse 系列:ClickHouse 儲存引擎 - MergeTree
2025-08-06
ClickHouse 能夠支撐高性能資料查詢的核心秘密之一,就是其強大的儲存引擎 — MergeTree。這一篇將帶你深入理解 MergeTree 是什麼、它解決了哪些問題,以及如何透過不同的變種引擎 (ReplacingMergeTree, SummingMergeTree 等) 應對不同資料處理場景。
1988 字
|
10 分鐘

ClickHouse 系列:ClickHouse 為什麼選擇 Column-based 儲存?講解 Row-based 與 Column-based 的核心差異
2025-08-05
在過去兩篇文章中有提到「Row-based Storage」與「Column-based Storage」是 OLTP 與 OLAP 系統架構選擇的根本差異。本文將從行列存儲的原理出發,說明 ClickHouse 為什麼選擇列式架構,以及它帶來的效能優勢與適用場景。
1655 字
|
8 分鐘

ClickHouse 系列:ClickHouse 是什麼?與傳統 OLAP/OLTP 資料庫的差異
2025-08-04
ClickHouse 是由 Yandex 開發的 開源分布式列式資料庫管理系統(Column-oriented DBMS)。
1138 字
|
6 分鐘

台科電資學院暨校園傑出青年申請歷程
2025-08-03
這篇文章主要是想紀錄自己當初申請院傑青和校傑青的歷程,以及留一些當初準備的方向給後面的人~
如果你對於爭取校內傑出青年榮譽有意願,看完文章如果仍然有疑問,歡迎私訊我的 Instagram,能回答的我都會幫忙解答!(要有禮貌喔 ✨)
1724 字
|
9 分鐘
