VicWen - Blog about my life

ClickHouse 系列：表格設計與儲存優化細節

2025-08-26

software development

ClickHouse

/

Database

/

鐵人賽

在 ClickHouse 中，表格設計並不是隨便定義欄位就好，因為不同的欄位屬性、型別選擇、壓縮策略，會直接影響儲存空間與查詢效能。今天我們就來深入探討實戰中最容易忽略的幾個細節，包括：

1075 字

|

5 分鐘

ClickHouse 系列：儲存政策（Storage Policies）與磁碟資源分層策略

2025-08-25

software development

ClickHouse

/

Database

/

鐵人賽

當你的 ClickHouse 資料規模從 GB、TB 成長到 PB 時，如何妥善分配 SSD、HDD、甚至雲端冷儲存資源，變得至關重要。ClickHouse 透過 Storage Policies (儲存政策)，提供了極為靈活的磁碟分層架構，不僅能優化查詢效能，也能大幅降低儲存成本。

1386 字

|

7 分鐘

ClickHouse 系列：TTL 資料清理與儲存成本優化

2025-08-24

software development

ClickHouse

/

Database

/

鐵人賽

隨著時間的資料量成長，如何免去手工、使用自動化進行過期資料清理與儲存成本控制，成為大型數據系統設計中不可忽視的一環。ClickHouse 提供了 TTL（Time To Live）資料清理機制，不僅能自動刪除過期資料，還能將資料移動至冷儲存 (如 S3、HDD)，有效降低儲存成本。

1168 字

|

6 分鐘

ClickHouse 系列：Sampling 抽樣查詢與統計技術原理

2025-08-23

software development

ClickHouse

/

Database

/

鐵人賽

當面對 PB 級大數據查詢時，如何在不影響統計結論的前提下，快速獲得近似結果？ClickHouse 提供了高效的 Sampling 抽樣查詢技術，讓你能夠用「1% 的資料，取得 95% 準確度的結果」。

1189 字

|

6 分鐘

ClickHouse 系列：Projections 進階查詢加速技術

2025-08-22

software development

ClickHouse

/

Database

/

鐵人賽

在處理大規模資料聚合查詢時，ClickHouse 除了靠 Partition Pruning、Data Skipping Index 來加速查詢（忘了再回去複習），還有一個極具威力的查詢優化武器 — Projections。

1112 字

|

6 分鐘

ClickHouse 系列：如何提升查詢優化？system.query_log 與 EXPLAIN 用法

2025-08-21

software development

ClickHouse

/

Database

/

鐵人賽

在資料量日益龐大的場景下，如何優化查詢效能是每一位開發者必須具備的核心能力。本篇將帶你實戰演練 ClickHouse 中兩個查詢優化利器：

1734 字

|

9 分鐘

ClickHouse 系列：ClickHouse 與外部資料源整合（PostgreSQL）

2025-08-20

software development

ClickHouse

/

Database

/

鐵人賽

/

Distributed

在實際數據平台架構中，ClickHouse 通常不是唯一的資料庫，而是與其他資料源（如 MySQL、PostgreSQL、S3、Kafka 等）整合，扮演高效查詢與分析層的角色。

1325 字

|

7 分鐘

ClickHouse 系列：批次匯入最佳實踐 (CSV、Parquet、Native Format)

2025-08-19

software development

ClickHouse

/

Database

/

鐵人賽

/

Distributed

在實務的資料分析與數倉場景中，批次匯入（Batch Import）是 ClickHouse 最常見的資料導入方式之一。根據資料量、來源與格式的不同，選擇合適的匯入方法與檔案格式，能大幅提升匯入速度並降低資源消耗。

1236 字

|

6 分鐘