Можно ли заменить PostgreSQL на ClickHouse полностью?

Нет. ClickHouse — OLAP-база для аналитики, не для транзакций. Нет нормального UPDATE/DELETE, нет RI foreign keys, нет сложных ACID-транзакций. Используйте ClickHouse как дополнение к OLTP-хранилищу, а не замену.

Какой порядок ускорения даёт ClickHouse на аналитике?

На агрегациях по миллиардам строк ClickHouse обычно быстрее PostgreSQL в 50-500 раз. На нашем бенчмарке с 2.4 млрд строк COUNT+GROUP BY выполнился за 0.8 сек в ClickHouse и 312 сек в PostgreSQL на одинаковом железе.

Сколько места занимает ClickHouse по сравнению с PostgreSQL?

Обычно в 5-10 раз меньше благодаря колоночному сжатию (LZ4 по умолчанию, ZSTD опционально). Логи веб-сервера, которые в PostgreSQL занимали 180 ГБ, в ClickHouse уместились в 22 ГБ без изменения структуры.

Как переливать данные из PostgreSQL в ClickHouse?

Три варианта: MaterializedPostgreSQL-движок ClickHouse через логическую репликацию, внешний ETL (Debezium+Kafka или Airbyte), прямой INSERT с JOIN через PostgreSQL table function clickhouse. Для near-realtime — Debezium, для батчевого экспорта — функция postgresql().

Когда нужен кластер ClickHouse?

При объёме данных больше 10 ТБ или скорости вставки выше 100 тыс. строк/сек стандартный single-node не справляется. Кластер нужен для горизонтального масштабирования на шарды и репликации ReplicatedMergeTree для отказоустойчивости.

Базы данных 14 ноября 2025 · 16 мин чтения

ClickHouse vs PostgreSQL для аналитики: где чья сила и как совмещать

Семёнов Евгений Сергеевич, директор АйТи Фреш. «У нас отчёты в BI грузятся по 15 минут, надо что-то делать» — типовой запрос, с которым ко мне приходят раз в три-четыре месяца. Ответ не универсален: иногда хватит индекса в PostgreSQL, иногда нужен партишенинг, а иногда — отдельная колоночная база. Разберу, когда пора ставить ClickHouse и что это даст, на примере реальных чисел из нашей инфраструктуры.

Главное различие: строки против колонок

PostgreSQL — классическая row-oriented СУБД. На диске строки таблицы лежат подряд: все поля первой записи, потом все поля второй. Это оптимально для OLTP: «найди покупателя №12345 и обнови его адрес» — один seek, считал всю строку, обновил.

ClickHouse — column-oriented. Каждая колонка хранится отдельно. Чтобы посчитать SUM(price) за год, ClickHouse читает только колонку price — игнорируя остальные 40 полей. На аналитике это даёт скачок производительности на порядки.

Таблица отличий

Параметр	PostgreSQL	ClickHouse
Ориентация	Row-based (строки)	Column-based (колонки)
Тип нагрузки	OLTP: вставки, апдейты, точечные запросы	OLAP: агрегации по большим объёмам
UPDATE/DELETE	Нативные, быстрые	Только ALTER TABLE UPDATE, медленные
Транзакции	Полный ACID	Нет транзакций (атомарные вставки партиций)
Сжатие	TOAST для больших значений	LZ4/ZSTD по колонкам, в 5-10 раз меньше
Вставка	5-20k rows/sec на одну таблицу	1-10 млн rows/sec
SQL	Полный стандарт	SQL с расширениями, без FK, без полноценных JOIN для больших таблиц
Индексы	B-tree, GIN, GIST, BRIN	Primary key (сортировка), sparse index

Бенчмарк на 2.4 млрд строк

Поставил у нас в дата-центре МТС Москва два одинаковых сервера Dell Xeon Platinum 8280, 256 ГБ RAM, 4 × NVMe 7.68 ТБ. Загрузили таблицу веб-логов за 2 года (2.4 млрд записей, 45 полей). Одинаковые запросы:

-- Агрегация количества запросов по URL за год
SELECT url, COUNT(*) as cnt
FROM weblogs
WHERE event_date >= '2024-01-01' AND event_date < '2025-01-01'
GROUP BY url
ORDER BY cnt DESC
LIMIT 100;

Метрика	PostgreSQL 16 + BRIN	ClickHouse 24.3
Размер таблицы на диске	186 ГБ	22 ГБ
Время вставки 100 млн строк	47 мин	3 мин 12 сек
Запрос агрегации (холодный кэш)	312 сек	0.82 сек
Запрос агрегации (горячий кэш)	58 сек	0.31 сек
COUNT(DISTINCT user_id)	184 сек	2.4 сек
UPDATE одной строки по PK	0.8 мс	не применимо

Разница на агрегациях — сотни раз. На точечных апдейтах PostgreSQL выигрывает. Именно поэтому их часто используют вместе.

Гибридная архитектура: OLTP + OLAP

Правильный pattern для среднего бизнеса: PostgreSQL держит транзакционные данные (заказы, пользователи, платежи), ClickHouse — аналитическое хранилище для дашбордов и ML. Данные переливаются через CDC (Debezium → Kafka → ClickHouse) или батчами через postgresql() table function.

-- В ClickHouse
CREATE TABLE orders_analytics (
    order_id UInt64,
    user_id UInt64,
    amount Decimal(12, 2),
    status LowCardinality(String),
    created_at DateTime,
    region LowCardinality(String)
) ENGINE = MergeTree()
PARTITION BY toYYYYMM(created_at)
ORDER BY (region, created_at, user_id)
SETTINGS index_granularity = 8192;

-- Первоначальная загрузка
INSERT INTO orders_analytics
SELECT * FROM postgresql('10.0.0.10:5432', 'shop', 'orders',
  'analytics_reader', 'password');

Когда ClickHouse точно нужен

Аналитическая таблица больше 100 млн строк с агрегациями.
Запись метрик, логов, событий со скоростью >50 тыс/сек.
Отчёты в BI за годовой период выполняются больше минуты.
Дисковое пространство в PostgreSQL расходуется со скоростью больше 100 ГБ/месяц.
Нужны оконные функции на больших объёмах (COUNT OVER, SUM OVER).
Time-series: показания IoT-датчиков, метрики инфраструктуры, биржевые котировки.

Когда хватит PostgreSQL

Таблицы до 50 млн строк с грамотным индексированием.
Смешанная нагрузка OLTP+лёгкая аналитика.
Нужна строгая консистентность, внешние ключи, триггеры.
Команда не хочет осваивать новую СУБД.
Можно вынести тяжёлые отчёты в реплику с materialized views.

Базовая установка ClickHouse

# Debian 12
apt install -y apt-transport-https ca-certificates dirmngr
GNUPGHOME=$(mktemp -d) \
gpg --no-default-keyring --keyring /usr/share/keyrings/clickhouse-keyring.gpg \
  --keyserver hkp://keyserver.ubuntu.com:80 \
  --recv-keys 8919F6BD2B48D754

echo "deb [signed-by=/usr/share/keyrings/clickhouse-keyring.gpg] \
  https://packages.clickhouse.com/deb stable main" \
  > /etc/apt/sources.list.d/clickhouse.list

apt update
apt install -y clickhouse-server clickhouse-client
systemctl enable --now clickhouse-server

Движки таблиц

Движок	Назначение
MergeTree	Базовый, для обычных аналитических таблиц
ReplicatedMergeTree	Для кластеров с репликацией через ZooKeeper
ReplacingMergeTree	Схлопывает дубликаты по ключу
SummingMergeTree	Суммирует значения по ключу
AggregatingMergeTree	Материализованные агрегаты
CollapsingMergeTree	Для обновлений через insert + sign

Реальный кейс: e-commerce на 80 млн заказов

В феврале 2025 пришёл клиент — маркетплейс товаров для дома. В PostgreSQL накопилось 80 млн заказов, 900 млн строк детализации, ежедневные дашборды для руководства собирались 40-50 минут. Команда уже думала про Snowflake, но хотела сначала оценить on-premise вариант.

Что сделали за 10 рабочих дней:

Поставили ClickHouse 24.3 на одном сервере Dell Xeon Platinum 8280 (96 ядер, 256 ГБ RAM, 4 × NVMe 7.68 ТБ) в нашем дата-центре.
Настроили CDC через Debezium → Kafka → ClickHouse Kafka Engine для orders, order_items, users, products.
Создали 4 materialized view для типовых дашбордов Metabase.
Перевели 23 отчёта с PostgreSQL на ClickHouse через Query Rewrite в Metabase.
Настроили ежедневный резервный dump на S3 через clickhouse-backup.

Результат: дашборды грузятся за 2-6 секунд вместо 40-50 минут, PostgreSQL разгрузился на 70% по CPU (нет больше тяжёлых reporting-запросов), место в продакшене стало увеличиваться на 3 ГБ/мес вместо 35 ГБ/мес (исторические данные переехали в ClickHouse). Стоимость проекта — 265 000 руб. с лицензией нашего железа и сопровождением 3 мес.

Советы из практики

Не пытайтесь мигрировать всё сразу. Сначала выносите один тяжёлый отчёт и тестируйте производительность.
LowCardinality для строк с низкой кардинальностью — экономит 50-80% места.
PARTITION BY toYYYYMM(date) даёт легкое удаление старых данных через DROP PARTITION.
ORDER BY для MergeTree — ключевой выбор, определяет скорость запросов. Колонки с высокой кардинальностью в конце.
Бэкап через clickhouse-backup, не через pg_dump-аналог: инкрементальные бэкапы и S3-upload из коробки.
Мониторинг query_log — видно все запросы, их длительность, потреблённую память.

Поможем с архитектурой и миграцией

Проведу аудит вашей аналитики, оценю выигрыш от ClickHouse на реальных данных, спроектирую ETL-конвейер. Размещаем ClickHouse на своих 8 серверах Dell Xeon Platinum 8280 с NVMe-хранилищем и 40G Mellanox в дата-центре МТС Москва. Пилот на реальных данных клиента — за 3-5 дней, от 60 000 руб.

Телефон: +7 903 729-62-41
Telegram: @ITfresh_Boss
Семёнов Евгений Сергеевич, директор АйТи Фреш

FAQ — вопросы по ClickHouse и PostgreSQL

Можно ли заменить PostgreSQL на ClickHouse полностью?: Нет. ClickHouse — OLAP-база, не для транзакций. Используйте как дополнение к OLTP-хранилищу.
Какой порядок ускорения даёт ClickHouse на аналитике?: На агрегациях по миллиардам строк обычно в 50-500 раз быстрее PostgreSQL.
Сколько места занимает ClickHouse по сравнению с PostgreSQL?: В 5-10 раз меньше благодаря колоночному сжатию LZ4/ZSTD.
Как переливать данные из PostgreSQL в ClickHouse?: MaterializedPostgreSQL-движок, Debezium+Kafka или прямой INSERT через postgresql() table function.
Когда нужен кластер ClickHouse?: При объёмах больше 10 ТБ или скорости вставки >100 тыс. строк/сек, а также для отказоустойчивости через ReplicatedMergeTree.