SaaS-платформа «КлаудАпп» — российский аналог Notion с модулями для документов, задач, чатов и видеозвонков. Каждый модуль представляет собой отдельный сервис: Go-бэкенд, Python-воркеры, Node.js-рендерер, Redis, PostgreSQL, MinIO и ещё два десятка компонентов. Всё это работало на трёх bare-metal серверах без Kubernetes — команда из пяти разработчиков не хотела тратить ресурсы на оркестрацию кластера.
Проблема, с которой «КлаудАпп» обратилась к специалистам itfresh.ru, была типичной для монолитного деплоя: сервисы падали, перезапускались вручную, утечки памяти в Python-воркерах убивали соседние процессы, а логи смешивались в общем syslog без возможности фильтрации. Однажды OOM-killer остановил PostgreSQL из-за того, что воркер обработки изображений сожрал 28 ГБ из 32 доступных.
Мы предложили системный подход: превратить systemd из простого «запускальщика» в полноценную платформу управления сервисами с ресурсными лимитами, изоляцией, мониторингом и автоматическим восстановлением.
Оставить комментарий