Мониторинг IT-инфраструктуры офиса: Zabbix, бэкапы, алерты в Telegram
Меня зовут Семёнов Евгений Сергеевич, директор АйТи Фреш, 15 лет занимаюсь обслуживанием офисных IT-инфраструктур в Москве. За эти годы я насмотрелся на самые разные «системы мониторинга»: от тетрадки администратора до перехода в офис каждый понедельник для проверки серверов. В реальности всё это не работает. Узнаёт о проблеме не админ, а руководитель — когда бухгалтерия в 9:30 утра уже не может работать в 1С. В этой статье разберу, как поставить нормальный мониторинг для офиса до 50 рабочих мест за 1-2 дня и тысяч 50 рублей.
Что значит «нет мониторинга» на практике
Расскажу свежий случай — март 2026. Пришла на обслуживание небольшая фирма (производство пластиковой упаковки, 18 рабочих мест). Без мониторинга. Пятничным вечером перед майскими праздниками у них упал сервер 1С — встал дисковый массив RAID-1, потому что один из дисков «уехал» ещё в декабре, и никто не заметил. Когда умер второй диск, всё легло.
В понедельник в 8:30 утра приходят сотрудники, никто не может работать. К 10:00 у них там паника, в 11:00 наш дежурный инженер выезжает на место, в 13:00 начинаем восстановление с бэкапа. Восстановление шло 7 часов, потому что бэкап был на USB-диске и копировался по 1С-протоколу. Простой полного офиса — 8 часов, прямые потери — около 240 000 ₽ упущенной выручки.
Если бы у них был хотя бы простейший мониторинг состояния RAID, они бы получили алерт ещё в декабре, когда умер первый диск. Замена диска под нагрузкой стоила бы 0 ₽ простоя и 8 000 ₽ за работу инженера. Вот разница между «есть мониторинг» и «нет мониторинга».
Что обязательно мониторить в офисе
Минимальный набор, ниже которого опускаться нельзя. Каждый из этих пунктов — это потенциальная катастрофа, если случится незамеченным:
| Что мониторить | Почему критично | Алерт когда |
|---|---|---|
| Доступность сервера 1С | Работа всего офиса | Сервер не отвечает 2 минуты |
| Свободное место на дисках сервера | 1С перестаёт работать при 0 свободно | Менее 15 % свободно |
| Состояние RAID | Без алерта незамеченный отказ диска = потеря данных | Любая деградация массива |
| Свободное место на NAS | Бэкапы перестают делаться | Менее 20 % свободно |
| Успешность последнего бэкапа | Без бэкапов нечего будет восстанавливать | Бэкап не сделан более 26 часов |
| Доступность интернета | Облачные сервисы и удалённые сотрудники | Нет интернета 1 минуту |
| Доступность IP-АТС | Звонки клиентов | SIP-регистрация упала |
| Срабатывания антивируса | Возможно начало инцидента | Любое событие EDR |
| SMART-показатели дисков | Предсказание отказа диска | Reallocated Sectors > 10 |
| Температура серверного шкафа | Перегрев убивает железо | Выше 28°C |
Это базовый набор. Для офиса с дополнительными системами (видеонаблюдение, СКУД, специализированное ПО) добавляется ещё 5-10 пунктов. Но и этого минимума достаточно, чтобы не повторить историю выше.
Uptime Kuma: минимальный мониторинг за 1 час
Если у вас совсем небольшой офис (до 15 рабочих мест) с одним сервером и одним NAS — начните с Uptime Kuma. Это бесплатный простой инструмент, который мониторит доступность сервисов через ICMP, TCP, HTTP, и шлёт уведомления в Telegram, Discord или на почту.
Установка через Docker Compose на любой Linux-сервер или NAS Synology/QNAP занимает 15 минут:
# docker-compose.yml
version: '3.3'
services:
uptime-kuma:
image: louislam/uptime-kuma:1
container_name: uptime-kuma
restart: always
ports:
- "3001:3001"
volumes:
- ./data:/app/data
# Запуск:
docker compose up -d
Дальше через веб-интерфейс на порту 3001 добавляете проверки: «Сервер 1С — ICMP», «Веб-интерфейс NAS — HTTP», «Mikrotik — ICMP», «Внешний интернет — ICMP к 8.8.8.8». Подключаете Telegram-бота через токен из @BotFather — и получаете дашборд с зелёными/красными точками + мгновенные уведомления о падениях.
У меня в АйТи Фреш половина небольших клиентов сидят на Uptime Kuma — этого хватает. Для больших историй (метрики внутри систем, история, графики, прогнозирование) ставим уже Zabbix.
Zabbix: полноценный мониторинг для офиса 25+ рабочих мест
Когда оборудования становится больше — несколько серверов, NAS, Mikrotik, IP-АТС, ИБП — нужен инструмент, который не только пингует, но и собирает метрики «изнутри»: загрузку CPU, память, IOPS дисков, температуру, состояние сервисов Windows. Стандарт для этого — Zabbix.
Я обычно ставлю Zabbix Server LTS-версию на отдельную виртуалку Ubuntu Server 22.04 с 4 ГБ RAM и 60 ГБ диска — этого хватает на офис до 100 узлов. Установка из репозитория автоматизирована:
# Подключение репозитория Zabbix 7.0 LTS на Ubuntu 22.04
wget https://repo.zabbix.com/zabbix/7.0/ubuntu/pool/main/z/zabbix-release/zabbix-release_7.0-1+ubuntu22.04_all.deb
dpkg -i zabbix-release_7.0-1+ubuntu22.04_all.deb
apt update
# Установка сервера, веб-интерфейса и MySQL
apt install -y zabbix-server-mysql zabbix-frontend-php \
zabbix-apache-conf zabbix-sql-scripts zabbix-agent2 mysql-server
# Создание базы данных
mysql -uroot -p
> create database zabbix character set utf8mb4 collate utf8mb4_bin;
> create user zabbix@localhost identified by 'СильныйПароль';
> grant all privileges on zabbix.* to zabbix@localhost;
> set global log_bin_trust_function_creators = 1;
> quit;
# Импорт схемы
zcat /usr/share/zabbix-sql-scripts/mysql/server.sql.gz | mysql --default-character-set=utf8mb4 -uzabbix -p zabbix
# Конфигурация и запуск
nano /etc/zabbix/zabbix_server.conf # вписываем DBPassword=СильныйПароль
systemctl enable --now zabbix-server zabbix-agent2 apache2
На каждый сервер и рабочую станцию, которые надо мониторить, ставится Zabbix Agent — он собирает локальные метрики и отдаёт их серверу. Для Mikrotik используется SNMP, для NAS Synology/QNAP — встроенные SNMP-агенты, для UPS — обычно через сетевую карту с SNMP.
За первый месяц работы Zabbix у одного из моих клиентов отловил:
- 3 случая падения сервиса 1С (автоматический рестарт через 30 секунд по триггеру)
- 2 случая 100 % загрузки диска бэкапов — успели почистить до того, как остановилось копирование
- 1 случай повышения температуры в серверной до 32°C (сломался кондиционер ночью) — алерт пришёл в 2:43, инженер выехал, в 5:30 поставил резервный кондиционер
- 1 случай начала отказа SSD на сервере 1С — заменили под нагрузкой через RAID
Любое из этих событий незамеченным могло стоить клиенту от 50 тыс. до 1 млн рублей убытков. Стоимость Zabbix — бесплатно, стоимость нашей настройки — 35 000 ₽ разово.
Алерты в Telegram — почему именно туда
Я давно отказался от алертов на почту. Причины:
- Почта приходит с задержкой 30 секунд — 5 минут
- Письма от мониторинга часто попадают в спам
- Никто не сидит и не смотрит в почту в 3 ночи
- Невозможно сделать «звуковое уведомление только для критичных»
Telegram-бот доставляет сообщение за 1-2 секунды, поддерживает разные чаты для разной критичности, и через настройки уведомлений Telegram можно сделать звук только для одного канала с критикой. Настройка занимает 20 минут:
# 1. В Telegram пишем @BotFather → /newbot → получаем токен типа
# 1234567890:AAFv-TestTokenExampleTextHere
# 2. Создаём канал для алертов, добавляем бота как админа
# 3. Получаем chat_id канала через @username_to_id_bot
# 4. Создаём скрипт /usr/local/bin/zabbix_telegram.sh:
#!/bin/bash
TOKEN="1234567890:AAFv-TestTokenExampleTextHere"
CHAT_ID="-1001234567890"
TO=$1
SUBJECT=$2
BODY=$3
curl -s -X POST "https://api.telegram.org/bot${TOKEN}/sendMessage" \
-d "chat_id=${CHAT_ID}" \
-d "text=*${SUBJECT}*%0A${BODY}" \
-d "parse_mode=Markdown"
# Делаем исполняемым
chmod +x /usr/local/bin/zabbix_telegram.sh
# В Zabbix: Administration → Media Types → Create Media Type
# Type: Script, Script name: zabbix_telegram.sh
# Параметры: {ALERT.SENDTO}, {ALERT.SUBJECT}, {ALERT.MESSAGE}
Дальше в Zabbix настраиваются Actions — какие триггеры в какие каналы шлются. Я обычно делаю три канала:
- Critical — серверы упали, бэкап не сделался, RAID-деградация. Звуковое уведомление дежурному инженеру 24/7
- Warning — диски заполняются, температура повышается, ИБП на батарее. Сообщение в общий чат IT-команды
- Info — плановые события, восстановление сервиса. Общий чат без звука
Мониторинг бэкапов — отдельная история
Самая частая ошибка, которую я вижу: «у нас бэкапы делаются» — а на проверку оказывается, что они либо не делались полгода, либо делались, но битые. Поэтому мониторинг бэкапов должен включать три уровня:
- Факт запуска задания. Veeam, Acronis, Active Backup для бизнеса — все умеют слать письмо/SNMP-trap при ошибке. Это самый базовый уровень — узнать, что задание не запустилось
- Размер и дата файла бэкапа. Zabbix следит за датой модификации файла бэкапа на NAS — если файл старше 26 часов (для ежедневного бэкапа), идёт алерт. Это ловит случай, когда задание показывает «успех», но на самом деле ничего не записало
- Контрольное восстановление. Раз в квартал инженер берёт случайную базу из бэкапа, восстанавливает на тестовый сервер, проверяет, что данные читаются и актуальны. Это единственный способ убедиться, что ваши бэкапы реально работают
У меня был случай — клиент 4 года делал «бэкапы» на NAS Synology через скрипт. Все 4 года скрипт писал «ОК» в лог. Когда понадобилось восстановить базу 1С после сбоя, выяснилось, что скрипт копировал базу в момент работы 1С, без остановки сервиса — и все 4 года сохранял битые файлы, которые невозможно открыть. Восстановили из бумажных распечаток квартальных отчётов, потеряли 2 года первичной документации.
Мораль: «бэкап делается» = «лог показывает ОК» — это не одно и то же. Проверка восстановлением обязательна.
Мониторинг для нетехнического руководителя
Отдельная задача — сделать так, чтобы руководитель компании мог одним взглядом понять «у нас всё в порядке» или «что-то не так». Я обычно настраиваю руководителю:
- Простой публичный дашборд Uptime Kuma с зелёными/красными точками: «Сервер 1С», «Почта», «Сайт», «Телефония», «Интернет». Без технических деталей. Доступен по URL с любого браузера
- Еженедельный отчёт в Telegram: количество инцидентов за неделю, время простоя, состояние бэкапов. На одной картинке, понятно нетехническому человеку
- Алерт только при критичных авариях: остановилось обслуживание 1С, упала почта, нет интернета. Предупреждения и отчёты — НЕ руководителю, чтобы не было «boy who cried wolf»
У одного из моих клиентов руководитель раньше каждое утро в 9:00 обзванивал офисы (у него 3 офиса в Москве) с вопросом «всё работает?». Сейчас он смотрит на телефон, видит зелёные точки и спокойно занимается бизнесом. Если что-то падает — он узнаёт раньше сотрудников и звонит мне с конкретикой.
Сколько стоит поставить мониторинг офисной инфраструктуры
Реальные цифры по моей практике на апрель 2026 в Москве:
| Размер офиса | Решение | Стоимость работ | Срок |
|---|---|---|---|
| 10 рабочих мест, 1 сервер | Uptime Kuma + Telegram | от 12 000 ₽ | 1 день |
| 25 рабочих мест, 2 сервера + NAS | Zabbix + Telegram + дашборд для директора | от 38 000 ₽ | 2 дня |
| 50 рабочих мест, AD + 1С + IP-АТС + NAS | Zabbix полный + Wazuh для безопасности | от 78 000 ₽ | 4-5 дней |
В стоимость входит: установка и настройка системы мониторинга, шаблоны под ваше оборудование (Mikrotik, Synology, Windows Server, 1С), настройка триггеров и алертов в Telegram, настройка дашбордов для руководителя, документация, обучение IT-сотрудников клиента (если есть). Оборудование — обычно отдельная виртуальная машина 4 ГБ RAM на существующем гипервизоре, отдельная железка не нужна.
Дальнейшее обслуживание (обновление шаблонов, добавление новых узлов, реагирование на алерты) входит в нашу абонентку «Стандарт» от 45 000 ₽/мес для офиса 25 РМ — без дополнительной платы.
Чего я не делаю в офисах
За 15 лет я отказался от ряда «модных» решений, которые в малом бизнесе создают больше проблем, чем решают:
- Не ставлю Prometheus + Grafana в офис на 25 человек — это решение для команды DevOps, требует постоянного допила. Zabbix даёт всё то же из коробки
- Не использую ELK-стек для логов в малых офисах — пожирает 8+ ГБ RAM просто за то, что работает. Wazuh дешевле и понятнее
- Не настраиваю SLA-метрики и SLI/SLO для внутренних сервисов — это нужно сервис-провайдерам, не офису
- Не ставлю мониторинг рабочих станций сотрудников по умолчанию — это создаёт ощущение слежки и обижает людей. Включаю только при явном запросе руководства и с информированием сотрудников
- Не делаю красивые дашборды на телевизор в офисе с зелёными графиками — никто на них не смотрит, это понты, а не польза
Мониторинг должен решать конкретную бизнес-задачу — узнать о проблеме раньше, чем она ударит по клиентам. Всё, что не решает эту задачу, в офисе до 50 человек избыточно.
Получите бесплатный аудит инфраструктуры
Я лично выезжаю на аудит к каждому новому клиенту в Москве и в радиусе 50 км от МКАД. За 2–3 рабочих дня вы получите письменный отчёт со списком критичных узлов вашей инфраструктуры, оценкой текущего состояния мониторинга (или его отсутствия) и сметой на внедрение. Без обязательств.
Телефон: +7 903 729-62-41
Telegram: @ITfresh_Boss
Семёнов Евгений Сергеевич, директор АйТи Фреш
FAQ — частые вопросы по мониторингу
- Зачем офису мониторинг, если у нас всего 1 сервер?
- Чтобы узнать о проблеме раньше пользователей. Без мониторинга вы услышите «у меня не работает 1С» через 30 минут после того, как сервер начал тормозить. С мониторингом получаете алерт в Telegram через 2 минуты после сбоя бэкапа, переполнения диска или зависания сервиса.
- Что выбрать — Zabbix или Uptime Kuma?
- Для офиса 10-25 рабочих мест с одним сервером — Uptime Kuma за 1 час настройки, мониторит доступность и сертификаты. Для офиса 30+ с несколькими серверами, NAS, IP-АТС — Zabbix, потому что он умеет смотреть метрики (CPU, RAM, диск, температура) внутри систем, а не только снаружи.
- Сколько стоит мониторинг для офиса 25 рабочих мест?
- Развёртывание Zabbix с шаблонами для 1С, Mikrotik, NAS и Windows-серверов — от 35 000 ₽ разовых работ. Дальнейшее обслуживание входит в нашу абонентку «Стандарт» от 45 000 ₽/мес. Оборудование — отдельная виртуалка 4 ГБ RAM на сервере, бесплатно если есть гипервизор.
- Как мониторить, что бэкапы реально делаются?
- Не только проверять, что задание Veeam или Acronis отработало успешно (это ничего не гарантирует), но и контролировать размер бэкап-файлов, дату последней копии, и раз в квартал реально восстанавливать одну базу из бэкапа. Я считаю, что бэкап без проверки восстановлением — это иллюзия.
- Можно ли получать алерты не на почту, а в Telegram?
- Да, и это правильнее почты. Telegram-бот доставляет алерт за 1-2 секунды и точно не потеряется в спаме. Я ставлю всем клиентам именно Telegram-канал с разделением: критичные алерты — звуковое уведомление дежурному, плановые отчёты — в общий чат IT-команды.