Мониторинг IT-инфраструктуры офиса: Zabbix, бэкапы, алерты в Telegram
Привет! Меня зовут Семёнов Евгений Сергеевич, и я директор АйТи Фреш. Уже целых 15 лет я занимаюсь обслуживанием офисных IT-инфраструктур в Москве. За эти годы я повидал столько разных «систем мониторинга» — от каких-то записей в тетрадке администратора до чуть ли не ритуального обхода серверов каждый понедельник. И вот что я вам скажу: на самом деле, почти ничего из этого не работает. Обычно о проблеме первым узнаёт вовсе не админ, а руководитель — и, как правило, это случается в тот самый момент, когда бухгалтерия в 9:30 утра уже не может зайти в 1С. В этой статье я расскажу, как можно настроить по-настоящему рабочий мониторинг для офиса до 50 рабочих мест всего за 1-2 дня и каких-то тысяч 50 рублей.
Что значит «нет мониторинга» на практике
Вот вам свежая история, буквально из марта 2026 года. К нам на обслуживание пришла небольшая компания, которая занимается производством пластиковой упаковки, у них 18 рабочих мест. С мониторингом там, можно сказать, было совсем ноль. И вот, пятничным вечером перед майскими праздниками, у них "падает" сервер 1С: полностью отказал дисковый массив RAID-1. А знаете, почему это произошло? Один из дисков вышел из строя ещё в декабре, но, конечно, этого никто не заметил.
Представьте картину: Понедельник, 8:30 утра. Сотрудники приходят, а работать никто не может. К 10:00 в офисе уже настоящая паника, в 11:00 наш дежурный инженер срочно выезжает на место, и только в 13:00 мы начинаем восстановление данных с бэкапа. И что вы думаете? Всё это безобразие растянулось на целых 7 часов! Причина проста: бэкап лежал на обычном USB-диске и копировался по древнему 1С-протоколу. Итог печален: 8 часов простоя всего офиса и около 240 000 ₽ упущенной выручки. Вот такая история.
А ведь если бы у них был хоть какой-то простенький мониторинг состояния RAID, они бы получили "алерт" ещё в декабре, когда первый диск приказал долго жить. Тогда замена диска "на горячую", под нагрузкой, обошлась бы им в 0 ₽ простоя и всего 8 000 ₽ за работу нашего инженера. Вот она, вся разница между ситуациями, когда мониторинг есть и когда его нет.
Что обязательно мониторить в офисе
Это тот минимум, ниже которого опускаться нельзя. Каждый пункт — потенциальная катастрофа, если проворонить:
| Что мониторить | Почему критично | Алерт когда |
|---|---|---|
| Доступность сервера 1С | Работа всего офиса | Сервер не отвечает 2 минуты |
| Свободное место на дисках сервера | 1С перестаёт работать при 0 свободно | Менее 15 % свободно |
| Состояние RAID | Без алерта незамеченный отказ диска = потеря данных | Любая деградация массива |
| Свободное место на NAS | Бэкапы перестают делаться | Менее 20 % свободно |
| Успешность последнего бэкапа | Без бэкапов нечего будет восстанавливать | Бэкап не сделан более 26 часов |
| Доступность интернета | Облачные сервисы и удалённые сотрудники | Нет интернета 1 минуту |
| Доступность IP-АТС | Звонки клиентов | SIP-регистрация упала |
| Срабатывания антивируса | Возможно начало инцидента | Любое событие EDR |
| SMART-показатели дисков | Предсказание отказа диска | Reallocated Sectors > 10 |
| Температура серверного шкафа | Перегрев убивает железо | Выше 28°C |
Это наш базовый комплект, с которого стоит начать. Если у вас в офисе есть дополнительные системы, например, видеонаблюдение, СКУД или какое-то специализированное ПО, к этому списку добавятся ещё 5-10 пунктов. Но даже этого минимума будет вполне достаточно, чтобы никогда не повторить ту историю, что я рассказал выше.
Uptime Kuma: минимальный мониторинг за 1 час
Если ваш офис совсем небольшой, скажем, до 15 рабочих мест, и у вас всего один сервер и один NAS — тогда я советую начать с Uptime Kuma. Это абсолютно бесплатный и до безобразия простой инструмент: он отлично мониторит доступность сервисов через ICMP, TCP, HTTP и умеет "кидать" уведомления прямо в Telegram, Discord или, если что, на почту.
Установить его через Docker Compose на любой Linux-сервер или даже на ваш NAS Synology/QNAP — это дело буквально 15 минут, и готово:
# docker-compose.yml
version: '3.3'
services:
uptime-kuma:
image: louislam/uptime-kuma:1
container_name: uptime-kuma
restart: always
ports:
- "3001:3001"
volumes:
- ./data:/app/data
# Запуск:
docker compose up -d
Дальше через веб-интерфейс на порту 3001 добавляете проверки: «Сервер 1С — ICMP», «Веб-интерфейс NAS — HTTP», «Mikrotik — ICMP», «Внешний интернет — ICMP к 8.8.8.8». Подключаете Telegram-бота через токен из @BotFather — и получаете дашборд с зелёными/красными точками + мгновенные уведомления о падениях.
У нас в АйТи Фреш примерно половина небольших клиентов вполне себе "сидит" на Uptime Kuma — и им этого хватает с головой. Но вот для более серьёзных задач, когда нужны метрики внутри систем, полная история, красивые графики и даже прогнозирование, мы, конечно, уже ставим Zabbix.
Zabbix: полноценный мониторинг для офиса 25+ рабочих мест
Когда "железа" становится ощутимо больше — это уже несколько серверов, NAS, Mikrotik, IP-АТС, ИБП — тут нужен инструмент, который не просто проверяет "жив" ли ресурс, а снимает метрики "изнутри": какая там загрузка CPU, сколько памяти занято, какие IOPS дисков, какая температура, и, конечно, как себя чувствуют сервисы Windows. Здесь стандарт, на мой взгляд, только один — это Zabbix.
Я обычно предпочитаю ставить Zabbix Server LTS-версии на отдельную виртуалку Ubuntu Server 22.04 с 4 ГБ RAM и 60 ГБ диска. Этого, кстати, вполне хватает для офиса до 100 узлов. Установка из репозитория тут полностью автоматизирована, что очень удобно:
# Подключение репозитория Zabbix 7.0 LTS на Ubuntu 22.04
wget https://repo.zabbix.com/zabbix/7.0/ubuntu/pool/main/z/zabbix-release/zabbix-release_7.0-1+ubuntu22.04_all.deb
dpkg -i zabbix-release_7.0-1+ubuntu22.04_all.deb
apt update
# Установка сервера, веб-интерфейса и MySQL
apt install -y zabbix-server-mysql zabbix-frontend-php \
zabbix-apache-conf zabbix-sql-scripts zabbix-agent2 mysql-server
# Создание базы данных
mysql -uroot -p
> create database zabbix character set utf8mb4 collate utf8mb4_bin;
> create user zabbix@localhost identified by 'СильныйПароль';
> grant all privileges on zabbix.* to zabbix@localhost;
> set global log_bin_trust_function_creators = 1;
> quit;
# Импорт схемы
zcat /usr/share/zabbix-sql-scripts/mysql/server.sql.gz | mysql --default-character-set=utf8mb4 -uzabbix -p zabbix
# Конфигурация и запуск
nano /etc/zabbix/zabbix_server.conf # вписываем DBPassword=СильныйПароль
systemctl enable --now zabbix-server zabbix-agent2 apache2
На каждый сервер и рабочую станцию, которые надо мониторить, ставится Zabbix Agent — он собирает локальные метрики и отдаёт их серверу. Для Mikrotik используется SNMP, для NAS Synology/QNAP — встроенные SNMP-агенты, для UPS — обычно через сетевую карту с SNMP.
За первый же месяц работы Zabbix у одного из моих клиентов отловил вот что:
- 3 случая падения сервиса 1С (автоматический рестарт через 30 секунд по триггеру)
- 2 случая 100 % загрузки диска бэкапов — успели почистить до того, как остановилось копирование
- 1 случай повышения температуры в серверной до 32°C (сломался кондиционер ночью) — алерт пришёл в 2:43, инженер выехал, в 5:30 поставил резервный кондиционер
- 1 случай начала отказа SSD на сервере 1С — заменили под нагрузкой через RAID
Любое из этих событий, если бы оно осталось незамеченным, могло бы стоить нашим клиентам от 50 тыс. до 1 млн рублей убытков. Сам Zabbix, к слову, абсолютно бесплатный, а вот наша настройка под ключ — это 35 000 ₽ разово.
Алерты в Telegram — почему именно туда
От алертов на почту я отказался давно. И вот почему:
- Почта приходит с задержкой 30 секунд — 5 минут
- Письма от мониторинга часто попадают в спам
- Никто не сидит и не смотрит в почту в 3 ночи
- Невозможно сделать «звуковое уведомление только для критичных»
Telegram-бот отправляет сообщение буквально за 1-2 секунды, умеет "разводить" разную критичность по разным чатам, а через настройки уведомлений Telegram можно оставить звук только на одном канале — том, где приходят критичные сообщения. Настройка занимает всего 20 минут:
# 1. В Telegram пишем @BotFather → /newbot → получаем токен типа
# 1234567890:AAFv-TestTokenExampleTextHere
# 2. Создаём канал для алертов, добавляем бота как админа
# 3. Получаем chat_id канала через @username_to_id_bot
# 4. Создаём скрипт /usr/local/bin/zabbix_telegram.sh:
#!/bin/bash
TOKEN="1234567890:AAFv-TestTokenExampleTextHere"
CHAT_ID="-1001234567890"
TO=$1
SUBJECT=$2
BODY=$3
curl -s -X POST "https://api.telegram.org/bot${TOKEN}/sendMessage" \
-d "chat_id=${CHAT_ID}" \
-d "text=*${SUBJECT}*%0A${BODY}" \
-d "parse_mode=Markdown"
# Делаем исполняемым
chmod +x /usr/local/bin/zabbix_telegram.sh
# В Zabbix: Administration → Media Types → Create Media Type
# Type: Script, Script name: zabbix_telegram.sh
# Параметры: {ALERT.SENDTO}, {ALERT.SUBJECT}, {ALERT.MESSAGE}
Дальше в Zabbix настраиваются Actions — какие триггеры в какие каналы шлются. Я обычно делаю три канала:
- Critical — серверы упали, бэкап не сделался, RAID-деградация. Звуковое уведомление дежурному инженеру 24/7
- Warning — диски заполняются, температура повышается, ИБП на батарее. Сообщение в общий чат IT-команды
- Info — плановые события, восстановление сервиса. Общий чат без звука
Мониторинг бэкапов — отдельная история
Самая распространённая ошибка, которую я постоянно встречаю: "у нас бэкапы делаются" — а потом начинаешь копать глубже, и выясняется, что либо их не делали полгода, либо они делались, но, к сожалению, битые. Поэтому мониторинг бэкапов, на мой взгляд, должен охватывать три уровня:
- Факт запуска задания. Veeam, Acronis, Active Backup для бизнеса — все умеют слать письмо/SNMP-trap при ошибке. Это самый базовый уровень — узнать, что задание не запустилось
- Размер и дата файла бэкапа. Zabbix следит за датой модификации файла бэкапа на NAS — если файл старше 26 часов (для ежедневного бэкапа), идёт алерт. Это ловит случай, когда задание показывает «успех», но на самом деле ничего не записало
- Контрольное восстановление. Раз в квартал инженер берёт случайную базу из бэкапа, восстанавливает на тестовый сервер, проверяет, что данные читаются и актуальны. Это единственный способ убедиться, что ваши бэкапы реально работают
Был у меня один такой случай: клиент целых 4 года делал "бэкапы" на NAS Synology с помощью скрипта. И все эти 4 года скрипт исправно, как по часам, писал "ОК" в лог. А когда, наконец, понадобилось восстановить базу 1С после сбоя, вскрылось страшное: скрипт копировал базу прямо во время её работы, не останавливая сервис, — и все эти 4 года складывал битые файлы, которые, естественно, попросту не открываются. В итоге восстанавливали всё по старинке, из бумажных распечаток квартальных отчётов, и потеряли 2 года первичной документации. Ужас!
Мораль из этой истории простая и ясная: "бэкап делается" и "лог показывает ОК" — это, поверьте, далеко не одно и то же. Проверка восстановлением просто обязательна!
Мониторинг для нетехнического руководителя
Отдельная, очень важная задача — это сделать так, чтобы руководитель компании буквально одним взглядом понимал: "у нас всё в порядке" или "что-то пошло не так". Руководителю я обычно настраиваю вот что:
- Простой публичный дашборд Uptime Kuma с зелёными/красными точками: «Сервер 1С», «Почта», «Сайт», «Телефония», «Интернет». Без технических деталей. Доступен по URL с любого браузера
- Еженедельный отчёт в Telegram: количество инцидентов за неделю, время простоя, состояние бэкапов. На одной картинке, понятно нетехническому человеку
- Алерт только при критичных авариях: остановилось обслуживание 1С, упала почта, нет интернета. Предупреждения и отчёты — НЕ руководителю, чтобы не было «boy who cried wolf»
У одного моего клиента руководитель раньше каждое утро ровно в 9:00 обзванивал все свои офисы (а у него их целых три по Москве) с единственным вопросом: «Всё работает?» Теперь он просто смотрит в свой телефон, видит зелёные точки и спокойно занимается бизнесом. А если что-то "падает" — он узнаёт об этом даже раньше своих сотрудников. Очень удобно!
Сколько стоит поставить мониторинг офисной инфраструктуры
Реальные цифры по моей практике на апрель 2026 в Москве:
| Размер офиса | Решение | Стоимость работ | Срок |
|---|---|---|---|
| 10 рабочих мест, 1 сервер | Uptime Kuma + Telegram | от 12 000 ₽ | 1 день |
| 25 рабочих мест, 2 сервера + NAS | Zabbix + Telegram + дашборд для директора | от 38 000 ₽ | 2 дня |
| 50 рабочих мест, AD + 1С + IP-АТС + NAS | Zabbix полный + Wazuh для безопасности | от 78 000 ₽ | 4-5 дней |
В эту стоимость, разумеется, входит всё необходимое: установка и полная настройка системы мониторинга, готовые шаблоны под ваше конкретное оборудование (будь то Mikrotik, Synology, Windows Server или 1С), настройка триггеров и алертов в Telegram, удобные дашборды для руководителя, подробная документация, и, конечно, обучение IT-сотрудников клиента, если таковые имеются. Что касается "железа" — обычно это просто отдельная виртуалка с 4 ГБ RAM на уже существующем гипервизоре, никакой отдельной коробки покупать не нужно.
Дальнейшее обслуживание — это и обновление шаблонов, и добавление новых узлов, и, конечно, оперативное реагирование на алерты — всё это включено в нашу абонентскую плату по тарифу «Стандарт». Для офиса на 25 РМ это от 45 000 ₽/мес, и никаких доплат сверху.
Чего я не делаю в офисах
За свои 15 лет в этом деле я, например, отказался от целого ряда "модных" решений, которые, особенно в малом бизнесе, зачастую создают куда больше проблем, чем реально решают:
- Не ставлю Prometheus + Grafana в офис на 25 человек — это решение для команды DevOps, требует постоянного допила. Zabbix даёт всё то же из коробки
- Не использую ELK-стек для логов в малых офисах — пожирает 8+ ГБ RAM просто за то, что работает. Wazuh дешевле и понятнее
- Не настраиваю SLA-метрики и SLI/SLO для внутренних сервисов — это нужно сервис-провайдерам, не офису
- Не ставлю мониторинг рабочих станций сотрудников по умолчанию — это создаёт ощущение слежки и обижает людей. Включаю только при явном запросе руководства и с информированием сотрудников
- Не делаю красивые дашборды на телевизор в офисе с зелёными графиками — никто на них не смотрит, это понты, а не польза
Мониторинг, на мой взгляд, должен всегда закрывать конкретную бизнес-задачу — а именно, помочь узнать о проблеме раньше, чем она больно ударит по вашим клиентам. Всё остальное, что эту задачу не решает, в офисе до 50 человек — это просто лишнее.
Получите бесплатный аудит инфраструктуры
Кстати, на аудит к каждому новому клиенту в Москве и в радиусе 50 км от МКАД я выезжаю лично. Всего за 2–3 рабочих дня вы получите от меня подробный письменный отчёт: там будет список всех критичных узлов вашей инфраструктуры, честная оценка текущего состояния мониторинга (или, если его нет, его отсутствия) и, конечно, смета на его внедрение. И всё это без каких-либо обязательств с вашей стороны.
Телефон: +7 903 729-62-41
Telegram: @ITfresh_Boss
Семёнов Евгений Сергеевич, директор АйТи Фреш
FAQ — частые вопросы по мониторингу
- Зачем офису мониторинг, если у нас всего 1 сервер?
- Чтобы узнать о проблеме раньше пользователей. Без мониторинга вы услышите «у меня не работает 1С» через 30 минут после того, как сервер начал тормозить. С мониторингом получаете алерт в Telegram через 2 минуты после сбоя бэкапа, переполнения диска или зависания сервиса.
- Что выбрать — Zabbix или Uptime Kuma?
- Для офиса 10-25 рабочих мест с одним сервером — Uptime Kuma за 1 час настройки, мониторит доступность и сертификаты. Для офиса 30+ с несколькими серверами, NAS, IP-АТС — Zabbix, потому что он умеет смотреть метрики (CPU, RAM, диск, температура) внутри систем, а не только снаружи.
- Сколько стоит мониторинг для офиса 25 рабочих мест?
- Развёртывание Zabbix с шаблонами для 1С, Mikrotik, NAS и Windows-серверов — от 35 000 ₽ разовых работ. Дальнейшее обслуживание входит в нашу абонентку «Стандарт» от 45 000 ₽/мес. Оборудование — отдельная виртуалка 4 ГБ RAM на сервере, бесплатно если есть гипервизор.
- Как мониторить, что бэкапы реально делаются?
- Не только проверять, что задание Veeam или Acronis отработало успешно (это ничего не гарантирует), но и контролировать размер бэкап-файлов, дату последней копии, и раз в квартал реально восстанавливать одну базу из бэкапа. Я считаю, что бэкап без проверки восстановлением — это иллюзия.
- Можно ли получать алерты не на почту, а в Telegram?
- Да, и это правильнее почты. Telegram-бот доставляет алерт за 1-2 секунды и точно не потеряется в спаме. Я ставлю всем клиентам именно Telegram-канал с разделением: критичные алерты — звуковое уведомление дежурному, плановые отчёты — в общий чат IT-команды.
