Почему сервер 1С через 2 года тормозит: разбираем деградацию SSD в офисных серверах
Меня зовут Семёнов Евгений Сергеевич, 15 лет занимаюсь IT-инфраструктурой средних офисов в Москве и Подмосковье. Один из самых частых запросов, с которым к нам приходят новые клиенты: «У нас сервер 1С работает уже два года, раньше всё летало, а сейчас бухгалтерия материт, отчёт формируется по 8 минут, документ открывается 15 секунд». В этой статье — разбор реальных причин и наш типовой алгоритм диагностики и лечения.
Симптомы, которые рассказывают историю
Когда клиент описывает проблему по телефону, я уже примерно знаю, что увижу на месте. Классическая картина:
- Сервер собран 18–28 месяцев назад как «среднебюджетная сборка для 1С».
- В системнике стоят два-четыре потребительских SSD Samsung 870 EVO или Samsung 980 Pro.
- Объединены в RAID 1 или RAID 5/10 на встроенном контроллере материнки или на дешёвом аппаратном RAID-контроллере.
- Заполнение тома 75–95%.
- Первые 8–14 месяцев всё работало хорошо, потом постепенно стало хуже, последние 2–3 месяца — невыносимо.
В девяти случаях из десяти причина — деградация SSD. Не аппаратная поломка, не «диски умерли», а именно физика NAND-памяти, которая не была учтена при проектировании сервера. Расскажу подробнее, почему так происходит.
Откуда берётся деградация: коротко про физику NAND
SSD пишет данные не побайтово, как HDD, а блоками по 4–16 МБ (page erase block). Чтобы перезаписать один байт, контроллеру SSD приходится прочитать весь блок, изменить нужный байт в кэше, стереть блок целиком и записать его обратно. Это называется write amplification — реальный объём записи больше, чем то, что попросил хост.
Чтобы это работало быстро, SSD держит «карман» свободных, заранее подготовленных блоков. Когда заполнение достигает 80–85%, кармана не хватает, и контроллер начинает «жонглировать» — для каждой записи приходится сначала освобождать место. Результат: запись замедляется в 5–20 раз, задержки растут с миллисекунды до 50–100 мс.
Команда TRIM нужна именно для того, чтобы операционная система могла сообщить SSD: «вот эти блоки теперь свободны, можешь готовить их заранее». Если TRIM не работает (а в офисных серверах с дешёвым RAID-контроллером он часто не работает) — карман не пополняется, и SSD умирает «по жизни», а не по записям.
Почему потребительские SSD в сервер 1С — это бомба замедленного действия
Разница между потребительским и серверным SSD не в скорости (она часто похожа в синтетике) и не в объёме. Разница — в трёх вещах:
| Параметр | Потребительский (Samsung 990 Pro 2 ТБ) | Серверный (Samsung PM9A3 1.92 ТБ) |
|---|---|---|
| Ресурс TBW | 1 200 ТБ | 3 504 ТБ (1 DWPD на 5 лет) |
| Защита от потери питания (PLP) | Нет | Конденсаторы для сохранения кэша |
| Стабильность задержки | 2–500 мс при нагрузке | 0.1–10 мс гарантированно |
| Over-provisioning | 7% | 20–28% |
| Гарантия | 5 лет в десктопном использовании | 5 лет в серверной 24/7-нагрузке |
| Цена за 2 ТБ (апрель 2026) | 22 000 ₽ | 58 000 ₽ |
Когда системный интегратор предлагает сервер за 280 000 руб., самый простой способ удешевить — поставить четыре потребительских SSD вместо двух серверных. Заказчик радуется, что у него «целых 8 терабайт». Через два года заказчик проклинает интегратора и звонит нам.
Из реальных кейсов 2024–2025 годов: у клиента-производителя в Балашихе на сервере 1С стояли четыре Samsung 870 EVO 4 ТБ в RAID 10. Через 22 месяца показатели smartctl: Wear Leveling Count — 8% (то есть осталось 8% заявленного ресурса), Total Bytes Written — 980 ТБ из заявленных 2400. Сервер тормозил так, что бухгалтерия не успевала закрывать месяц. Замена на пару Samsung PM9A3 1.92 ТБ в зеркале решила проблему — отчёт, который формировался 11 минут, стал формироваться 45 секунд.
Аппаратный RAID-контроллер: ещё один ингредиент катастрофы
Старая привычка с эпохи HDD — «нормальный сервер должен иметь нормальный RAID-контроллер». Для жёстких дисков это было верно: контроллер с батарейкой давал прирост скорости и защищал от потери данных при отключении питания. Для SSD — почти всегда вред.
Большинство аппаратных RAID-контроллеров до 2022 года выпуска не передают команду TRIM на SSD. Контроллер видит том как один большой блочный устройств и не знает, что внутри SSD. В результате SSD не получает информации о свободных блоках, карман не пополняется, через 6–12 месяцев производительность падает в разы.
Что мы делаем в АйТи Фреш с 2022 года:
- На Linux-серверах — программный RAID через mdadm. TRIM работает по умолчанию, скорость не уступает аппаратному, цена — ноль.
- На Windows-серверах — Storage Spaces. Тоже бесплатно, тоже с TRIM.
- Если клиент настаивает на аппаратном RAID — только Broadcom 9560-серии или новые HPE Smart Array P408i-c с явной поддержкой SSD и TRIM. Прошивку обновляем до последней.
- Контроллеры HPE P420/P440 и LSI 9271 — выкидываем и меняем на HBA в IT-mode.
Как мы диагностируем: типовая процедура
Когда клиент жалуется на тормоза сервера, я выезжаю с ноутбуком и набором инструментов. Алгоритм такой:
- Проверка SMART каждого диска. Команда
smartctl -A /dev/sdaна Linux илиCrystalDiskInfoна Windows. Смотрим Wear Leveling Count, Total Bytes Written, Reallocated Sectors. Если ресурс вышел — диагноз готов. - Проверка TRIM. На Linux:
lsblk -D— если DISC-MAX равен 0B, TRIM не работает. На Windows:fsutil behavior query DisableDeleteNotify. Если 1 — TRIM выключен. - Проверка заполнения. Если заполнение тома больше 80%, добавляем это в список причин.
- Проверка очереди I/O. На Linux
iostat -xz 1, на Windows — Performance Monitor с счётчиком Avg. Disk Queue Length. Если очередь регулярно больше 4 — диски не справляются. - Бенчмарк на текущей нагрузке. Запускаю
fioс типичным паттерном 1С (random read/write 4k), сравниваю с эталоном для конкретной модели SSD. - Проверка типа дисков. По модели понимаю, потребительские или серверные.
На основании этого выдаю отчёт с тремя сценариями: «лечение без замены дисков» (Secure Erase, переразметка с over-provisioning), «частичная замена» (меняем самый изношенный диск на серверный), «полная пересборка» (новые серверные SSD, миграция данных).
Что мы рекомендуем при сборке нового сервера 1С
Для офиса 15–40 пользователей 1С наша типовая конфигурация в 2026 году:
| Компонент | Модель | Цена |
|---|---|---|
| Платформа | HP DL380 Gen10 / Supermicro 1U-2U | 180 000–280 000 ₽ |
| Процессор | Intel Xeon Silver 4314 ×1 или ×2 | от 95 000 ₽ |
| Память | 96–192 ГБ DDR4 ECC RDIMM | от 75 000 ₽ |
| Системный диск | 2× Samsung PM9A3 480 ГБ в RAID 1 (mdadm) | 52 000 ₽ |
| Базы 1С | 2× Samsung PM9A3 1.92 ТБ в RAID 1 | 116 000 ₽ |
| Файловое хранилище | 4× Toshiba MG09 6 ТБ в RAID 10 | 72 000 ₽ |
| Контроллер | Broadcom 9400-8i в IT-mode | 32 000 ₽ |
| ИБП | APC Smart-UPS 2200 RM2U | 78 000 ₽ |
Итого по железу — 700–900 тыс. руб. в зависимости от количества пользователей. Сборка, настройка, миграция базы 1С — 90–140 тыс. руб. Итого под ключ — около миллиона. Прослужит 5–7 лет без значимой деградации.
Лечение «уже больного» сервера: реальный кейс
Март 2026 года. Производственная компания в районе Кунцево, 24 пользователя 1С УПП. Сервер собран в 2023 году самим бывшим админом, четыре Crucial MX500 2 ТБ в RAID 5 на встроенном RAID Intel RST. Жалобы — закрытие месяца идёт 4 часа против обычных 40 минут.
Диагностика заняла два часа. Картина: Wear Leveling Count на дисках 14–22%, заполнение тома 88%, TRIM через Intel RST не работает (это известная проблема RST 17-й серии), очередь I/O в пиках 18–24. Диагноз — комбо «выработанный ресурс плюс отсутствие TRIM плюс переполнение».
План работ:
- Холодный бэкап базы 1С на внешний диск (3 часа).
- Замена четырёх Crucial MX500 на два Samsung PM9A3 1.92 ТБ + два Samsung PM9A3 3.84 ТБ.
- Перенос RAID-конфигурации на программный mdadm под Debian (систему пришлось переустанавливать).
- Включение TRIM через fstrim.timer раз в сутки.
- Восстановление базы 1С, проверка целостности, тестовый запуск ключевых отчётов.
Все работы — пятница вечер 18:00 до субботы 14:00. Стоимость работ — 65 тыс. руб., новые диски — 218 тыс. руб. С понедельника закрытие месяца снова за 38 минут.
Что показывает SMART: расшифровка на пальцах
Чтобы клиент мог сам понять, в каком состоянии его SSD, я объясняю значение основных атрибутов SMART. Их три критичных:
- Wear Leveling Count (177 / 173 в зависимости от вендора). Это процент остаточного ресурса. 100% — диск как новый, 0% — выработал весь заявленный TBW. После 30% диск ещё работает, но я планирую замену в течение полугода. После 10% — это бомба, которая взорвётся в любой момент.
- Total LBAs Written (241). Сколько данных было записано за всю жизнь диска. Делите на 2 048 000, чтобы получить терабайты. Сравниваете с заявленным TBW — это и есть выработка ресурса в абсолютных цифрах.
- Reallocated Sectors Count (5). Количество переназначенных секторов. У SSD это редкое явление, любое значение больше нуля — повод присмотреться. Растёт со временем — диск явно умирает.
В нашей абонентке мы автоматически собираем эти показатели через Zabbix-агент со всех серверов клиентов раз в сутки и ставим алерт на превышение порогов. Это позволяет планово менять диски ДО того, как они стали проблемой, а не аварийно ночью под крик «всё пропало».
Чек-лист профилактики для уже работающего сервера
- Минимум раз в квартал смотреть smartctl/CrystalDiskInfo и записывать показатели в журнал.
- Контролировать Wear Leveling — при выработке более 60% планировать замену.
- Не допускать заполнение тома выше 75%.
- Убедиться, что TRIM работает (на Linux fstrim.timer, на Windows — Optimize Drives).
- Раз в год обновлять прошивку SSD и RAID-контроллера.
- Мониторить задержки I/O через Zabbix/PRTG, ставить алерт на превышение 20 мс.
- Иметь два запасных диска той же модели, чтобы при выходе из строя не ждать поставки.
Что делать прямо сейчас, не дожидаясь катастрофы
Если вы дочитали до этого места и понимаете, что описанные симптомы — про вас, вот короткий план действий на ближайшую неделю:
- Сегодня вечером. Скачать CrystalDiskInfo (для Windows) или собрать вывод
smartctl -aс каждого SSD на сервере. Записать показатели Wear Leveling Count и Total LBAs Written в табличку с датой. - Завтра утром. Проверить, какой процент тома заполнен. Если больше 80% — срочно почистить или расширить.
- На неделе. Найти модели всех SSD в сервере, погуглить «модель + datasheet TBW», сравнить с вашим Total Bytes Written. Понять, на каком вы проценте выработки.
- В этом месяце. Если выработка больше 60% или диски потребительские — заказать диагностику у профильного подрядчика и спланировать замену до того, как начнутся реальные проблемы.
- Раз в квартал постоянно. Снимать показатели SMART и сравнивать с прошлым квартом. Если рост Total Bytes Written ускоряется — что-то изменилось в нагрузке, надо разбираться.
И главное — не ждите, пока бухгалтерия начнёт жаловаться. К моменту, когда тормоза стали заметны пользователю, SSD уже глубоко в зоне деградации, и времени на спокойную замену почти не осталось.
Сервер тормозит, бухгалтерия в ярости?
Я лично выезжаю на диагностику к каждому новому клиенту в Москве и в радиусе 50 км от МКАД. За один визит мы покажем, что не так с вашим сервером, и дадим три варианта решения с конкретными ценами. Если виноват не сервер, а конфигурация 1С или сеть — тоже честно скажем.
Телефон: +7 903 729-62-41
Telegram: @ITfresh_Boss
Семёнов Евгений Сергеевич, директор АйТи Фреш
FAQ — частые вопросы
- Почему мой сервер 1С через 2 года стал тормозить?
- В 70% случаев — это деградация потребительских SSD: либо кончился ресурс TBW, либо TRIM не работает через RAID-контроллер, либо заполнение выше 80%.
- Какие SSD ставить в сервер 1С на 25 пользователей?
- Только серверные: Samsung PM9A3, Intel D7-P5520, Micron 7450 Pro. Потребительские Samsung 980/990 Pro в сервер ставить нельзя.
- Лучше брать аппаратный RAID или собирать на mdadm?
- Для SSD — программный mdadm на Linux или Storage Spaces на Windows. Аппаратный RAID часто блокирует TRIM, что убивает производительность.
- Сколько живут серверные SSD в реальной офисной нагрузке?
- Серверные SSD класса 1 DWPD на сервере 1С под 30 пользователей живут 5–7 лет. Потребительские — 14–24 месяца.
- Что делать, если сервер уже тормозит — менять диски?
- Сначала диагностика. В половине случаев помогает Secure Erase + переразметка с over-provisioning 25% и включение TRIM. Если ресурс выработан более 90% — только замена.