Хостинг-провайдер «ВебХост» обратился к нам с нетипичной жалобой: на 40 серверах с SSD-дисками в RAID-10 производительность записи деградировала на 70-80% спустя 3-4 месяца эксплуатации. Серверы обслуживали клиентские сайты на WordPress и Bitrix, и при высокой нагрузке пользователи жаловались на таймауты.
Первичная диагностика показала следующую картину:
- Конфигурация: Intel S4510 480GB x4 в RAID-10 через LSI MegaRAID 9361-8i
- Заполнение дисков: 85-92% на большинстве серверов
- Скорость записи: упала с 450 MB/s до 90-120 MB/s (случайная запись 4K — с 68K IOPS до 7K IOPS)
- Латентность: p99 записи выросла с 0.3 мс до 12 мс, периодические всплески до 45 мс
Аппаратный RAID-контроллер LSI не поддерживал проброс команды TRIM на SSD — и это оказалось корнем проблемы.
Оставить комментарий