Dell R640 iDRAC9: укрощаем шум вентиляторов и снижаем температуру
Меня зовут Семёнов Евгений Сергеевич, я директор АйТи Фреш. С 14-м поколением Dell PowerEdge у меня странные отношения: с одной стороны, R640 — самая надёжная 1U-машина на рынке последних 5 лет. С другой — вентиляторы у неё в стоковой настройке шумят как взлетающий вертолёт. В офисе без серверной такой сервер слышно с другого конца этажа. В этой статье разбираю, как правильно настраивать охлаждение через iDRAC9, чтобы снизить шум и продлить ресурс железа без риска перегрева.
Откуда берётся шум, или почему R640 «гудит»
В R640 стоят 6 вентиляторов 40×40 мм со скоростью до 18000 RPM. На максимальных оборотах каждый из них выдаёт 60+ дБ — это сравнимо с шумом стиральной машины во время отжима. Шесть штук в одной коробке = ад в офисе.
Стоковая прошивка iDRAC9 рассчитывает обороты по нескольким датчикам: температура CPU, ambient temperature на входе, температура памяти, температура HDD-бэкплейна, температура BBU контроллера PERC. Алгоритм консервативный: лучше пусть гудит, чем перегреется. И это правильно для дата-центра, где шум всё равно неважен. Но в шкафу под лестницей в офисе клиента — нет.
За годы работы я выделил 5 ситуаций, которые гарантированно вызывают высокие обороты на R640:
- Установлены не Dell-сертифицированные PCIe-карты — iDRAC не видит их температуру и крутит вентиляторы на полную «на всякий случай».
- Заглушки PCIe-слотов сняты или потеряны, нарушен воздушный поток.
- В корзине дисков пустые ячейки без заглушек (caddies).
- Стоит NVMe-бэкплейн с пустыми слотами без заглушек NVMe.
- Прошивка iDRAC устаревшая (до 4.40), не умеет нормально работать с новыми CPU второго поколения.
Thermal Profile: главная настройка охлаждения
На iDRAC9 в разделе Configuration → BIOS Settings → System Profile Settings → Thermal Configuration есть параметр Thermal Profile со следующими значениями:
| Профиль | Минимальная скорость | Чувствительность | Когда использовать |
|---|---|---|---|
| Default Thermal Profile | ~28% | Стандартная | Дата-центр, серверная |
| Maximum Performance | ~35% | Агрессивная | HPC, чрезмерная нагрузка |
| Minimum Power | ~22% | Спокойная | Лёгкие задачи, экономия энергии |
| Sound Cap | ~12-18% | Минимальная | Офис без серверной |
| Custom | задаётся | задаётся | Тонкая настройка под кейс |
Default — это разумный компромисс для дата-центра, где шум не важен, а холодный воздух стоит дёшево. Maximum Performance имеет смысл только для серверов с тяжёлыми GPU и нон-стоп нагрузкой 100 % CPU.
Sound Cap — это режим, ради которого многие меняют настройки. Он специально снижает обороты, чтобы шум не превышал примерно 50 дБ на расстоянии метра от сервера. Цена — повышение средней температуры CPU на 5–10 °C. Для офисных задач (1С, AD, файлы) это безопасно, для тяжёлой нагрузки — нет.
Fan Speed Offset: подкрутка под нестандартное железо
Fan Speed Offset — это коэффициент 0–255, который суммируется с автоматически рассчитанной скоростью. Полезен в одном частном случае: вы воткнули в R640 PCIe-карту, температуру которой iDRAC9 не видит (например, GPU NVIDIA T4 без сертифицированной прошивки или 100G NIC от Mellanox).
Без Offset карта может перегреваться, потому что iDRAC не знает про её температуру и крутит вентиляторы по другим датчикам. Через Offset вы как бы говорите: «на всякий случай, гоняй на 30–50 % выше».
Через racadm:
# Текущее значение
racadm get system.thermalsettings.FanSpeedOffset
# Поставить 30% Offset
racadm set system.thermalsettings.FanSpeedOffset Medium
# Варианты: Off, Low (Medium-30), Medium, High, Max
# Применить
racadm jobqueue create iDRAC.Embedded.1 --realtime
Минимальная скорость вентиляторов: тонкая настройка для тишины
В Custom Thermal Profile можно явно задать минимальную скорость вентиляторов в процентах. Это критично для серверов в офисах, где шум — основная жалоба.
Я обычно ставлю одно из двух значений в зависимости от ситуации:
- 15–18 % — для серверов в открытом стеллаже в кабинете админа, под кондиционером.
- 22–25 % — для серверов в шкафу под лестницей или в подсобке без активной вентиляции.
- 28–32 % — для серверов в комнате, где жарко (выше 28 °C на входе).
Опускать ниже 12 % я не рекомендую — на R640 при таких оборотах перестаёт хватать воздуха для PERC и BBU, температура контроллера уходит выше 60 °C, и BBU начинает преждевременно деградировать.
Через racadm:
# Поставить минимум 18%
racadm set system.thermalsettings.MinimumFanSpeed 18
# Установить Custom профиль
racadm set system.thermalsettings.ThermalProfile "Custom"
# Применить (требует reboot для смены профиля)
racadm jobqueue create iDRAC.Embedded.1 --reboot
Настройка через веб-интерфейс iDRAC9
Если не хочется возиться с командной строкой, всё то же самое делается через веб:
- Открываем iDRAC по адресу
https://10.0.0.50, заходим под root/calvin (либо вашими). - Слева Configuration → BIOS Settings → System Profile Settings.
- Выбираем нужный System Profile (Performance, Performance Per Watt, Custom).
- Прокручиваем до Thermal Configuration, выбираем Thermal Profile.
- Если нужна тонкая настройка, выбираем Custom и указываем Min Fan Speed и Maximum CPU Temperature.
- Нажимаем Apply → выбираем «At Next Reboot» либо «On Reset».
- Перезагружаем сервер.
На R640 смена Thermal Profile требует именно полного reboot, не просто warm reset. Без перезагрузки настройки не вступят в силу даже если в интерфейсе показано Applied.
Мониторинг температур через iDRAC и racadm
Я снимаю температуры с серверов в наш Zabbix через SNMP-template Dell-iDRAC9 либо через парсинг racadm. Главные сенсоры, на которые смотрю:
- Inlet Temp — температура воздуха на входе в сервер. Норма 18–28 °C, выше 32 °C — лезть и разбираться с вентиляцией помещения.
- Exhaust Temp — на выходе. Обычно на 15–25 °C выше Inlet. Большая разница — высокая нагрузка.
- CPU1 Temp / CPU2 Temp — текущая температура процессоров. На Xeon Scalable нормально 45–70 °C, до 80 °C допустимо при пиках, выше 85 °C — алёрт.
- System Board Temp — температура самой платы. Норма до 50 °C, выше 60 °C обычно говорит о плохой циркуляции.
- Battery Temp на BBU контроллера PERC — норма до 50 °C, выше 60 °C — батарея быстро деградирует.
Опрос через racadm:
# Все датчики температуры разом
racadm getsensorinfo | grep -i temp
# Только CPU
racadm getsensorinfo | grep -E "CPU.*Temp"
# Скорости всех вентиляторов
racadm getsensorinfo | grep -E "Fan|RPM"
# Системные журналы (LCL) с фильтром по температуре
racadm lclog view -c TMP
Алёрты на перегрев и проблемы с охлаждением
В нашей практике на каждый Dell-сервер настраиваются три уровня алёртов в Zabbix через SNMP-trap от iDRAC:
- Warning: Inlet Temp > 32 °C, CPU Temp > 75 °C, скорость любого вентилятора более 70 % дольше 30 минут.
- High: CPU Temp > 85 °C, любой Fan переключился в Critical или отказал, BBU Temp > 60 °C.
- Disaster: CPU Temp > 92 °C, два или более Fan в Critical, прошёл Thermal Shutdown.
Дополнительно в iDRAC настраиваю SMTP-алёрты на собственный почтовый ящик дежурного инженера — на случай если Zabbix лежит, чтобы хотя бы по почте узнать о проблеме.
Кейс: убрали шум на 60% в офисе клиента
В феврале 2026 у нас был интересный кейс. Дизайн-студия в центре Москвы, 22 рабочих места, в кабинете руководителя стоял R640 с 1С и файловым сервером. Машина в открытой стойке, обычная вентиляция, температура в комнате 24–26 °C. Жалоба простая: «гудит так, что нельзя проводить переговоры».
На замерах шум был 62 дБ на расстоянии 1.5 метра. Зашёл в iDRAC, увидел Default Thermal Profile, минимальная скорость 28 %. CPU грузились в среднем 12–18 %, температура CPU 51–58 °C — то есть железо было сильно недогружено, а вентиляторы работали как при HPC-нагрузке.
Что сделал:
- Сменил Thermal Profile на Custom с минимальной скоростью 16 %.
- Maximum CPU Temperature поставил 80 °C (по умолчанию 65, что и заставляло вентиляторы крутиться).
- Проверил все заглушки в шасси — две caddy в дисковой корзине были пустые без заглушек, заказал и поставил.
- Отключил Fan Speed Offset (был выставлен Low по непонятной причине).
- Обновил прошивку iDRAC9 с 4.22 до 6.10.30.20.
После reboot замеры показали 47 дБ — снижение на 15 дБ или примерно в 3 раза по субъективному восприятию. Температура CPU поднялась на 4–6 °C, осталась в безопасной зоне 56–63 °C. Клиент в восторге, дизайнеры довольны, переговоры идут спокойно.
Что нельзя делать с охлаждением R640
Список того, что я регулярно вижу у клиентов и что заставляет меня хвататься за голову:
- Снимать вентиляторы. Иногда «временно отключают один, чтобы тише», и забывают. Через неделю CPU перегревается, BBU деградирует, диски в корзине шипят.
- Открывать крышку сервера навсегда. Кажется, что лучше остывает — на самом деле нарушается направленный поток воздуха, температура отдельных компонентов растёт.
- Использовать сторонние вентиляторы. В R640 вентиляторы со SmartFan-чипами, передающими данные iDRAC. Чужие будут показывать ошибку и крутиться на максимуме.
- Игнорировать алёрты по Inlet Temp. Если в комнате жарко, никакая настройка профиля не спасёт сервер от перегрева. Нужно решать вопрос с вентиляцией помещения.
- Менять Profile через ipmitool raw. На прошивках iDRAC9 после 4.0 эта возможность закрыта, попытки записи могут привести к застреванию iDRAC и необходимости его сброса.
Рекомендуемые настройки: моя сводная таблица
| Условия | Thermal Profile | Min Fan Speed | Max CPU Temp |
|---|---|---|---|
| Дата-центр, активная вентиляция | Default | 28% (по умолчанию) | 65°C (по умолчанию) |
| Серверная без активной вентиляции | Default или Custom | 22-25% | 72°C |
| Шкаф в офисе, средняя нагрузка | Custom | 18-20% | 75°C |
| Кабинет, лёгкая нагрузка (1С 5-10 юзеров) | Custom (Sound Cap) | 15-16% | 78°C |
| Дома или удалёнка, очень лёгкая нагрузка | Custom (Sound Cap) | 12-14% | 80°C |
| HPC, GPU, постоянная 100% нагрузка | Maximum Performance | 35-40% | 62°C |
Шумят серверы Dell в офисе? Поможем настроить
Я лично выезжаю на аудит парка серверов в Москве и в радиусе 50 км от МКАД. Перенастройка iDRAC, обновление прошивок, проверка заглушек, аудит температурных режимов. Без обязательств.
Телефон: +7 903 729-62-41
Telegram: @ITfresh_Boss
Семёнов Евгений Сергеевич, директор АйТи Фреш
FAQ — частые вопросы по охлаждению R640
- Какие Thermal Profile есть на iDRAC9?
- Default, Maximum Performance, Minimum Power, Sound Cap и Custom (с задаваемой минимальной скоростью вентиляторов и температурным потолком CPU).
- Как снизить шум сервера R640 в офисе?
- Поставить Custom Thermal Profile с минимальной скоростью 12–18 %, удалить незанятые заглушки PCIe и проверить вентиляционные caddy в корзине дисков. Реально получить 45–47 дБ вместо 60+.
- Что такое Fan Speed Offset?
- Это коэффициент 0–255, который суммируется с автоматически рассчитанной скоростью. Полезно при добавлении тяжёлых GPU или нестандартных PCIe-карт.
- Можно ли управлять вентиляторами через ipmitool?
- Технически да, но Dell с iDRAC9 4.0+ закрыл прямое управление через raw IPMI. Используйте racadm — он официально поддерживается.
- При какой температуре сервер начинает дросселировать CPU?
- Xeon Scalable начинает thermal throttling при достижении Tjmax (86–94 °C). При штатной работе CPU не должен превышать 75 °C.