· 17 мин чтения

Dell PERC: настройка RAID на H330, H730 и H755 без лишних движений

Dell PERC: настройка RAID на H330, H730 и H755 без лишних движений

Привет! Это Семёнов Евгений Сергеевич, директор ITFresh. Сегодня поделюсь с вами кое-чем очень личным — нашим опытом. Вот взять нашу собственную инфраструктуру: там трудятся восемь серверов Dell, все на мощных Xeon Platinum 8280. Знаете, когда-то я сам, своими руками, собирал все эти RAID-массивы. Были и простенькие зеркала под гипервизоры, и настоящие монстры — RAID 60 на двадцать дисков, которые служили клиентской «файл-помойкой». Для меня контроллеры PERC — это просто эталон надёжности. Хотя, положа руку на сердце, у Dell есть одна такая... странная привычка: каждый раз, с новым поколением серверов, они почему-то меняют хоткеи и всё меню в BIOS. Ну вот зачем? Ладно, ближе к делу. Дальше подробно расскажу, что будет актуально в 2025–2026 годах, в каких случаях удобнее работать через OMSA, а когда проще сразу нырнуть в perccli.

Что такое Dell PERC и какие модели живы

Итак, что такое PERC? Если по-простому, это PowerEdge RAID Controller — целое семейство аппаратных контроллеров от Dell. Они не просто так называются "аппаратными": у каждого свой процессор, собственная память. А на топовых моделях, кстати, найдётся ещё и батарейный кэш. Но главная их фишка, прямо «киллер-фича»? Контроллер сам! Да, сам он собирает из физических дисков один большой Virtual Disk, который потом отдаёт операционной системе как единый, готовый к работе том. И что самое классное, если вдруг диск выйдет из строя, PERC самостоятельно, без всякого нашего участия или участия хоста, запустит ребилд. Разве это не удобно?

В новых проектах, когда мы что-то ставим клиентам, чаще всего выбираем из трёх конкретных моделей.

Если нагрузка не слишком тяжёлая, то и сегодня нередко увидишь H345 и H355. По своей сути, это такие SAS-HBA, но с возможностью собрать простенький RAID 1 или 10. Dell сейчас активно ставит их на свои 16-е поколения шасси. Заменили ими старые добрые H330, которые уже, честно говоря, морально устарели.

Как выбрать уровень RAID под задачу

Знаете что? Голый RAID 0? Вот его я в продакшн не поставлю никогда. Ни за что! Даже под какой-нибудь кэш. Зачем такие риски? Стоит ведь потерять всего одну плашку, и что произойдёт? Весь массив тут же рассыплется к чертям! Чтобы не гадать, ниже я приготовил удобную табличку. По ней, кстати, мы часто принимаем решения прямо на объекте у клиента.

УровеньМин. дисковЖивучестьКогда беру
RAID 12−1 дискЗагрузочный том, hypervisor boot
RAID 53−1 дискАрхив, небольшие общие папки на SAS
RAID 64−2 дискаБольшие NL-SAS массивы, бэкап-тома
RAID 104−1 в каждой пареБазы данных, VMware, Hyper-V
RAID 506−1 в каждой группеФайлопомойки 20+ ТБ
RAID 608−2 в каждой группеВидеонаблюдение, долгосрочный архив

На этот счёт у меня всегда одно очень простое, но железное правило. Если говорим про SSD под базу данных, то тут без вариантов — только RAID 10. И точка. А вот когда имеем дело с SATA 7.2k дисками, да ещё и на 8–16 ТБ каждый, мы выбираем исключительно RAID 6 или RAID 60. Почему так категорично? Причина вот в чём: ребилд RAID 5 на таких огромных объёмах превращается в настоящий кошмар. Это создаёт гигантское «окно» для второй ошибки. И, что самое неприятное, может затянуться не просто на часы, а почти на целые сутки! Мы не можем себе позволить такие риски.

Создание Virtual Disk через BIOS

Первый способ — куда же без него? Это, конечно, классический BIOS самого контроллера. Если у вас сервер 13-го поколения, например, старый добрый R730 или T630, то просто жмите Ctrl+R во время загрузки. А вот на 14-м поколении и всех, что вышли позже, алгоритм изменился: теперь давим F2 и там уже ищем раздел Device Settings. Не перепутайте!

  1. Увидели приглашение PERC? Жмите Ctrl+R. Или можно зайти в System Setup — просто через F2.
  2. Дальше что? Выбираем нужный контроллер. Потом либо Configuration Management, либо (еще проще) нажимаем F2, а там уже 'Create New VD'.
  3. Укажите нужный уровень RAID, а затем пробелом отметьте физические диски.
  4. Окей, Strip Size. Я обычно оставляю 64 КБ, если это универсальные задачи. Но если речь о файловых серверах, где много больших файлов, то лучше поставить 128 КБ – это просто оптимальнее.
  5. Read Policy ставим 'Adaptive Read-Ahead'. А Write Policy — 'Write-Back', но только при условии, что есть BBU. Это важно!
  6. Жмём OK. Инициализация пойдёт в фоне, так что можете сразу приступать к установке операционной системы. Красота!

А теперь один крайне важный момент, прямо жизненно важный: никогда, слышите, НИКОГДА не создавайте RAID на дисках, которые уже содержат данные! Что произойдёт? Контроллер не будет разбираться, он просто возьмёт и перезапишет все служебные области. Ваша прежняя файловая система? Просто исчезнет, без следа! Я сам, к сожалению, не раз видел это на практике у клиентов. Особенно когда они пытались мигрировать со старого программного RAID, забыв сделать бэкап. Это ведь так просто: всегда, всегда делайте резервные копии!

Управление из ОС через OMSA

Что делать, если сервер уже пашет вовсю в продакшне и его ну никак нельзя перезагружать? В таких случаях я, как правило, сразу переключаюсь на OpenManage Server Administrator, или просто OMSA. Это очень крутая утилита, которая без проблем ставится как на Windows, так и на любой Linux. А её удобный веб-интерфейс всегда доступен на порту 1311. Идеальное решение, когда нужно что-то настроить или посмотреть, не прерывая работу сервера!

# Ubuntu 22.04 — установка OMSA 11
curl -O https://linux.dell.com/repo/pgp_pubkeys/0x1285491434D8786F.asc
sudo apt-key add 0x1285491434D8786F.asc
echo "deb http://linux.dell.com/repo/community/openmanage/11200/jammy jammy main" | \
  sudo tee /etc/apt/sources.list.d/linux.dell.com.list
sudo apt update
sudo apt install srvadmin-all -y
sudo srvadmin-services.sh start

В OMSA всё просто: заходите в меню Storage, затем Controllers, выбираете нужный PERC, и команда Create Virtual Disk проведёт вас через интуитивно понятный мастер. Кстати, огромный плюс OMSA в том, что можно посмотреть практически всё: SMART по каждому диску, их температуру, и даже проценты износа для SSD. Но, конечно, есть и минус: это довольно тяжёлый агент. Он спокойно «отъедает» 250–400 МБ оперативной памяти.

Командная строка: perccli и racadm

Но что делать, когда на стойке не один-два, а сразу десяток серверов, или даже больше? Вот тут я полностью, без оговорок, перехожу на командную строку – CLI. Это просто незаменимая вещь. Инструменты? perccli работает прямо внутри операционной системы. А racadm — он общается с iDRAC по сети. С помощью этих утилит мы можем автоматизировать просто огромное количество задач, используя целые плейбуки Ansible. Это ведь не просто удобно, это колоссально ускоряет всю нашу работу!

# perccli на Linux
sudo /opt/MegaRAID/perccli/perccli64 /c0 show                 # контроллер
sudo /opt/MegaRAID/perccli/perccli64 /c0/eall/sall show        # физические диски
sudo /opt/MegaRAID/perccli/perccli64 /c0/vall show             # виртуальные диски

# Создание RAID 10 из 4 SSD в слотах 0-3 enclosure 252
perccli /c0 add vd r10 drives=252:0-3 pdperarray=2 \
  wt=no wb=yes ra=yes cached=on

# Назначить диск слота 7 глобальным Hot Spare
perccli /c0/e252/s7 add hotsparedrive
# racadm через iDRAC — удалённо
racadm -r 10.10.10.15 -u root -p "..." storage get pdisks
racadm -r 10.10.10.15 -u root -p "..." storage createvd:RAID.Integrated.1-1 \
  -rl r5 -pdkey:Disk.Bay.0:Enclosure.Internal.0-1:RAID.Integrated.1-1,\
Disk.Bay.1:Enclosure.Internal.0-1:RAID.Integrated.1-1,\
Disk.Bay.2:Enclosure.Internal.0-1:RAID.Integrated.1-1
racadm -r 10.10.10.15 -u root -p "..." jobqueue create RAID.Integrated.1-1 \
  --realtime

Кстати, на iDRAC 9 есть очень полезный флаг — `--realtime`. Он позволяет применять все изменения вообще без перезагрузки сервера. Это просто спасение, когда нельзя прерывать текущую работу ни на секунду.

Hot Spare, Patrol Read и мониторинг

В любом клиентском сервере, где дисков больше четырёх, у нас есть железное правило: там всегда должен быть настроен хотя бы один Global Hot Spare. Что это такое? Представьте себе диск, который просто терпеливо ждёт своего часа, готовый мгновенно включиться в работу, как только один из основных дисков вдруг выйдет из строя. Без него вы рискуете получить деградированный массив. А дальше? Останется только молиться, чтобы второй диск не «умер» до того, как приедет замена. Зачем вообще идти на такие риски, если можно их легко избежать?

Patrol Read — это, по сути, такая фоновая проверка. Контроллер сам вычитывает все сектора массива, и я всегда включаю эту функцию в автоматическом режиме. При этом мы ограничиваем её аппетиты до 30% ресурса, чтобы не мешать основной работе. Зачем это нужно? Всё просто: помогает выявить потенциальные проблемы заранее, до того, как они превратятся в настоящий инцидент.

perccli /c0 set patrolread=on mode=auto
perccli /c0 set patrolread rate=30
perccli /c0 set cc=on mode=concurrent rate=30
perccli /c0/bbu show status

А как мы мониторим всё это у себя в ITFresh? Наш дежурный инженер использует очень простой, но невероятно эффективный скрипт. Он всего лишь раз в пять минут дёргает perccli. И как только в ответе встречается злополучное слово «Degraded»? Тут же летит алерт! Сообщение уходит в наш Telegram-бот, и по SMTP на почту дежурного инженера. Благодаря этой системе мы научились ловить самые первые предвестники возможных отказов за несколько дней до того, как произойдёт сам инцидент. Это даёт нам драгоценное время.

Кейс: продакшн-восстановление RAID 5 в Химках

Помните ту осень 2025-го? К нам в ITFresh тогда обратилась одна оптовая компания из Химок. У них 35 рабочих мест, и сердце их инфраструктуры – сервер PowerEdge R740xd с контроллером PERC H740P. И вот, в одно злосчастное понедельничное утро приходит алерт: сразу два диска SAS по 2.4 ТБ в RAID 5 выдают 'Predictive Failure'. Массив ещё держался, да, но что это значило? Любой следующий сбой — и вся база 1С, плюс архив за пять лет, могли исчезнуть в небытие. Ситуация была, без преувеличения, критической!

Что сделали за 18 часов:

Что в итоге? Нулевой простой! Ни одной минуты простоя — мы гордимся этим результатом. Клиенту вся эта история, включая два новых диска и ночной выезд нашего инженера, обошлась в 72 000 рублей. Прошло уже полгода, а система до сих пор работает как швейцарские часы. Ни единого инцидента с тех пор!

Частые проблемы и как их лечить

Оптимизация производительности

Знаете, стандартные настройки Dell зачастую бывают слишком консервативны. Ну вот правда! Особенно для продакшена. Поэтому мы, на нашей практике, обычно сразу правим четыре ключевых параметра.

  1. Write Policy — Write-Back для массивов, защищённых BBU. Ускоряет случайную запись в 3–5 раз на HDD.
  2. Read Policy — Adaptive Read-Ahead. Контроллер сам решает, когда включать упреждающее чтение.
  3. Disk Cache — Disabled на HDD для критичных данных, чтобы внезапное обесточивание не потеряло запись в кэше шпинделя. На SSD — Enabled.
  4. Strip Size — 128 КБ для видео и файлового архива, 64 КБ для БД и VMware.
# Изменение политик на Virtual Disk 0
perccli /c0/v0 set wrcache=WB
perccli /c0/v0 set rdcache=ARA
perccli /c0/v0 set pdcache=off
perccli /c0/v0 set iopolicy=Cached

Соберём и поддержим сервер Dell под ключ

Моя команда АйТи Фреш занимается серверным железом Dell с 2011 года. Подберём шасси PowerEdge и контроллер под ваш профиль нагрузки, соберём RAID, настроим iDRAC, подключим мониторинг и возьмём поддержку 24/7 по SLA. Выезд по Москве и МО за 2–4 часа, экстренная замена дисков из нашего склада.

Телефон: +7 903 729-62-41
Telegram: @ITfresh_Boss
Семёнов Евгений Сергеевич, директор АйТи Фреш

FAQ — частые вопросы про Dell PERC

Какой уровень RAID выбрать для сервера 50 сотрудников?
Под систему — зеркало RAID 1 из двух SSD. Под данные при 4–6 дисках рассматривайте RAID 10 или RAID 6. RAID 5 на SATA-дисках большого объёма сегодня советую использовать осторожно — ребилд занимает сутки и больше.
Почему на PERC H330 нельзя включить Write-Back?
У H330 физически отсутствует DRAM-кэш и батарейный модуль, поэтому Write-Back невозможен. Контроллер работает только в Write-Through. Нужна скорость записи — ставьте H730P, H740P или H755 с BBU.
Что делать, если диск перешёл в Predictive Failure?
Это предупреждение о скором отказе. Меняйте диск, пока массив в Optimal. При Global Hot Spare замена делается с горячей подменой, контроллер сам начнёт синхронизацию.
Можно ли поменять уровень RAID без пересоздания?
На H730, H740P и H755 доступна миграция RAID Level Migration. На H330 такой возможности нет — потребуется бэкап, пересоздание массива и восстановление.
Сколько длится ребилд массива 8 ТБ?
Для RAID 5 из 4 дисков SAS 10k — 10–18 часов. На NL-SAS 7.2k и больших объёмах время доходит до 36 часов. Под нагрузкой ребилд замедляется кратно.

Подпишитесь на рассылку ITfresh

Кстати, не пропустите! Каждую неделю мы делимся практическими гайдами — специально для руководителей IT и сисадминов. Чего там только нет: от безопасности и 1С до сложных миграций, резервных копий. И, конечно, куча лайфхаков, взятых прямо из наших реальных проектов.

Реквизиты оператора персональных данных

ООО «АЙТИ-ФРЕШ», ИНН 7719418495, КПП 771901001. Юридический адрес: 105523, г. Москва, Щёлковское шоссе, д. 92, корп. 7. Контакт: info@itfresh.ru, +7 903 729-62-41. Оператор обрабатывает e-mail подписчика в целях рассылки информационных и рекламных материалов до момента отзыва согласия.