Кластер ловит всплеск трафика, поды встают в очередь и ждут, пока появятся новые узлы. Сколько они будут ждать, две минуты или тридцать секунд, решает выбор механизма, который добавляет узлы. А сколько вы заплатите за эти узлы в конце месяца, решает то, насколько плотно он упаковывает поды и умеет ли пользоваться дешёвыми прерываемыми мощностями. Два инструмента в мире облачного Kubernetes подходят к этому принципиально по-разному. Разберём честно, откуда у одного берётся скорость в секунды и экономия в десятки процентов, и где второй, более старый, всё ещё остаётся разумным выбором.

Чем отличается подход к масштабированию узлов

Разница в самой философии. Классический автоскейлер кластера работает от инфраструктуры: вы заранее описываете группы узлов с фиксированными типами машин, а он масштабирует число машин внутри этих заранее заданных границ. Он смотрит на ожидающие поды, выбирает, какую группу нарастить, и просит облако добавить туда машины через механизм групп автомасштабирования.

Новый инструмент работает от подов и в реальном времени. Он наблюдает за ожидающими подами, сопоставляет их требования с описанием желаемых узлов и напрямую обращается к программному интерфейсу облака, запуская машину, которая лучше всего подходит под текущую потребность. Он не привязан к заранее заданным группам, а каждый раз подбирает оптимальный тип машины из широкого набора. Это и есть корень всех дальнейших различий: один работает в рамках предопределённых групп, другой синтезирует узел под конкретную нужду на лету.

Откуда берётся разница в скорости

Скорость различается разительно, и причина архитектурная. Новый инструмент выводит узел в строй примерно за сорок пять-шестьдесят секунд в облачных тестах, потому что обращается к интерфейсу запуска машин напрямую. Классический автоскейлер обычно тратит три-четыре минуты, потому что опрашивает состояние с интервалом в десяток секунд, моделирует размещение подов, а затем поручает облаку поднять машины через группу автомасштабирования, и ждёт полного цикла сканирования.

Разница в природе реакции. Новый инструмент событийно-управляемый: каждый ожидающий под немедленно запускает действие по поиску или запуску узла. Классический автоскейлер работает по таймеру, сканируя состояние каждые несколько секунд и лишь потом действуя. Для рваной нагрузки с резкими всплесками эта разница между секундами и минутами решающая. Веб-приложения со скачками трафика, системы сборки, запускающие сотни подов разом, событийные архитектуры, всё это выигрывает от быстрого запуска особенно сильно.

Почему плотная упаковка экономит деньги

Вторая ось различий это эффективность использования купленных мощностей. Новый инструмент применяет алгоритм плотной упаковки, складывающий нагрузку на наименьший набор узлов, способный её вместить. Вдобавок он активно переупаковывает: его механизм уплотнения может заменить три недозагруженные машины одной более крупной, сокращая простой и счёт. Свежая версия добавила уплотнение с приоритетом на пустоту, которое агрессивнее убирает простаивающие узлы, уважая при этом бюджеты нарушений.

Классический автоскейлер так не умеет. Он масштабирует группы узлов, но не переупаковывает нагрузку активно: его упаковка базовая, и фрагментация со временем накапливается. Узел убирается лишь по задержке и низкой утилизации, без умного перекладывания подов. В реальных миграциях именно улучшенная упаковка давала ощутимую часть экономии: компании сокращали простаивающие процессор и память, переходя на динамический подбор машин вместо фиксированных групп.

Как различается работа с прерываемыми мощностями

Тут одно из самых весомых различий по деньгам. Прерываемые мощности это дешёвые машины, которые облако может в любой момент забрать с коротким предупреждением, и они в разы дешевле обычных. Новый инструмент работает с ними изящно: он автоматически подбирает пул прерываемых мощностей, диверсифицирует типы машин и при изъятии прерванного узла успевает заменить его в пределах окна предупреждения.

Классический автоскейлер требует для этого ручной возни. Под прерываемые мощности заводят отдельные группы узлов, навешивают предпочтения размещения через сходство узлов и обязательно ставят отдельный обработчик, который ловит уведомление об изъятии и аккуратно сгоняет поды с машины. То есть то, что новый инструмент делает встроенно, в классическом приходится собирать руками из нескольких частей.

Цифры экономии впечатляют. По реальным наблюдениям, плотная упаковка сама по себе даёт от двадцати пяти до сорока процентов экономии, а с привлечением прерываемых мощностей выгода удваивается. Один финансовый сервис, перейдя на динамический подбор машин с прерываемыми мощностями, получил около тридцати процентов экономии и сберёг существенную сумму на облачных счетах за квартал. Другая компания довела долю прерываемых мощностей до восьмидесяти процентов боевых нагрузок после перехода.

Что показывают миграции крупного масштаба

Честность требует и трезвых цифр, потому что маркетинговые проценты бывают завышены. Показателен перевод более тысячи кластеров одной крупной компанией с классического автоскейлера на новый инструмент. Их результаты оказались скромнее громких лозунгов: около пяти процентов экономии в первый год с прогнозом ещё пяти-десяти в следующий по мере вызревания упаковки и использования прерываемых мощностей. Зато операционные накладные расходы упали на восемьдесят процентов, потому что автоматический подбор машин заменил ручное управление группами узлов.

Это важный нюанс. Экономия сильно зависит от того, насколько хорошо был настроен классический автоскейлер до перехода. Если моделирование мощностей уже было плотным, выигрыш по деньгам выйдет умеренным, в районе пятнадцати-тридцати процентов против хорошо настроенной классической схемы. А вот выигрыш по скорости запуска и по сокращению ручного труда проявляется почти всегда.

Где классический автоскейлер всё ещё уместен

Не стоит думать, что новый инструмент побеждает всухую, у старого есть своя территория. Классический автоскейлер это давно обкатанное, зрелое и предсказуемое решение. Он остаётся разумным выбором для небольших кластеров со стабильной, предсказуемой нагрузкой, где простота и предсказуемость важнее максимальной оптимизации. Если мощности уже хорошо смоделированы, а всплесков почти нет, гнаться за новым инструментом незачем.

Есть и довод мультиоблачности и опоры на управляемые группы узлов: классический автоскейлер использует штатные механизмы обновления, осушения по бюджету нарушений и управления правами через группы узлов. У нового инструмента есть и своё ограничение масштабируемости: один ведущий экземпляр держит всю модель кластера в памяти, и очень крупные кластеры за тысячу узлов требуют аккуратной настройки. Поэтому выбор стоит делать по приоритетам: если важнее стабильность и простота, разумен классический автоскейлер, если важнее максимальная оптимизация и быстрый отклик, и команда готова к большей сложности, новый инструмент.

Что меняет управляемый режим

Отдельно стоит свежий поворот, упрощающий выбор. Облако предложило управляемый режим, в котором новый инструмент работает как управляемый компонент вне самого кластера. В этом режиме не нужно самому устанавливать, масштабировать и обновлять механизм подбора узлов, облако берёт это на себя. Тем самым снимается часть операционной сложности, которая раньше была доводом против. Для команд, целиком живущих в этом облаке, такой режим даёт скорость и экономию динамического подбора без забот о сопровождении самого инструмента.

Как мигрировать без потрясений

Если решение о переходе принято, разумен поэтапный путь, а не рубка с плеча. Сначала новый инструмент ставят рядом со старым, не трогая существующие группы. Затем на новую мощность переводят одну неопасную нагрузку и наблюдают за выбором машин, плотностью упаковки и временем запуска. Дальше постепенно переносят остальные неприхотливые сервисы, добавляют прерываемые мощности для пакетных задач с повторами, включают уплотнение в тихое окно и проверяют поведение бюджетов нарушений. На всём протяжении одну группу старого автоскейлера держат как страховочную сетку, пока не наберётся уверенность. Крупные миграции проходили именно так: легаси-узлы аккуратно осушали с полным уважением к бюджетам нарушений.

Какой вывод следует

Однозначного победителя нет, хотя для динамичных нагрузок в этом облаке новый инструмент чаще выходит вперёд. Его сила в скорости запуска узлов за десятки секунд против минут, в плотной упаковке с активным уплотнением и во встроенной работе с прерываемыми мощностями, что в сумме даёт и быстрый отклик на всплески, и экономию от пятнадцати до тридцати процентов, а на агрессивном использовании дешёвых мощностей и больше. Классический автоскейлер сохраняет нишу: стабильные предсказуемые кластеры, ценность простоты и зрелости, опора на штатные группы узлов.

Главное при выборе это честно оценить характер нагрузки и текущую настройку. Тот, у кого кластер ровный и хорошо смоделирован, не получит от перехода больших денег и может остаться на проверенном решении. А тот, у кого нагрузка рваная, разнородная и страдает от того, что запросы расходятся с реальностью, переходом на динамический подбор срежет и время ожидания подов, и счёт за мощности, особенно если не побоится дешёвых прерываемых машин с грамотной обработкой их изъятия.