36-3 · Глава 36 · 5 мин. чтения

Платформа, пайплайн и стратегия развертывания как единая система

Как согласовать платформу, CI/CD пайплайн и стратегию деплоя, чтобы команды доставляли изменения быстро, безопасно и без сбоев. Практические рекомендации для DevOps и SRE.

Платформа, пайплайн и стратегия развертывания как единая система

Вы уже распределили команды. Знаете, кто что разрабатывает, кто проверяет изменения и кто реагирует на инциденты в продакшене. Но когда кто-то спрашивает: «Где это вообще работает?» или «Как код из пул-реквеста превращается в работающий сервис?» — ответы становятся расплывчатыми.

Именно здесь большинство инициатив по доставке ПО буксуют. Команды начинают выбирать инструменты, писать YAML-файлы и решать, что использовать: blue-green или canary, — не связывая инфраструктуру, автоматизацию и механизмы релизов. В результате получается разрозненная система, где платформа конфликтует с пайплайном, а стратегия развертывания работает против них обоих.

Почему платформа — это основа

Представьте команду, которой нужно развернуть новый микросервис. Без общей платформы они вручную поднимают виртуальную машину, устанавливают зависимости и настраивают сеть через тикет-систему. Другая команда делает то же самое, но иначе. Через полгода одна среда работает на Ubuntu 20.04, другая — на 22.04. Одна команда хранит логи локально, другая — стримит их в центральный сервис. Когда случается инцидент, никто не знает, какая среда похожа на продакшен.

Платформенный инжиниринг решает эту проблему, предоставляя единый фундамент. Он отвечает на вопрос: как команды получают окружения, не пересобирая всё с нуля каждый раз? Платформой может быть кластер Kubernetes со стандартизированными шаблонами ресурсов, набор Terraform-модулей, которые использует каждая команда, или управляемый слой сервисов, полностью абстрагирующий детали инфраструктуры.

Ключевой принцип — единообразие. Когда все команды разворачиваются на одном фундаменте, различия между средами исчезают. Стейдж ведет себя как продакшен, потому что оба работают на одной платформе. Проблемы, найденные в тестировании, — это те же проблемы, что возникнут в продакшене, а не новые, вызванные расхождением конфигураций.

Общий Terraform-модуль делает это единообразие воспроизводимым:

# modules/team-namespace/main.tf
resource "kubernetes_namespace" "team" {
  metadata {
    name = var.team_name
    labels = {
      team    = var.team_name
      env     = var.environment
      managed = "platform"
    }
  }
}

resource "kubernetes_resource_quota" "limits" {
  metadata {
    name      = "${var.team_name}-quota"
    namespace = kubernetes_namespace.team.metadata[0].name
  }
  spec {
    hard = {
      pods                = var.max_pods
      requests.cpu        = var.max_cpu
      requests.memory     = var.max_memory
      limits.cpu          = var.max_cpu
      limits.memory       = var.max_memory
      persistentvolumeclaims = var.max_pvcs
    }
  }
}

Каждая команда вызывает этот модуль со своими переменными, но определения ресурсов остаются идентичными.

Пайплайн как позвоночник доставки

CI/CD пайплайн — это не просто последовательность автоматизированных шагов. Это путь, который соединяет код, написанный разработчиками, со средой, где пользователи взаимодействуют с приложением. Каждый этап пайплайна — сборка, модульные тесты, интеграционные тесты, сканирование безопасности, деплой — представляет собой шаг в потоке ценности, доставляющем изменения пользователям.

Без пайплайна эти шаги выполняются вручную. Кто-то собирает артефакт на своем ноутбуке. Кто-то копирует его на сервер. Третий человек запускает тесты руками. Каждый ручной шаг вносит задержки и риски. Забытая зависимость, другая версия операционной системы или пропущенный тест могут привести к сбоям, которые проявятся только после деплоя.

Хорошо спроектированный пайплайн применяет одни и те же проверки к каждому изменению. Каждый пул-реквест запускает одинаковый процесс сборки, выполняет те же тесты и проходит через одни и те же шлюзы верификации. Команды могут доверять «зеленому» пайплайну — это значит, что изменение прошло все значимые проверки. Именно это доверие делает частые деплои безопасными.

Стратегия развертывания — это о пользователях, а не о технологиях

Когда говорят о стратегиях развертывания, часто фокусируются на технических паттернах: blue-green, canary, rolling update, feature flags. Но это лишь детали реализации. Настоящий вопрос: как доставлять изменения, не нарушая работу пользователей?

Ответ зависит от характеристик вашего приложения. Публичному веб-сервису с миллионами пользователей может потребоваться canary-релиз, который направляет один процент трафика на новую версию, а затем постепенно увеличивает долю, отслеживая уровень ошибок. Внутреннему инструменту, которым пользуются двадцать человек, может быть достаточно простого rolling update, заменяющего экземпляры один за другим.

Деплои баз данных добавляют еще один уровень сложности. Миграция схемы, добавляющая колонку, безопасна для выполнения вместе со старым кодом. Миграция, переименовывающая колонку или меняющая её тип, требует тщательной координации между версиями приложения. Стратегия развертывания должна учитывать эти ограничения, а не только код приложения.

Возможность отката — тоже часть стратегии. Если что-то пошло не так, как быстро вы можете вернуться к предыдущей версии? Можете ли вы откатить приложение независимо от базы данных? Поддерживает ли платформа мгновенный откат, или нужно пересобирать и переразворачивать? Эти вопросы должны быть решены до первого деплоя в продакшен, а не во время инцидента.

Три слоя должны проектироваться вместе

Платформа, пайплайн и стратегия развертывания — это не независимые решения. Они образуют систему, где каждый слой ограничивает и расширяет возможности других.

Диаграмма ниже показывает, как каждый слой зависит от других и ограничивает их.

Платформа определяет, что может делать пайплайн. Если платформа не поддерживает blue-green деплой с переключением трафика, пайплайн не сможет реализовать эту стратегию. Если на платформе нет механизма отката, стратегия развертывания не может полагаться на быстрое восстановление.

Пайплайн определяет, как выполняется стратегия развертывания. Если в пайплайне нет этапа верификации с интеграционными тестами против стейджа, у canary-релиза не будет осмысленной проверки работоспособности. Если пайплайн пропускает валидацию миграций базы данных, стратегия развертывания не сможет безопасно обрабатывать изменения схемы.

Стратегия развертывания определяет, что должна поддерживать платформа. Если стратегия требует мгновенного отката, платформа должна держать предыдущую версию запущенной и переключать трафик мгновенно. Если стратегия использует feature flags, платформа должна поддерживать изменения конфигурации на лету без переразвертывания.

Когда эти три слоя проектируются вместе, результатом становится система доставки, работающая как единое целое. Командам не нужно разбираться, как заставить несовместимые части работать вместе. Платформа предоставляет то, что нужно пайплайну. Пайплайн выполняет то, что требует стратегия. Стратегия учитывает возможности платформы.

Практический чек-лист для вашей системы доставки

Прежде чем финализировать платформу, пайплайн и стратегию развертывания, проверьте следующее:

Может ли каждая команда развернуть свой сервис, используя один и тот же шаблон пайплайна?
Обеспечивает ли платформа одинаковое поведение в стейдже и продакшене?
Можете ли вы откатить деплой без ручного вмешательства?
Включает ли пайплайн этапы верификации, соответствующие вашей стратегии развертывания?
Поддерживает ли платформа выбранную стратегию развертывания без обходных путей?
Интегрирован ли процесс миграции базы данных в пайплайн, а не выполняется отдельно?
Можете ли вы деплоить в рабочее время, не опасаясь нарушить работу пользователей?

Если хотя бы на один вопрос ответ «нет» — у вас разрыв между слоями. Устраните его, прежде чем масштабировать систему.

Вывод

Платформа, пайплайн и стратегия развертывания — это не три отдельных решения. Это одна система, которую нужно проектировать вместе. Когда они согласованы, команды могут деплоить часто, быстро восстанавливаться и доверять, что каждое изменение проходит один и тот же строгий путь. Когда они не согласованы, каждый деплой превращается в проблему координации, а каждый инцидент вскрывает разрыв между тем, что предоставляет платформа, и тем, что требует стратегия. Начните с платформы, выстройте вокруг неё пайплайн и выберите стратегию, которую они обе могут поддержать.