9-1 · Глава 9 · 5 мин. чтения

Что на самом деле должно делать тестирование в пайплайне

Каждый раз, когда разработчик пушит код, возникает один вопрос: безопасно ли это изменение? Тестирование в пайплайне существует, чтобы ответить на него. Не ради галочки, а чтобы дать уверенность, что изменение можно продвигать дальше, не ломая работающее.

Что на самом деле должно делать тестирование в пайплайне

Каждый раз, когда разработчик пушит код, возникает один вопрос, требующий ответа: безопасно ли это изменение? Тестирование в пайплайне существует, чтобы ответить на этот вопрос. Не чтобы гонять тесты ради самих тестов. Не чтобы гнаться за 100% покрытием. А чтобы дать уверенность: изменение можно передать на следующий этап, не сломав то, что уже работает.

Эта уверенность важна, потому что пайплайны работают автоматически. Как только изменение попадает в пайплайн, он обрабатывает его без ожидания ручного одобрения на каждом шаге. Без механизма проверки безопасности изменения риск поломки доходит до продакшена. Тестирование в пайплайне действует как фильтр: изменения, не прошедшие тесты, останавливаются здесь; прошедшие — движутся дальше.

Но не каждый тест уместен в пайплайне. Некоторые тесты лучше выполнять вне его. Исследовательское тестирование, которое QA проводит вручную, чтобы найти сценарии, о которых никто не подумал. Крупномасштабное нагрузочное тестирование, которое занимает часы и требует выделенной инфраструктуры. Эти тесты важны, но им не место на быстром пути пайплайна, потому что они замедляют обратную связь разработчику. Пайплайну нужны тесты, которые быстры, детерминированы и достаточно надежны для принятия автоматических решений.

Для чего на самом деле нужно тестирование в пайплайне

Цель — не поймать каждый баг. Это в любом случае невозможно. Цель — поймать критичные баги до того, как они доберутся до пользователей. Набор тестов в пайплайне — это страховочная сетка, а не полный доспех. Он должен отсеивать изменения, которые нанесут видимый вред в продакшене.

Взгляните на это так. Разработчик меняет логику платежей. Если это изменение сломается, пользователи потеряют деньги, посыплются тикеты в поддержку, бизнес пострадает. Пайплайн должен это отловить. Разработчик исправляет опечатку на странице ошибки, которую почти никто не видит. Если это изменение сломается, ничего страшного не произойдет. Пайплайну не нужно прогонять полный регресс для такого случая.

В этом суть риск-ориентированного тестирования в пайплайне. Простая версия: какие части системы наиболее вероятно сломаются, и если они сломаются, каково будет влияние? Части, которые часто меняются. Части, являющиеся критическими бизнес-путями. Части, в которых трудно вручную обнаружить проблемы. Вот те части, которым нужно больше внимания от тестирования в пайплайне.

Как решить, какие тесты включать в пайплайн

Начните с риска. Не с того, какие тесты уже существуют. Не с того, что команда тестирования считает стандартом. Начните с того, что будет больно, если сломается.

Для платежной системы пайплайну нужны тесты, которые глубоко проверяют логику платежей. Для страницы профиля пользователя достаточно легкой проверки. Для миграции базы данных, меняющей тип колонки, пайплайн должен проверить, что существующие данные все еще работают и приложение корректно обрабатывает новый тип. Для изменения цвета кнопки в UI проверка визуальных регрессий может быть избыточной, если только кнопка не является частью критического пути.

Такой подход означает, что вы не запускаете все тесты для каждого изменения. Вы расставляете приоритеты на основе риска доставляемого изменения. Это практическое решение, а не теоретическое. Оно экономит время, сокращает длительность пайплайна и сохраняет быструю обратную связь.

Гейты уверенности: что на самом деле выдают тесты

Результат тестирования в пайплайне — это свидетельство. Это свидетельство используется для решения, может ли изменение перейти на следующий этап, например, из стейджинга в продакшен. Этот механизм часто называют гейтом уверенности (confidence gate).

Если тесты на этапе падают, гейт остается закрытым. Изменение останавливается. Если тесты проходят, гейт открывается, и изменение движется дальше. Чем выше риск, тем строже должен быть гейт. Для низкорискового изменения может хватить только юнит-тестов и быстрого смоук-теста. Для высокорискового могут понадобиться юнит-тесты, интеграционные тесты, сканирование безопасности и шаг ручной верификации.

Гейт — это не про совершенство. Это про достаточность, чтобы отловить критичные проблемы до того, как они доберутся до пользователей. Пайплайн, который блокирует каждое изменение по любой возможной причине, заблокирует всё. Никто ничего не зарелизит. Пайплайн, который пропускает всё, будет постоянно ломать продакшен. Баланс — в дизайне гейта.

Вот простой пример того, как может выглядеть гейт уверенности в конфигурации CI:

stages:
  - test
  - deploy

test:
  stage: test
  script:
    - pytest --junitxml=report.xml
  artifacts:
    reports:
      junit: report.xml

deploy:
  stage: deploy
  script:
    - echo "Deploying..."
  rules:
    - if: $CI_PIPELINE_SOURCE == "merge_request_event"
      when: manual
    - when: never
  needs: ["test"]
  variables:
    CONFIDENCE_GATE_MIN_PASS_RATE: 95
  before_script:
    - |
      PASS_RATE=$(grep -oP 'tests=\K[0-9]+' report.xml | head -1)
      TOTAL=$(grep -oP 'errors=\K[0-9]+' report.xml | head -1)
      RATE=$(echo "scale=2; ($PASS_RATE - $TOTAL) / $PASS_RATE * 100" | bc)
      if (( $(echo "$RATE < $CONFIDENCE_GATE_MIN_PASS_RATE" | bc -l) )); then
        echo "Confidence gate failed: pass rate $RATE% is below $CONFIDENCE_GATE_MIN_PASS_RATE%"
        exit 1
      fi

Что тестирование в пайплайне не заменяет

Тестирование в пайплайне — не замена ответственности разработчика. Разработчики по-прежнему должны убедиться, что их код работает, перед тем как пушить. Пайплайн добавляет автоматизированный слой верификации, который последователен и воспроизводим каждый раз, когда приходит изменение. Он ловит то, что пропускают люди, особенно когда они устали, спешат или работают над чем-то сложным.

Но он не заменяет мышление. Он не заменяет ручное тестирование для сценариев, которые сложно автоматизировать. Он не заменяет обсуждения того, правильное ли это изменение само по себе. Это инструмент, а не процесс.

Краткий практический чеклист

Когда вы настраиваете или проверяете тестирование в пайплайне, вот короткий список для сверки:

Есть ли у каждого теста в пайплайне четкая причина там находиться? Если нет — удалите его.
Достаточно ли быстр пайплайн, чтобы разработчики получали обратную связь в течение минут? Если нет — отдавайте приоритет более быстрым тестам перед медленными.
Детерминированы ли тесты? Плавающие тесты разрушают доверие к пайплайну.
Соответствуют ли тесты риску изменения? Исправление опечатки не должно запускать те же тесты, что и изменение логики платежей.
Есть ли четкий гейт на каждом этапе? Все должны понимать, что означает прохождение и падение.

Конкретный вывод

Тестирование в пайплайне — это не про запуск тестов. Это про построение уверенности, что изменение безопасно продвигать дальше. Эта уверенность приходит от выбора правильных тестов на основе риска, поддержания пайплайна достаточно быстрым для полезной обратной связи и проектирования гейтов, которые останавливают проблемы до того, как они доберутся до пользователей. Начните с того, что будет больно, если сломается, и стройте тестирование в пайплайне от этого.