6-6 · Глава 6 · 6 мин. чтения

Почему ручные проверки после деплоя обречены на провал (и что делать вместо этого)

Ручные проверки после деплоя не масштабируются. Узнайте, как автоматизировать smoke-тесты и синтетические транзакции, чтобы ловить проблемы до пользователей.

Почему ручные проверки после деплоя обречены на провал (и что делать вместо этого)

Вы только что выкатили новую версию. Открываете браузер, кликаете по страницам, проверяете, отвечает ли база данных, — всё выглядит нормально. Закрываете вкладку и идёте дальше.

Это работает, когда вы деплоите раз в неделю. Но когда деплои происходят ежедневно или по несколько раз в день, ручная проверка перестаёт быть надёжной. Один и тот же человек не может каждый раз повторять одинаковую инспекцию, ничего не упуская. Какие-то проверки пропускаются из-за спешки. Какие-то делаются на бегу, потому что начинается следующая встреча. Какие-то считаются заведомо успешными, потому что «в прошлый раз всё работало».

Проблема не в том, что люди невнимательны. Проблема в том, что ручное повторение не масштабируется. И когда плохой деплой проскальзывает из-за того, что кто-то забыл проверить один эндпоинт, расплачивается вся команда.

Реальная цена ручных проверок после деплоя

Ручные проверки после деплоя создают скрытые риски, которые команды часто недооценивают.

Во-первых, они полагаются на память. Человек, выполняющий проверку, должен помнить каждый шаг: какие эндпоинты дёргать, какие ответы ожидать, какие запросы к базе верифицировать, какие фоновые задачи подтвердить. Память ненадёжна, особенно под давлением.

Во-вторых, они различаются от человека к человеку. Один инженер может проверить логин и поиск. Другой — процесс оформления заказа и админ-панель. Никто не проверяет всё, и оба предполагают, что другой покрыл остальное.

В-третьих, они не оставляют следов. Когда ручная проверка проходит успешно, нет записи о том, что именно проверялось, каким был ответ и была ли проверка тщательной. Если что-то ломается через час, вы не можете вернуться к результатам проверки, чтобы понять, что изменилось.

В-четвёртых, они создают узкое место. Человек, который умеет делать проверки, становится вратами. Деплои ждут его. Релизы задерживаются. А если этот человек недоступен, команда либо деплоит без проверок, либо не деплоит вообще.

Автоматизация проверок после деплоя: основная идея

Решение прямолинейно: после того как пайплайн завершил деплой новой версии, он должен немедленно запустить предопределённый набор проверок. Эти проверки выполняются одинаково каждый раз, без необходимости кому-либо помнить, что нужно инспектировать.

Следующая диаграмма потока противопоставляет ручной подход автоматизированному, описанному здесь:

flowchart TD subgraph Manual[Ручные проверки после деплоя] A[Деплой новой версии] --> B[Открыть браузер] B --> C[Кликать по страницам] C --> D[Проверить базу данных] D --> E[Предположить, что всё в порядке] E --> F[Закрыть вкладку, идти дальше] F --> G[Проблемы обнаружены позже] end subgraph Automated[Автоматизированные проверки после деплоя] H[Деплой новой версии] --> I[Пайплайн запускает smoke-тесты] I --> J[Пайплайн выполняет синтетические транзакции] J --> K{Все проверки пройдены?} K -->|Да| L[Релиз подтверждён как здоровый] K -->|Нет| M[Немедленное оповещение команды] M --> N[Расследование конкретного сбоя] end Manual -.->|Ненадёжно| O[Команда платит цену] Automated -.->|Надёжно| P[У команды есть доказательства]

Речь не о тестировании каждой функции. Речь о верификации того, что самые критичные функции всё ещё работают после деплоя. Проверки подтверждают, что приложение живо, доступно и ведёт себя корректно на том уровне, который важнее всего для пользователей.

Пайплайн запускает эти проверки автоматически. Если все они проходят, у команды есть доказательство, что новая версия здорова. Если какая-то проверка падает, пайплайн немедленно оповещает команду, и они точно знают, какая часть требует внимания.

Вот минимальный пример того, как может выглядеть такой скрипт автоматизированной проверки:

#!/bin/bash
# post-deploy-check.sh
# Запускается после деплоя для верификации здоровья приложения.

BASE_URL="https://your-app.example.com"
PASS=0
FAIL=1

# Smoke-тест: проверка основного эндпоинта
HTTP_CODE=$(curl -s -o /dev/null -w "%{http_code}" "$BASE_URL")
if [ "$HTTP_CODE" -ne 200 ]; then
  echo "FAIL: Основной эндпоинт вернул $HTTP_CODE"
  exit $FAIL
fi
echo "PASS: Основной эндпоинт доступен"

# Синтетическая транзакция: симуляция потока логина пользователя
LOGIN_RESPONSE=$(curl -s -X POST "$BASE_URL/api/login" \
  -H "Content-Type: application/json" \
  -d '{"username":"test_user","password":"test_pass"}')

if echo "$LOGIN_RESPONSE" | grep -q '"token"'; then
  echo "PASS: Поток логина работает"
else
  echo "FAIL: Поток логина не работает"
  exit $FAIL
fi

echo "Все проверки пройдены. Деплой здоров."
exit $PASS

Два типа автоматизированных проверок для начала

Smoke-тесты

Smoke-тесты — это самая простая форма автоматизированных проверок после деплоя. Они проверяют, что приложение запущено и отвечает на базовые запросы.

Smoke-тест может проверять:

Может ли приложение принимать сетевые соединения?
Возвращает ли основной эндпоинт статус 200?
Может ли новая версия подключиться к базе данных?
Отвечают ли критические API-маршруты?

Такие проверки легко писать. Это просто скрипты, которые пайплайн вызывает после шага деплоя. Если какая-то проверка падает, пайплайн останавливается и уведомляет команду.

Smoke-тесты не обязаны быть всеобъемлющими. Они просто должны ловить очевидные сбои: сервис, который не запустился, соединение с БД, которое оборвалось, конфигурацию, которая пропала.

Синтетические транзакции

Синтетические транзакции идут на шаг дальше. Они симулируют действия реального пользователя шаг за шагом.

Для интернет-магазина синтетическая транзакция может:

Открыть страницу списка товаров
Кликнуть на конкретный товар
Добавить его в корзину
Перейти к оформлению заказа
Заполнить данные доставки
Подтвердить заказ

Каждый шаг проверяет, что ответ корректен. Если страница корзины возвращает ошибку или оформление заказа не загружается, синтетическая транзакция падает, и пайплайн знает, что что-то не так.

Синтетические транзакции требуют больше настройки, чем smoke-тесты. Вам нужно писать скрипты, имитирующие поведение пользователя. Но они ловят проблемы, которые smoke-тесты пропускают: сломанные воркфлоу или отсутствующие данные в многошаговом процессе.

Что автоматизировать в первую очередь

Не пытайтесь автоматизировать всё сразу. Начните с функций, поломка которых причинит наибольшую боль.

Спросите свою команду: «Если мы задеплоим и эта функция перестанет работать, как быстро пользователи это заметят? Какой будет ущерб?»

Ответы подскажут, что автоматизировать в первую очередь. Для большинства приложений это:

Аутентификация и логин
Функциональность поиска
Ключевые транзакционные потоки (оформление заказа, оплата, бронирование)
Формы отправки данных
API-эндпоинты, от которых зависят другие сервисы

Начните с одного-двух сценариев. Запускайте их consistently после каждого деплоя. Добавляйте новые по мере того, как увидите, что ломается и что важно.

Небольшой набор проверок, которые выполняются каждый раз, гораздо ценнее, чем большой набор, который постоянно падает из-за flaky-тестов или нерелевантных сценариев.

Как сделать результаты видимыми

Автоматизированные проверки полезны только тогда, когда их результаты видны и по ним можно действовать.

Ваш пайплайн должен записывать результат каждой проверки. Храните результаты рядом с логами деплоя. Отображайте их на дашборде, который видит команда.

Когда все проверки пройдены, у команды есть чёткое доказательство, что деплой здоров. Когда проверка падает, команда немедленно знает, какую часть системы нужно исследовать.

Такая видимость меняет то, как работает команда. Вместо того чтобы гадать, прошёл ли деплой успешно, у них есть данные. Вместо того чтобы полагаться на чью-то память, у них есть записи. Вместо того чтобы узнавать о проблемах из жалоб пользователей, они ловят их через несколько минут после деплоя.

Следующий шаг: от верификации к решению

Как только автоматизированные проверки после деплоя становятся рутиной, следующим логическим шагом будет использование их как шлюза. Если проверки падают, пайплайн может автоматически остановить релиз, не допуская его до пользователей. Если они проходят, релиз продолжается.

Речь не об устранении человеческого суждения. Речь об устранении необходимости людям повторять одну и ту же ручную верификацию каждый раз. Команда решает, что проверять. Пайплайн выполняет эти проверки consistently. А команда фокусируется на исключениях, а не на рутине.

Практический чеклист для начала

Прежде чем строить полноценную систему автоматизации, начните с малого:

Определите три самые критичные пользовательские функции в вашем приложении
Напишите скрипт smoke-теста, который проверяет, что ваши основные эндпоинты отвечают корректно
Напишите один скрипт синтетической транзакции, симулирующий ключевой пользовательский поток
Добавьте эти проверки в пайплайн деплоя, сразу после шага деплоя
Настройте пайплайн на уведомление команды, если какая-то проверка падает
Запускайте проверки в течение недели и отмечайте любые ложные срабатывания или пробелы
Скорректируйте проверки на основе полученных данных
Добавьте ещё один сценарий на следующей неделе

Конкретный вывод

Ручные проверки после деплоя работают, пока не перестают работать. Как только ваша команда деплоит чаще раза в день, или как только плохой деплой проскальзывает из-за того, что кто-то забыл проверить одну вещь, вам нужна автоматизация.

Начните со smoke-тестов для базовой доступности. Добавьте синтетические транзакции для критических пользовательских потоков. Сделайте результаты видимыми. И позвольте пайплайну взять на себя повторение, чтобы ваша команда могла сосредоточиться на том, что действительно требует человеческого внимания.

Цель — не устранить человеческий контроль. Цель — устранить тот вид контроля, который происходит потому, что кому-то пришлось запоминать проверку одной и той же вещи в сотый раз.