SRE. Рецепты выживания в продакшене для инженера по надежности. Наталья Савенкова

SRE. Рецепты выживания в продакшене для инженера по надежности - Наталья Савенкова


Скачать книгу
достаточно тяжело.

      Более благоприятная ситуация складывается тогда, когда количество пользователей естественным образом снижается и вы можете спокойно завершать свои затянувшиеся работы.

      В этом подходе есть риски – если работы проводят люди, которые уже отработали полный рабочий день, то к концу этого дня концентрация внимания снижена и вероятность ошибок выше.

      Оценивайте риски для вашей конкретной ситуации.

      Деньги: для компании почти всегда проще оплатить переработки группы сотрудников, чем нести потери от неработоспособности системы в дневное время.

      53. Календарь плановых запусков и работ

      О запусках и непредсказуемости.

      По мнению большинства инженеров продакт-менеджеры это очень непредсказуемые хаотичные ребята, которые всегда всё делают в последний момент. За это их, конечно, не любят. На самом деле, никаких непредсказуемых запусков у продактов нет – обычно о запуске известно за пару месяцев, потому что любой запуск требует достаточно большого объёма работы.

      Единственное, что нужно делать инженеру для уменьшения энтропии в этом мире продактов – иногда слезать с олимпа величия, ходить к продактам и задавать очень простой вопрос: “Коллеги, что вы планируете запустить в продукте в ближайшее время?”

      Продакты, они как дети, а ни один ребёнок не хочет быть плохим, поэтому с радостью расскажут вам о своих планах, если увидят в ваших искренних глазах готовность им помочь.

      Если у вас уже есть общий корпоративный календарь, то внесите туда планируемые запуски продактов, свой график регламентных работ и график “фризов” на изменения в системе. Если общего календаря нет – сделайте его. Не хотите электронный? Нарисуйте на стене табличку и приклейте в неё стикеры.

      Возьмите на себя задачу координации запусков и своих работ – вам все будут благодарны.

      54. Зафиксируйте термины

      Любая группа людей, занимающихся продолжительное время одним и тем же, неизбежно обрастает кучкой локальных терминов. Не каждому новичку сразу понятно, что именно значат местные названия. Я видела хорошую практику – завести глоссарий и описать в нём используемые названия и их значения.

      За историю работы мне встречались сервисы с запоминающимися названиями, например: “укроп”, “банана”, “L7”. И ещё вагончик терминов, типа: “ручка”, “дырка”, “бабуля”, “манка”… Список можно продолжать долго.

      Когда вы работаете в команде, с которой нужно быстро решать возникающие проблемы, вам необходимо говорить на одном языке и не допускать неверных трактовок. Нужно договориться, что именно и какими словами называть.

      Если мы говорим "снимаем трафик с Х", то все вокруг должны однозначно понимать, что это значит. Если мы говорим "катим Y в Z", все должны точно понимать, что такое Y, что такое Z и что значит "катим". Неточность в терминах приводит к плохим последствиям из-за нарушения координации и взаимопонимания.

      55. Групповая


Скачать книгу