Нейромагия. Как MidJourney, ChatGPT и Claude создают наше будущее. Ранас Мукминов
Claude, и обсудим их сильные и слабые стороны. Также мы заглянем в неожиданные сферы применения нейросетей, от творческой деятельности до медицины, и разберём их возможное будущее.
Книга организована по тематическим главам, каждая из которых посвящена определённому кругу вопросов, связанных с нейросетями. В первой главе мы пройдёмся по истории, ключевым игрокам и базовым принципам работы. Во второй – погрузимся в подробности того, как именно строятся и функционируют популярные сегодня модели MidJourney, ChatGPT и Claude. Третья глава расскажет о самых удивительных и иногда совершенно неожиданных способах применения нейросетей. И, наконец, в четвёртой главе мы обсудим проблемы и перспективы, поговорим об этических вопросах и том, как мы, обычные люди, можем интегрировать нейросети в свою жизнь, не теряя при этом человеческого начала.
Приглашаю вас в увлекательное путешествие по миру искусственного интеллекта!
ГЛАВА 1. МИР НЕЙРОСЕТЕЙ
1.1. ЭВОЛЮЦИЯ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
Чтобы лучше понять, что такое нейросети и почему они сейчас в центре внимания научного сообщества и индустрии высоких технологий, полезно проследить историю их появления и развития. Идея создать «мыслящую машину» или хотя бы «машину, способную учиться», появилась намного раньше, чем появились реальные технические возможности для её реализации. Уже в середине XX века, с развитием кибернетики, математики и компьютерных наук, учёные начали выдвигать гипотезы о том, что вычислительные устройства могут моделировать процессы, происходящие в человеческом мозге. Однако в те времена ресурсы для подобных экспериментов были крайне ограничены.
1.1.1. ПЕРВЫЕ ОПЫТЫ И ТЕОРЕТИЧЕСКИЕ ОСНОВЫ
Перцептрон Фрэнка Розенблатта (1957). Одним из наиболее известных и важных шагов на раннем этапе развития искусственного интеллекта стал перцептрон, разработанный Фрэнком Розенблаттом в 1957 году в лаборатории Корнеллского аэронавтического института. Перцептрон представлял собой простую модель, имитирующую работу одного биологического нейрона – основного «строительного блока» мозга. На теоретическом уровне данная модель позволяла машине «учиться» распознавать простейшие шаблоны. Ключевыми элементами перцептрона были входные сигналы (например, от пикселей изображения), весовые коэффициенты (настраивающиеся в процессе обучения), сумматор и пороговая (активационная) функция, решающая, будет ли выход «1» или «0». Модель могла обучаться путём корректировки весов при сравнении своих ответов с «эталонными».
Логические элементы Маккалока – Питтса. Ещё раньше, в 1940-х годах, Уоррен Маккалок и Уолтер Питтс разработали математическую модель нейрона, которая позволяла говорить о «логике» работы мозга. В их работах показывалось, что даже простая сеть, состоящая из нескольких «логических» нейронов, способна реализовывать функции булевой логики. Это закладывало идею, что человеческий мозг можно рассматривать как сложную вычислительную машину, и теоретически есть способы её воспроизведения.
Нейрокомпьютеры (1960–1970-е). В 1960–70-х годах предпринимались смелые попытки создать компьютеры с «нейроподобной» архитектурой, используя аппаратные компоненты, повторяющие принципы работы нейронных сетей. Некоторые исследователи разрабатывали специализированные чипы, имитирующие работу нейронов и синапсов, чтобы соединить множество подобных процессоров в крупные системы. Однако вычислительные мощности того времени были слишком ограниченны, а теоретическая база ещё не сформирована достаточно для стабильных результатов.
1.1.2. ЗИМА ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
В 1970–80-е годы интерес к нейросетям заметно угас. Простейшие модели, вроде однослойного перцептрона, не могли распознавать сложные закономерности, а вычислительные мощности оставляли желать лучшего. Это привело к тому, что финансирование исследований сократилось, и этот период назвали «зимой искусственного интеллекта». Проблемы заключались в недостатке аппаратуры, неумении работать с нелинейными задачами и малом количестве качественных данных для обучения.
В то же время научная мысль не замерла полностью. Разрабатывались основы для новых методов обучения и усовершенствованных архитектур. Одним из ключевых моментов стало более глубокое понимание алгоритма обратного распространения ошибки (backpropagation), который впоследствии позволил обучать многослойные перцептроны и более сложные сети.
1.1.3. ВОЗРОЖДЕНИЕ ИНТЕРЕСА И ПРОРЫВЫ
С 2000-х годов наступил качественно новый этап в развитии искусственного интеллекта. Это стало результатом сходящихся факторов:
– Мощные GPU. Первоначально графические процессоры создавались для компьютерной графики и игр, но выяснилось, что архитектура GPU отлично подходит для параллельных вычислений, необходимых при обучении глубоких нейронных сетей. Теперь процесс, который раньше мог занять месяцы, стал возможен за считаные дни или недели.
– Большие данные. Распространение интернета, социальных сетей и мобильных устройств привело к накоплению огромных объёмов информации: тексты, изображения, видео, аудио. Эти данные стали «топливом» для обучения нейросетей.
– Глубокое обучение.