Искусственный интеллект – для вашего бизнеса. Руководство по оценке и применению. Эндрю Берджесс
помечаете все картинки по принципу «есть собака» и «нет собаки». Используя машинное обучение (один из методов, применяемых при разработке искусственного интеллекта, – о нем я расскажу позже) и введенные данные, система изучает, как выглядит собака на изображении (что общего есть между любыми собаками, присутствующими на картинках). Затем систему следует проверить на другом наборе таких же (но не идентичных) данных, где изображения тоже помечены, но на этот раз об этом знаете только вы, а системе ничего не известно. Если система сможет идентифицировать наличие или отсутствие собак на фотографиях, значит, она обучена достаточно хорошо. Вы можете проверять это снова и снова. Если после этого люди будут использовать созданное вами приложение (назовем его условно «Найди собаку на картинке») с подключенной обратной связью, то есть оценивая правильность ответов системы, то ИИ будет продолжать свое обучение прямо по ходу работы. Контролируемое обучение обычно используется там, где входные данные неструктурированы или структурированы лишь частично: изображения, звуки, рукописный текст. Сюда относятся функции распознавания изображений, речи и поиска в соответствии с предложенной мною моделью структуризации искусственного интеллекта.
При неконтролируемом обучении системе предлагается очень большой набор данных, которые в начале процесса для нее ничего не «значат». Однако по ходу анализа искусственный интеллект может определить в этих данных схожие характеристики (так называемые кластеры сходства). Следует отчетливо понимать, что искусственный интеллект не вкладывает в эти сходства и различия никакого «смысла» в человеческом понимании; он просто ищет повторение шаблонов среди океана информации. Но самое замечательное в таком подходе то, что и сам пользователь может ничего не понимать в этих данных. Да ему зачастую и не нужно знать, что он ищет: всю эту работу выполняет искусственный интеллект. Что бы мы ни исследовали, после того как ИИ определит кластеры сходства, он сможет создавать прогнозы для новых входящих данных.
Например, мы хотим определить стоимость дома в определенном районе. Цена дома зависит от многих переменных, таких как местоположение, количество жилых и ванных комнат, года постройки, площади участка земли и т. д. Такое обилие входящей информации затрудняет прогнозирование стоимости. Однако между всеми этими переменными, безусловно, должна быть какая-то скрытая связь, вопрос лишь в том, как ее найти. Именно это и делает за нас искусственный интеллект. Если в его распоряжении есть достаточное количество базовых данных, содержащих все эти переменные вместе с фактической ценой недвижимости, он использует статистический анализ, чтобы найти все доступные связи. Причем некоторые переменные могут очень сильно влиять на цену, а другие, как выясняется, вообще не оказывают на нее воздействия. Подготовив таким образом статистическую модель, мы вводим те же характеристики для дома, цена которого еще неизвестна, и модель