Мечты об «умных машинах», поражение экспертных систем и торжество трансформеров

Кандидат физико-математических наук, заместитель директора Математического центра в Академгородке, и.о. заведующего кафедрой информатики и ИКТ СУНЦ НГУ Сергей Оспичев рассказал о том, как искусственный интеллект эволюционировал от фантазий людей прошлого о мыслящих машинах до современных больших языковых моделей. О самых первых разработках, удачах и поражениях, успехах и запретах, достижениях и провалах на этом пути, узнали слушатели его лекции «Искусственный интеллект: происхождение и эволюция», прошедшей в рамках «Недели Дарвина» — научно-популярного марафона, который традиционно проводит Новосибирском государственном университете в феврале. В этом году мероприятие впервые было организовано на площадке нового кампуса НГУ. 

От голема к «Rent a Human»

Свою лекцию Сергей Оспичев начал с цитаты из фильма «Бегущий по лезвию», которая, на его взгляд, очень хорошо описывает ИИ: «Я не думаю, я вычисляю, но разница эта уже становится неочевидной». Он привел определение ИИ, данное китайской исследовательницей Чжун, Ю. С. (Zhong, Y. X.) еще в 2006 году в ее статье «Когнитивный подход и исследования в области искусственного интеллекта» (A cognitive approach and AI research): «Искусственный интеллект —...отрасль современной науки и техники, направленная, с одной стороны, на исследование секретов человеческого разума и максимально возможное наделение машин преимуществами человеческого разума, а с другой, чтобы машины могли выполнять функции настолько разумно, насколько они способны…».

Сергей Оспичев привел пример самого раннего искусственного интеллекта, существующего, впрочем, лишь как фантазия о «неживом», но могучем помощнике человека. Им стал глиняный великан, оживленный с помощью каббалистических ритуалов. Его активировали и деактивировали с помощью магического слова, написанного на свитке и помещенного в пасть истукана. Получив приказ, он самостоятельно принимал решение, каким способом его выполнить. Он действовал по заданной программе и являлся своеобразной машиной, работающей по инструкции. Тогда, в XVII веке, человек отдавал приказы пусть примитивному и вымышленному искусственному интеллекту, но с недавнего времени положение начало меняться.

В сети появился портал «Rent a Human», где нейросети сами могут выбрать человека для выполнения различных действий, которые они не способны производить самостоятельно: например, провести фотосъемку каких-либо объектов, осуществить доставку товаров или получение посылки, провести эмоциональную оценку каких-либо явлений или событий. Пока данная платформа носит экспериментальный характер, но намечается тенденция: теперь ИИ начинает управлять людьми. Хорошо это или нет — пока неизвестно, но таков теперь тот мир, в котором мы живем, — сказал Сергей Оспичев.

Первые предки

Эволюцию ИИ Сергей Оспичев предложил рассматривать с начала XX века. Он рассказал о взлетах и падениях на этом непростом пути, а также разобрал важные вехи этого процесса.

Первым на этот путь ступил немецкий исследователь, один из самых известных математиков прошлого века Давид Гилберт (1862-1943 гг.). Символами того времени стали телеграф и железные дороги, а преобладающим настроением — оптимизм и вера в науку. Ученый предложил сформировать единый формальный язык математики, в основе которого была заложена простая арифметика. Этот язык должен был предполагать алгоритмическую разрешимость всей науки. Почему это было так необходимо? С возникновением телеграфа мир изменился. Наука моментально стала международной, а научные знания — мгновенными. У ученых разных стран появилась возможность активно общаться друг с другом, обмениваться новостями, устраивать международные конференции, конгрессы, форумы и симпозиумы. Поэтому у математиков и назрела необходимость в едином формальном языке, понятным всем ученым.

Арифмометр — настольная механическая машина, предназначенная для точного выполнения четырех арифметических действий: сложения, вычитания, умножения и деления.

В начале прошлого века многие верили, что наука поможет разрешить все проблемы и с помощью хорошего арифмометра можно будет сделать любые вычисления и добиться высоких достижений в математике, физике и других науках. Давид Гилберт не был исключением и предложил формализовать математику. Однако на сцену выходит австрийский логик, математик и философ математики Курт Гедель (1906-1978 гг.) со своей теоремой о неполноте, согласно которой любая алгоритмически разрешимая теория, расширяющая арифметику, неполна. Он утверждал, что нельзя формализовать математику, основываясь на арифметике и используя алгоритмические методы. «Искусственный» математик не сможет заменить живой интеллект. Для нас, ученых, с одной стороны, это очень печально, потому что нам никогда не увидеть автоматического математика, а с другой — великолепно, потому что у нас всегда останется работа, — пояснил Сергей Оспичев.

Машина Тьюринга — абстрактная вычислительная машина, математическая модель вычислений, предложенная выдающимся британским математиком Аланом Тьюрингом (1912–1954) в 1936 году для формализации понятия алгоритма. Считается фундаментом теории вычислимости и используется для формального определения того, какие задачи можно решить с помощью алгоритмов.

Важным открытием этого периода зарождения ИИ стала машина Тьюринга. Этот ученый перевел дискуссии об алгоритмах из философии в инженерию. Во время II Мировой войны идея абстрактной машины Тьюринга была объединена с идеей взлома немецкой шифровальной машины «Энигма», которая активно использовалась тогда для передачи секретных сообщений. В итоге Алан Тьюринг разработал дешифровальную машину «Бомба», благодаря которой вошел в историю как взломщик «Энигмы» и основоположник ИИ.

Машина Тьюринга стала предком современных компьютеров, но при этом ее создатель сформулировал теорему Entscheidungsproblem (проблема разрешимости), доказав, что не все вычисления можно сделать с помощью компьютеров — существуют алгоритмы, которые нельзя написать ни на одном языке программирования. Из этого вытекает сложная проблема: с одной стороны, применяется инженерный подход: создаются сложные арифмометры и вычислительные машины, а с другой стороны — ученые заведомо знают, что все проблемы с помощью этих средств не решить. Мне нравится называть это термином «шизофрения вычислимости», — сказал Сергей Оспичев.

На старте

Термин «искусственный интеллект» появился в 1956 году на Дартмутском семинаре. Именно его принято считать стартом развития ИИ. Здесь же сложилась удивительная для нашего времени ситуация: по результатам семинара не было опубликовано ни одной статьи, но многие его участники стали общепризнанными «отцами-основателями» ИИ. Важные события на фоне: Холодная война и старт космической гонки. В ученом мире витают разговоры о том, что вычислительных мощностей не хватит на запуск спутников в космос.

Человечество уже изобрело компьютеры и уверенно пользуется ими. Эра микросхем еще не наступила. «Умные машины» пока слабы и имеют гигантские размеры — один из самых быстрых компьютеров занимает 280 квадратных метров и весит 25 тонн. Он годится лишь для простых арифметических вычислений. Необходимо переходить на новый способ вычисления, ускорить и оптимизировать их. На Дартмутском семинаре американский математик Джон Маккарти (1927 —гг. ) предлагает термин «искусственный интеллект». Позже он изобретет язык программирования Лисп, станет основоположником функционального программирования и лауреатом премии Тьюринга за огромный вклад в область исследований искусственного интеллекта.

Под запретом

Еще одним важнейшим звеном эволюции ИИ с стало изобретение американского ученого в области психологии и нейрофизиологии Фрэнка Розенблатта (1928-1971 гг.) из Корнеллского университета (США). Он разработал и собрал первый числовой компьютер Марк1, который позволял распознавать некоторые буквы английского алфавита, написанные от руки. Важно, что компьютер всему этому обучился самостоятельно. Марк1 стал первой нейронной сетью, собранной в железе. И, конечно, изобретение имело ошеломительный успех, и возникло убеждение: нужно изучать перцептроны и создавать все более сложные нейронные сети.

Перцептрон Розенблатта (1957–1960 гг.) — одна из первых моделей искусственных нейронных сетей, имитирующая процесс восприятия мозга. Он состоит из сенсорных (S), ассоциативных (A) и реагирующих (R) элементов, работая как линейный бинарный классификатор с пороговой функцией активации. Основа — обучение с коррекцией весов.

Однако эйфория продолжалась недолго — через несколько лет вышла в свет книга ученого в области ИИ из Массачусетского технологического института Марвина Мински (1927 —2016 гг) и математика Сеймура Пейперта (1928—2016 гг.) «Перцептроны». В ней авторы утверждали, что «...Увеличение размера перцептрона не приводит к улучшению способности решения сложных задач». Таким образом, вероятно, Марвин Мински пытался привлечь внимание (а равно и финансирование) к своим разработкам, но результат получился неожиданным: интерес к нейросетям угас, финансирование на разработки перестало выделяться, сам термин ИИ попал под запрет, а Марвин Мински получил прозвище «Убийца нейросетей». Так из-за соперничества двух организаций развитие ИИ остановилось на десятки лет.

Слишком сложно!

Сергей Оспичев удивил аудиторию, когда сказал, что первые многослойные нейронные сети появились в 70-х годах прошлого века. Поскольку нейронные сети были под негласным запретом и даже упоминать их не рекомендовалось, не то, чтобы вести разработки в данном направлении, работала экспертная система на логических правилах.

Отмечается растущая популярность логических языков программирования. И это не удивительно: раз уж, как писал в своей книге Марвин Мински, мы не можем обучить систему, потому что это не работает, то должны сами прописывать все правила. Появляются первые очень сложные экспертные системы. Одна из них — MYCIN — медицинская экспертная система, созданная в начале в Стэнфорде и предназначенная для диагностики инфекционных заболеваний (менингит, сепсис) и рекомендации антибиотиков. Она использовала базу правил (около 600,) и обратный вывод, демонстрируя точность на уровне экспертов-врачей и даже выше. Правда, выше всего на 2,6 %, но все же. Для сравнения — она предлагала приемлемую терапию в 65% случаев, а врачи — в 62,5% случаев. Эта система спровоцировала первые вопросы этики ИИ, но так и не нашла применения из-за сложности ввода данных, ведь пациенту приходилось отвечать примерно на 200 вопросов, чтобы система приняла решение о назначении терапии. В лучшем случае ввод данных занимал полчаса и больше, — рассказал Сергей Оспичев.

Поколение V

80-е годы прошлого века ознаменовались технологическим бумом в Японии и появлением микропроцессоров. Япония захватывает рынок вычислительной техники. Поток данных растет, вычислительных мощностей для их обработки становится недостаточно.

Появление микропроцессоров меняет мир компьютеров — они становятся меньше по размеру и мощнее. Теперь их вес составляет не 28 тонн, а 5 кг. Правда, стоимость их высока и далеко не каждый желающий может позволить себе персональный компьютер в домашних условиях, но это был большой шаг вперед. 

Стремясь сохранить технологическое лидерство, в 1982 году правительство Японии инициирует гигантскую государственную программу, рассчитанную на 11 лет с финансированием в 50 миллиардов иен (500 млн долларов). Позднее к этой гонке начали присоединяться другие страны. Ожидался прорыв в прикладном ИИ, однако ставки были сделаны на технологии, которые устарели еще на старте: на суперкомпьютеры, аппаратно способные к распределенным вычислениям. Термин «ИИ» по-прежнему под запретом: вместо него в научных статьях используются такие выражения, как «обработка данных», «автоматическое исследование изображений», «автоматический подход к обработке формул» и т.д. Начался расцвет императивных языков, а логические стали сдавать позиции.

Темно-синяя оттепель

В 90-х годах персональные компьютеры распространились повсеместно, всемирная паутина растет экспоненциально. Возникает уверенность: машина умнее человека! Подтверждение этому появилось в 1997 году и было растиражировано на весь мир. Сенсация: суперкомпьютер IBM Deep Blue впервые обыграл чемпиона мира Гарри Каспарова в матче из 6 классических партий со счетом 3½–2½. Это историческое событие стало первой победой искусственного интеллекта над действующим чемпионом, ознаменовав новую эру в шахматах и развитии технологий ИИ.

Конечно, для компаний, которые занимались ИИ, это было очень важно — это событие было для них прекрасной возможностью выйти из тени и развивать ИИ в открытую: публиковать статьи о своих научных разработках в журналах, открывать кафедры в университетах, внедрять свои разработки и претендовать на финансирование. Правда, высказывались версии, что это выигрыш стал результатом ошибки в коде, вследствие которой компьютером был сделан нестандартный ход, определивший исход этой игры. Но, с другой стороны, Deep Blue открыл для социума ИИ, и люди поняли, что можно заниматься ИИ, это что-то большое, важное, которое изменит нашу жизнь. По современным меркам Deep Blue был очень слабым компьютером, и искусственного интеллекта там было очень мало, и присутствовало там еще не мышление, а исчисление, но это точно стало одним из важнейших шагов в ИИ современного времени, — поделился Сергей Оспичев.

Видеокарты — вторая жизнь

Развитие многослойным нейросетям дали разработки, которые изначально не предназначались для серьезных задач, — игровые видеокарты. Именно благодаря им удалось преодолеть недостаточность мощности компьютеров того времени для необходимых вычислений.

Рынок был перенасыщен видеокартами — их выпускали гораздо больше, чем требовалось геймерам того времени, и стоили они гораздо дороже, чем геймеры того времени могли себе позволить. К тому же, эти видеокарты были гораздо круче, чем игры того времени. Тогда была разработана технология, позволяющая использовать их для вычислений. Такие видеокарты компания Nvidia, производящая их, стала бесплатно передавать в различные университеты, чтобы ученые пробовали их использовать в решении своих задач. В 2012 году достались они и разработчикам сверточной нейросети AlexNet Илье Суцкеверу, Джеффри Хинтону и Алексу Крижевскому. Объединив две видеокарты и получив 6 Гигабайт видеопамяти, они смогли выиграть в одном из важных соревнований по обработке изображения. При создании своей нейронной сети они и обошли классические алгоритмы машинного обучения, разработанные еще 5-7 лет назад, и продемонстрировали преимущество GPU — специализированного электронного чипа для параллельной обработки данных, рендеринга графики и ускорения сложных вычислений. Им удалось запустить цепную реакцию, которая привела к сегодняшней популярности глубокого обучения. Нейросети были реабилитированы, — рассказал Сергей Оспичев.

Три всадника ИИ

В наше время развитие нейросетей продвигают три всадника ИИ: arXiv — крупнейший бесплатный открытый архив (репозиторий) электронных препринтов научных статей, трансформеры и чатбот на основе Генеративного Предобученного Трансформера (GPT).

АrXiv представляет собой базу препринтов, содержащую 2,5 миллиона статей, более 30000 загрузок в месяц, 200 статей по ИИ в день.

Наука в области машинного обучения развивается очень быстро, а решения о публикации статей в научных журналах принимаются на протяжении довольно продолжительного времени — год или два. За два года в машинном обучении статья уже исчезнет из мира машинного обучения — потеряет актуальность и новизну. На этом же ресурсе можно выложить свою статью сразу, чтобы коллеги смогли, не дожидаясь официальной публикации, ознакомиться с ней, обсудить, начать использовать и делиться рекомендациями. Здесь же статьи появляются мгновенно, поэтому АrXiv — это один из главных реакторов машинного обучения нашего времени, — пояснил Сергей Оспичев.

Вторым «всадником ИИ» являются трансформеры — это следующее поколение нейронных сетей, своеобразный мостик между AlexNet и современными GPT-системами. Они обеспечивают глубокое обучение для обработки текстов. Рядом с ним следует и «третий всадник» — ChatGPT — чат-бот на основе генеративного предобученного трансформера, уже имеющий миллиарды запросов в год. GPT позволяет нам быстро и качественно обрабатывать тексты, переводить их с одного языка на другой, искать данные, формировать их них предложения и т.д. Он появился в 2020 году, а затем были разработаны его «наследники», которые сейчас являются постоянными помощниками человека.  

Вот это поворот!

И все же, каким бы большим ни был соблазн воспользоваться ИИ, целиком и полностью доверять ему нельзя. Что бы он ни делал, должно быть проверено на достоверность интеллектом естественным. Так, Сергей Оспичев по окончании лекции признался, что несколько цитат, открывающих его выступление, были сгенерированы нейросетью ИИ. Не было приведенной фразы в фильме «Бегущий по лезвию». И фото китайской исследовательницы, высказавшей свое видение ИИ в научной статье, процитированной в данной лекции, тоже  было сгенерировано нейросетью DeepSeek.


Материал подготовил: Елена Панфило, пресс-служба НГУ
Фото: Инесса Бахарева, пресс-служба НГУ
Продолжая использовать сайт, вы даете согласие на использование cookies и обработку своих данных. Узнайте подробности или измените свои настройки cookies.