Тест Ворошилова
Антон Рундквист
Специалист в области обнаружения подлинного искусственного интеллекта беседует с новейшим суперкомпьютером, используя особую методику вопросов и ответов, направленную на выявление у машины зачатков творческого мышления.
Антон Рундквист
Тест Ворошилова
Тест Ворошилова
Аннотация. Специалист в области обнаружения подлинного искусственного интеллекта беседует с новейшим суперкомпьютером, используя особую методику вопросов и ответов, направленную на выявление у машины зачатков творческого мышления.
– Геннадий Константинович?
Услышав свои имя и отчество, мужчина вынырнул из состояния глубокой задумчивости, сопровождаемого привычным поглаживанием едва тронутой сединой черной бороды. Белоснежное фойе научно-исследовательского института натолкнуло визитера на размышления об облаках, тумане, яичной скорлупе, лепестках ромашки, снеговых шапках на горных вершинах и чистоте. Подобная реакция, в общем-то, ожидаема от человека, в чьи профессиональные обязанности входит постоянная работа с различными образами и ассоциациями.
– Да, – отозвался мужчина.
– Здравствуйте, меня зовут Светлана Петровна Ким, – представилась одетая в бежевый деловой костюм невысокая темноволосая женщина с чуть раскосыми карими глазами. – Я старший научный сотрудник нашего НИИ и один из ведущих инженеров проекта «Саша». Рада знакомству.
– Очень приятно, – проговорил Геннадий Константинович, пожимая протянутую ему миниатюрную ладонь. Та оказалась мягкой на ощупь и практически невесомой. А еще на безымянном пальце отсутствовало кольцо – абсолютно не имеющая отношения к делу, но отчего-то все равно примечательная деталь. Ради любопытства гость попытался приблизительно определить возраст собеседницы, однако потерпел неудачу: с учетом, во-первых, впечатляющих достижений нынешних медицины и диетологии, а во-вторых, субъективных признаков объекта изучения вроде предполагаемого увлечения спортом (фитнес-браслет на левой руке), вполне допускаемого отсутствия вредных привычек, умелого использования косметики, а также сугубо индивидуальных генетических особенностей даме запросто можно было дать от двадцати пяти до пятидесяти – тут уж действительно не угадаешь, да и зачем?
– А нам приятно принять представителя AIDIC, – улыбнувшись, заметила Светлана Петровна. – Признаться, мы здесь все крайне заинтригованы вашим визитом. Деятельность комиссии окутана мраком, а о вас с коллегами ходит столько слухов – не знаешь, чему и верить. У меня к вам так много вопросов!
– Правда? Что ж, пока мы не приступили к тесту, я готов удовлетворить ваше любопытство. По крайней мере, частично.
– Чем конкретно ваша организация занимается?
– Как следует из ее полного названия – «Artificial intelligence detection international commission», то есть «Комиссия по обнаружению искусственного интеллекта», – мы, собственно, нацелены на поиски настоящего ИИ, под которым подразумеваем машину, обладающую признаками творческого мышления и способную решать наиболее широкий круг задач благодаря самостоятельному рассуждению, основанному на ранее приобретенном опыте.
– А разве не этим характеризуются любые современные нейросети? Какой смысл именно вы вкладываете в понятие «настоящий» применительно к искусственному интеллекту?
– Умеющий думать за пределами предварительно очерченных рамок.
– Ага, – внутренне стараясь получше осмыслить последнюю фразу, отреагировала Светлана Петровна. – И ваш тест помогает выявить такое умение?
– Полагаю, да.
– Расскажете о нем подробнее по пути в лабораторию?
– Конечно. Показывайте дорогу.
Инженер проводила посетителя до лифта и нажала кнопку вызова.
– Итак, – принялся в ожидании прибытия транспорта излагать Геннадий Константинович, – отправной точкой для разработки моего теста стало желание создать универсальное испытание, позволяющее отличить творчески мыслящий разум от обычного продвинутого алгоритма, заточенного под выполнение строго определенного набора функций. Существовавшие доселе методики меня по разным причинам не устраивали. Например, нельзя считать убедительным индикатором наличия творческих задатков навык создания нейросетью произведений литературы, музыки или живописи, потому как в каждом из аналогичных случаев мы сталкиваемся со всего-навсего выдающимся копированием уже существующих работ мастеров прошлого. Машине по плечу имитировать стиль импрессионистов, кубистов, пуантилистов, супрематистов и прочих, но она не в силах изобрести абсолютно новое художественное течение, ведь у ее фантазии, в отличие от человеческой, есть жесткие ограничения. Следующее из отброшенных мной направлений – это классический тест Тьюринга. Вы же слышали о тесте Тьюринга?
– Разумеется, – заходя внутрь приехавшей кабинки, откликнулась провожатая. – Если человек, не знающий наверняка, с кем или чем он общается по переписке, всерьез принимает компьютер за другого человека, то считается, будто бы машина, сумевшая обмануть собеседника, прошла испытание.
– Да. Тем не менее в данной ситуации речь также идет лишь об умелой имитации. По большому счету, написать программу, притворяющуюся «живым» собеседником, сегодня не особо сложно: достаточно симулировать в чате неадекватное поведение условного двенадцатилетнего школьника, строящего бессвязные, наполненные грамматическими ошибками предложения и выражающего эмоции посредством широкого набора соответствующих картинок. Нынче люди в мессенджерах пишут гораздо примитивнее, нежели обученные машины, а умному прикинуться дурачком гораздо проще, чем наоборот, вот и умной машине – при внесении в ее код нужных правок – относительно просто прикинуться глупым человеком. В итоге, отбросив и тест Тьюринга, я обратил внимание на игры – развлечения, ценные сами по себе в отрыве от каких-либо конкретных практических задач и ориентированные в первую очередь на веселье. Согласитесь, веселящийся компьютер значительно больше напоминал бы человека.
– Возможно, – кивнула Светлана Петровна, – однако едва ли не с самого начала программисты учили ЭВМ играть в различные игры: от крестиков-ноликов до трехмерных шахмат. А симулирующие поведение людей алгоритмы так или иначе используются во всех компьютерных шутерах, гонках или стратегиях.
Створки лифта распахнулись, и мужчина с женщиной очутились в длинном разветвленном коридоре. Далее разговор продолжился на ходу.
– Вы правы. Давным-давно машины соревнуются с людьми во всевозможных игровых дисциплинах. В 1997 году шахматный суперкомпьютер Deep Blue выиграл матч из шести партий у чемпиона мира Гарри Каспарова, а в 2016 году программа AlphaGo со счетом 4:1 обыграла в го корейского профессионала девятого дана Ли Седоля. Но еще сильнее меня заинтересовала история суперкомпьютера Watson. Созданная компанией IBM машина в 2011 году приняла участие в телевикторине Jeopardy! – аналоге российской «Своей игры» – и вышла победителем из схватки с двумя мастеровитыми соперниками: Брэдом Раттером и Кеном Дженнингсом. По правде сказать, я не был удивлен успехом Watson’а, так же как не был удивлен успехами Deep Blue и AlphaGo. И хотя задачи перед тремя перечисленными программами стояли разные, для решения компьютерам не требовалось пресловутое творческое мышление. Комбинации в шахматах и го в определенной степени просчитываются математически, а распознав ключевые слова в тексте вопроса из Jeopardy!, Watson’у, чтобы отыскать ответ, оставалось только сопоставить их со своей внушительной базой данных. Зато достижение компьютера от IBM натолкнуло меня на мысль: а в какую интеллектуальную игру обыкновенная машина обыграть человека точно не сумеет?
– И в какую же?
Выдержав приличествующую театральную паузу, Геннадий Константинович торжественно произнес:
– В «Что? Где? Когда?».
– В «Что? Где? Когда?»? – переспросила Светлана Петровна. – Не понимаю. А в чем с точки зрения мышления разница между «Что? Где? Когда?» и «Своей игрой»? И там, и там, насколько мне известно, задают мудреные вопросы, а игроки на них отвечают.
– О! Разница принципиальнейшая! Вопросы в «Своей игре» – или в Jeopardy!, причем особенно в Jeopardy! – основаны преимущественно на эрудиции, то есть на чистом знании о фактах. Скажем, вы в курсе, что такое айлурофобия?
– Ну, греческое слово «фобия» намекает на некую боязнь…
– А кого или чего?
– Э-э… затрудняюсь ответить.
– Кошек. Айлурофобия – это навязчивая боязнь кошек. Без дополнительных специфических знаний на заданный мною вопрос не ответить.
– Пожалуй. Мне, честно, даже трудно представить, как вообще можно бояться кошек – они же милые…
– Всяко в жизни бывает. Я вам привел яркий пример вопроса, целиком основанного на эрудиции. Угадать верный ответ наобум практически нереально. Вы вот правильно зацепились за слово «фобия», но дальше ограниченность познаний в греческом языке вам продвинуться не позволила. В классическом «Что? Где? Когда?» вопросы подбираются иначе. Как правило, если мы говорим действительно о добротном, традиционном ЧГКшном вопросе, то он требует минимума знаний (школьная программа плюс опыт, почерпнутый из повседневной жизни) и раскручивается благодаря рассуждениям, базирующимся на элементарной логике, ассоциациях, образном мышлении и здравом смысле – атрибутах человеческого, не машинного разума.
– Ясно. И коль скоро указанные качества присущи людям, то, по вашему мнению, исходя из их наличия либо отсутствия, допустимо провести грань между полноценным ИИ и остальными программами.
– Абсолютно точно! – воодушевился Геннадий Константинович. – На мой взгляд, машина, умеющая играть не в Jeopardy!, а в «Что? Где? Когда?» вправе претендовать на статус настоящего искусственного интеллекта. На данном предположении и строится разработанный мною тест Ворошилова, названный так по фамилии автора телевизионного «Что? Где? Когда?» Владимира Яковлевича Ворошилова.
– И в чем же состоит ваша методика?
– Она предельно проста. Я общаюсь с машиной (и да, в отличие от теста Тьюринга, я точно знаю, что мой собеседник не человек), задаю ей особым образом подобранные вопросы, а затем, получив ответы, делаю предварительные выводы о том, имеются или нет у данной машины признаки настоящего ИИ. Вся соль в качестве вопросов. К ним предъявляются следующие требования. Первое: как я уже упомянул, вопросы должны основываться на только минимально необходимом уровне эрудиции. Человек не обязан знать все. А поскольку мы ищем искусственный разум, хотя бы частично воспроизводящий особенности человеческого мышления, то ошибочно было бы ставить такой разум в другие по сравнению с человеком условия, изменяя сложность задания за счет введения лишних элементов, связанных с какими-либо специфическими знаниями. Мы и без того прекрасно осведомлены о способности компьютеров хранить колоссальный объем информации, и нам незачем лишний раз проверять их на банальную эрудицию. Потому-то второе важное требование к вопросам теста – невозможность найти по ключевым словам прямой ответ на них ни в одной базе данных. Выражаясь иначе, вопросы должны быть на сто процентов авторскими и максимально защищенными от тривиального загугливания. Отдельный ряд требований касается непосредственно самих ответов. Так, ответ – и это крайне желательно – должен быть однозначным, то есть к данной формулировке вопроса должен подходить единственный конкретный ответ. Еще ответ не должен просчитываться с помощью известных математических формул или обнаруживаться простым перебором либо угадыванием. Допустим, я загадал некоего поэта. Попробуйте отгадать его фамилию.
– М-м… Пушкин?
– Верно. Александр Сергеевич обычно среди первых приходит в голову, когда спрашивают о поэтах, и вероятность угадать чересчур высока. А значит, вопрос надлежит формулировать хитрее. И при всем при том он должен оставаться логичным и потенциально распутываемым. Увы, вопрос, никоим образом по своей формулировке с гладиолусом не связанный, но имеющий в качестве ответа «потому что гладиолус», не годится, равно как и любые построенные на абсурде загадки. Приведу пару относительно широко известных примеров. Кто по потолку бегает и лампы сосет?
– Таракан? Жук? Хм… лампы… лампы… Светлячок?
– Нет. Сдаетесь?
– Сдаюсь.
– Потолочный лампосос.
– А-ха! Смешно.