Как искусственный интеллект проходит тест Тьюринга

Тест Тьюринга (Turing Test) — это метод исследования искусственного интеллекта (ИИ), позволяющий определить, способен ли компьютер мыслить как человек.

Тест назван в честь его создателя Алана Тьюринга, британского ученого-информатика, криптоаналитика, математика и биолога-теоретика.

Тьюринг предположил, что компьютер обладает искусственным интеллектом в том случае, если способен имитировать человеческие реакции в определенных условиях.

В статье о том, как проводят этот тест и почему он является философской отправной точкой для исследования ИИ. Рассказывает команда TechTarget.

Содержание статьи

Что представляет из себя тест Тьюринга?

История теста Тьюринга

Ограничения теста Тьюринга

Вариации и альтернативы тесту Тьюринга

Как тест Тьюринга используется сегодня?

Что представляет из себя тест Тьюринга?

Для проведения оригинального теста Тьюринга требуется три физически удаленных друг от друга терминала. Один терминал управляется компьютером, а два других — людьми.

Во время теста один из людей выступает в роли исследователя, задающего вопросы, а второй человек и компьютер — в роли респондентов.

Исследователь задает респондентам вопросы из какой-то предметной области, используя определенный формат и контекст. После заданного периода времени или количества вопросов он должен определить, кто из респондентов — человек, а кто — компьютер.

В тесте Тьюринга участвуют два человека и одна машина: человек, задающий вопросы, респондент-человек и респондент-компьютер

Тест повторяется большое количество раз. Если исследователь угадывает в половине случаев и меньше, считается, что компьютер обладает искусственным интеллектом, так как исследователь считает его «таким же человеком», как и человек-респондент.

История теста Тьюринга

Тест назван в честь Алана Тьюринга, пионера машинного обучения (machine learning) в 1940-х и 1950-х годах. Тьюринг представил тест в 1950 году в статье «Вычислительные машины и разум».

В своей статье Тьюринг предложил вариант так называемой «Игры в имитацию». В нее играют трое: мужчина, женщина и исследователь, задающий вопросы, причем последний может быть любого пола. Каждый из них находится в отдельной комнате. Цель игры для исследователя — определить, кто мужчина, а кто женщина.

Тьюринг меняет концепцию этой игры, включив в нее ИИ, человека-респондента и человека, задающего вопросы. Задача последнего — понять, кто является ИИ, а кто — человеком.

С момента появления теста многие ИИ смогли его пройти. Одной из первых стала программа «Элиза» (ELIZA), созданная Джозефом Вейценбаумом.

Виртуальный собеседник — компьютерная программа Элиза, написанная Джозефом Вейценбаумом в 1966 году

Ограничения теста Тьюринга

На протяжении многих лет тест Тьюринга подвергался критике. Отчасти это связано с тем, что для демонстрации компьютером человеческого интеллекта характер вопросов исторически должен был быть ограничен.

Долгое время компьютер мог получить высокие баллы только в том случае, если вопросы предполагали ответ «Да»/«Нет» или относились к узкой области знаний. Если вопросы были открытого типа и требовали развернутых ответов, компьютерной программе редко удавалось обмануть исследователя.

Кроме того, такая программа, как «Элиза», способна пройти тест Тьюринга, манипулируя символами, которые она не вполне понимает. Американский философ Джон Серл утверждал, что в таком случае искусственный интеллект нельзя сравнивать с человеческим.

Для многих исследователей вопрос о том, способен ли компьютер пройти тест Тьюринга, стал неактуальным. Вместо того, чтобы думать, как убедить кого-то, что он разговаривает с человеком, а не с компьютерной программой, нужно сфокусироваться на том, как сделать взаимодействие человека и машины более интуитивным и эффективным. Например, с помощью диалогового интерфейса.

Вариации и альтернативы тесту Тьюринга

Чтобы сделать тест Тьюринга более актуальным, были разработаны разные версии этого теста. Среди них:

Обратный тест Тьюринга — когда человек пытается убедить компьютер, что он не компьютер. Примером этого является CAPTCHA.
Тотальный тест Тьюринга — где исследователь также может проверить способности восприятия и манипулирования объектами.
Минимальный интеллектуальный Signal-тест — где разрешены лишь два типа ответов — «верно/неверно» и «да/нет».

Поскольку многие считают тест Тьюринга некорректным, позже были разработаны альтернативы. Среди них такие тесты, как:

Тест Маркуса — тест, в котором программа, способная «смотреть» телешоу, отвечает на вопросы по их содержанию.
Тест Лавлейс 2.0 — тест призван определять наличие интеллекта у машины через ее способность к творчеству.
«Схема винограда» — тест, в котором машина отвечает на вопросы с несколькими вариантами ответов, сформулированными особым образом.

Как тест Тьюринга используется сегодня?

Хотя вариации теста Тьюринга более применимы к нашему нынешнему пониманию ИИ, его оригинальный формат также до сих пор используется.

Например, ежегодно с 1990 года присуждают Премию Лёбнера (Loebner Prize) наиболее «человечной» компьютерной программе. Конкурс проводится по стандартным правилам теста Тьюринга.

Критики этой премии часто преуменьшают ее значение, считая ее скорее рекламой, нежели реальной проверкой того, способны ли машины мыслить.

На конкурсе, организованном Университетом Рединга в ознаменование 60-й годовщины смерти Тьюринга в 2014 году, чат-бот Евгений Густман (Eugene Goostman), имитирующий 13-летнего мальчика, прошел тест Тьюринга, обманув 33% судей.

Это было встречено большой критикой со стороны тех, кто утверждал, что членов жюри было недостаточно, что другие машины лучше справились с тестом в прошлом и что тест недействителен, так как длился всего 5 минут.

В 2018 году Google Duplex успешно записался по телефону в салон перед 7000 толпой. У администратора не возникло никаких подозрений, что ее собеседник вовсе не человек. Некоторые считают это прохождением теста Тьюринга, несмотря на то, что он не полагался на истинный формат теста.

По мнению некоторых, модель обработки естественного языка GPT-3, созданная OpenAI, имеет все шансы пройти тест в своей истинной форме и обойти любую другую технологию. Но даже несмотря на ее продвинутые способности к генерации текста многие критиковали машину за то, что ее можно обмануть, заставив отвечать на бессмысленные вопросы, и, следовательно, ей придется трудно в условиях теста Тьюринга.

Несмотря на многочисленные споры об актуальности теста Тьюринга в наши дни и обоснованности конкурсов на его базе, этот тест по-прежнему остается философской отправной точкой для исследования ИИ.

Высоких вам конверсий!

По материалам: techtarget.com. Автор: Benjamin St. George, Alexander S. Gillis

06-06-2023