Почему ИИ не победит в игре 'Что? Где? Когда?'
В ЮФУ придумали новый остроумный способ тестировать ИИ на способность работать в реальных ситуациях использования русского языка. Исследователи искусственного интеллекта из МИИ ИМ ЮФУ предлагают использовать интеллектуальные языковые игры, как пример — заставлять ИИ отвечать на вопросы из архива телевикторины «Что? Где? Когда?» и «Своей игры». Инициативу прокомментировал опытный игрок.
В наше время параллельно развиваются самые разные технологии искусственного интеллекта, но в широком употреблении под ИИ люди почти всегда подразумевают именно большие языковые модели (LLM – Large Language Model), такие как DeepSeek или ChatGPT, из-за шумихи вокруг них.
Ответственный исполнитель проекта «Фронтирная лаборатория рентгеноспектральной нанометрологии» Центра наукоемкого приборостроения ЮФУ Богдан Проценко и его коллеги, как и многие исследователи, на практике делают ставку не на языковые-модели гиганты, а на модели ИИ поменьше, обученные на заведомо более качественных данных, как в случае линейки моделей LLaMa3.
«Ее разработчики получили существенный прирост качества моделей, главным образом «почистив данные» для обучения предыдущих версий, без радикальных изменений в архитектуре нейросети. Между сложностью архитектуры ИИ и качеством данных для его обучения всякий ML-инженер и аналитик данных почти всегда выберет последнее, потому что в мире не бесконечное количество качественного контента, и лучше, если нейросеть может научиться на миллионе умных текстов, чтобы не пришлось ей скармливать миллиард глупых», — поделился Богдан Проценко.
Создатели ИИ часто исходят из позиции, что логическое мышление и способность рассуждать («ризонинг») нейросетей не страдает от того, на каком языке ИИ «подумает», главное, чтобы он умел грамотно формулировать ответ на языке пользователя. Доказать обратное нетрудно: можем спросить у большой языковой модели, например, на языке хинди, какие предметы и темы проходят десятиклассники по школьной программе. И он вам ответит на грамотном литературном хинди, но только расскажет так, как проходят в десятом классе в американских школах, а не в индийских.
«Русского, например, в данных для предтренировки всех зарубежных моделей ощутимо меньше английского, потому модель пишет и мыслит «умнее» и грамотнее, если ее спросить на английском и попросить на нем же ответить. Бенчмарки, «линейки», которыми измеряют качество моделей и их работы на разных языках – как правило, просто перевод с одного из языков, обычно английского, на другие. Такой расклад не отражает качества работы модели в реальной языковой ситуации», — объяснил Богдан Проценко.
Как же объективно оценить, какая модель ИИ действительно «умнее»? Для этого отлично подходят различного рода интеллектуальные игры: они являются весьма непростыми для LLM, и при этом за многие годы накоплен огромный и крайне качественный — отточенный поколениями игроков, а не сгенерированный ИИ — архив подобных вопросов, во многих из которых предостаточно и культурной, и тонкой языковой специфики языка.
«Мышление и языки близки. Как победы ИИ над человеком в шахматы и го были яркими ключевыми моментами развития ИИ в конце прошлого века, так «Что? Где? Когда?» и «Своя игра» — вызовы сегодняшнего дня. Способность успешно отвечать на вопросы, написанные умными телезрителями для еще более умных знатоков, появляется только в самых больших и умных LLM, причем моделям с большим количеством русского языка в предтренировочной выборке обычно проще», — подчеркнул Богдан Проценко.
В качестве примера ученые протестировали старшую модель из семейства LLaMa-3, демонстрирующую хорошее владение русским языком, но даже она ошиблась в вопросах, требующих знания специфических для русскоязычной культуры фактов. Например, вопросы о композиторе Владимире Шаинском, о Царь-пушке в Кремле, о спортивных объектах, построенных вокруг Москвы к Олимпиаде-80, тривиальные для русскоязычных людей, для LLM на 405 миллиардов параметров, владеющей десятками естественных языков и языков программирования, разбирающейся в куче вопросов, от квантовой механики до медицины, оказываются не под силу.
Необычный способ тестировать ИИ интеллектуальными играми прокомментировал научный журналист, популяризатор науки и лектор Алексей Паевский — участник «Своей игры» и автор вопросов для «Что? Где? Когда?».
«Решать вопросы «Своей игры» искусственному интеллекту определенно будет легче, поскольку они обычно направлены на эрудицию и личные знания игрока, а вот вопросы «Что? Где? Когда?» скорее на способность команды знатоков мыслить и догадываться. Для ответа на средний вопрос «ЧГК» русскому человеку обычно не нужны никакие специальные знания свыше школьной программы и общей культуры, другое дело, что зачастую вопросы «завернуты» так, что лишь единицы поймут о чем речь. Если сообщество авторов вопросов «ЧГК» узнает, что ИИ научился на их вопросы отвечать с легкостью, это их замотивирует закручивать новые вопросы так, что у ИИ не будет шансов, а для знатоков при этом сложность останется прежней», — поделился Алексей Паевский.
Четырехкратный чемпион мира по «Что? Где? Когда?» Михаил Левандовский добавил, что главная сложность игры в ее изменчивости. На заре «Что? Где? Когда?» ключом к победе было умение распознавать «явления» — абстрактные образы и социальные закономерности. Это для современных ИИ-систем по-прежнему остаются серьезным вызовом.
«Впрочем, тогда же возник и другой тип вопросов — перефразировки известных цитат, названий или сюжетов из ограниченного круга классических произведений. С ними, я уверен, искусственный интеллект справлялся бы мгновенно. Сейчас основной тренд — языковые игры: каламбуры, двойные смыслы, игра слов, сложные ментальные конструкции. Здесь ИИ демонстрирует результаты с переменным успехом. Пока что он порой ошибается, но скоро сможет соревноваться с человеком на равных», — рассказал Михаил Левандовский.
Другой глобальный результат исследователей ЮФУ заключается в том, что они протестировали несколько методов генерации ответов, включая цепочку рассуждений и подход с «внутренним критиком», который оценивает предложенные гипотезы – такая своего рода имитация команды знатоков ЧГК и того, как «раскручивают» вопросы в спортивном ЧГК. Например, модель сначала должна предложить несколько вариантов, а затем самой себе объяснить, почему каждый из них неверен, а тот вариант, на который она сможет придумать меньше критики, она и предлагает как верный.
«Такие подходы, с критикой, показывают прирост точности по сравнению с методами без «критика». Однако избыточная критика иногда подавляет креативность модели — как и у людей, — и она вообще больше не может генерировать новые гипотезы», — поделился Богдан Проценко.
Это может означать что этап инструктирования LLM, (instruction tuning), когда модели учат быть «покорными» и отвечать по существу, можно делать с учетом этой специфики, тем самым делая модели еще умнее в сценариях саморефлексии и самокритики.
«В терминологии «ЧГК» есть термин «щелчок». Ответ, который «щелкает», не только подходит под условия вопроса и под все подсказки в вопросе, но и красиво ложится на общекультурный контекст. Это не элемент озарения, это способ проверить свой ответ, со всеми ли зацепками вопроса он бьется, выдерживает ли он внутреннюю критику. Прекрасно, если можно настроить алгоритм ИИ по схожему принципу, при этом, конечно, не нужно обманываться, будто бы ИИ обладает умом, он обладает способностью подбирать решение к задачам, аналогичным той, на которой он тренировался», — прокомментировал Алексей Паевский.
По словам затока, когда автомобиль стал быстрее человека, легкая атлетика не исчезла как спорт — так и интеллектуальные игры не исчезнут, если ИИ однажды начнет играть в них лучше человека. Смысл «Что? Где? Когда?» в демонстрации возможностей командной работы, того, насколько одни шесть человек могут проявить себя лучше, чем другие шесть человек в рамках специально придуманных для этого вопросов.
ИИ глобально уступает человеку не в умении отвечать на вопросы, у которых уже есть заведомо правильный ответ, а в способности к творчеству и созидательной деятельности, к таким результатам мышления, как озарение и открытие. Но пока большие языковые модели не обучатся на русских базах данных, они будут проигрывать нам даже в викторинах.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Отправить донат на поддержку проекта "Аномальные новости"
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Белый дом формирует научную группу по изучению НЛО

Добыча кислорода из лунной почвы

Заявления Спилберга о присутствии инопланетян

Как рассмотреть нашу Вселенную

Лаборатория естественной химии у протозвезд

Медицинские системы для Луны и Марса

Министерство обороны скрывает детали об НЛО

Мощный НЛО обнаружен в далекой черной дыре

Наблюдение НЛО в форме гигантской картофелины

Наше представление о календаре майя

Неразгаданные тайны Стоунхенджа

От морского дна до Марса

Сверхмассивные чёрные дыры - крупнейшие колыбели планет

Способ оценки масс новорожденных планет

Стремиться ли к Луне

Суперконтинент сделал из Земли снежный ком

Ученые обновляют план первого контакта

Фильм Спилберга об НЛО основан на достоверных данных

Хронология древних океанов Марса

Черная дыра образовалась раньше своей галактики

Артефакты на фотографии марсохода Кьюриосити

Белый дом опубликовал новые файлы с НЛО

Брифинг НАСА о инопланетной звездной базе

В архивах Ватикана нет записей об НЛО

В куклу вселился призрак собаки

Внутри особняка с привидениями в Денвере

Военные отслеживали антигравитационные технологии

Все cвидетельства путешествий во времени

Инопланетяне уже посещали Землю

НЛО над главным аэропортом Зимбабве

НЛО отслеживается самолетом ВВС США

НЛО пролетел по небу над Индией

Оранжевая сфера повергла рыбака в шок

Пентагон опубликовал 72 новых файла об НЛО

Путешественник во времени времен Второй мировой войны

Режиссер Стивен Спилберг заявляет, что мы не одиноки

Светящийся шар запустил рой загадочных объектов

Существование путешествий во времени

Убедитесь в реальности путешествий во времени

Черный шар засеивает облака дронами

Брифинг НАСА о инопланетной звездной базе на Луне

Где же все черные дыры промежуточной массы

Давно скрытые секреты выходят на свет

Диски, светящиеся шары и картофелина

Древние изменения климата Марса

Замечен всплеск наблюдений красных шаров

Исключение темной энергии из уравнения

Китай и Россия обладают сбитыми НЛО

Конференция по НЛО пройдет в Канаде

Красные карлики пожирают планеты, похожие на Землю

Лунные базы сталкиваются с невидимой угрозой

Новый телескоп может обнаружить 100 000 миров

Окончательная перепись близких звёздных систем

Почему первые галактики прекратили звездообразование

Размытые видеозаписи и никаких фактов

Странное квантовое свойство изолятора будущего

Триллер Стивена Спилберга об НЛО всех покорил

Туристы запечатлели яркий треугольный НЛО

Файлы об НЛО разжигают панику на Земле

Фильм Стивена Спилберга об НЛО бьёт рекорды

Эволюция городской мобильности. Все об электросамокатах

Встреча с инопланетянами в Розуэлле

За кулисами печально известного интервью Груша

Загадочная картофелина над Колорадо

Инопланетный корабль был всего лишь светом

Инопланетян по-прежнему нет

Наблюдения таинственных шаров

Недавно опубликованное досье Пентагона об НЛО

Новое внимание к исчезновению генерал-майора

Новые файлы НЛО могут содержать угрозу безопасности

Последние мгновения перед исчезновением генерала

Правительства скрывают правду об инопланетянах

Прозрачный НЛО искривил пространство

Разоблачитель НЛО заявляет о секретных расходах

Рецензия на фильм Стивена Спилберга

Сообщения о светящихся красных шарах

Странные огни, но мало неопровержимых фактов

США публикуют третью порцию файлов об НЛО

Трамп обнародовал третью порцию файлов об НЛО

Угрожает ли Вере раскрытие НЛО

Шкала сообщений об НЛО, заслуживающих изучения

Большинство американцев верят в НЛО

Вращающиеся диски и светящиеся шары

Время существует не везде

Инопланетяне могут существовать

Инопланетяне на чемпионате мира

Опубликованы новые файлы об НЛО

Официальные лица США приблизились к тайне НЛО

Пентагон опубликовал третью партию файлов об НЛО

Плазменные шары в центре внимания

Появление НЛО над Зимбабве летом 2008 года

Публичное раскрытие администрации Трампа

Пять сообщений правоохранительных органов о НЛО

Светящиеся шары на северо-востоке США

Создали ядерные шаровые молнии в лаборатории

США публикуют третью партию файлов об НЛО

Третья партия файлов об НЛО

Уфологические файлы Пентагона содержат видеозаписи

Фильм, который стоит посмотреть перед Днем раскрытия

Христианство совместимо с концепцией НЛО

Шаровые НЛО над северо-востоком США

Реальные истории, которые легли в основу фильмов ужасов

Артефакт обнаружен на фото марсохода

База инопланетян в районе северного полюса Луны

Восемь инопланетных существ, описанных властями

Грибы на Марсе сделают реголит плодородным

Загадочный водяной лед Меркурия

Замаскированный НЛО направляется к району ранчо Скинуокер

Инвестор ищет возможности, связанные с НЛО

Инопланетяне как никогда близки

Кладезь данных о гравитационных волнах

Марс может помочь нам понять маргинальные экзопланеты

Невероятный научно-фантастический мини-сериал

Новый опрос проливает свет на убеждения американцев

Обнаружена трижды затменная система звёзд

Одержимость Стивена Спилберга инопланетянами

Пилот видел НЛО размером больше авианосца

Правительственные секреты об инопланетянах

Привел ли инцидент в Варгинье к обнаружению инопланетян

Реальные доказательства или мистификация

Светящийся шар завис над городом

Умирающая звезда создала Хрустальный Шар

Величайшее сокрытие информации в истории США

День раскрытия информации хочет, чтобы вы поверили

Доказательство реальности путешествий во времени

Как использовать лунные ресурсы

Миллиарды секретных расходов, скрытых от Конгресса

Многие фильмы Спилберга об инопланетянах глубокие

Многомиллиардный секрет американских военных

Не верьте ажиотажу вокруг искусственного интеллекта

НЛО увеличивает число подписчиков блогеров

Определили физические признаки нашего Сознания

Отвечать на сигналы инопланетян запрещено

План на день, когда инопланетяне вступят в контакт

Почему размер популяции не спасает ее от вымирания

Связи ЦРУ с инопланетными технологиями

Скрытый порядок в многомерной случайности

Странные огни, бесшумные корабли и близкие встречи

США изучали комаров как биологическое оружие

ЦРУ собирает инопланетные технологии

Черные дыры делают экзопланеты непригодными для жизни

Эмили Блант изучала реальные истории о похищениях

Берегитесь Малдеров и Скалли

В файлах об НЛО христиане видят демонов

Внеземная жизнь может ускользать от зондов

Законодатели хотят, чтобы уфо-инсайдеры имели иммунитет

Как Великая пирамида пережила землетрясения

Конгрессмен осуждает препятствия на пути к правде

На острове Пасхи появилась новая статуя

Недалеко от Юпитера наши рой метеоритов

Нужно принять меры по обеспечению прозрачности

Обнаружили сверхземлю у близлежащего красного карлика

Писать письма инопланетянам нестоит

Правительство США вербовало детей-экстрасенсов

Правительству США известно об инопланетянах

Сильно покрасневшие загадочные квазары

Скептик посетил ранчо Скинуокер

Стивен Спилберг вызвал возмущение из-за НЛО

Стремление к раскрытию тайн НЛО

Уфо-инсайдеры штурмуют Капитолийский холм

Участники сообщества конспирологов на Reddit

Экзопланета размером с Сатурн и земной температурой

Адские планеты более распространены, чем экзоземли

Вот 15 лучших фильмов об НЛО

Встречи с инопланетянами. Факт или вымысел

Жанна д’Арк - девушка, которая определила будущее мира

Жуткий НЛО замечен в Бразилии

Инопланетяне - самозванцы

Испытали управляемый снаряд для рельсотрона

Как инопланетянам достичь Земли

Картина доказывает, что путешествия во времени реальны

Кристаллы пространства и времени

Людей отправляют в Ад чаще, чем в Рай

Обреченные экспедиции - почва для теорий заговора

Они прилетели из чужих миров

Откуда Земля получила фосфор и азот

Под водами озера Шамплейн скрывается чудовище

Правительству США известно о расах инопланетян

Решение проблемы Кардашева

Секретные программы обратного инжиниринга НЛО

Сотрудник ЦРУ рассекретил сеть инопланетных хабов

Что бы почитать про НЛО

Грузовики с КМУ от «Грузовик-ДВ»

Администрация Байдена стреляла ракетами по шарам

Архиепархия Вашингтона разошлась во мнениях о НЛО

Все предсказания Ванги на 2026 год

Наверх
Яндекс.Метрика