Как просто отличить текст, написанный ИИ
Команда исследователей из Сколтеха, МФТИ, Института искусственного интеллекта AIRI и других научных центров разработала метод, позволяющий не просто отличать тексты, написанные человеком, от сгенерированных нейросетью, но и понимать, по каким именно признакам классификатор принимает решение о том, является ли текст генерацией или нет. Анализируя внутренние состояния глубоких слоев языковой модели, ученые смогли выделить и интерпретировать численные признаки, отвечающие за стилистику, сложность и «степень уверенности» текста.
Работа принята на конференцию Findings of ACL 2025 и опубликована в виде препринта на портале arXiv. Стремительное развитие больших языковых моделей (LLM), таких как ChatGPT, Gemma и LLaMA, привело к тому, что сгенерированные ими тексты наполнили интернет, учебники, учебные пособия и даже научные статьи. Возникла острая проблема: как отличить оригинальное человеческое творчество от продукта машины? Существующие системы детекции сгенерированного текста часто работают как «черные ящики»: они выдают вердикт «человек» или «ИИ», но не могут объяснить, на каких конкретно свойствах текста основано их решение. Такая непрозрачность ограничивает их гибкость и надежность: если детектор ошибается, то бывает очень сложно понять, почему именно он ошибся и как избежать такой ошибки в будущем.
Исследователи решили подойти к проблеме с другой стороны. Вместо того чтобы создавать еще один «черный ящик», они задались целью заглянуть «под капот» нейросети и превратить ее внутренние состояния в набор четких и интерпретируемых характеристик текста. Для этого они использовали известную технику — разреженные автокодировщики (Sparse Autoencoders, SAE). Если представить внутреннее состояние нейросети как сложный коктейль из тысяч смешанных сигналов, то SAE работает как высокоточный сепаратор, который раскладывает этот коктейль на более чистые, атомарные «ингредиенты», которые легче интерпретировать. Каждый такой признак отвечает за определенный аспект текста: например, за сложность предложений или использование специфической лексики.
Лаида Кушнарева, старший академический консультант в компании Huawei, прокомментировала: «Люди, регулярно имеющие дело с текстами, сгенерированными ChatGPT, зачастую могут распознать такой текст по характерным чертам — например, неуместно сухому и формальному языку, чрезмерно длинным и “водянистым” вступлениям перед переходом к сути, повторяющимся формулировкам одной и той же мысли и низкой информационной плотности в целом. Однако большинство популярных детекторов сгенерированных текстов не показывают, в какой степени в тексте присутствуют эти и другие понятные человеку особенности.
В отличие от них, наш детектор на основе SAE позволяет автоматически раскладывать тексты на “атомарные” числовые признаки, многие из которых поддаются интерпретации в терминах, понятных человеку. При этом детектор обходит все существующие решения на том наборе данных, который мы использовали. Кроме того, мы показали, что с помощью SAE можно обнаруживать и некоторые осознанные попытки скрыть факт генерации текста — например, преднамеренное добавление лишних пробелов, артиклей или нестандартных символов с целью запутать детекторы. Другими словами, данная техника позволяет автоматически разобрать текст “по косточкам” и принять решение, обоснованность которого может быть впоследствии проверена человеком на основе выявленных признаков и их интерпретации».
В ходе исследования ученые подавали на вход нейросети Gemma-2-2B различные примеры текстов и сохраняли внутренние состояния с глубоких слоев модели для каждого текста. Далее, они выделили из этих внутренних состояний тысячи “атомарных” признаков с помощью SAE. Используя эти признаки, они обучили классификатор для распознавания сгенерированных текстов и приступили к самой интересной части — интерпретации. Они выявили как «универсальные» признаки, характерные для многих генерирующих моделей, так и специфические, присущие отдельным семействам ИИ или определенным типам текста (например, научным статьям и отзывам). Так, в текстах на научные темы ИИ склонен к излишне сложным синтаксическим конструкциям, а в текстах на финансовую тематику — к необоснованным, многословным рассуждениям о простых фактах.
Например, в работе показано, что «признак №3608 с 16-го слоя SAE» отвечает за синтаксическую сложность. Ученые обнаружили, что искусственное усиление этого признака в процессе генерации текста заставляет нейросеть создавать чрезмерно запутанные предложения, которые сложно читать. Наоборот, ослабление этого признака приводит к появлению коротких, «рубленых» фраз с минимальной связностью. Другой сильный признак, №4645, отвечает за степень уверенности текста, а №6587 — за многословные вступления и чрезмерно подробные объяснения.
Анастасия Вознюк, студентка МФТИ, добавила: «Помимо анализа того, на что конкретно модель обращает внимание при детекции, мы попробовали управлять моделью генерации. Признаки, которые мы определили ранее, можно усиливать или ослаблять, и в результате наблюдать что в некоторых случаях новый сгенерированный текст сильнее или, наоборот, слабее, характеризуется данным признаком. Например, при изменении признака определяющего уровень «академичности» языка текста, будет изменяться в соответствующую сторону и стилистика текста.
Результаты показывают, что если давать современным языковым моделям вроде ChatGPT стандартные запросы для генерации, то они с большой вероятностью генерируют текст с характерными чертами, который легко обнаруживается этим и другими детекторами. Однако исследователи предупреждают: если дать нейросети более персонализированное задание (например, попросить написать текст в каком-то необычном для нее стиле), эти характерные черты могут ослабнуть или даже исчезнуть, что может сделать задачу детекции значительно сложнее.
В исследовании был применен новый многогранный подход, который сочетает автоматическое выделение признаков, их ручную интерпретацию и экспериментальную проверку с помощью техники «управления» (steering). Это создает основу для разработки более интерпретируемых детекторов, которые смогут не просто выносить вердикт, но и предоставлять отчет о том, какие именно аномалии были найдены в тексте. Такие инструменты будут полезны для преподавателей, редакторов и исследователей дезинформации. В более широкой перспективе эта работа является важным шагом к демистификации искусственного интеллекта, позволяя нам лучше понимать, как нейросети «мыслят» и создают тексты.
Дальнейшие исследования будут направлены на применение этого метода к новым, более мощным языковым моделям и на изучение более сложных и трудноуловимых признаков, чтобы оставаться на шаг впереди тех, кто пытается использовать ИИ в недобросовестных целях, и при этом уменьшить вероятность ошибиться и несправедливо обвинить человека в том, что его текст был сгенерирован.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Отправить донат на поддержку проекта "Аномальные новости"
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Администрация Трампа опубликует записи об НЛО

Два внешних кольца Урана имеют разное происхождение

Джей Ди Вэнсу нужно быть аккуратней с высказываниями

Заменит ли ИИ людей-ученых

Заявления родителей Чандры Леви об НЛО

Зона 51 сотрясается от таинственных землетрясений

Инопланетяне прибыли из обреченного будущего Земли

Лучший способ поиска внеземного разума

Люди могут вырастить новые зубы всего за 4 года

Могла ли Чандра Леви быть убитой из-за НЛО

НЛО обгоняет истребители F-18

Пилоты видели очень странные вещи

Программа исследования НЛО - 'Space Tiger Team'

Разгадали главную тайну обоняния

Разоблачения НЛО и исследования паранормальных явлений

Республиканец делится мыслями о Зоне 51

Скоро будут опубликованы очень интересные файлы об НЛО

Струи черной дыры демонстрируют огромную мощь

Что мы знаем о пропавших и погибших ученых

Эффект домино от солнечных вспышек

Вещи, в которые вы не поверите

Демонические НЛО могут спровоцировать глобальную панику

Загадочные землетрясения вблизи Зоны 51

Закономерность, стоящая за землетрясениями

Комиссия никогда не общалась с пилотами по делу GOFAST

Люди созданы для того, чтобы жить намного дольше

Невероятные наблюдения пилотов привлекают политиков

Пилоты видели такое, во что вы бы не поверили

Полное раскрытие информации об НЛО близко

Призрачные частицы сохраняют массу в скрытом измерении

Разоблачители НЛО заявляют о кампаниях запугивания

Самопроизвольное возгорание человека. Факты и теории

Создан идеальный сценарий для фиксации НЛО

США в ближайшее время опубликуют файлы об НЛО

Тайна Рендлшемского леса

Трамп дразнит публикацией файлов об НЛО

Файлы об НЛО будут опубликованы в ближайшем будущем

Что представляет собой программа ВВС США 'Янки Блю'

Элизондо принимает участие в поиске пропавших ученых

Ярко-оранжевый шар замечен над Сассексом

Администрация США планирует опубликовать данные НЛО

В сообществе футурологов бытует противоречивая идея

Генерала обвиняют в предвзятом отношении к НЛО

Дональд Трамп обещает скорое обнародование файлов НЛО

Загадочный проект 'Янки Блю'

Загадочный случай самовозгорания

Инопланетяне уже живут среди нас

Историк восстановил утраченный отрывок Библии

Как образовались гигантские черные дыры

Количество поддельных сайтов об НЛО растет

НЛО - отвлекающий маневр

НЛО - это не пустяк

Пилот королевских ВВС видит будущее

Погиб очередной военный специалист по НЛО

Президент США дразнит общественность

Президент Трамп раскроет материалы о НЛО

Размышляя о тайне гравитационной постоянной

Трамп в ближайшее время раскроет файлы об НЛО

Ученые ищут внеземную жизнь со времен Аристотеля

Что на самом деле скрывается под Антарктидой

Геймпад Xbox не подключается к приставке или компьютеру

Генерал ВМС называет бывшего шефа AARO лжецом

Глава Anthropic предрёк исчезновение инженерных профессий

Дементор замечен над Астаной

Еврей из НЛО

Загадочное исчезновение экипажа корабля

Инопланетяне, кровь и Белый дом

Кем был уфолог Дэвид Уилкок

Несмотря на конфликт, Белый дом ведёт переговоры с Anthropic

НЛО выводят из строя ядерное оружие с 1960-х годов

Новые откровения о НЛО и почему это не случайность

Общественник предложил создать музей уфологии

Он знал много ядерных секретов

Они маскируются под дроны

Они нашли черную живую слизь внутри корабля

Пентагон купил ИИ Гугла

Сущности предупредили чиновников о начале их войны с Богом

У американцев с инопланетянами всё давно на мази

Уфолог Ник Поуп скончался в возрасте 60 лет

Частое использование ИИ влияет на мозг

Чешуя дракона обнаружена на Марсе

Время может двигаться и быстро, и медленно одновременно

Галактики растут вокруг черных дыр

Древний марсианский океан существовал

Зафиксировано изменение состава кометы 3I-ATLAS

Инопланетная жизнь может скрываться у всех на виду

Камера запечатлела Существо во время ограбления

Крах майя был вызван климатическими колебаниями

Метан выделяется из межзвездной кометы 3I-ATLAS

Метан обнаружен на гигантской экзопланете

Новая группа крови, которая есть только у трех человек

Опасения по поводу сокрытия информации об НЛО

Пентагон согласовывал позиции с Луисом Элизондо

Постоянно меняющаяся многопланетная система

Путешественник во времени прибыл из 2582 года

США десятилетиями проводили эксперименты с НЛО

Тайна НЛО в Уайт-Маунтинс

Темный вулканический пепел Марса

Трехмерная карта меняет представление о Вселенной

Человечество упускает что-то важное об НЛО

Я единственный человек в постапокалиптическом мире

Американская лаборатория изучала НЛО

Гигантская жуткая тень на Марсе сильно выросла

Гравитация подчиняется законам Ньютона и Эйнштейна

Доказательства существования магнетизма в звездах

Дональд Трамп приказал обнародовать досье об НЛО

Инопланетяне могут подтвердить свое существование

Информатор об НЛО умер от передозировки

Источник загадочной дымки в атмосфере Венеры

Как газ превращается в диски, формирующие планеты

Может ли темная материя образоваться из черных дыр

НАСА подтвердило дату сближения с Апофисом

Открытие на острове Пасхи может переписать историю

Планетам требуется больше воды для поддержания жизни

Разоблачитель НЛО скончался накануне дачи показаний

Темная материя объясняет появление ранних черных дыр

Теория заговора привлекает внимание законодателей

Теперь 13 погибших или пропавших без вести

Трамп обещает расследовать гибель ученых-уфологов

Федералы встречались по поводу НЛО в 1990-х годах

Черные дыры вызывают вспышки в триллионы солнц

Бытовки в Москве и модульное строительство. Оперативные решения для бизнеса и частного сектора

Давать показания в Конгрессе США опасно для жизни

Загадочная смерть информатора об НЛО

Изучала ли американская лаборатория НЛО

Информатор конгресса умер от наркотической смеси

Карта мира скоро будет переписана

Конгрессмен предупреждает о разрушительной правде

Кто стоит за исчезновениями и смертями ученых

НАСА обнаружило важный ключ к жизни на Марсе

НЛО раскрывают секреты, искажающие реальность

Правда о Великой пирамиде раскрыта

Пропавшие ученые изучали НЛО

Путешественник во времени из 2118 года

Разоблачитель НЛО скончался перед дачей показаний

Растет число свидетельств того, что они уже здесь

Сообщения об НЛО подпитывают спекуляции

Тайна пропавших и погибших ученых раскрыта

Теория о большой батареи в Великой пирамиде

Ури Геллер предупредил Трампа, что телепортация реальна

Уфо-информатор умер от передозировки

ФБР проводит расследование смерти информатора

Ватикан настаивает на обнародовании данных об НЛО

Всплыло жуткое видео пропавшего ученого

Духовность и религиозная связь с НЛО

Инопланетяне, НЛО и демоны

Конгрессмен видел ошеломляющие данные об НЛО

На одной стороне Земли быстро становится холоднее

Пентагон скрывает инопланетный корабль

Политик видел фотографии и видео НЛО

Последние леденящие душу слова уфолога

Последние моменты жизни уфолога

Предупреждение уфолога перед смертью

Пропавшие ученые. Заговора нет, только подозрения

Ролик фильма Спилберга 'День раскрытия информации об НЛО'

Скандал вокруг смерти уфолога Дэвида Уилкока

Смерти и исчезновения ведущих ученых США

Странная смерть всей семьи ученого НАСА

Тайна происхождения минералов

У пропавших ученых США есть кое-что общее

Уфолог найден мертвым в Колорадо

Уфолог размышлял о недавних смертях своих коллег

Автор статей о паранормальных явлениях скончался

Видеозаписи НЛО, которые не поддаются никакому объяснению

Земляне могут быть хуже инопланетян

Зловещие файлы об НЛО существуют

Исследователь НЛО знал что-то важное

Кем был уфолог Дэвид Уилкок

Конгрессмен поделилась душераздирающей новостью

Кто такой доктор Джон Бранденбург

Лучший друг Дэвида Уилкока ошеломлен его смертью

Разрушили ли кибер-сталкеры жизнь уфолога

Расследование смерти писателя-уфолога

Сообщения о самоубийстве уфолога

Тайна инопланетной жизни вот-вот будет раскрыта

Трагический инцидент с автором книги о НЛО

У Дэвида Уилкока были проблемы с психикой

Уфолог Дэвид Уилкок привлек к себе внимание

Уфолог умер в возрасте 53 лет после самоубийства

Череда смертей известных уфологов

Что стоит за всплеском интереса к уфологии

Электронные письма представителя Пентагона об НЛО

Братья Земли. Между вечной ночью и днем

Грань между человеком и инопланетянином

Действительно ли Луна богата железом

Доказательства существования первых звезд

Наверх
Яндекс.Метрика