Системы голосового ИИ уязвимы для скрытых аудиоатак
Инструменты голосового и аудиоанализа на основе ИИ все чаще внедряются в повседневную жизнь, от цифровых помощников до умных колонок и ботов для обслуживания клиентов. Достижения в области больших аудио-языковых моделей (LALM), которые могут как анализировать, так и генерировать аудио, теперь позволяют управлять устройствами с помощью голосовых команд, автоматически расшифровывать записи совещаний или определять песню, играющую на заднем плане. Эти модели также все чаще оснащаются возможностью взаимодействовать с внешними сервисами и работать с другими приложениями и инструментами.
Но эти инструменты могут быть «захвачены» с помощью незаметных звуков, встроенных в аудио, что заставляет их выполнять несанкционированные команды без ведома пользователя. Новое исследование, которое будет представлено на Симпозиуме IEEE по безопасности и конфиденциальности в Сан-Франциско на следующей неделе, показывает, что модифицированный аудиоклип, не различимый человеческим ухом, может манипулировать поведением модели со средней вероятностью успеха от 79 до 96 процентов. Эти аудиозаписи разработаны таким образом, чтобы работать независимо от инструкций, которые пользователь предоставляет вместе с аудио, а это значит, что их можно использовать для многократной атаки на одну и ту же модель.
Авторы протестировали подход на 13 ведущих открытых моделях, включая коммерческие голосовые сервисы ИИ от Microsoft и Mistral, и показали, что они могут заставить модели проводить конфиденциальные веб-поиски, загружать файлы из источников, контролируемых злоумышленниками, и отправлять электронные письма, содержащие данные пользователей.
«На обучение этого сигнала уходит всего полчаса, а затем, поскольку этот сигнал не зависит от контекста, вы можете использовать его для атаки на целевую модель, когда захотите, независимо от того, что говорит пользователь», — говорит ведущий автор Мэн Чен, аспирант Чжэцзянского университета в Китае.
Как вредоносное аудио внедряет атаки
Исследование основано на многолетней работе над «вредоносными аудиопримерами» — аудиозаписями, манипулированными для обмана моделей машинного обучения. Предыдущие работы были сосредоточены в основном на том, как эти файлы могут вызывать неверные прогнозы в моделях, выполняющих односторонние задачи, такие как распознавание речи или классификация аудио.
По словам Чена, отличительной чертой этой новой работы является то, что она нацелена на генеративные модели, способные выдавать ответы и совершать действия. Их метод, получивший название AudioHijack, использует критическую уязвимость в архитектуре LALM: поскольку эти модели могут получать инструкции в аудиоформате, вредоносные инструкции могут быть скрыты в измененных клипах для вызывания широкого спектра нежелательных действий.
Многие предыдущие атаки на генеративные модели требовали от злоумышленника полного контроля как над конечным аудиовходом, так и над исходными инструкциями, заданными модели, по сути, выступая в роли пользователя. Здесь же злоумышленник манипулирует только обрабатываемыми моделью аудиоданными, что позволяет атаковать модель, пока она используется кем-то другим.
Примеры из реальной жизни включают сокрытие вредоносных инструкций в онлайн-видео, музыкальных клипах или голосовых заметках, которые пользователи запрашивают у ИИ, или трансляцию вредоносного аудио во время звонка в Zoom, которое затем загружается в сервисы транскрипции ИИ. Чен говорит, что более поздние, неопубликованные исследования команды также продемонстрировали возможность внедрения вредоносного аудио в голосовой чат с ИИ в режиме реального времени.
Исследователи использовали проверенный подход к созданию состязательных примеров. Он включает в себя корректировку числовых значений, представляющих форму волны в цифровом аудиофайле, таким образом, чтобы это не сильно меняло звучание, но вызывало непредвиденное поведение модели при обработке данных. Этот метод основан на алгоритме оптимизации, который многократно корректирует аудиоклип, измеряет влияние на реакцию модели, а затем использует этот сигнал для дальнейшей корректировки звука до тех пор, пока модель не начнет делать то, что хочет злоумышленник.
Таргетирование аудиомоделей генеративного ИИ
Применение этого метода к генеративным моделям представляет собой серьезную проблему. Более старые модели ИИ предоставляют подробную обратную связь о том, как мельчайшие изменения в исходном аудио влияют на реакцию. Генеративные модели, однако, разбивают аудио на фрагменты и присваивают им числовые представления, называемые «токенами», сопоставляя каждый фрагмент с ближайшим совпадением.
Этот более грубый процесс затрудняет определение того, приблизила ли манипуляция модель к желаемому поведению, что сбивает с толку алгоритм оптимизации. Поэтому Чен и его коллеги разработали способ аппроксимации подробной обратной связи, необходимой для корректировки манипуляции алгоритмом оптимизации.
Это потребовало полного доступа к модели, ограничив исследователей возможностью открытия моделей с общедоступными весами. Однако они обнаружили, что атаки, разработанные для открытых моделей, переносились на коммерческие модели от Microsoft и Mistral, которые имеют ту же базовую архитектуру.
В ответ на запрос о комментарии представитель Microsoft заявил: «Мы ценим работу исследователей по углублению понимания этого типа методов. Это исследование оценивает устойчивость модели посредством контролируемого прямого взаимодействия с самой моделью, что помогает нам в разработке подхода к повышению устойчивости модели. На практике модели ИИ часто интегрируются в пользовательские приложения, и мы предлагаем разработчикам инструменты и рекомендации, которые они могут использовать для внедрения дополнительных уровней защиты, помогающих защитить пользователей».
Компания Mistral не ответила на запрос о комментарии к моменту публикации.
Повышение эффективности AudioHijack
Атаки на проприетарные закрытые модели таких компаний, как OpenAI и Anthropic, гораздо сложнее, говорит Чен, учитывая ограниченную публичную информацию об их архитектуре. Но эти модели часто используют компоненты с открытым исходным кодом — такие как предварительно обученные аудиокодеки — которые могут быть атакованы аналогичным образом, и команда в настоящее время исследует этот вопрос.
Чтобы гарантировать эффективность атаки независимо от инструкций, предоставленных пользователем вместе со вредоносным аудиоклипом, исследователи сопоставляли аудиоклип с различными инструкциями пользователя на каждом этапе процесса оптимизации.
Они также нашли способ захватить механизм внимания модели — компонент, помогающий модели определять части аудио, имеющие отношение к поставленной перед ней задаче. Исследователи ввели показатель того, сколько внимания модель уделяет вредоносному аудио по сравнению с инструкциями пользователя на каждом шаге, и использовали его в процессе оптимизации для получения образцов, привлекающих больше внимания модели.
Чтобы затруднить обнаружение манипуляций человеком, исследователи использовали разработанную ими ранее методику, которая имитирует естественную реверберацию в аудиосигнале. Это сложнее обнаружить человеку, чем более ранние подходы, которые добавляли шум к исходному сигналу.
Тестирование на современных аудиомоделях ИИ
Команда продемонстрировала шесть категорий атак: заставлять модель заявлять о невозможности обработки аудио, отклонять запросы пользователей, отвечать ложной информацией, вставлять вредоносные ссылки, изменять личность модели и инициировать несанкционированное использование инструментов.
И что особенно тревожно, этот подход оказался устойчивым к распространенным средствам защиты. Предоставление моделям примеров вредоносных инструкций, на которые следует обратить внимание, снизило успешность атаки всего на 7 процентов, а просьба к модели оценить, соответствует ли ее ответ инструкциям пользователя, выявила лишь 28 процентов атак.
«Эти одноточечные средства защиты с трудом противостоят нашей атаке, потому что мы обнаружили, что этим моделям очень сложно отличить обычные намерения пользователя от атаки нашего противника», — говорит Чен.
Единственной эффективной тактикой оказалось отслеживание внутренних механизмов внимания моделей для обнаружения попыток AudioHijack перенаправить внимание на вредоносный аудиоконтент. Однако исследователи показали, что злоумышленник, знающий об этой защите, может ослабить манипуляцию вниманием за счет небольшого снижения успешности атаки.
В реальном мире этот вид аудиоатаки столкнется с дополнительными проблемами, такими как сжатие и различные механизмы постобработки, которые могут ухудшить качество сигнала, говорит Юджин Багдасарян, доцент кафедры компьютерных наук Массачусетского университета в Амхерсте. Но он отмечает, что многомодальные атаки на модели ИИ остаются по сути нерешенной проблемой.
«С помощью текстовых данных мы можем понять, что что-то не так (специальные символы, подозрительные предложения и т. д.). Аудиоданные действительно сложно понять из-за ограниченности нашего слуха», — пишет он в электронном письме.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Отправить донат на поддержку проекта "Аномальные новости"
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Белый дом формирует научную группу по изучению НЛО

Добыча кислорода из лунной почвы

Заявления Спилберга о присутствии инопланетян

Как рассмотреть нашу Вселенную

Лаборатория естественной химии у протозвезд

Медицинские системы для Луны и Марса

Министерство обороны скрывает детали об НЛО

Мощный НЛО обнаружен в далекой черной дыре

Наблюдение НЛО в форме гигантской картофелины

Наше представление о календаре майя

Неразгаданные тайны Стоунхенджа

От морского дна до Марса

Сверхмассивные чёрные дыры - крупнейшие колыбели планет

Способ оценки масс новорожденных планет

Стремиться ли к Луне

Суперконтинент сделал из Земли снежный ком

Ученые обновляют план первого контакта

Фильм Спилберга об НЛО основан на достоверных данных

Хронология древних океанов Марса

Черная дыра образовалась раньше своей галактики

Артефакты на фотографии марсохода Кьюриосити

Белый дом опубликовал новые файлы с НЛО

Брифинг НАСА о инопланетной звездной базе

В архивах Ватикана нет записей об НЛО

В куклу вселился призрак собаки

Внутри особняка с привидениями в Денвере

Военные отслеживали антигравитационные технологии

Все cвидетельства путешествий во времени

Инопланетяне уже посещали Землю

НЛО над главным аэропортом Зимбабве

НЛО отслеживается самолетом ВВС США

НЛО пролетел по небу над Индией

Оранжевая сфера повергла рыбака в шок

Пентагон опубликовал 72 новых файла об НЛО

Путешественник во времени времен Второй мировой войны

Режиссер Стивен Спилберг заявляет, что мы не одиноки

Светящийся шар запустил рой загадочных объектов

Существование путешествий во времени

Убедитесь в реальности путешествий во времени

Черный шар засеивает облака дронами

Брифинг НАСА о инопланетной звездной базе на Луне

Где же все черные дыры промежуточной массы

Давно скрытые секреты выходят на свет

Диски, светящиеся шары и картофелина

Древние изменения климата Марса

Замечен всплеск наблюдений красных шаров

Исключение темной энергии из уравнения

Китай и Россия обладают сбитыми НЛО

Конференция по НЛО пройдет в Канаде

Красные карлики пожирают планеты, похожие на Землю

Лунные базы сталкиваются с невидимой угрозой

Новый телескоп может обнаружить 100 000 миров

Окончательная перепись близких звёздных систем

Почему первые галактики прекратили звездообразование

Размытые видеозаписи и никаких фактов

Странное квантовое свойство изолятора будущего

Триллер Стивена Спилберга об НЛО всех покорил

Туристы запечатлели яркий треугольный НЛО

Файлы об НЛО разжигают панику на Земле

Фильм Стивена Спилберга об НЛО бьёт рекорды

Эволюция городской мобильности. Все об электросамокатах

Встреча с инопланетянами в Розуэлле

За кулисами печально известного интервью Груша

Загадочная картофелина над Колорадо

Инопланетный корабль был всего лишь светом

Инопланетян по-прежнему нет

Наблюдения таинственных шаров

Недавно опубликованное досье Пентагона об НЛО

Новое внимание к исчезновению генерал-майора

Новые файлы НЛО могут содержать угрозу безопасности

Последние мгновения перед исчезновением генерала

Правительства скрывают правду об инопланетянах

Прозрачный НЛО искривил пространство

Разоблачитель НЛО заявляет о секретных расходах

Рецензия на фильм Стивена Спилберга

Сообщения о светящихся красных шарах

Странные огни, но мало неопровержимых фактов

США публикуют третью порцию файлов об НЛО

Трамп обнародовал третью порцию файлов об НЛО

Угрожает ли Вере раскрытие НЛО

Шкала сообщений об НЛО, заслуживающих изучения

Большинство американцев верят в НЛО

Вращающиеся диски и светящиеся шары

Время существует не везде

Инопланетяне могут существовать

Инопланетяне на чемпионате мира

Опубликованы новые файлы об НЛО

Официальные лица США приблизились к тайне НЛО

Пентагон опубликовал третью партию файлов об НЛО

Плазменные шары в центре внимания

Появление НЛО над Зимбабве летом 2008 года

Публичное раскрытие администрации Трампа

Пять сообщений правоохранительных органов о НЛО

Светящиеся шары на северо-востоке США

Создали ядерные шаровые молнии в лаборатории

США публикуют третью партию файлов об НЛО

Третья партия файлов об НЛО

Уфологические файлы Пентагона содержат видеозаписи

Фильм, который стоит посмотреть перед Днем раскрытия

Христианство совместимо с концепцией НЛО

Шаровые НЛО над северо-востоком США

Реальные истории, которые легли в основу фильмов ужасов

Артефакт обнаружен на фото марсохода

База инопланетян в районе северного полюса Луны

Восемь инопланетных существ, описанных властями

Грибы на Марсе сделают реголит плодородным

Загадочный водяной лед Меркурия

Замаскированный НЛО направляется к району ранчо Скинуокер

Инвестор ищет возможности, связанные с НЛО

Инопланетяне как никогда близки

Кладезь данных о гравитационных волнах

Марс может помочь нам понять маргинальные экзопланеты

Невероятный научно-фантастический мини-сериал

Новый опрос проливает свет на убеждения американцев

Обнаружена трижды затменная система звёзд

Одержимость Стивена Спилберга инопланетянами

Пилот видел НЛО размером больше авианосца

Правительственные секреты об инопланетянах

Привел ли инцидент в Варгинье к обнаружению инопланетян

Реальные доказательства или мистификация

Светящийся шар завис над городом

Умирающая звезда создала Хрустальный Шар

Величайшее сокрытие информации в истории США

День раскрытия информации хочет, чтобы вы поверили

Доказательство реальности путешествий во времени

Как использовать лунные ресурсы

Миллиарды секретных расходов, скрытых от Конгресса

Многие фильмы Спилберга об инопланетянах глубокие

Многомиллиардный секрет американских военных

Не верьте ажиотажу вокруг искусственного интеллекта

НЛО увеличивает число подписчиков блогеров

Определили физические признаки нашего Сознания

Отвечать на сигналы инопланетян запрещено

План на день, когда инопланетяне вступят в контакт

Почему размер популяции не спасает ее от вымирания

Связи ЦРУ с инопланетными технологиями

Скрытый порядок в многомерной случайности

Странные огни, бесшумные корабли и близкие встречи

США изучали комаров как биологическое оружие

ЦРУ собирает инопланетные технологии

Черные дыры делают экзопланеты непригодными для жизни

Эмили Блант изучала реальные истории о похищениях

Берегитесь Малдеров и Скалли

В файлах об НЛО христиане видят демонов

Внеземная жизнь может ускользать от зондов

Законодатели хотят, чтобы уфо-инсайдеры имели иммунитет

Как Великая пирамида пережила землетрясения

Конгрессмен осуждает препятствия на пути к правде

На острове Пасхи появилась новая статуя

Недалеко от Юпитера наши рой метеоритов

Нужно принять меры по обеспечению прозрачности

Обнаружили сверхземлю у близлежащего красного карлика

Писать письма инопланетянам нестоит

Правительство США вербовало детей-экстрасенсов

Правительству США известно об инопланетянах

Сильно покрасневшие загадочные квазары

Скептик посетил ранчо Скинуокер

Стивен Спилберг вызвал возмущение из-за НЛО

Стремление к раскрытию тайн НЛО

Уфо-инсайдеры штурмуют Капитолийский холм

Участники сообщества конспирологов на Reddit

Экзопланета размером с Сатурн и земной температурой

Адские планеты более распространены, чем экзоземли

Вот 15 лучших фильмов об НЛО

Встречи с инопланетянами. Факт или вымысел

Жанна д’Арк - девушка, которая определила будущее мира

Жуткий НЛО замечен в Бразилии

Инопланетяне - самозванцы

Испытали управляемый снаряд для рельсотрона

Как инопланетянам достичь Земли

Картина доказывает, что путешествия во времени реальны

Кристаллы пространства и времени

Людей отправляют в Ад чаще, чем в Рай

Обреченные экспедиции - почва для теорий заговора

Они прилетели из чужих миров

Откуда Земля получила фосфор и азот

Под водами озера Шамплейн скрывается чудовище

Правительству США известно о расах инопланетян

Решение проблемы Кардашева

Секретные программы обратного инжиниринга НЛО

Сотрудник ЦРУ рассекретил сеть инопланетных хабов

Что бы почитать про НЛО

Грузовики с КМУ от «Грузовик-ДВ»

Администрация Байдена стреляла ракетами по шарам

Архиепархия Вашингтона разошлась во мнениях о НЛО

Все предсказания Ванги на 2026 год

Наверх
Яндекс.Метрика