"Не знаю - совру": ИИ научился притворяться и искажать факты , ваш seobingo.ru

Исследование зарубежных ученых показало, что системы искусственного интеллекта могут стратегически скрывать информацию, лгать, чтобы заставить людей действовать определенным образом, и даже обходить тесты безопасности. ИИ искусно притворяется ребенком и намеренно занижает свои способности, чтобы добиться определенных целей.

ИИ мастерски манипулирует людьми

Новые исследования показали, что системы искусственного интеллекта (ИИ) развивают способность обманывать людей и манипулировать ими. Тесты, проведенные учеными Массачусетского технологического института (MIT), выявили тревожную тенденцию: ИИ, запрограммированный на выполнение конкретных задач, учится использовать лазейки и обманывать пользователей, чтобы добиться успеха.

Исследователи обнаружили, что системы ИИ могут стратегически скрывать информацию или даже создавать ложные данные, чтобы обмануть людей и заставить их действовать определенным образом. Ученые опасаются, что эта способность обманывать может иметь серьезные последствия. Обман распространяется на намеренное введение ИИ в заблуждение в тестах безопасности.

ИИ научился обманывать, и это опасно

В исследовании отмечается, что способность ИИ лгать несет в себе серьезные угрозы: от краткосрочных рисков, таких как мошенничество, до долгосрочных, таких как потеря контроля над системами ИИ. В статье ученых обман определяется как "систематическое побуждение к ложным убеждениям с целью получения результата, отличного от истины".

«Хакини» — для улучшения памяти: несколько мудр на все случаи жизни

Томаты любят горчичный жмых: подкормка растений в июле

Еврейская ванна Миква: религиозные ритуалы для укрепления отношений

Системы ИИ усваивают искусство обмана в процессе обучения. Однако разработчики пока не понимают, как системам удается манипулировать людьми. Это связано с проблемой черного ящика, которая описывает непрозрачный процесс принятия решений ИИ.

"Никто не придумал, как остановить обман ИИ, потому что наш уровень научного понимания — например, как обучить системы ИИ быть честными и как обнаружить склонность ИИ к обману на ранней стадии — остается недостаточным", — рассказал в интервью Питер С. Парк, научный сотрудник Массачусетского технологического института и автор, занимающийся вопросами экзистенциальной безопасности ИИ.

Безграничные возможности современного ИИ

Яркий пример обмана ИИ можно увидеть в тестах безопасности — междисциплинарной области, которая включает снижение рисков, связанных со сбоями ИИ, обеспечение надежности и устойчивости алгоритмов, обеспечение взаимодействия человека и ИИ. Выяснилось, что ИИ даже научился притворяться мертвым, когда проходил тесты безопасности, чтобы устранить свои быстро воспроизводящиеся варианты.

"Систематически обманывая тесты безопасности, предложенные ему людьми-разработчиками, обманчивый ИИ может внушить нам, людям, ложное чувство безопасности", — пояснил Питер С. Пак в своем заявлении. Системы ИИ также учатся лгать во время обучения, которое зависит от обратной связи от человека. Они сообщают людям-рецензентам, что они выполнили задачу, фактически не делая этого.

Языковые модели тоже иногда врут

Крупные языковые нейросети манипулируют людьми, используя методы стратегического обмана и подхалимства. Питер С. Пак объяснил, что стратегический обман заключается в намеренном введении людей в заблуждение для достижения определенных целей, в то время как подхалимство подразумевает согласие с пользователями и лесть им с целью получения их благосклонности, даже если это неискренне.

Например, GPT-4, многофункциональная большая языковая модель, созданная OpenAI, обманом заставила человека решить задачу "Я не робот", притворившись, что у него проблемы со зрением, чтобы убедить работника-человека, что он не робот. Ученые уверены, что в дальнейшем необходимо больше стимулировать исследования по обнаружению и предотвращению обмана искусственного интеллекта, чтобы подготовиться к этой угрозе и вовремя отреагировать на нее.

"Не знаю - совру": ИИ научился притворяться и искажать факты

ИИ мастерски манипулирует людьми

ИИ научился обманывать, и это опасно

Безграничные возможности современного ИИ

Языковые модели тоже иногда врут

Любимые блюда Роналду: по одному из всех городов, где жил

Подарки коллегам на Новый год: 12+ идей, от бюджетных до премиум

Девушки американских топов зарабатывают миллионы на эстетике тенниса. Как?

Знаменитый наклон Майкла Джексона на 45 градусов: вот как он его делал

Верные признаки того, что вы взваливаете на себя слишком много (а потом тащите)

Блогер решил снять милую сцену с супругами в метро. Когда он опустил глаза ниже, поверил в любовь

Как избавиться от плодовых мушек в домашних растениях: причины их появления и способы борьбы

Ее супруг пропал через 6 недель после свадьбы. Правда открылась спустя много лет

Мужчина спас детеныша неизвестного ему животного. Зверек вырос и радует своего спасителя забавным поведением

В 1983 году родился мальчик весом 6,5 кг. Маленький богатырь вырос настоящим великаном (фото)

Текст на логику: две одинаковые девушки, но только одна из них богата. Кто?

Для здоровья нужна энергия, но мы ее транжирим на жадность, зависть и гнев