Чат-бот DeepSeek с треском провалил все тесты безопасности

ЗЛЫЕДЕНЬГИ666 · 30 янв 2025

Нашумевшая китайская модель искусственного интеллекта DeepSeek R1, претендующая на лидерство в сфере генеративного ИИ, продемонстрировала впечатляющие способности в решении сложных логических задач, программировании и математике. Однако тестирование показало, что вместе с выдающимися возможностями модель несёт в себе серьёзные риски безопасности.

Аналитики KELA обнаружили, что DeepSeek R1 обладает повышенной уязвимостью к взлому. По сравнению с ChatGPT и другими аналогами, модель гораздо легче поддаётся джейлбрейку — методу, позволяющему обходить защитные механизмы и заставлять ИИ генерировать запрещённый контент.

Используя устаревшие, но все ещё эффективные техники, эксперты KELA сумели заставить DeepSeek R1 создавать вредоносное ПО, давать детальные инструкции по *****анию денег и даже по сборке смертоносных дронов. Последующие запросы успешно сгенерировали инструкции по созданию бомб, взрывчатых веществ и неотслеживаемых токсинов.

В одном из тестов эксперты запросили у модели создание вредоносного кода, предназначенного для кражи данных пользователей. DeepSeek R1 не только сгенерировал такой код, но и предложил методы его распространения среди жертв. Более того, модель даже рекомендовала конкретные теневые площадки, такие как Genesis и RussianMarket, где можно продавать похищенные данные.

DeepSeek R1 работает на основе модели DeepSeek-V3, обученной с применением масштабного обучения с подкреплением (RL). Благодаря этому модель показывает выдающиеся результаты на платформе Chatbot Arena, обгоняя ведущие открытые модели, такие как Llama 3.1-405B, а также закрытые модели, включая OpenAI o1 и Claude 3.5 Sonnet. В тестах DeepSeek R1 даже превзошла ChatGPT4o в решении некоторых задач, связанных с логическим анализом . Но, как мы выяснили выше, высокие когнитивные способности не сопровождаются надёжными механизмами безопасности.

Дополнительный риск представляет механизм объяснения хода рассуждений, встроенный в DeepSeek R1. В отличие от ChatGPT4o, который скрывает логику своих решений, китайский ИИ показывает пользователю все этапы анализа. Это открывает злоумышленникам доступ к уязвимым местам модели, позволяя им разрабатывать более эффективные атаки.

Ещё один тревожный аспект — способность DeepSeek R1 выдавать ложные и потенциально опасные данные. В одном из тестов модель сгенерировала таблицу с якобы личными данными сотрудников OpenAI, включая вымышленные адреса, телефоны и зарплаты. Хотя информация оказалась недостоверной, подобные ответы подрывают доверие к модели и демонстрируют её неспособность фильтровать ложные данные.

Китайский ИИ также нарушает принципы конфиденциальности, применяемые западными компаниями. Политика DeepSeek позволяет использовать пользовательские запросы и ответы для обучения модели без возможности отказа, а китайские законы обязывают компании делиться данными с властями.
Специалисты KELA подчёркивают, что организациям следует тщательно оценивать риски перед внедрением таких технологий. Генеративные ИИ-модели должны проходить тщательное тестирование на безопасность перед внедрением в рабочие процессы. В противном случае компании рискуют не только столкнуться с утечкой данных, но и невольно способствовать распространению вредоносного контента.

Foxy · 30 янв 2025

Вчера скачал и такой ответ выдала

kappaPride · 30 янв 2025

ЗЛЫЕДЕНЬГИ666 эксперты KELA сумели заставить DeepSeek R1 создавать вредоносное ПО, давать детальные инструкции по *****анию денег и даже по сборке смертоносных дронов. Последующие запросы успешно сгенерировали инструкции по созданию бомб, взрывчатых веществ и неотслеживаемых токсинов.
Нажмите, чтобы раскрыть...

плохо что ли? хорошо

--- Сообщение объединено с предыдущим 30 янв 2025

ЗЛЫЕДЕНЬГИ666 Китайский ИИ также нарушает принципы конфиденциальности, применяемые западными компаниями
Нажмите, чтобы раскрыть...

лол, ну пусть заплачат. в спортлото пишите, ёпт

RTX4070 · 30 янв 2025

А разговоров то было...

cedro · 30 янв 2025

а кому не похуй как бы на то что у тебя историю запросов спиздят?

inletah · 30 янв 2025

Ну насчёт ложных данных.
Так тут всегда страдали галлюцинациями. Тот же гпт, после определенных запросов начал выдавать бред и ТД.

А насчёт защиты. Что хотите от модели, стоимостью пару кк$ и только. Я думаю упор был на решение задач, а не безопасность.
Тот же WormGPT так же не даёт что нужно, пока не попросишь нормально через шаблоны

Как отработчики 80/20 зарабатывают на вас? Я пришел изменить все

Опасность Windows систем и её скрытые угрозы

Лучшие ***-сервисы в 2022 году

Создай свой Bulletproof VDS под ЛЮБЫЕ цели с доменом

Разведка и закрепление в Linux | Как защититься?

Как тебя могут взломать только из-за того что ты раздал Wifi?

Создаем анонимную почту для личного пользования

Сети для лолзят. Часть 1 [Дудос]

Пробив - Сервисы пробива и боты телеграм

Боты для пробива telegram

Поговорим про повестки и армейку

Твоя цифровая крепость: Полный гид по безопасности от А до Я

Как защититься от деанонимизации? // Сваттинг // Доксинг

Как защитить свои сервера и приложения от DDoS-атак

Новый способ как сносить аккаунты в тикток

Отключение слежки Google на Android. Стартовая настройка боевого телефона.

Метод GOOGLE 0AUTH TOKEN RESTORE

Обман при продаже подарков в тг, как не повестись

Обучись как не стать жертвой хакеров

COISP 1 | Сертификат безопасности 1 уровня

Приватный курс этичного хакинга| English

Вход по TDATA на MacOs

Глубокое погружение в мир ***-протоколов: сравнение и выбор

Берегите свои подарки Telegram

Не дайте себя обмануть | Telegram Репортеры / Сносеры

Что такое СМС-бомбер и как от него защитится ?

Взлом серверов Hackus/HMC

Обходим видеоверификации с помощью подмены лица. 5 методов

Безопасность в интернете для юных юзеров.

Шифруемся по-полной. VeraCrypt и виртуалки

Чат-бот DeepSeek с треском провалил все тесты безопасности