Загрузка...

Чат-бот DeepSeek с треском провалил все тесты безопасности

Тема в разделе Безопасность создана пользователем ЗЛЫЕДЕНЬГИ666 30 янв 2025. (поднята 9 фев 2025) 629 просмотров

Загрузка...
  1. ЗЛЫЕДЕНЬГИ666
    ЗЛЫЕДЕНЬГИ666 Автор темы 30 янв 2025 2567 29 июл 2020
    Нашумевшая китайская модель искусственного интеллекта DeepSeek R1, претендующая на лидерство в сфере генеративного ИИ, продемонстрировала впечатляющие способности в решении сложных логических задач, программировании и математике. Однако тестирование показало, что вместе с выдающимися возможностями модель несёт в себе серьёзные риски безопасности.

    Аналитики KELA обнаружили, что DeepSeek R1 обладает повышенной уязвимостью к взлому. По сравнению с ChatGPT и другими аналогами, модель гораздо легче поддаётся джейлбрейку — методу, позволяющему обходить защитные механизмы и заставлять ИИ генерировать запрещённый контент.

    Используя устаревшие, но все ещё эффективные техники, эксперты KELA сумели заставить DeepSeek R1 создавать вредоносное ПО, давать детальные инструкции по *****анию денег и даже по сборке смертоносных дронов. Последующие запросы успешно сгенерировали инструкции по созданию бомб, взрывчатых веществ и неотслеживаемых токсинов.

    [IMG]

    В одном из тестов эксперты запросили у модели создание вредоносного кода, предназначенного для кражи данных пользователей. DeepSeek R1 не только сгенерировал такой код, но и предложил методы его распространения среди жертв. Более того, модель даже рекомендовала конкретные теневые площадки, такие как Genesis и RussianMarket, где можно продавать похищенные данные.

    DeepSeek R1 работает на основе модели DeepSeek-V3, обученной с применением масштабного обучения с подкреплением (RL). Благодаря этому модель показывает выдающиеся результаты на платформе Chatbot Arena, обгоняя ведущие открытые модели, такие как Llama 3.1-405B, а также закрытые модели, включая OpenAI o1 и Claude 3.5 Sonnet. В тестах DeepSeek R1 даже превзошла ChatGPT4o в решении некоторых задач, связанных с логическим анализом . Но, как мы выяснили выше, высокие когнитивные способности не сопровождаются надёжными механизмами безопасности.

    Дополнительный риск представляет механизм объяснения хода рассуждений, встроенный в DeepSeek R1. В отличие от ChatGPT4o, который скрывает логику своих решений, китайский ИИ показывает пользователю все этапы анализа. Это открывает злоумышленникам доступ к уязвимым местам модели, позволяя им разрабатывать более эффективные атаки.

    Ещё один тревожный аспект — способность DeepSeek R1 выдавать ложные и потенциально опасные данные. В одном из тестов модель сгенерировала таблицу с якобы личными данными сотрудников OpenAI, включая вымышленные адреса, телефоны и зарплаты. Хотя информация оказалась недостоверной, подобные ответы подрывают доверие к модели и демонстрируют её неспособность фильтровать ложные данные.

    Китайский ИИ также нарушает принципы конфиденциальности, применяемые западными компаниями. Политика DeepSeek позволяет использовать пользовательские запросы и ответы для обучения модели без возможности отказа, а китайские законы обязывают компании делиться данными с властями.
    Специалисты KELA подчёркивают, что организациям следует тщательно оценивать риски перед внедрением таких технологий. Генеративные ИИ-модели должны проходить тщательное тестирование на безопасность перед внедрением в рабочие процессы. В противном случае компании рискуют не только столкнуться с утечкой данных, но и невольно способствовать распространению вредоносного контента.
     
  2. Foxy
    Foxy 30 янв 2025 Лучшие, антиабуз домены - lolz.live/threads/111111
    [IMG]
    Вчера скачал и такой ответ выдала :amcute:
     
    1. 803
      Foxy, нихуя се долго думал 5 сек
    2. ЗЛЫЕДЕНЬГИ666 Автор темы
      Foxy, по моему, китайское поделие врёт
  3. kappaPride
    kappaPride 30 янв 2025 триста тридцать три 4353 24 сен 2019
    плохо что ли? хорошо
    --- Сообщение объединено с предыдущим 30 янв 2025
    лол, ну пусть заплачат. в спортлото пишите, ёпт
     
  4. RTX4070
    RTX4070 30 янв 2025 Лучшие, антиабуз домены - lolz.live/threads/111111 11 668 28 май 2022
    А разговоров то было...
     
    1. ЗЛЫЕДЕНЬГИ666 Автор темы
      RTX4070, реклама в тг аля "убийца чатгпт" - проплачена)
  5. cedro
    cedro 30 янв 2025 A clear conscience is a soft pillow. 740 25 июн 2020
    а кому не похуй как бы на то что у тебя историю запросов спиздят?
     
  6. inletah
    inletah 30 янв 2025 Уууууууу реклама - lolz.live/threads/7756293/
    Ну насчёт ложных данных.
    Так тут всегда страдали галлюцинациями. Тот же гпт, после определенных запросов начал выдавать бред и ТД.

    А насчёт защиты. Что хотите от модели, стоимостью пару кк$ и только. Я думаю упор был на решение задач, а не безопасность.
    Тот же WormGPT так же не даёт что нужно, пока не попросишь нормально через шаблоны
     
Top