Загрузка...

The last test of humanity has come out.

Thread in Neural networks created by oooooooooooooo Jan 24, 2025. 64 views

  1. oooooooooooooo
    oooooooooooooo Topic starter Jan 24, 2025 50 рублей 2407 Dec 28, 2024
    [IMG] [IMG][IMG]

    Тот самый сложнейший бенчмарк людей уже доступен и даже есть лидерборд, в котором DeepSeek-R1 занимает первое место с почти 10% правильности ответов

    Подробней: https://static.scale.com/uploads/654197dc94d34f66c0f5184e/Publication%20Ready%20Humanity's%20Last%20Exam.pdf
    GitHub: https://github.com/centerforaisafety/hle

    Кто не вкурсе - Последний экзамен человечества это самый сложный бенчмарк, которое создавало человечество, это на данный момент максимально сложный бенчмарк для нейросетей, который возможно создать.


     
Loading...
Top