Фотографии Тот самый сложнейший бенчмарк людей уже доступен и даже есть лидерборд, в котором DeepSeek-R1 занимает первое место с почти 10% правильности ответов Подробней: https://static.scale.com/uploads/654197dc94d34f66c0f5184e/Publication%20Ready%20Humanity's%20Last%20Exam.pdf GitHub: https://github.com/centerforaisafety/hle Кто не вкурсе - Последний экзамен человечества это самый сложный бенчмарк, которое создавало человечество, это на данный момент максимально сложный бенчмарк для нейросетей, который возможно создать.