Нейросети провалили тест на человеческое мышление: исследование
Исследовательский консорциум из Израиля и Англии представил неожиданные результаты тестирования когнитивных способностей современных языковых моделей. Исследователи применили Монреальскую шкалу когнитивной оценки – стандартизированный медицинский инструмент для выявления ранних признаков деменции – к ведущим нейросетям, включая GPT-4, Claude 3.5 Sonnet и Gemini.
Результаты тестирования оказались неутешительными. Даже самые передовые модели продемонстрировали показатели, которые у людей считаются пограничными или указывающими на когнитивные нарушения. При максимально возможных 30 баллах, оценка ниже 26 сигнализирует о вероятных нарушениях мыслительных функций.