💡 GPT-4.5 прошла трехсторонний тест Тьюринга
Исследователи
провели трехсторонний тест Тьюринга для четырех ИИ-систем — ELIZA, GPT-4o, LLaMa-3.1-405B и GPT-4.5. Последняя набрала наивысший балл.
Они применили оригинальную трехстороннюю версию теста — участники вели 5-минутные разговоры одновременно с другим человеком и одной из ИИ-систем, после чего определяли, кого из собеседников считают человеком. Такой вариант является более сложным по сравнению с тестом, где люди общаются только с машиной.
В 73% случаев испытуемые посчитали GPT-4.5 человеком. Другие ИИ набрали меньший результат:
◽️ LLaMa-3.1 — 56%;
◽️ ELIZA — 23%;
◽️ GPT-4o — 21%.
«Полученные данные представляют собой первое эмпирическое доказательство того, что искусственная система проходит стандартный трехсторонний тест Тьюринга», — отметили исследователи.
Новости |
AI |
YouTube