MLTimes • @mltimesofficial/727

Your trial period has ended!

For full access to functionality, please pay for a premium subscription

Message

2 224 subscribers

713

В DeepSeek создали «умных судей» для искусственного интеллекта

Китайская исследовательская лаборатория DeepSeek AI представила значительное достижение в области моделирования систем вознаграждения для больших языковых моделей (LLM). Новая техника, получившая название "Настройка самостоятельной принципиальной критики" (Self-Principled Critique Tuning, SPCT), нацелена на создание универсальных и масштабируемых моделей вознаграждения (RM).

Это потенциально может привести к появлению более совершенных ИИ-приложений для открытых задач и доменов, где существующие модели не способны уловить все нюансы и сложности окружающей среды и потребностей пользователей.

https://mltimes.ai/v-deepseek-sozdali-umnyh-sudej-dlya-iskusstvennogo-intellekta/

04/09/2025, 13:37

t.me/mltimesofficial/727