Your trial period has ended!
For full access to functionality, please pay for a premium subscription
Message
ML
MLTimes
2 224 subscribers
6
10
713
В DeepSeek создали «умных судей» для искусственного интеллекта

Китайская исследовательская лаборатория DeepSeek AI представила значительное достижение в области моделирования систем вознаграждения для больших языковых моделей (LLM). Новая техника, получившая название "Настройка самостоятельной принципиальной критики" (Self-Principled Critique Tuning, SPCT), нацелена на создание универсальных и масштабируемых моделей вознаграждения (RM).

Это потенциально может привести к появлению более совершенных ИИ-приложений для открытых задач и доменов, где существующие модели не способны уловить все нюансы и сложности окружающей среды и потребностей пользователей.

https://mltimes.ai/v-deepseek-sozdali-umnyh-sudej-dlya-iskusstvennogo-intellekta/
04/09/2025, 13:37
t.me/mltimesofficial/727
Similar message chronology:
Newest first
Similar messages not found