🤖 O3 от OpenAI: ИИ, который “думает руками”
Или как я попросил ИИ выбрать лучшую библиотеку для работы с PDF — и он устроил настоящее мини-исследование.
OpenAI выпустила новую модель o3, которая умеет использовать инструменты прямо в процессе размышлений. То есть, если ей нужно что-то понять, она не просто “угадывает” ответ, а идёт за фактами — ищет, проверяет, экспериментирует, анализирует изображение, пишет код, — всё как настоящий исследователь.
🧪 Я протестировал это на реальной задаче.
Запрос был простой, но очень жизненный:
Найди лучшие open-source библиотеки для извлечения текста, таблиц и структуры из PDF-файлов (включая сканы), и предложи на их основе рабочее решение.
📌 Что сделала модель:
1. 🔍 Запустила несколько запросов в веб-поиске по PDF extraction tools.
2. 📚 Собрала список решений: pdfplumber, unstructured.io, PyMuPDF, layoutparser и др.
3. 🧠 Оценила их по метрикам: OCR-качество, поддержка layout, стабильность, работа с noisy/rotated pages.
4. 🧩 Предложила комбинацию библиотек, где одни отвечают за OCR, другие — за структуру, а третьи — за унификацию вывода.
5. 💻 Написала код на Python с установкой зависимостей и подробной инструкцией.
6. 📦 Скомпилировала всё в ZIP-архив и предложила архитектуру пайплайна.
🎯 Результат:
O3 продемонстрировала не шаблонный ответ, а полноценный ресерч с анализом, кодом и выводами.
Это уже не просто ассистент — это полноценный интеллектуальный исполнитель, который сам разбивает задачу на части и решает её шаг за шагом, используя всё, что у него есть в арсенале.
📽️ Демо OpenAI:
YouTube📄 Подробнее:
openai.com