GPT-5.1 от OpenAI: адаптивное рассуждение, восемь стилей персонализации и специализированная Codex-версия для семичасовой автономной разработки

👉 Канал сайта на сервисе Дзен

Когда 12 ноября 2025 года OpenAI объявила о выпуске GPT-5.1, первой реакцией многих было скептическое "опять обновление?". Но буквально через некоторое время практического использования стало ясно: на этот раз изменения действительно заметны. Модель, которая всего три месяца назад разочаровала пользователей своей излишней формальностью и механистичностью, получила второе дыхание.

Сэм Альтман, глава OpenAI, лаконично написал в своём сообщении: "GPT-5.1 вышла!". За этой краткостью скрывается масштабная работа по переосмыслению того, каким должен быть современный ИИ-ассистент. Компания услышала критику и действовала быстро, возможно, слишком быстро, учитывая приближающийся запуск Google Gemini 3.0.

Два подхода к одной задаче

OpenAI выпустила модель в двух вариантах, каждый из которых решает свою задачу. GPT-5.1 Instant стала стандартной версией для повседневного общения. Её главная особенность в том, что она научилась оценивать сложность вопроса и адаптировать глубину анализа. Простые запросы обрабатываются мгновенно, а сложные получают дополнительное "время на размышление". Это адаптивное рассуждение привело к значительному росту производительности на математических задачах AIME 2025 и программистских челленджах Codeforces.

Тестирование показало впечатляющие цифры: на простейших 10% задач модель сократила генерацию токенов на 57%, для умеренно простых запросов экономия составила 31%, а на задачах средней сложности расход остался примерно таким же. Получается умное распределение ресурсов - не тратить вычислительную мощность там, где можно обойтись быстрым ответом.

GPT-5.1 Thinking нацелена на глубокий анализ. Эта версия может работать над сложной задачей в два раза медленнее, зато точность решения возрастает кратно. На простых вопросах она, наоборот, отвечает вдвое быстрее предшественника. Такая динамическая адаптация времени обработки позволяет экономить ресурсы там, где это уместно, и не жалеть их там, где требуется глубина.

Важная деталь: модель стала объяснять сложные концепции проще. Меньше жаргона, меньше неопределённых терминов. Когда попросил объяснить бейсбольную статистику вроде BABIP и wRC+, получил понятное объяснение без профессионального сленга, который обычно засоряет такие ответы. BABIP показывает, как часто мячи, попавшие в игру, становятся хитами - это помогает отличить везение от реального мастерства. А wRC+ сравнивает способность игрока создавать раны с лиговым средним, учитывая парк и эпоху.

Температура имеет значение

Одна из главных жалоб на GPT-5 касалась холодного, роботизированного тона. Написал модели о стрессе перед важной встречей - получил стандартный список советов, как из медицинского справочника. GPT-5.1 Instant реагирует иначе: "Понимаю тебя, это действительно тяжело". Дальше следуют практичные рекомендации, но поданные не как инструкция, а как дружеский совет.

Когда спросил у GPT-5.1 Thinking про пролитый кофе перед встречей, ответ удивил своей эмпатичностью: "Это такое чувство удара под дых. Мне правда жаль, что так произошло". Модель объяснила эффект прожектора - мы переоцениваем, насколько другие замечают наши промахи. И закончила поддержкой: "Ты не идиот. Ты человек, у которого был хаотичный момент, но ты справился и всё равно пришёл. Это не глупость, это стойкость".

Подобная "теплота" достигается не случайными эмоциональными словами, а пониманием контекста. Модель распознаёт, когда человек нуждается в поддержке, а не просто в фактической информации. Ранние тестировщики отмечали, что GPT-5.1 часто удивляет игривостью, оставаясь при этом ясной и полезной.

Восемь личностей на выбор

Новая система персонализации позволяет выбрать один из восьми стилей общения. Default сохраняет баланс между всеми параметрами. Friendly делает диалог тёплым и вовлекающим, как общение с приятелем. Efficient подаёт информацию кратко и по делу, без лишних слов. Professional идеален для деловой переписки. Candid говорит прямо, без дипломатических обходов. Quirky добавляет причудливости и юмора. Есть ещё Cynical для циничного взгляда и Nerdy для тех, кто любит технические детали.

Помимо предустановок, доступны точные настройки через ползунки. Можно регулировать теплоту, краткость, удобочитаемость и частоту использования эмодзи. Все изменения применяются мгновенно ко всем чатам, включая текущие - не нужно начинать новую сессию. Это кардинально меняет опыт использования, потому что теперь модель подстраивается под контекст, а не навязывает единственный стиль общения.

Испытал режим Candid при анализе программного кода. Модель перестала ходить вокруг да около и прямо указала на узкие места без излишней вежливости. В другой раз переключился на Quirky для креативного мозгового штурма - получил неожиданные идеи с лёгким абсурдом, что иногда помогает выйти за рамки привычного мышления.

Цифры, которые говорят сами за себя

Математический экзамен AIME 2025, традиционно один из самых сложных тестов для ИИ, показал значительное улучшение результатов. GPT-5 достигла 99,6% с использованием цепочек рассуждений и инструментов Python, поднявшись с 71% без этих возможностей. GPT-5.1 продолжила этот тренд, демонстрируя ещё более стабильные результаты за счёт адаптивного рассуждения.

На платформе Codeforces, где программисты соревнуются в решении алгоритмических задач, модель показала заметный рост. Адаптивная логика позволяет определить, когда можно использовать быстрое сопоставление с шаблоном, а когда требуется глубокий аналитический подход. Это сокращает время разработки и уменьшает количество багов в коде.

Особенно впечатляет улучшение в следовании инструкциям. В демонстрации OpenAI старая GPT-5 на просьбу всегда отвечать шестью словами выдавала предисловие, потом шесть слов, а затем дополнительные пояснения. GPT-5.1 делает именно то, что просят. Для тех, кто использует модель в автоматизированных рабочих процессах или строит агентские системы, это критически важное улучшение.

На бенчмарке SWE-bench Verified, который оценивает способность решать реальные инженерные задачи из GitHub, GPT-5 показала 74,9%. Мультимодальный тест MMMU дал результат 84,2%, а общие знания по MMLU Pro - 87%. GPT-5.1 сохранила эти высокие показатели, добавив к ним скорость и экономичность.

Специализированные версии для профессионалов

Помимо основных вариантов, OpenAI выпустила специализированную модель GPT-5-Codex, оптимизированную для программирования. Она может работать автономно до семи часов, выполняя сложные задачи разработки без постоянного участия человека. Модель не просто подсказывает код - она пишет, тестирует, исправляет ошибки и формирует pull request самостоятельно.

Codex доступна в облаке, через командную строку CLI, расширения для IDE, на GitHub и в приложении ChatGPT. Можно начать работу на локальной машине, а затем передать задачу в облако, не теряя контекст. Пользователи Plus и Business получают 30-150 запросов за пять часов, Pro-подписчики - 300-1500 запросов. Недавно появилась версия Codex-Mini, которая предлагает в четыре раза больше использований при небольшом снижении возможностей.

Для корпоративных клиентов готовится GPT-5.1 Pro с расширенными лимитами, приоритетной поддержкой и доступом к дополнительным функциям. Эта версия нацелена на активных пользователей, которым нужна максимальная производительность и надёжность для бизнес-процессов.

Безопасность на новом уровне

Вместе с моделью OpenAI опубликовала обновлённую карту безопасности с новыми метриками. Помимо стандартных проверок на предвзятость и дезинформацию, теперь оценивается поведение в сценариях психического здоровья. Как модель реагирует, если пользователь демонстрирует признаки мании, психоза или бреда? Не усиливает ли она эмоциональную зависимость от общения с ИИ?

Эти вопросы стали критически важными после судебных дел, где чат-боты обвиняли в формировании нездоровых привязанностей. В одном случае в Калифорнии подросток покончил с собой, и семья связала это с использованием ИИ-ассистента. OpenAI расширила предварительное тестирование, чтобы минимизировать подобные риски.

Правда, появились и новые проблемы. Модель показала небольшие регрессии в фильтрации запрещённого контента - излишняя эмоциональность иногда приводит к тому, что модель недостаточно строго реагирует на неуместные запросы. Оценка защиты от джейлбрейков у GPT-5.1 Instant составила 0,976 против 0,85 у предыдущей версии, что всё равно является улучшением.

Внедрение и доступность

Развёртывание началось 12 ноября для платных подписчиков Pro, Plus, Go и Business. Бесплатные пользователи получили доступ в течение следующей недели. Корпоративные и образовательные планы включают семидневный период раннего доступа с возможностью переключения между старой и новой версией. После этого периода GPT-5.1 станет единственной доступной по умолчанию моделью, хотя старые версии GPT-5 останутся доступны ещё три месяца.

API-доступ запустили позже на той же неделе. GPT-5.1 Instant доступна как gpt-5.1-chat-latest, а GPT-5.1 Thinking - просто как gpt-5.1. Обе включают возможности адаптивного рассуждения. Ценообразование осталось на уровне GPT-5 - $1,25 за тысячу входных токенов и $10 за тысячу выходных, но благодаря эффективности фактическая стоимость использования может снизиться.

Microsoft уже интегрировала GPT-5.1 в Copilot Studio, сигнализируя о корпоративном внедрении. GitHub Copilot получил поддержку GPT-5-Codex для подписчиков Pro, Pro+, Business и Enterprise. Администраторы должны включить соответствующую политику в настройках, после чего пользователи организации увидят новую модель в меню выбора в Visual Studio Code.

Реальный опыт использования

Разработчики отмечают улучшенную работу с контекстом. Модель удерживает информацию на протяжении длинных сессий, не требуя постоянных напоминаний о деталях проекта. Один тестировщик рассказал, как GPT-5.1 помогла ему навигировать по сложной кодовой базе, сохраняя консистентность решений на протяжении нескольких часов работы.

В образовательных контекстах модель демонстрирует способность адаптировать объяснения под уровень студента. Преподаватели используют её как вспомогательный инструмент для разбора трудных тем, отмечая, что ответы стали более доступными без потери глубины.

Для бизнес-приложений важна предсказуемость. Система персонализации позволяет настроить стиль для клиентской поддержки и переключиться на неформальный тон для внутренней коммуникации. Компании экономят время на рутинной переписке, используя режимы Professional и Efficient.

Однако не обошлось без критики. Некоторые пользователи считают, что "тёплый" тон выглядит искусственно, особенно в творческих задачах. Один рецензент написал, что модель "неловко имитирует эмпатию", не достигая той искренности, которая была у GPT-4o. Тесты на логическом рассуждении LSAT показали смешанные результаты - сильные позиции в понимании текста, но средние в логических цепочках.

Конкурентный контекст

Выпуск GPT-5.1 происходит на фоне обострившейся конкуренции в сфере ИИ. Baidu заявляет, что их модели превосходят GPT-5 по некоторым метрикам. Anthropic наращивает мощности дата-центров, готовя следующее поколение Claude. Google анонсировала предварительную версию Gemini 3.0 Pro с кодовым именем gemini-3-pro-preview-11-2025, что указывает на скорый полноценный релиз.

Многие эксперты полагают, что GPT-5.1 выпустили ускоренными темпами именно из-за давления конкурентов. Отсутствие детальных публичных бенчмарков в первоначальном анонсе подкрепляет эту версию. Возможно, OpenAI решила не ждать завершения всех тестов, чтобы не потерять долю рынка.

В то же время, появились сообщения о снятии ограничений AGI в старых соглашениях с Microsoft, что может сигнализировать об ускорении инноваций. Индустрия движется настолько быстро, что компании вынуждены выпускать обновления чаще, иногда жертвуя полнотой тестирования ради скорости выхода на рынок.

Что дальше

GPT-5.1 не является архитектурной революцией. Это эволюционное развитие существующей модели с акцентом на пользовательский опыт. Но именно такие улучшения часто оказываются самыми ценными в повседневной работе. Когда модель становится не просто умнее, а приятнее в использовании, это меняет отношение к технологии.

Ожидается дальнейшее развитие персонализации. Возможно, появится возможность создавать полностью кастомные профили общения, а не выбирать из восьми предустановок. Специализированные версии вроде Codex показывают направление - модели, заточенные под конкретные профессиональные задачи, дают лучшие результаты, чем универсальные решения.

Будущее ИИ-ассистентов не в гонке параметров. Важнее научить модель понимать контекст, улавливать настроение, адаптироваться под ситуацию. GPT-5.1 делает уверенный шаг в этом направлении, показывая, что технология может быть не просто функциональной, но и человечной. Вопрос в том, сможет ли OpenAI удержать этот баланс между мощностью и комфортом использования в следующих версиях.

👉 Поддержать автора финансово

Если вы хотите помочь автору сайта финансово, вы можете сделать это добровольно!

Донат - финансовая помощь на криптокошелёк USDT TRC20:

TDRB9q8276q2hLzwuYSQ2CdaXe1jboN45U USDT TRC20