Когда я впервые узнал о выпуске моделей gpt-oss-120b и gpt-oss-20b от OpenAI 5 августа 2025 года, мне показалось, что перед нами распахнули двери в мастерскую, где каждый может взять в руки инструменты, прежде доступные лишь избранным. Эти модели с открытыми весами под лицензией Apache 2.0 — не просто новый шаг в развитии искусственного интеллекта, а настоящий прорыв, который делает мощь ИИ доступной для разработчиков, исследователей и энтузиастов по всему миру. Но что делает их такими особенными? И как они могут переписать правила игры в глобальной технологической гонке? Давайте разберемся, заглянув в их техническое сердце и исследуя их потенциал.
Революция открытых моделей от OpenAI
OpenAI, компания, стоявшая у истоков таких гигантов, как GPT-3 и o4-mini, сделала смелый шаг, выпустив свои первые модели с открытыми весами со времен GPT-2 в 2019 году. Gpt-oss-120b и gpt-oss-20b — это как открытые чертежи космического корабля, которые любой желающий может изучить, модифицировать и запустить. Модель gpt-oss-120b с 117 миллиардами параметров работает на одном 80-гигабайтном GPU, таком как NVIDIA H100, активируя всего 5.1 миллиарда параметров на токен благодаря архитектуре mixture-of-experts (MoE). Ее младшая сестра, gpt-oss-20b, с 21 миллиардом параметров, требует лишь 16 ГБ памяти, что делает ее идеальной для ноутбуков, краевых устройств и даже мощных смартфонов.
Обе модели построены на трансформерной архитектуре с чередованием плотных и локально-полосовых слоев внимания, вдохновленных GPT-3. Они используют группированное многозапросное внимание (группа размера 8) и вращающееся позиционное кодирование (RoPE), поддерживая контекст до 128 тысяч токенов. Это как держать в памяти целую библиотеку, не теряя ни одной страницы. Обучение проводилось на преимущественно англоязычном наборе данных, ориентированном на STEM, программирование и общие знания, с использованием токенизатора o200k_harmony, который OpenAI также открыла для всех. Разве не заманчиво получить доступ к такой мощи?
Рассуждения, которые впечатляют
Что, если ИИ мог бы не просто выдавать ответы, а размышлять, как опытный аналитик, взвешивая каждый шаг? Модели gpt-oss-120b и gpt-oss-20b от OpenAI поддерживают цепочку рассуждений (CoT) с тремя уровнями усилий — низким, средним и высоким, позволяя выбирать между скоростью и глубиной анализа. Это как переключаться между велосипедом и скоростным поездом в зависимости от задачи. Низкий уровень идеален для быстрых запросов, а высокий — для сложных математических или аналитических задач.
На бенчмарках модели демонстрируют выдающиеся результаты. Gpt-oss-120b обходит o3-mini и соперничает с o4-mini на задачах программирования (Codeforces: Elo 2622 с инструментами против 2516 для o4-mini), общих знаний (MMLU: 90% точности), PhD-уровневых вопросов (GPQA Diamond: 80.1%) и использования инструментов (Tau-Bench: 67.8%). Gpt-oss-20b, несмотря на меньший размер, превосходит o3-mini в математике (AIME 2024: 96.6%, AIME 2025: 97.9%) и медицинских запросах (HealthBench: 59.8%, HealthBench Hard: 31.6%). Эти показатели ставят их в один ряд с китайскими моделями, такими как DeepSeek R-1 и Qwen-2.5-Max, но с преимуществом открытости. Какой разработчик не захочет попробовать такую мощь?
Инструменты как продолжение ИИ
Бывало ли у вас, что поиск информации занимал часы, а решение задачи требовало еще больше времени? Gpt-oss-120b и gpt-oss-20b от OpenAI берут эту работу на себя. Они поддерживают агентные рабочие процессы, включая веб-поиск, вызов функций и выполнение Python-кода. Это как иметь ассистента, который не только находит нужную формулу, но и применяет ее к вашим данным. Модели совместимы с API ответов OpenAI и поддерживают структурированные выходные данные, что делает их идеальными для интеграции в сложные системы, от чат-ботов до аналитических платформ.
На Tau-Bench gpt-oss-120b достигла 67.8% точности в задачах вызова функций, обойдя o4-mini (65.6%). Они могут выполнять последовательные действия, например, искать актуальную информацию или генерировать код, что делает их универсальными инструментами. Это как команда экспертов, работающая в вашем кармане, готовая решать задачи любой сложности.
Безопасность: открытость с ответственностью
Открытые модели — это как мощный инструмент: в умелых руках он творит чудеса, но требует осторожности. OpenAI подошла к этому с максимальной ответственностью, проведя тщательное обучение безопасности. На этапе предварительного обучения фильтровались вредоносные данные, включая материалы по химическим, биологическим, радиологическим и ядерным угрозам. На этапе пост-тренинга использовались методы выравнивания, такие как deliberative alignment и instruction hierarchy, чтобы модели отказывались от небезопасных запросов.
Чтобы оценить риски, OpenAI протестировала антагонистически настроенные версии моделей в биологии и кибербезопасности, подтвердив, что даже такие версии не достигают критических уровней опасности по их Рамкам подготовки. Три независимые группы экспертов проверили этот процесс, предложив улучшения, которые были внедрены. Кроме того, OpenAI запустила Челлендж по красной команде с призовым фондом в 500 тысяч долларов, чтобы сообщество могло выявить новые уязвимости. Это как открыть двери лаборатории и сказать: «Проверьте, где мы можем стать лучше». Результаты будут опубликованы, укрепляя экосистему открытых моделей.
Доступность для каждого
Когда я впервые запускал ИИ-модель на своем ноутбуке, это было как зажечь свет в темной комнате — ощущение, что ты на пороге чего-то великого. Gpt-oss-120b и gpt-oss-20b от OpenAI делают это чувство реальностью для всех. Их веса доступны на Hugging Face с нативной квантовкой MXFP4, позволяя gpt-oss-120b работать на 80 ГБ GPU (1.5 миллиона токенов в секунду на NVIDIA Blackwell), а gpt-oss-20b — на устройствах с 16 ГБ памяти. Оптимизация для NVIDIA RTX GPU, AMD Ryzen AI, Cerebras и Groq делает их молниеносно быстрыми.
OpenAI сотрудничает с платформами, такими как Azure AI Model Catalog, AWS, vLLM, Ollama, Fireworks, Together AI и другими, для упрощения развертывания. Microsoft интегрировала gpt-oss-20b в Windows через ONNX Runtime, что позволяет разработчикам запускать модель локально через Foundry Local или AI Toolkit для VS Code. Это как раздать каждому желающему ключи от мастерской, где можно создавать свои решения. Открытый токенизатор o200k_harmony и рендеры на Python и Rust упрощают настройку.
Стратегический прорыв в глобальной гонке
В мире, где технологии развиваются быстрее, чем мы успеваем за ними следить, выпуск gpt-oss-120b и gpt-oss-20b имеет не только техническое, но и стратегическое значение. OpenAI подчеркивает, что эти модели укрепляют позиции США в глобальной гонке ИИ, конкурируя с такими моделями, как DeepSeek и Qwen. Их открытость снижает барьеры для малого бизнеса, стартапов и развивающихся рынков, делая ИИ демократичным. Это как построить мост, по которому каждый может пройти к новым возможностям.
Но с великой силой приходит великая ответственность. Открытые модели требуют от сообщества активного участия в обеспечении безопасности. Челлендж по красной команде и открытые данные — это шаг к созданию безопасной экосистемы. Что, если мы сможем построить мир, где ИИ будет не только мощным, но и этичным? Это вызов, который стоит принять.
Будущее в наших руках
Работая с gpt-oss-120b и gpt-oss-20b, я вижу не просто код и параметры, а возможности. Эти модели от OpenAI — как маяки, освещающие путь для тех, кто хочет создавать, экспериментировать и раздвигать границы. Их архитектура, оптимизированная для эффективности, мощные возможности рассуждений и инструментов, а также акцент на безопасность делают их уникальными. Они не заменяют проприетарные модели, а дополняют их, предлагая гибкость и доступность.
Будущее ИИ — это не закрытые лаборатории, а открытая мастерская, где каждый может внести свой вклад. Gpt-oss-120b и gpt-oss-20b — это приглашение присоединиться к этому процессу. Так что, если вы разработчик, исследователь или просто любопытный энтузиаст, скачайте эти модели, запустите их и начните создавать. Кто знает, может, ваша идея станет следующим большим прорывом?