Sony 360 Reality Audio как объектная революция в звуковой сфере вокруг слушателя

Реклама: ООО "АЛИБАБА.КОМ (РУ)" ИНН: 7703380158 erid=2SDnjdb8wti

Привычный стереоформат держится на двух точках, где располагаются динамики или капсюли наушников. Голос между ними, инструменты по краям, иллюзия глубины достигается уровнями громкости и реверберацией. Потолок этой схемы давно нащупан, и все попытки добавить пространства через 5.1 или 7.1 упирались в одно ограничение - звук всё равно собирался из конкретных каналов, привязанных к конкретным колонкам. Японские инженеры предложили иной путь, в котором сама идея канала уступает место объекту с координатами в сферическом поле. Технология получила название 360 Reality Audio и с момента презентации на CES в январе 2019 года выросла из лабораторного эксперимента в полноценный формат с собственным каталогом записей и линейкой сертифицированных устройств.

Объектная модель против канальной как фундаментальный сдвиг в подходе к звукозаписи

Чтобы понять масштаб перемен, стоит сравнить два мира. В канальной парадигме звукорежиссёр сводит микс под конкретную конфигурацию динамиков. Дорожка 5.1 содержит шесть готовых потоков (фронт левый и правый, центр, тыл левый и правый, низкочастотный канал), и каждый из них жёстко предписан своей колонке. Если у слушателя дома стоит 7.1 или просто стереопара, система пересчитывает сигнал, теряя точность позиционирования.

Объектная модель работает иначе. Запись хранится не как набор готовых каналов, а как коллекция отдельных звуковых сущностей. Каждая нота вокала, каждый удар по тарелке, каждый аплодисмент в зале существует как самостоятельный объект с метаданными: координаты X, Y, Z в сферической системе, размер, расстояние, азимут и угол подъёма. Декодер на стороне пользователя читает эти данные и в реальном времени раскладывает объекты на ту акустическую систему, что физически доступна. Хоть тринадцать колонок по сфере, хоть саундбар, хоть пара наушников, рендер подстраивается под железо, не теряя художественного замысла.

Технология поддерживает до 24 независимых аудиообъектов в одном произведении. Звукорежиссёр размещает их в виртуальной сфере, окружающей слушателя, и может задавать траектории движения, изменение размера, плавные переходы. Получается не плоская картина с глубиной, а полноценный купол, где барабанщик стоит за спиной, гитарист справа, вокалист прямо перед носом, а бас уходит куда-то вниз и влево.

Технический фундамент на базе MPEG-H 3D Audio и связи с создателем формата MP3

Под капотом формата лежит кодек MPEG-H 3D Audio, спецификация ISO/IEC 23008-3, разработанная институтом Fraunhofer IIS. Именно эта команда в своё время подарила миру MP3, а позже AAC, и теперь её научный задел обслуживает иммерсивный звук. Стандарт целиком способен оперировать 64 громкоговорящими каналами и 128 кодек-ядрами, поддерживает каналы, объекты и амбисоники высоких порядков (HOA, higher order ambisonics) одновременно. Японская реализация использует строго объектную часть, отказавшись от смешанной канально-объектной модели, которой пользуется Dolby Atmos.

Кодирование строится на улучшенной модифицированной дискретно-косинусной трансформации (MDCT), той же математической базе, что лежит в основе AAC. Каждый объект сжимается отдельно, метаданные кодируются параллельно и привязываются к временной шкале. Битрейт варьируется в зависимости от уровня сервиса и количества активных объектов, чаще всего поток укладывается в 1,5 Мбит/с, что сопоставимо с качественным многоканальным AAC. Декодирование на смартфоне отъедает ощутимый кусок процессорного времени, а на профессиональных AV-ресиверах применяются специализированные DSP вроде Analog Devices ADSP-2156x и ADSP-2159x, 64-битные SHARC-процессоры с плавающей точкой, способные обрабатывать поток без артефактов и заметной задержки.

Студия-эталон для производства контента включает тринадцать динамиков: три на уровне ушей спереди, три ниже, три выше, плюс четыре окружающих позиции. Художник видит звуковое поле через визуализатор и буквально мышью двигает объекты по сфере, регулируя их параметры. После сведения файл уходит в дистрибуцию в виде единого MPEG-H потока, и уже устройство пользователя решает, как этот поток воспроизвести.

Магия фотографии собственных ушей и принцип индивидуальной настройки наушников

Самая неожиданная часть истории касается персонализации. Голова и ушная раковина каждого человека уникальны, как отпечаток пальца. Звук, прежде чем достичь барабанной перепонки, проходит сквозь индивидуальный акустический фильтр - это и есть передаточная функция головы, известная инженерам под аббревиатурой HRTF. Усреднённая модель работает так себе, индивидуальная даёт точное позиционирование.

Японцы предложили решение через мобильное приложение Sony Headphones Connect. Пользователь делает четыре снимка ушей под разными углами, программа анализирует геометрию раковины, размеры козелка, форму завитка, и формирует персональный HRTF-профиль. Дальше этот профиль загружается в облако, привязывается к учётной записи и подгружается при воспроизведении контента в формате 360.

Эффект ощутимый. Источники звука перестают казаться размытыми, появляется чёткая локализация по высоте, сцена обретает осязаемую глубину. Без персонализации формат тоже работает, но теряет львиную долю того самого "как будто я в зале" впечатления, ради которого затевался.

Что нужно для прослушивания и где взять контент в сертифицированном формате

Совместимость поддерживают три категории устройств. Первая - сертифицированные наушники, как родные модели от Sony (WH-1000XM5, LinkBuds S и далее), так и продукция партнёров вроде Audio-Technica с её ATH-TWX9. Вторая - умные колонки и саундбары, среди которых SRS-RA5000 и SRS-RA3000 от самой Sony, Amazon Echo Studio, линейка HT-A. Третья - AV-ресиверы и домашние кинотеатры с прямой поддержкой MPEG-H. Среди них Denon AVR-X3800H, флагман AVR-A1H, Marantz Cinema 50 и Cinema 40. Передача 360RA через Bluetooth не работает, поток требует Wi-Fi или HDMI с достаточной полосой.

Каталогом занимаются крупные стриминговые сервисы. Amazon Music HD и Tidal интегрировали формат напрямую в свои приложения, Deezer выпустил отдельное приложение 360 by Deezer, nugs.net предложил формат для концертных записей. Контент включает как классические альбомы (Майлз Дэвис, Боб Марли, Битлз в новом сведении), так и современные релизы. Среди них упоминаются работы Алиши Киз, Эрика Клэптона и многих других. На начало 2024 года в формате существовало больше тысячи треков, с тех пор каталог заметно вырос.

Для воспроизведения от слушателя требуется:

Подписка одного из стриминговых сервисов с поддержкой формата (обычно высший тариф)
Совместимое приложение и сертифицированное устройство вывода
Wi-Fi-соединение либо проводное HDMI-подключение к ресиверу
Желательно мобильное приложение для сканирования ушей и активации персонального профиля

Сравнение с Dolby Atmos Music и принципиальные расхождения двух конкурирующих философий

На рынке иммерсивной музыки два главных игрока. Подход американцев из Dolby базируется на гибридной модели: канальная "кровать" 7.1.4 плюс наложенные сверху объекты. Это даёт совместимость с уже существующей кинотеатральной инфраструктурой, потому что Dolby Atmos родился именно из кинопроизводства (формат стартовал в кинотеатрах ещё в 2012 году с фильмом "Храбрая сердцем"). Японский ответ изначально проектировался под музыку и остаётся чисто объектным до момента воспроизведения. Этот философский нюанс выливается в практическое отличие: 360RA лучше держит точность позиционирования при разной геометрии комнаты, тогда как Atmos выигрывает в плотности и кинематографичности.

Apple встроила собственную обработку Spatial Audio, технически основанную на Atmos, прямо в свою экосистему, что мгновенно обеспечило формату гигантскую аудиторию. Японцы выбрали путь открытого стандарта, лицензируемого третьим сторонам - Denon, Marantz, Sennheiser, Audio-Technica. Это медленнее, но создаёт более широкую коалицию производителей и не привязывает слушателя к одной марке устройств.

С точки зрения чисто технических возможностей MPEG-H гибче. Стандарт умеет передавать интерактивные элементы (например, регулировку громкости отдельных дорожек слушателем, выбор языка диалога), хотя 360RA пока этим не пользуется. Кодек выбран сетью корейского эфирного телевидения ATSC 3.0 как единственный аудиостандарт для 4K-вещания, а это серьёзный сертификат зрелости.

Куда движется формат и стоит ли простому слушателю погружаться в новый звуковой мир

Технология не отменяет стерео и не претендует на роль универсального преемника. Привычные форматы продолжат жить, потому что подавляющее большинство музыки сводится под две колонки и звучит в этом виде естественно. Иммерсивный формат раскрывается там, где художник изначально задумывал многомерное полотно: концертные записи, амбициозные студийные альбомы, саундтреки к играм, где направление звука даёт игроку преимущество в ориентации.

В 2023 году Sony показала вариант формата для прямых трансляций. Звук от каждого виртуального объекта сжимается и переносится в нужную точку акустической системы практически без задержки, что открывает дорогу прямым концертам в иммерсивном звуке. Параллельно появилась лицензия Gaming Virtualizer by 360 Reality Audio для разработчиков игр - бесплатная для разработки, платная для коммерческого выпуска. Японцы хотят повторить успех Dolby в кино уже на территории интерактивных развлечений.

Стоит ли пробовать обычному человеку, не одержимому звуком? Если речь идёт о владельце совместимых наушников и подписке на один из поддерживающих сервисов, ответ скорее положительный. Несколько вечеров с любимым альбомом в новом сведении расширяют представление о том, на что вообще способна запись. Если же придётся специально покупать гарнитуру и менять стриминг, разумнее сначала послушать демо в магазине или на выставке. Эффект сильно зависит от качества студийной работы над конкретной композицией, и не каждый альбом, помеченный логотипом 360RA, оправдывает обещания.

Японская разработка стала редким примером продуманной долгосрочной игры. Открытый стандарт, авторитетный научный партнёр, согласие крупных лейблов, постепенное расширение круга производителей. Формат не пытается заменить всё разом, он медленно отвоёвывает свою нишу, опираясь на то, что не умеют делать другие, - чисто объектный подход с персональной подгонкой под анатомию слушателя. И этот неспешный путь, кажется, окажется устойчивее громких заявлений.