Алгоритмы цифрового предыскажения для линеаризации усилителей мощности от теоретических моделей до практической реализации на ПЛИС

Нелинейность - проклятие любого радиочастотного усилителя мощности. Идеальный усилитель должен умножать входной сигнал на фиксированный коэффициент, сохраняя форму огибающей и фазовые соотношения. В реальности же каждый транзистор демонстрирует сжатие при приближении к насыщению, паразитный фазовый сдвиг с ростом мощности, зависимость усиления от предыдущих значений сигнала и целый букет других неприятных эффектов. Результат - спектральный расплыв (spectral regrowth), ухудшение спектральной маски передачи и деградация error vector magnitude для модуляций высокого порядка.

Цифровое предыскажение (digital predistortion, DPD) решает задачу элегантным обходным манёвром. Вместо того чтобы линеаризовать сам усилитель, инженеры намеренно искажают цифровой сигнал перед ЦАП так, чтобы искажения предкомпенсации и искажения усилителя точно погасили друг друга. Формально DPD строит передаточную функцию F(·), обратную передаточной функции усилителя G(·), и вставляет её в тракт:

y(n) = G(F(x(n))) ≈ K · x(n)

где x(n) - исходный baseband-сигнал, K - желаемый линейный коэффициент усиления. Задача сводится к точному моделированию нелинейности G и её инверсии.

Математические модели нелинейности усилителя от простых полиномов до обобщённой памяти

Базовая безмеренная модель представляет усилитель как функцию от текущего отсчёта входного сигнала. Простейшая форма - степенной полином:

y(n) = a_1·x(n) + a_3·|x(n)|²·x(n) + a_5·|x(n)|⁴·x(n) + ...

Нечётные степени здесь возникают из-за того, что полезный спектр попадает в полосу сигнала только от нечётных гармоник при работе вокруг несущей. Коэффициенты a_k комплексные, что позволяет описывать одновременно амплитудные (AM-AM) и фазовые (AM-PM) искажения.

Беда в том, что современные транзисторы, особенно GaN-гетероструктуры, обладают выраженной памятью. Выходной отсчёт зависит не только от текущего входного значения, но и от нескольких предыдущих через тепловые, электрические и захватные эффекты. Безмеренный полином тут бессилен. На помощь приходит модель памяти Вольтерры - универсальный аппарат для описания нелинейных систем с памятью. Её полная форма содержит многомерные ядра и требует хранения огромного числа коэффициентов, что делает её непрактичной для реализации.

Компромиссом стала модель memory polynomial (MP), предложенная Морганом и коллегами:

y(n) = Σ_k Σ_q a_kq · x(n-q) · |x(n-q)|^(k-1)

где q - индекс задержки от 0 до Q, а k - порядок нелинейности (обычно нечётные от 1 до K). Модель учитывает память, но игнорирует перекрёстные члены между разными задержками. Её логическое расширение - generalized memory polynomial (GMP) - добавляет кросс-члены между текущим отсчётом и соседними задержками, существенно улучшая точность моделирования ценой роста числа коэффициентов.

Индирект-архитектура обучения упрощает задачу вычисления обратной функции

Прямое вычисление обратной функции усилителя G⁻¹(·) - нетривиальная математическая задача. Инженеры придумали обходной путь, названный indirect learning architecture (ILA). Идея изящная. Вместо построения инверсии сразу, система обучает второй, вспомогательный постдисторт-блок, который смотрит на выход усилителя и пытается восстановить по нему идеальный вход. Поскольку искажения на входе и выходе усилителя симметричны относительно желаемой линейной передаточной функции, коэффициенты обученного постдисторта копируются в предыскажатель на входе.

Процесс обучения превращается в классическую задачу линейной регрессии. Записывается матрица наблюдений Y, содержащая выходные отсчёты усилителя и их степенные комбинации, и вектор желаемых входных отсчётов X. Коэффициенты вычисляются через псевдообратную матрицу:

c = (Y^H · Y)^(-1) · Y^H · X

где H обозначает эрмитово сопряжение. На практике вместо прямого обращения используют более устойчивые алгоритмы вроде QR-разложения, рекурсивного метода наименьших квадратов (RLS) или LMS-адаптации. RLS сходится быстрее, но требует больше вычислений на итерацию. LMS экономнее по ресурсам, но медленнее адаптируется к изменениям характеристик усилителя.

Число обусловленности матрицы Y^H·Y играет критическую роль в численной стабильности. Обычный memory polynomial часто даёт плохо обусловленную матрицу из-за сильной корреляции между столбцами. Ортогонализация базисных функций через процедуру Грама-Шмидта или переход к ортогональным полиномам Чебышева радикально улучшает устойчивость и позволяет работать с меньшей разрядностью арифметики.

Основные варианты алгоритмов DPD, применяемых в серийных системах, можно свести к следующему списку:

Memory Polynomial (MP) - базовая модель с памятью, компромисс между точностью и сложностью, широко применяется для полос до 100 МГц.
Generalized Memory Polynomial (GMP) - расширение MP с кросс-членами, де-факто стандарт в 5G-системах для полос 100-400 МГц.
Dynamic Deviation Reduction Volterra - урезанная модель Вольтерры с селекцией значимых ядер, подходит для самых широкополосных задач.
2D-DPD для мультистандартных систем с carrier aggregation, где усилитель работает одновременно в двух разнесённых полосах.
Нейросетевые модели вроде PNTDNN - phase-normalized time-delay networks, дающие выигрыш по точности при большей вычислительной нагрузке.

Реализация актуатора на ПЛИС требует балансировки между точностью и ресурсами

ПЛИС стали доминирующей платформой для DPD благодаря сочетанию параллельной архитектуры и высокой пропускной способности. Система разбивается на два концептуально разных блока. Актуатор (DPD actuator) обрабатывает живой поток отсчётов в реальном времени и должен успевать за частотой дискретизации ЦАП, обычно 500-1500 миллионов выборок в секунду. Движок адаптации (adaptation engine) работает в фоновом режиме, периодически обновляя коэффициенты на основе наблюдений с приёмника обратной связи.

Актуатор на основе GMP-модели состоит из цепочки умножителей комплексных чисел, вычислителей степеней модуля |x|^n, линий задержки и сумматоров. Для порядка нелинейности K=9 и глубины памяти Q=4 требуется порядка 30-50 комплексных коэффициентов и сотни DSP48-блоков на современных Xilinx или Altera-чипах. Параллельная структура с многоканальной обработкой (скажем, 8 отсчётов за такт) позволяет достичь эквивалентной частоты 1.5 ГГц при тактовой 187.5 МГц внутри ПЛИС.

Арифметика с фиксированной точкой остаётся стандартом по соображениям экономии ресурсов. Типичная разрядность 16-18 бит обеспечивает adjacent channel power ratio (ACPR) лучше -50 дБн, что удовлетворяет требованиям 5G NR. Снижение до 12 бит даёт примерно 10 дБ потерь в ACPR, что неприемлемо для базовых станций. Масштабирование и округление промежуточных результатов требует тщательного анализа, иначе растёт квантизационный шум.

Движок адаптации обновляет коэффициенты с учётом термодрифта и старения компонентов

Характеристики усилителя не статичны. При прогреве транзистора от холодного пуска до установившегося теплового режима коэффициенты поведенческой модели смещаются на 10-20 процентов. Старение элементной базы добавляет медленный дрейф на масштабе месяцев и лет. DPD-система обязана это компенсировать автоматически.

Адаптация реализуется через периодический захват участков сигнала на входе и выходе усилителя. Приёмник обратной связи (observation receiver) оцифровывает выходной сигнал с частотой, в 3-5 раз превышающей полосу исходного канала, чтобы захватить всю спектральную расплывку. Типичный цикл обновления коэффициентов составляет от единиц миллисекунд до секунд в зависимости от динамики изменений. Для RLS-адаптации с размером окна 10000 отсчётов и моделью с 40 коэффициентами вычислительная нагрузка составляет порядка 10 миллионов операций с плавающей точкой на обновление, что легко укладывается в бюджет встроенного процессора или отдельного DSP-ядра.

Критически важна чистота наблюдаемого сигнала. I/Q-разбаланс приёмника, постоянная составляющая, фазовый шум гетеродина - все эти паразитные эффекты просачиваются в коэффициенты DPD-модели и портят линеаризацию. Калибровка приёмника обратной связи проводится регулярно, обычно в моменты пауз передачи. В некоторых решениях используется дополнительный эталонный сигнал известной формы для точного измерения характеристик тракта наблюдения.

Нейросетевые подходы переопределяют представления о сложности DPD

Последние годы принесли волну исследований по применению нейросетей в задачах предыскажения. Классические полиномиальные модели начинают пасовать при экстремальных полосах (единицы гигагерц) и сильной нелинейности GaN-транзисторов с envelope tracking. Нейросети с архитектурой time-delay neural network (TDNN) или рекуррентными слоями справляются лучше, но требуют на порядок больше вычислительных ресурсов.

Прорыв в практической применимости нейросетевых DPD связан с техниками разрежения. Работа SparseDPD, представленная в 2025 году, демонстрирует ACPR -59.4 дБн и EVM -54 дБн при потреблении всего 241 милливатта на чипе Xilinx Zynq-7Z010 благодаря неструктурированному прунингу, сокращающему число параметров на 74 процента без потери точности. Сеть PNTDNN содержит всего 64 коэффициента против сотен в классических GMP-реализациях и при этом обгоняет их по всем метрикам.

Ключевая формула, описывающая качество линеаризации через normalized mean square error (NMSE), помогает сравнивать разные алгоритмы:

NMSE = 10·log10( Σ|y_ideal(n) - y_actual(n)|² / Σ|y_ideal(n)|² )

Значения лучше -40 дБ считаются хорошим результатом для коммерческих систем, а -48 дБ и ниже - уровень state-of-the-art.

Практические соображения и перспективы развития

Современные трансиверы вроде семейств Analog Devices RadioVerse или Texas Instruments AFE7769 интегрируют DPD-функциональность прямо на кристалле, снимая необходимость реализовать весь алгоритм на внешней ПЛИС. Такие решения содержат встроенный микропроцессор и специализированный аппаратный актуатор, что радикально сокращает время разработки и снижает энергопотребление. Для базовых станций high-end сегмента ПЛИС-реализация остаётся предпочтительной из-за большей гибкости алгоритмов.

Перспективы развития технологии связаны с несколькими направлениями. Первое - расширение полосы DPD до 1-2 ГГц для поддержки перспективных стандартов 6G с агрегацией множества несущих. Второе - адаптация к нелинейности усилителей с envelope tracking, где комбинированные эффекты предыскажения и быстро меняющегося питания требуют специальных алгоритмов. Третье - переход на гибридные схемы, сочетающие классические полиномиальные модели для основного тела сигнала и нейросетевую коррекцию остаточных искажений. Сочетание математической строгости и аппаратной эффективности продолжит определять развитие DPD как одной из ключевых технологий беспроводной связи. Следующие годы принесут ещё больше решений, балансирующих точность, скорость и стоимость реализации.

👉 Канал сайта на сервисе Дзен