ПРИМЕНЕНИЕ ГРАФИЧЕСКОГО ПРОЦЕССОРА ДЛЯ ЦИФРОВОЙ ОБРАБОТКИ СИГНАЛОВ В РЕАЛЬНОМ МАСШТАБЕ ВРЕМЕНИ
Аннотация
Настоящая статья посвящена разработке энергоэффективных реализаций алгоритмов цифровой обработки сигналов в многоканальном радиолокаторе с пространственным разнесением передающих и приемных групп антенных элементов для оценки параметров целей на вычислителях с различной архитектурой. В соответствие общемировой тенденцией рассматривается возмож- ность применения вычислителей с параллельной архитектурой для цифровой обработки широко- полосных радиолокационных сигналов. Авторами предложена реализация процедуры обработки отраженного сигнала многоканального радиолокатора с пространственным разнесением пере- дающих и приемных групп антенных элементов с использованием технологии общих вычислений на графических картах (GPGPU). Проведена оценка производительности разработанного решения на различных GPU с разной микроархитектурой. Предложен критерий оценки производительно- сти алгоритма обработки в виде отношения пропускной способности алгоритма к пиковой про- пускной способности памяти вычислителя. Проведена численная оценка эффективности исполь- зования пропускной способности памяти вычислителя разработанного алгоритма в сравнении с известными реализациями на GPU. Целью работы является обнаружение и оценка параметров целей в реальном масштабе времени с помощью многоканального радиолокатора с пространст- венным разнесением передающих и приемных групп антенных элементов, используя доступный на рынке вычислитель с минимально возможными массогабаритными характеристиками. Для дос- тижения поставленной цели исследований решены задачи: – выбора и адаптации алгоритмов, позволяющих проводить оценку параметров целей в многоканальном радиолокаторе с простран- ственным разнесением передающих и приемных групп антенных элементов; – реализации выбран- ных алгоритмов с учетом архитектуры вычислителя, позволяющих проводить оценку фоновоце- левой обстановки в реальном масштабе времени; – оценки производительности полученного ре- шения. В процессе разработки алгоритма цифровой обработки сигнала многоканальным радиоло- катором с пространственным разнесением передающих и приемных групп антенных элементов проведен анализ нескольких вариантов реализации алгоритма с учетом архитектуры параллельно- го вычислителя, что позволило выполнить обработку кадра радиоизображения, состоящего из 8 млн. комплексных отсчетов, за время менее 50 мс. на графическом процессоре NVIDIA Jetson AGXXavier. Показана обратная зависимость времени обработки кадра от величины пиковой про- пускной способности памяти GPU. Предложен критерий оценки производительности алгоритма обработки. Проведена численная оценка эффективности использования пропускной способности памяти вычислителя разработанного алгоритма в сравнении с известными реализациями на GPU. Выигрыш разработанного алгоритма составляет в среднем 5 раз по сравнению с результатами, полученными другими авторами. По сравнению с ПЛИС реализация двумерного БПФ на GPU ока- зывается в 17 раз быстрее. Практическая значимость разработанного авторами функционально- го программного обеспечения не налагает никаких ограничений на количество приемных и пере- дающих каналов и может быть использовано для обработки сигналов в многоканальных радиоло- каторах с пространственным разнесением передающих и приемных групп антенных элементов с большим количеством каналов.
Список литературы
Deep Net, Remote Sensing, 2022, Vol. 15, No. 1, pp. 1-21.
2. Lobach V.T., Kas'yanov A.O., Potipak M.V., Sumatokhin K.V. Osobennosti tsifrovogo formirovaniya
diagrammy napravlennosti MIMO-radara [Features of digital beamforming of MIMO radar], Antenny
[Antennas], 2016, No. 7, pp. 47-52.
3. Lobach V., Kasyanov A., Potipak M. Digital beam forming in MIMO-radar with frequency diversity,
2016 IEEE East-West Design & Test Symposium (EWDTS). IEEE. 14-17 Oct. 2016, pp. 1-4.
4. Karim B.A., Ali H.K. Computationally efficient MUSIC based DOA estimation algorithm for FMCW
radar, Journal of Electronic Science and Technology, 2023, Vol. 21, No. 1, pp. 1-18.
5. Singh H., Chattopadhyay A. Multi-target Range and Angle detection for MIMO-FMCW radar with
limited antennas, arXiv preprint arXiv:2302.14327, 2023.
6. Grove R.L. MIMO radar Systems and Algorithms-Imperfections and Calibration. Copenhagen. Technical
University of Denmark, 2022, 189 p.
7. Patrick D., Huang Y., Brennan P.W. FMCW based MIMO imaging radar, ARMMS Conference. 7-8
Apr. 2014, Vol. 1, pp. 12-34.
8. Eugin H., Lee J. Hardware architecture design and implementation for FMCW radar signal processing
algorithm, Proceedings of the 2014 Conference on Design and Architectures for Signal and Image
Processing. IEEE. 8-10 Oct. 2014, pp. 1-6.
9. Fixed-Point and Floating-Point FMCW Radar Signal Processing with Tensilica DSPs, White paper.
– 2022. Available at: https://www.cadence.com/content/dam/cadence-www/global/en_US/ documents/
tools/ip/tensilica-ip/tip-fmcw-radar-wp.pdf.
10. Pitre E. et al. Comparison of massively parallel algorithms on graphics processing unit for MIMO
radar, e-Prime-Advances in Electrical Engineering. Electronics and Energy, 2022, Vol. 2, pp. 1-9.
11. Liu G. et al. A GPU based real time processing system for frequency division multiple input multiple
output radar, IET Radar. Sonar & Navigation, 2023, Vol. 17, No. 10, pp. 1524-1537.
12. Heo J. et al. FPGA implementation of an efficient FFT processor for FMCW radar signal processing,
Sensors, 2021, Vol. 21, No. 19, pp. 1-16.
13. Damnjanović V.D., Petrović M.L., Milovanović V. M. On Hardware Implementations of Two-
Dimensional Fast Fourier Transform for Radar Signal Processing, IEEE EUROCON 2023-20th International
Conference on Smart Technologies. 6-8 Jul. 2023, pp. 400-405.
14. Texas Instruments. MIMO radar, Application Report SWRA554, 2018.
15. Doerry A.W. SAR ambiguous range suppression, Report SAND2006-5332. Sandia National Laboratories
(SNL). Albuquerque. NM. and Livermore. CA (United States), 2006.
16. Harris M. How to Access Global Memory Efficiently in CUDA C/C++ Kernels, Parallel Forall.
NVIDIA Corporation, 2013. Available at: https://developer.nvidia.com/blog/how-access-globalmemory-
efficiently-cuda-c-kernels/.
17. Luitjens J. Faster parallel reductions on Kepler, Parallel Forall. NVIDIA Corporation, 2014. Available
at: https://devblogs. nvidia. com/faster-parallel-reductions-kepler.
18. Sakharnykh N. GPUPro Tip: Fast histograms using shared atomics on Maxwell, Parallel Forall.
NVIDIA Corporation, 2015. Available at: https://developer.nvidia.com/blog/gpu-pro-tip-fasthistograms-
using-shared-atomics-maxwell/.
19. Kalentev O. et al. Connected component labeling on a 2D grid using CUDA, Journal of Parallel and
Distributed Computing, 2011, Vol. 71, No. 4, pp. 615-620.
20. Kas'yanov A.O. Potipak M.V., Evtushenko A.N. Identifikatsiya radiolokatsionnoy stantsii na osnove
analiza neprednamerennoy vnutriimpul'snoy modulyatsii [Identification of a radar station based on the
analysis of unintentional intrapulse modulation], Radiotekhnika [Radio engineering], 2023, Vol. 87,
No. 2, pp. 73-83.
21. Jia Z. et al. Dissecting the NVidia Turing T4 GPU via microbench marking, arXiv preprint arXiv:
1903.07486, 2019.