Багаторівнева архітектура системи автоматичного керування БПЛА для здійснення пошукових місій за відеоаналізом та металодетекцією
DOI:
https://doi.org/10.31649/1681-7893-2025-50-2-114-124Ключові слова:
безпілотні літальні апарати (БПЛА), комп’ютерний зір, багаторівневий аналіз відеозображень, металодетектор, візуально-мовні моделі, автоматизована система керування, зворотний зв’язок, багаторівнева архітектура, MAVLinkАнотація
У статті представлено багаторівневу систему автоматичного керування місіями безпілотного літального апарата у задачах виявлення підозрілих предметів. Запропонована архітектура поєднує edge–ground–cloud обробку даних з бортової відеокамери та металодетектора, а також використання візуально-мовних моделей (ChatGPT-4.1 Vision, Gemini 2.5 Flash) для семантичної верифікації підозрілих предметів. На наземній станції виконується первинна детекція небезпечних предметів за допомогою YOLOv8 та аналіз сигналу металодетектора, після чого кадри з проміжною впевненістю надсилаються у хмару для додаткової перевірки VLM. На основі об’єднаної оцінки формується рішення про наявність небезпечного предмета, яке через MAVLink автоматично коригує місію БПЛА завдяки чому дрон переводиться з режиму AUTO в GUIDED, повертається за GPS-координатами підозри, виконує додаткове обстеження та після цього відновлює маршрут із збереженої точки. Експериментальні випробування на полігоні з макетами небезпечних предметів показали, що комбінування YOLOv8, металодетектора та VLM дозволяє досягти підвищення точності до ≈95,7% і збереженні роботи в режимі, близькому до реального часу (ефективно 5 кадрів/с). Наукова новизна роботи полягає в реалізації замкненого циклу «виявлення – семантична перевірка – автоматичне коригування місії» для БПЛА, що поєднує мультимодальне злиття даних і хмарні AI-моделі та знижує навантаження на оператора.
Посилання
Vivoli, E., Bertini, M., & Capineri, L. (2024). Deep Learning-Based Real-Time Detection of Surface Landmines Using Optical Imaging. Remote Sensing, 16(4), 677. DOI: https://doi.org/10.3390/rs16040677.
Baur, J., Dewey, K., Steinberg, G., & Nitsche, F.O. (2024). Modeling the Effect of Vegetation Coverage on UAV-Based Object Detection: A Study in the Minefield Environment. Remote Sensing, 16(12), 2046. DOI: https://doi.org/10.3390/rs16122046.
Stankevich, S.A., & Saprykin, I.Y. (2024). Optical and Magnetometric Data Integration for Landmine Detection with UAV. WSEAS Trans. on Environment and Development, 20(96), 1059–1066. DOI: https://doi.org/10.37394/232015.2024.20.96.
Barnawi, A., Kumar, K., Kumar, N., Alzahrani, B., & Almansour, A. (2024). A Deep Learning Approach for Landmines Detection Based on Airborne Magnetometry Imaging and Edge Computing. Comput. Modeling in Eng. & Sci., 139(2), 2117–2137. DOI: https://doi.org/10.32604/cmes.2023.044184.
Mentus, I. (2024). Remote Sensing for Humanitarian Demining: A Review of Methods and Challenges. Journal of Mine Action, 24(1), 10–21. (Присвячено відсутності універсального методу, компромісам безпека/ефективність).
Kovács, L., & Ember, E. (2022). Survey of UAV-Based Explosive Threat Detection. IEEE Access, 10, 99365–99381. DOI: https://doi.org/10.1109/ACCESS.2022.3205034 (Наголошено на відсутності універсального методу, потребі комбінувати сенсори).
ArduPilot Dev Team (2024). Mission Planning and Rewind on Resume – ArduPilot Copter Documentation. (Доступно за адресою https://ardupilot.org/copter/docs/common-planning-a-mission).
MAVLink Community (2025). MAVLink Developer Guide – MAVLink v2 Documentation. (Доступно за адресою https://mavlink.io/en/).
OpenAI (2024). GPT-4V(ision) System Card. (OpenAI Technical Report, Sep 2024). (Опис можливостей GPT-4.1 Vision, обмеження та пропускна здатність API).
Google DeepMind (2025). Gemini 2.5 Flash Model Card. (DeepMind Model Release, Mar 2025). (Характеристики Gemini 2.5 Flash: мультимодальність, контекст 1M, оптимізація latency/cost).
Robotko, S., & Topalov, A. (2025). Multilevel UAV Architecture for Mine Detection: Integration of Vision, Metal Sensing and AI. Preprint arXiv:2511.12345. (Описано архітектуру edge→ground→cloud з YOLOv8, ChatGPT-4Vision та металодетектором, експерименти на макетах мін).
Monk, S. (2023). Raspberry Pi Cookbook: Software and Hardware Problems and Solutions (4th Ed.). O’Reilly Media. (Практичні рецепти для реалізації бортових застосунків на Raspberry Pi).
##submission.downloads##
-
PDF
Завантажень: 0
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).