Багаторівнева архітектура системи автоматичного керування БПЛА для здійснення пошукових місій за відеоаналізом та металодетекцією

Автор(и)

  • С.П. Роботько Національний університет кораблебудування імені адмірала Макарова, м. Миколаїв
  • А.М. Топалов Національний університет кораблебудування імені адмірала Макарова, м. Миколаїв

DOI:

https://doi.org/10.31649/1681-7893-2025-50-2-114-124

Ключові слова:

безпілотні літальні апарати (БПЛА), комп’ютерний зір, багаторівневий аналіз відеозображень, металодетектор, візуально-мовні моделі, автоматизована система керування, зворотний зв’язок, багаторівнева архітектура, MAVLink

Анотація

У статті представлено багаторівневу систему автоматичного керування місіями безпілотного літального апарата у задачах виявлення підозрілих предметів. Запропонована архітектура поєднує edge–ground–cloud обробку даних з бортової відеокамери та металодетектора, а також використання візуально-мовних моделей (ChatGPT-4.1 Vision, Gemini 2.5 Flash) для семантичної верифікації підозрілих предметів. На наземній станції виконується первинна детекція небезпечних предметів за допомогою YOLOv8 та аналіз сигналу металодетектора, після чого кадри з проміжною впевненістю надсилаються у хмару для додаткової перевірки VLM. На основі об’єднаної оцінки формується рішення про наявність небезпечного предмета, яке через MAVLink автоматично коригує місію БПЛА завдяки чому дрон переводиться з режиму AUTO в GUIDED, повертається за GPS-координатами підозри, виконує додаткове обстеження та після цього відновлює маршрут із збереженої точки. Експериментальні випробування на полігоні з макетами небезпечних предметів показали, що комбінування YOLOv8, металодетектора та VLM дозволяє досягти підвищення точності до ≈95,7% і збереженні роботи в режимі, близькому до реального часу (ефективно 5 кадрів/с). Наукова новизна роботи полягає в реалізації замкненого циклу «виявлення – семантична перевірка – автоматичне коригування місії» для БПЛА, що поєднує мультимодальне злиття даних і хмарні AI-моделі та знижує навантаження на оператора.

Біографії авторів

С.П. Роботько, Національний університет кораблебудування імені адмірала Макарова, м. Миколаїв

аспірант

А.М. Топалов, Національний університет кораблебудування імені адмірала Макарова, м. Миколаїв

к.т.н., доцент

Посилання

Vivoli, E., Bertini, M., & Capineri, L. (2024). Deep Learning-Based Real-Time Detection of Surface Landmines Using Optical Imaging. Remote Sensing, 16(4), 677. DOI: https://doi.org/10.3390/rs16040677.

Baur, J., Dewey, K., Steinberg, G., & Nitsche, F.O. (2024). Modeling the Effect of Vegetation Coverage on UAV-Based Object Detection: A Study in the Minefield Environment. Remote Sensing, 16(12), 2046. DOI: https://doi.org/10.3390/rs16122046.

Stankevich, S.A., & Saprykin, I.Y. (2024). Optical and Magnetometric Data Integration for Landmine Detection with UAV. WSEAS Trans. on Environment and Development, 20(96), 1059–1066. DOI: https://doi.org/10.37394/232015.2024.20.96.

Barnawi, A., Kumar, K., Kumar, N., Alzahrani, B., & Almansour, A. (2024). A Deep Learning Approach for Landmines Detection Based on Airborne Magnetometry Imaging and Edge Computing. Comput. Modeling in Eng. & Sci., 139(2), 2117–2137. DOI: https://doi.org/10.32604/cmes.2023.044184.

Mentus, I. (2024). Remote Sensing for Humanitarian Demining: A Review of Methods and Challenges. Journal of Mine Action, 24(1), 10–21. (Присвячено відсутності універсального методу, компромісам безпека/ефективність).

Kovács, L., & Ember, E. (2022). Survey of UAV-Based Explosive Threat Detection. IEEE Access, 10, 99365–99381. DOI: https://doi.org/10.1109/ACCESS.2022.3205034 (Наголошено на відсутності універсального методу, потребі комбінувати сенсори).

ArduPilot Dev Team (2024). Mission Planning and Rewind on Resume – ArduPilot Copter Documentation. (Доступно за адресою https://ardupilot.org/copter/docs/common-planning-a-mission).

MAVLink Community (2025). MAVLink Developer Guide – MAVLink v2 Documentation. (Доступно за адресою https://mavlink.io/en/).

OpenAI (2024). GPT-4V(ision) System Card. (OpenAI Technical Report, Sep 2024). (Опис можливостей GPT-4.1 Vision, обмеження та пропускна здатність API).

Google DeepMind (2025). Gemini 2.5 Flash Model Card. (DeepMind Model Release, Mar 2025). (Характеристики Gemini 2.5 Flash: мультимодальність, контекст 1M, оптимізація latency/cost).

Robotko, S., & Topalov, A. (2025). Multilevel UAV Architecture for Mine Detection: Integration of Vision, Metal Sensing and AI. Preprint arXiv:2511.12345. (Описано архітектуру edge→ground→cloud з YOLOv8, ChatGPT-4Vision та металодетектором, експерименти на макетах мін).

Monk, S. (2023). Raspberry Pi Cookbook: Software and Hardware Problems and Solutions (4th Ed.). O’Reilly Media. (Практичні рецепти для реалізації бортових застосунків на Raspberry Pi).

##submission.downloads##

Переглядів анотації: 0

Опубліковано

2026-01-12

Як цитувати

[1]
С. Роботько і А. Топалов, «Багаторівнева архітектура системи автоматичного керування БПЛА для здійснення пошукових місій за відеоаналізом та металодетекцією», Опт-ел. інф-енерг. техн., вип. 50, вип. 2, с. 114–124, Січ 2026.

Номер

Розділ

Системи технічного зору і штучного інтелекту з обробкою та розпізнаванням зображень

Метрики

Завантаження

Дані завантаження ще не доступні.