Большинство имеющихся программных продуктов для распознавания образов в видеопотоках или на стационарных изображениях ориентировано на распознавание конкретных объектов (только людей, только машин, и т.д.), причем в них, как правило, заложен только один метод распознавания. Поэтому каждая такая система решает одну конкретную задачу методом, заложенным в базу моделей системы на этапе ее создания.
Основным отличием предлагаемой архитектуры является ее гибкость в том смысле, что она позволяет использовать эту систему в качестве конструктора различных систем распознавания для бизнеса и охраны объектов, причем в базу моделей этой системы пользователем могут добавляться новые методы.
Цель работы – разработать многозадачную систему распознавания.
Предмет изучения настоящей работы – обнаружение и распознавание объекта на определённой области исследования.
Объекты изучения работы – все (или часть объектов согласно установленным пользователем опциям) объекты, которые может распознавать библиотека ImageAI.
Требования к проектируемой системе:
1) удобный и функциональный интерфейс, позволяющий пользователю без труда выполнить поставленную ему задачу;
2) наглядность представления имеющейся информации;
3) быстрая скорость работы алгоритмов;
4) динамичность и интерактивность.
Для достижения заданной цели необходимо выполнение следующих задач:
1) проектирование интерфейса пользовательской формы и логики работы системы;
2) осуществление программирования модулей;
3) создание метода вырезки области на изображении и видео-потоке;
4) создание метода улучшения качество получаемого изображения;
5) реализация условий наблюдения и сигнализации;
6) реализация метода распознавания на всем получаемом изображении и на выделенной пользователем области;
7) реализация отчета о распознавании;
8) тестирование системы и последующий анализ результатов. Основные средства – Python 3.11, библиотеки: PyQt6,
OpenCV(cv2), torch, numpy [5].
ВВЕДЕНИЕ..................................................................................................... 3
1. Современные библиотеки распознавания объектов на Python.................. 6
1.1 Основные библиотеки и используемые методы Python........................... 6
1.2 Выбор метода распознавания объектов................................................... 8
2. Существующие системы распознавания объектов в бизнесе................... 11
2.1 Системы распознавания в маркетинге.................................................... 11
2.2 Системы распознавания в биологии....................................................... 13
2.3 Система распознавания для парковок.................................................... 14
3. Создание многозадачной системы распознавания................................... 16
3.1 Описание интерфейса программы.......................................................... 19
3.2 База данных............................................................................................. 19
3.3 Блок фильтрации изображения............................................................... 21
3.4 Форма выбора объекта обнаружения.................................................... 26
3.5 Форма выбора условия обнаружения.................................................... 29
3.6 Отчёт о ходе выполненного анализа...................................................... 30
3.7 Вырезка фрагмента изображения.......................................................... 31
3.8 Функция перехода между изображениями............................................. 31
4. Демонстрация работы многозадачной системы распознавания............. 33
ЗАКЛЮЧЕНИЕ............................................................................................. 37
СПИСОК ЛИТЕРАТУРЫ............................................................................. 40
ПРИЛОЖЕНИЯ............................................................................................. 42
Приложение 1. Метод проверки распознанных объектов........................... 42
Приложение 2. Метод отработки кадра,фильтрация.................................. 43
Приложение 3. Метод работы с изображением........................................... 45
Приложение 4. Метод отрисовки границ объектов..................................... 50
Приложение 5. Метод обработки видеопотока................................................. 51
1) Селянкин, В.В. Компьютерное зрение. Анализ и обработка изображений / В.В. Селянкин. – Санкт-Петербург : Лань, 2019. – 152 с. – ISBN 978-5-8114-3368-1.
2) Коул, А Искусственный интеллект и компьютерное зрение. Реальные проекты на Python, Keras и TensorFlow / А Коул, К Мехер, Г Сиддха. – Санкт-Петербург : Питер, 2023. – 624 с.
3) Шустова Е.П., Введение в анализ изображений на Python;
URL:https://kpfu.ru//staff_files/F_733916448/EOR_Vveden_v_AI.pdf (дата обращения: 31.03.2023).
4)
Справочное руководство по PyQt6 [Электронный ресурс].-2023- URL-https://www.riverbankcomputing.com/static/Docs/PyQt6/ (дата обращения 11.05.2023)
5) Прохоренок, Н OpenCV и Java. Обработка изображений и компьютерное зрение / Н Прохоренок. – Санкт-Петербург : БХВ- Петербург, 2018. – 312 с. – ISBN 978-5-9775-3955-5.
6) Аверин, В.Н. Компьютерная графика. Учебник / В.Н. Аверин. – Санкт-Петербург : Академия, 2020. – 256 с.
7) Брэдски Г. , Келер А. Изучение OpenCV// O'Reilly Media, Inc.– 2008. – № 6-1. – С. 67-73;
8) Малявкина Л.И., Меньшова М.В. Системы видеоанализа в розничной торговле // Научные записки орелгиэт. 2015. Вып. 6. C. 7-12.
9) Михайлов В.В., Колпащиков Л.А., Соболевский В.А., Соловьев Н.В., Якушев Г.К. Методологические подходы и алгоритмы распознавания и подсчета животных на аэрофотоснимках // Информационно- управляющие системы. 2021. №5 (114). С. 20-32.
10) Щукин С.А. Анализ методов распознавания свободных парковочных мест на основе распознавания графических образов // Научные записки орелгиэт. 2015. Вып. 6. C. 7-12.
11) Шустова Е.П., Шустова К.П. Архитектура многозадачной системы распознавания с помощью ImageAI и пользовательскими методами распознавания// Современные наукоемкие технологии. – 2022. –
№ 12-1. – С. 88-93; URL: https://top-technologies.ru/ru/article/view?id=39442 (дата обращения: 31.03.2023).