Исследовательский потенациал молодых ученых: взгляд в будущее - 2023

50 Рис. 1. Математическая модель нейрона Как правило, для детектирования объектов используются свёрточные ней- ронные сети. Они имеют архитектуру, предложенную Яном Лекуном в 1988 го- ду, при разработке которой Лекун основывался на нейробиологических исследо- ваниях в области зрительной коры головного мозга человека. Свёрточные нейронные сети являются развитием многослойных полносвяз- ных нейронных сетей и нацелены на эффективное распознавание изображений. Они имеют существенное отличие от сетей персептрона в том, что нейроны слоя имеют не индивидуальные весовые коэффициенты, а используют разделенные веса, то есть матрицы весов небольшого размера, называемые ядрами свёртки. В результате свёрточные сети имеют более высокую производительность, эко- номичны в памяти, так как они имеют меньшее число настраиваемых параметров по сравнению с полносвязной сетью. Одним из наиболее популярных и доступных обычным пользователям при- меров такой сверточной сети, является YOLO в различных версия от v1 (2016 г.) до v7 (2022 г.). Начиная с v4 представленной в 2020 году, YOLO является наилуч- шим доступным инструментом для детектирования различных объектов. Новейший алгоритм YOLOv7 превосходит все предыдущие модели обнару- жения объектов YOLO как по скорости, так и по точности. Для этого требуется в несколько раз более дешевое оборудование, чем для других нейронных сетей, и его можно обучать намного быстрее на небольших наборах данных. Отличительными особенностями YOLOv7, является интеграция с BlendMask, она используется для выполнения сегментации экземпляров. Модель обнаруже- ния объектов YOLOv7 была точно настроена на наборе данных сегментации эк- земпляров MS COCO и обучена для 30 эпох. Это обеспечивает самые современ- ные результаты сегментации экземпляров в реальном времени. Интеграция YOLOv7 с YOLO-Pose позволяет обнаруживать ключевые точки для оценки позы. Разработчики точно настроили модель обнаружения лю- дей YOLOv7-W6 в наборе данных обнаружения ключевых точек MS COCO и добились современной производительности оценки позы в реальном времени [3]. Производительность YOLOv7 оценивалась на основе предыдущих версий YOLO (YOLOv4 и YOLOv5) и YOLOR (рис. 2). Модели обучались с одинако- выми настройками. Новая YOLOv7 демонстрирует наилучшее соотношение ско- рости и точности по сравнению с современными детекторами объектов, и превосходит все предыдущие версии как по скорости, так и по точности в пре- делах от 5 FPS до целых 160 FPS [3].

RkJQdWJsaXNoZXIy ODQ5NTQ=