Молодежь и наука - третье тысячелетие: Материалы студенческой научно-практической конференции с международным участием
94 Для распознавания насильственного поведения на видео была использована 3D CNN, способная обрабатывать трехмерную информацию о видео, включая движение и глубину. В качестве основы для модели использовалась модель C3D, которая является одной из наиболее эффективных 3D CNN для видеоанализа. Перед обучением модели была проведена предварительная обработка ви- деоизображений, чтобы выделить в них кадры с определенной частотой и при- вести выделенные кадры к одному размеру. Далее и использовалась аугмента- цию данных, чтобы расширить обучающий датасет и улучшить обобщающую способность модели. Обучение модели проводилось на обучающем датасете, используя функ- цию потерь, основанную на категориальной кросс-энтропии, и оптимизатор Adam. Для предотвращения переобучения применялась регуляризацию весов. После обучения было проведено тестирование на тестовом датасете и оце- нены метрики точности (accuracy), полноты (recall) и F1-меры (F1-score), а также проанализированы ошибки модели для выявления причин неверных предсказаний. Эксперименты показали, что 3D CNN модель показывает высокую эффек- тивность в распознавании насильственного поведения на видео, с точностью, полнотой и F1-мерой, превышающими результаты других методов, основанных на 2D CNN. А анализ ошибок модели показал, что наибольшая частота ложных предсказаний происходит при наличии таких артефактов на видео, как тени и отражения, а также при низком разрешении видео. Таким образом, как показали эксперименты, проведенные на публичном датасете, рассмотренная модель 3D CNN для распознавания насильственного поведения на видео достаточно эффективна и может быть применена в реаль- ных системах видеонаблюдения. Однако, для улучшения модели необходимо рассмотреть возможность использования более сложных архитектур и оптими- зацию обработки видео. Литература 1. Ying Wen, Yue Lu, Jingqi Yan, Zhenyu Zhou, Karen M. von Deneen and Pengfei Shi. An Algorithm for License Plate Recognition Applied to Intelligent Transportation System. IEEE, transactions on intelligent transportation system, 2014. 2. Le Cun Y., Bengio, Y., & Hinton, G. (2015). Deep learning. Nature, 521 (7553), 436–444. 3. Krizhevsky A., Sutskever I., & Hinton, G. E. (2012). ImageNet classification with deep convolutional neural networks. Advances in neural information processing systems, 25, 1097–1105.
Made with FlippingBook
RkJQdWJsaXNoZXIy ODQ5NTQ=