road-signs-detection

Road signs detection project for DL in practice course

Обоснование подбора метрик

В задачах сегментации обычно используются такие метрики оценки, как пересечение с объединением (IoU), коэффициент Dice и точность пикселей. Intersection over Union (IoU) измеряет перекрытие между предсказанной маской сегментации и истинной маской. Он вычисляется как отношение пересечения двух масок к объединению двух масок. Коэффициент Dice — это метрика, аналогичная IoU, но она более чувствительна к небольшим различиям между предсказанной и истинной масками. Он вычисляется как удвоенное пересечение предсказанной и истинной масок, деленное на сумму количества пикселей в каждой маске. Коэффициент Dice часто предпочтительнее, чем IoU, поскольку он более чувствителен к небольшим вариациям и может лучше отражать общую производительность модели сегментации. Кроме того, он может быть полезен в ситуациях, когда предсказанная маска имеет малое количество пикселей, связанных со значениями в истинной маске. Однако IoU также часто используется, поскольку его интерпретация может быть более интуитивной.

При обучении модели YOLO были выбраны метрики IoU и Mean Average Precision (mAP) с акцентом на кривых точности и полноты. Этот выбор был обусловлен необходимостью комплексной оценки, учитывающей компромисс между точностью и полнотой в различных классах объектов. Путем изучения кривой точности-полноты оценивалась производительность модели при различных порогах уверенности, что позволяло получить тщательное представление о ее способности обнаруживать и правильно классифицировать объекты.

Выбор гиперпараметров для YOLO

В ходе исследования были протестированы две модели YOLO с различными входными аккаунтами обучения (Разрешение изображение, размер батча и количество эпох обучения). Список эскриментов изображен в следующей таблице

Эксперимент	Модель	Разрешение изображений	Размер батча	Количество эпох
Эксперимент 1	YOLOv5	640 пикселей	16	20
Эксперимент 2	YOLOv5	1280 пикселей	32	50
Эксперимент 3	YOLOv5	320 пикселей	8	10
Эксперимент 4	YOLOv5	1024 пикселей	64	30
Эксперимент 5	YOLOv5	256 пикселей	12	15
Эксперимент 6	YOLOv5	640 пикселей	16	20
Эксперимент 7	YOLOv5	1280 пикселей	32	50
Эксперимент 8	YOLOv5	320 пикселей	8	10
Эксперимент 9	YOLOv5	1024 пикселей	64	30
Эксперимент 10	YOLOv5	256 пикселей	12	15

В ходе подбора параметров для обучения, был выбран следующий лучший вариант:

изображения подавались на вход в разрешении 640 пикселей
размер батча был установлен равным 16
количество эпох равное 20

Остальные параметры самой модели, такие как размер сетки, количество и координаты якорей определялись самой моделью в процессе обучения, исходя из тренировочного датасета.

Работы с данными

Из-за большого количества отдельный обучений моделей проекте обучения YOLO для определения дорожных знаков было принято решение использовать версионирование чекпоинтов моделей с помощью инструмента DVC. С помощью DVC был создан репозиторий для чекпоинтов моделей, где были хранены все версии, используемых в проекте. Каждый раз при внесении изменений, например, дообучения или обновлении меток, DVC позволял создавать новую версию чекпоинтов. Это гарантировало сохранность истории изменений и возможность быстро вернуться к предыдущим версиям при необходимости.

Для работы с версионированными датасетами в проекте использовался DVC командный интерфейс, который предоставлял возможность создавать, клонировать и переключаться между различными версиями датасета. Использование DVC для версионирования чекпоинтов в проекте обучения позволило упростить управление данными и обеспечить надежность и воспроизводимость результатов.

Возможность масштабирования работы

На данный момент модель способна обрабатывать видео со скоростью примерно в 30 кадров в секунду. Это позволяет рассмотреть варианты масштабирования модели для работы с несколькими камерами. Стоит учесть, что мы все еще не уверены в тонкостях распараллеливания этих процессов, но в теории, модель может быть адаптирована для обработки видеопотоков с 2-3 камер.

Выбор YOLO в качестве основной архитектуры дает нам определенные преимущества, включая ее относительную легкость в вычислительном плане. Это позволяет нам обдумать возможности масштабирования без излишних оптимистических оценок, ориентируясь на текущие ресурсы и требования учебной задачи.

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
models		models
notebooks		notebooks
src		src
web		web
.gitignore		.gitignore
README.md		README.md
pyproject.toml		pyproject.toml
train.yaml		train.yaml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

road-signs-detection

Обоснование подбора метрик

Выбор гиперпараметров для YOLO

Работы с данными

Возможность масштабирования работы

About

Releases

Packages

Contributors 3

Languages

bier-ml/road-signs-detection

Folders and files

Latest commit

History

Repository files navigation

road-signs-detection

Обоснование подбора метрик

Выбор гиперпараметров для YOLO

Работы с данными

Возможность масштабирования работы

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages