Современное компьютерное зрение [stepik] [AI Education] [Елена Кантонистова,Марк Блуменау]

Капоне

Администратор
Регистрация
1 Апр 2015
Сообщения
94.840
Реакции
465.727
Складчина: Современное компьютерное зрение [stepik] [AI Education] [Елена Кантонистова,Марк Блуменау]
Курс посвящен основам глубинного обучения в области Computer Vision (CV). В курсе мы начнем с азов компьютерного зрения, а затем затронем актуальные задачи CV и посмотрим на устройство популярных решений.

Программа курса
О курсе

Классические методы Computer Vision

Основы обработки изображений: фильтры и сверткиДемо-доступ
Операторы градиента: Лаплас, Собель, КанниДемо-доступ
Бинаризация и трешхолдинг (Otsu, адаптивный порог)Демо-доступ
Методы выделения признаков: SIFT и другие
HOG: гистограммы направленных градиентов
Поиск и сопоставление ключевых точек
Преобразование Хафа и обнаружение геометрических фигур
Пространственные преобразования: аффинные и перспективные
CNN и первые архитектуры

Основы сверточных нейронных сетей: ядра, фильтры, пуллинги
Архитектура LeNet: первые шаги в CV с использованием CNN
AlexNet: особенности и влияние на развитие глубокого обучения
VGG: глубокие сети с фиксированными свертками
ResNet: идея резидуальных связей для решения проблемы исчезающих
Домашнее задание
Современные архитектуры CV

ViT (Vision Transformer): альтернатива CNN
MobileNet: легковесные модели для мобильных устройств
EfficientNet и EfficientNetV2: масштабируемость и оптимизация
Практика: аугментации и MBConv
Домашнее задание
Детекция

Основы задачи детекции и Non-Maximum Suppression
RCNN: архитектура и эволюция (Fast RCNN, Faster RCNN)
YOLOv1
Современные подходы к детекции: YOLO11 и более новые версии
Детекция на практике
Домашнее задание
Сегментация

Задача сегментации
U-Net: идея и применение в медицинских изображениях
Deeplab и его разновидности: адаптация к различным уровням разре
Mask R-CNN: объединение детекции и сегментации
Segment Anything Model (SAM): универсальная модель сегментации
Практика по сегментации
Домашнее задание (тестирование)
Трекинг и работа с видеопотоками

Задача трекинга и оценивание качества трекинга
Алгоритм трекинга
Работа с видеопотоками. FFMpeg: чтение, запись, сжатие видео
Gstreamer: организация сложных видео- и аудиопайплайнов
Практика: захват видео с камер в реальном времени
Тест по последнему занятию
Итоговый проект курса

Итоговый проект курса
Дополнительно: библиотека OpenCV

Установка библиотеки. Загрузка и вывод изображений
Дополнительно: фреймворк FastAPI

Аннотации типов в Python
Практика с FastAPI
Библиотека Pydantic




СЛИВЫ КУРСОВ
 
Сверху