Курс

Компьютерное зрение

Продвинутый курс по Computer Vision: от свёрточных сетей до диффузионных моделей генерации изображений и мультимодального ИИ.

О курсе

Компьютерное зрение позволяет машинам «видеть» и интерпретировать визуальную информацию. Эта технология лежит в основе беспилотных автомобилей, медицинской диагностики по снимкам, систем видеонаблюдения и генеративных ИИ-инструментов типа Midjourney и DALL-E.

Курс охватывает полный спектр CV-задач: от классической фильтрации изображений до современных Vision Transformer и диффузионных моделей. Разбираем реальные кейсы из медицины, автомобильной промышленности, ретейла и безопасности.

Ключевые компетенции

Классическое компьютерное зрение: фильтры, дескрипторы, детекторы

CNN для классификации изображений

Детектирование объектов: YOLO, SSD, Faster R-CNN

Сегментация: Semantic, Instance, Panoptic

3D компьютерное зрение и Depth Estimation

Генеративные модели: GAN, Diffusion, NeRF

Программа — 15 модулей

01
Основы обработки изображений: пиксели, цвет, частоты
4 ч 30 мин
02
Классические детекторы: SIFT, HOG, Canny
5 ч 00 мин
03
Свёрточные операции и архитектура CNN
5 ч 30 мин
04
Классификация изображений: AlexNet до EfficientNetV2
5 ч 45 мин
05
Data Augmentation и Transfer Learning
5 ч 15 мин
06
Детектирование объектов: двухэтапные методы
6 ч 00 мин
07
YOLO: однопроходное детектирование
5 ч 40 мин
08
Семантическая сегментация: FCN, U-Net, DeepLab
5 ч 50 мин
09
Instance и Panoptic Segmentation: Mask R-CNN, DETR
5 ч 30 мин
10
Vision Transformer: ViT, DeiT, Swin
6 ч 20 мин
11
3D зрение: стерео, глубина, Point Clouds
5 ч 45 мин
12
Video Understanding: оптический поток, действия
5 ч 30 мин
13
Генеративные модели: GAN, CycleGAN, StyleGAN
6 ч 10 мин
14
Диффузионные модели: DDPM, Stable Diffusion
6 ч 45 мин
15
Мультимодальные системы: CLIP, DALL-E, GPT-4V
5 ч 10 мин

Области применения

Компьютерное зрение находит применение в следующих индустриях:

  • Автономный транспорт — распознавание дорожной разметки, пешеходов, препятствий
  • Медицина — анализ рентгеновских снимков, МРТ, дерматологическая диагностика
  • Промышленность — контроль качества, роботизированная сборка, предиктивное обслуживание
  • Безопасность — системы видеонаблюдения, биометрическая идентификация
  • Ретейл — кассы без операторов, анализ поведения покупателей
  • Творческие индустрии — генерация изображений, видеоэффекты, виртуальная реальность