Курс
Продвинутый курс по архитектурам deep learning: от перцептрона до современных Transformer-моделей с миллиардами параметров.
Глубокое обучение произвело революцию в компьютерном зрении, обработке языка, медицинской диагностике и десятках других областей. Этот курс даёт систематическое понимание архитектур нейронных сетей: как они устроены, почему работают и как их обучать эффективно.
Курс охватывает теоретические основы и детальный разбор реальных архитектур — от LeNet до GPT-4. Особое внимание уделяется практическим аспектам: инициализации весов, выбору функции потерь, регуляризации и стратегиям оптимизации.
Прямое и обратное распространение ошибки
Сверточные сети (CNN): ResNet, EfficientNet, ViT
Рекуррентные сети: LSTM, GRU, Seq2Seq
Механизм внимания и архитектура Transformer
Генеративные модели: VAE, GAN, Diffusion
Transfer Learning и Fine-Tuning