Skip to content

msuvorov7/base_deep_learning

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

40 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

base_deep_learning

Репозиторий для кратких решений основных задач из DL

Audio

NLP

  • Word2Vec - реализация модели Word2Vec в подходе Skip-Gram (из центрального слова предсказать контекст)
  • BiLSTM_CRF - реализация сети со слоем CRF (+ small optimization) для задачи NER (новости) + инференс на ONNX
  • Seq2Seq_with_Attention - задача машинного перевода (EN->RU) с механизмом внимания
  • Transformer - задача машинного перевода (EN->RU) с обучением трансформера

CV

Generative Models

RL

  • Cross Entropy Method discrete - реализация метода Кросс-Энтропии для среды Taxi-v3 с использованием сглаживания
  • Cross Entropy Method continuous - реализация метода Кросс-Энтропии для среды LunarLander-v2
  • Model Free - реализация методов Q-Learning, Sarsa, Monte-Carlo для среды CartPole-v1 с бинаризацией состояний среды
  • Deep Q-Networks - реализация методов DQN, HardTargetDQN, SoftTargetDQN, DoubleDQN для среды LunarLander-v2
  • PPO Acrobot - реализация метода PPO для среды Acrobot-v1
  • PPO Pendulum - реализация метода PPO для среды Pendulum-v1
  • SAC Pendulum - реализация метода Soft Actor-Critic для среды Pendulum-v1
  • SAC CartPole - реализация метода Soft Actor-Critic для среды CartPole-v1