Skip to content

Выполненные проекты по ML и анализу данных.

Notifications You must be signed in to change notification settings

dx2-66/data-science

Repository files navigation

Репозиторий учебных проектов

Здесь выложены мои решения проектов из области Data Science, выполненные в 2021-2022 гг

Проект Краткое описание Навыки Библиотеки
Исследование надёжности заёмщиков Анализируем платежеспособность клиентов банка: влияет ли семейное положение, уровень дохода и цель получения кредита на факт своевременного погашения. Предобработка данных
Сводные таблицы
Лемматизация
Pandas
PyMystem3
Исследование объявлений о продаже квартир Исследуем факторы, определяющие рыночную стоимость объектов недвижимого имущества. Предобработка данных
EDA
Pandas
Matplotlib
Определение перспективного тарифа для телеком-компании Выясняем, какой из двух тарифов оператора сотовой связи приносит больше дохода. Предобработка данных
EDA
Статистический анализ
Pandas
Matplotlib
Seaborn
NumPy
SciPy
Исследование закономерностей успеха компьютерных игр Выявление закономерностей, определяющих успешные продажи видеоигр для глобального онлайн-магазина. Предобработка данных
EDA
Статистический анализ
Pandas
Matplotlib
Seaborn
NumPy
SciPy
Рекомендация тарифов Создаем модель, которая будет рекомендовать клиенту сотового оператора подходящий тариф на основе данных о потреблении услуг. Классификация Pandas
Scikit-learn
Matplotlib
Seaborn
XGBoost
Отток клиентов Делаем прогноз: уйдёт клиент из банка в скором времени или нет. Предобработка данных
Классификация
Балансировка классов
Pandas
Scikit-learn
imblearn
Matplotlib
Seaborn
XGBoost
CatBoost
SciPy
Выбор локации для скважины Определяем выгодный регион добычи для нефтедобывающей компании, прогнозируем прибыль и риски с помощью техники Bootstrap. Регрессия
Bootstrap
Pandas
Scikit-learn
Matplotlib
Seaborn
SciPy
Восстановление золота из руды Прогнозируем эффективность восстановления золота из золотосодержащей руды по техническим параметрам процесса для оптимизации производства. EDA
Feature selection
Регрессия
Pandas
Scikit-learn
statsmodels
XGBoost
Matplotlib
Seaborn
Защита персональных данных клиентов Предсказываем число страховых случаев для страховой компании и шифруем конфиденциальные данные с сохранением качества модели. Линейная алгебра
Гомоморфное шифрование
Регрессия
Pandas
NumPy
Scikit-learn
Matplotlib
Seaborn
Определение стоимости автомобилей Оцениваем рыночную стоимость подержанного автомобиля для будущего приложения с калькулятором. Предобработка данных
Кодирование признаков
Регрессия
Pandas
Scikit-learn
category_encoders
NumPy
SciPy
statsmodels
LightGBM
Matplotlib
Seaborn
Прогнозирование заказов такси Помогаем такси-агрегатору эффективней распланировать график водителей: прогноз количества заказов на следующий час. Анализ временного ряда
Feature Engineering
Регрессия
Pandas
Scikit-learn
statsmodels
XGBoost
Plotly
Разметка комментариев на токсичность Облегчаем работу модераторам онлайн-магазина. NLP
Deep Learning
Transfer Learning
Классификация
Pandas
Scikit-learn
PyTorch
transformers
NumPy
Matplotlib
Seaborn
Определение возраста покупателей Определяем возраст человека по фотографии. Компьютерное зрение
Deep Learning
Transfer Learning
Регрессия
Pandas
Tensorflow
Keras
Matplotlib
Seaborn
Определение конечной температуры в плавильной печи Помогаем металлургическому комбинату сэкономить на электроэнергии. Предобработка данных
EDA
Feature Selection
Feature Engineering
Dimensionality Reduction
Генетические алгоритмы
Deep Learning
Байесовская оптимизация
Регрессия
Pandas
Scikit-learn
Scikit-optimize
gplearn
PyTorch
NumPy
SciPy
statsmodels
XGBoost
Matplotlib
Seaborn
Graphviz

About

Выполненные проекты по ML и анализу данных.

Resources

Stars

Watchers

Forks