Проект | Краткое описание | Навыки | Библиотеки |
---|---|---|---|
Исследование надёжности заёмщиков | Анализируем платежеспособность клиентов банка: влияет ли семейное положение, уровень дохода и цель получения кредита на факт своевременного погашения. | Предобработка данных Сводные таблицы Лемматизация |
Pandas PyMystem3 |
Исследование объявлений о продаже квартир | Исследуем факторы, определяющие рыночную стоимость объектов недвижимого имущества. | Предобработка данных EDA |
Pandas Matplotlib |
Определение перспективного тарифа для телеком-компании | Выясняем, какой из двух тарифов оператора сотовой связи приносит больше дохода. | Предобработка данных EDA Статистический анализ |
Pandas Matplotlib Seaborn NumPy SciPy |
Исследование закономерностей успеха компьютерных игр | Выявление закономерностей, определяющих успешные продажи видеоигр для глобального онлайн-магазина. | Предобработка данных EDA Статистический анализ |
Pandas Matplotlib Seaborn NumPy SciPy |
Рекомендация тарифов | Создаем модель, которая будет рекомендовать клиенту сотового оператора подходящий тариф на основе данных о потреблении услуг. | Классификация | Pandas Scikit-learn Matplotlib Seaborn XGBoost |
Отток клиентов | Делаем прогноз: уйдёт клиент из банка в скором времени или нет. | Предобработка данных Классификация Балансировка классов |
Pandas Scikit-learn imblearn Matplotlib Seaborn XGBoost CatBoost SciPy |
Выбор локации для скважины | Определяем выгодный регион добычи для нефтедобывающей компании, прогнозируем прибыль и риски с помощью техники Bootstrap. | Регрессия Bootstrap |
Pandas Scikit-learn Matplotlib Seaborn SciPy |
Восстановление золота из руды | Прогнозируем эффективность восстановления золота из золотосодержащей руды по техническим параметрам процесса для оптимизации производства. | EDA Feature selection Регрессия |
Pandas Scikit-learn statsmodels XGBoost Matplotlib Seaborn |
Защита персональных данных клиентов | Предсказываем число страховых случаев для страховой компании и шифруем конфиденциальные данные с сохранением качества модели. | Линейная алгебра Гомоморфное шифрование Регрессия |
Pandas NumPy Scikit-learn Matplotlib Seaborn |
Определение стоимости автомобилей | Оцениваем рыночную стоимость подержанного автомобиля для будущего приложения с калькулятором. | Предобработка данных Кодирование признаков Регрессия |
Pandas Scikit-learn category_encoders NumPy SciPy statsmodels LightGBM Matplotlib Seaborn |
Прогнозирование заказов такси | Помогаем такси-агрегатору эффективней распланировать график водителей: прогноз количества заказов на следующий час. | Анализ временного ряда Feature Engineering Регрессия |
Pandas Scikit-learn statsmodels XGBoost Plotly |
Разметка комментариев на токсичность | Облегчаем работу модераторам онлайн-магазина. | NLP Deep Learning Transfer Learning Классификация |
Pandas Scikit-learn PyTorch transformers NumPy Matplotlib Seaborn |
Определение возраста покупателей | Определяем возраст человека по фотографии. | Компьютерное зрение Deep Learning Transfer Learning Регрессия |
Pandas Tensorflow Keras Matplotlib Seaborn |
Определение конечной температуры в плавильной печи | Помогаем металлургическому комбинату сэкономить на электроэнергии. | Предобработка данных EDA Feature Selection Feature Engineering Dimensionality Reduction Генетические алгоритмы Deep Learning Байесовская оптимизация Регрессия |
Pandas Scikit-learn Scikit-optimize gplearn PyTorch NumPy SciPy statsmodels XGBoost Matplotlib Seaborn Graphviz |
-
Notifications
You must be signed in to change notification settings - Fork 0
dx2-66/data-science
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
Выполненные проекты по ML и анализу данных.