Skip to content

Este repositorio contiene un proyecto de análisis de datos que investiga la relación entre hábitos de vida (como fumar, beber y hacer ejercicio) y la probabilidad de cáncer. Utilizando PySpark, el proyecto analiza un conjunto de datos que incluye diferentes hábitos de los participantes y su probabilidad asociada de desarrollar cáncer

Notifications You must be signed in to change notification settings

yisireth95/Tarea3_Bigdata

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 

Repository files navigation

Tarea3_Bigdata

Este repositorio contiene un proyecto de análisis de datos que investiga la relación entre hábitos de vida (como fumar, beber y hacer ejercicio) y la probabilidad de cáncer. Utilizando PySpark, el proyecto analiza un conjunto de datos que incluye diferentes hábitos de los participantes y su probabilidad asociada de desarrollar cáncer

link donde se obtiene el dataset wget www.kaggle.com/datasets/tusharkute/cancer-probabilities/croissant/download

About

Este repositorio contiene un proyecto de análisis de datos que investiga la relación entre hábitos de vida (como fumar, beber y hacer ejercicio) y la probabilidad de cáncer. Utilizando PySpark, el proyecto analiza un conjunto de datos que incluye diferentes hábitos de los participantes y su probabilidad asociada de desarrollar cáncer

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages