Trabalho realizado para a disciplina SCC0244 - USP.
Os objetivos do projeto são:
- Fazer uma análise das bases de dados FAPESP COVID-19 DataSharing/BR, disponíveis no seguinte link: https://repositoriodatasharingfapesp.uspdigital.usp.br/;
- Criar uma nova base de dados, apresentando as soluções para cada um dos problemas encontrados durante a carga dos dados, justificando o motivo das decisões tomadas;
- Criar uma Árvore de Decisão para classicar os dados para prever qual será o resultado do exame "NOVO CORONAVÍRUS 2019 (SARS-CoV-2), DETECÇÃO POR PCR". Um dos pontos mais importantes aqui é selecionar quais atributos serão utilizados durante a classificação, lembrando que dependendo do número e da entropia dos atributos, o tempo de construção e a qualidade da Árvore de Decisão podem mudar.
Linguagens: SQL e Python.