Iniciação Científica

Descrição do Projeto

Projeto de Web Scraping e análise de dados (currículos lattes cadastrados no CNPQ) desenvolvido em Python

Objetivo principal

Através desse código analisamos vários currículos lattes de pesquisadores que compõem os grupos de pesquisa da usp-leste, atribuímos pontuações a esses grupos com base em critérios pré-estabelecidos pela comissão de pesquisa e, essas pontuações servem para redistribuir de maneira mais justa os espaços disponíveis, na USP-leste, entre grupos de pesquisa, sendo que grupos com mais pontos tem prioridades em detrimento dos outros.

Status do Projeto:

Em desenvolvimento ⚠️

Sequência do Desenvolvimento

✔️ A princípio ja havia um programa em perl que extraía os lattes com formato xml (feito por um professor), do site do cnpq e os transformava para csv. Assim, a primeira etapa desse projeto foi pegar os dados dos pesquisadores em formato csv, fazer as devidas análises, atribuir as pontuações aos grupos de pesquisa e construir visualizações gráficas para apresentá-las.

✔️ Na segunda etapa, percebemos que não seriam possíveis concluir determinadas análises, pois alguns dados não estavam disponíveis nos lattes dos pesquisadores. Diante desse fato, contruímos um formulário no Google forms e distribuímos entre os grupos com perguntas que não podiam ser respondidas analisando apenas os currículos dos mesmos. Após obter as respostas via forms, eu construí um programa que extrai os dados via api deste forms. Usei a api do google Sheets para extrair os dados com formato xls.

✔️ A terceira etapa será refatorar o código, calcular medias as ponderadas e identificar outliers referentes as pontuações finais de cada grupo de pesquisa.

⚠️ A quarta e última etapa será extrair os currículos lattes diretamente da plataforma cnpq e analisá-los com o formato xml, sem precisar usar o programa secundário perl citado na primeira etapa. Toda a esrutura será mudada para atender o formato xml.

Resumo das Funcionalidades

🏆 Extrai dados com formato csv de arquivos que estão em diretórios locais

🏆 Extrai dados xls de Planilhas do Google (Google sheetes) via api

🏆 Blox-Plot -> Outliers

⚠️ web scraping e parser de dados com formato xml (em breve)

⚠️ Resume as análises em visualizações gráficas (em breve)

Desenvolvedores

_{Denise Proença}

_{Ruanitto Docine}

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
.DS_Store		.DS_Store
Box_Plot_Grupos_Pesquisa_EACH.jpeg		Box_Plot_Grupos_Pesquisa_EACH.jpeg
LICENSE		LICENSE
Main_pontuacoes_grupos.py		Main_pontuacoes_grupos.py
README.md		README.md
capitulos.py		capitulos.py
codigo_pontacoes_forms.py		codigo_pontacoes_forms.py
credenciais_sheets.json		credenciais_sheets.json
forms.py		forms.py
livros.py		livros.py
main.ipynb		main.ipynb
orientações.py		orientações.py
periodicos.py		periodicos.py
pontuacao_final.csv		pontuacao_final.csv
pontuacoes.csv		pontuacoes.csv
primeira_versao_codigo_pontuacoes.grupos_pesquisa.py		primeira_versao_codigo_pontuacoes.grupos_pesquisa.py
python_sheets.py		python_sheets.py
qualis.csv		qualis.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Iniciação Científica

Descrição do Projeto

Objetivo principal

Status do Projeto:

Sequência do Desenvolvimento

Resumo das Funcionalidades

Desenvolvedores

About

Releases

Packages

Languages

License

Denise-Pro/Iniciacao-Cientifica-I

Folders and files

Latest commit

History

Repository files navigation

Iniciação Científica

Descrição do Projeto

Objetivo principal

Status do Projeto:

Sequência do Desenvolvimento

Resumo das Funcionalidades

Desenvolvedores

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages