Skip to content

anamioto/DataMining

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Projeto de Mineração de Dados

Trabalho realizado para a disciplina SCC0244 - USP.

Os objetivos do projeto são:

  • Fazer uma análise das bases de dados FAPESP COVID-19 DataSharing/BR, disponíveis no seguinte link: https://repositoriodatasharingfapesp.uspdigital.usp.br/;
  • Criar uma nova base de dados, apresentando as soluções para cada um dos problemas encontrados durante a carga dos dados, justificando o motivo das decisões tomadas;
  • Criar uma Árvore de Decisão para classicar os dados para prever qual será o resultado do exame "NOVO CORONAVÍRUS 2019 (SARS-CoV-2), DETECÇÃO POR PCR". Um dos pontos mais importantes aqui é selecionar quais atributos serão utilizados durante a classificação, lembrando que dependendo do número e da entropia dos atributos, o tempo de construção e a qualidade da Árvore de Decisão podem mudar.

Linguagens: SQL e Python.