Um projeto utilizado apenas para o estudo do algoritmo de Árvore de decisão, utilizando-se o R. Serão utilizadas duas bases de dados e dois scripts
A base de dados census.csv
foi retirada do UCI Machine Learning Repository, a qual no mesmo possui o nome de Adult Data Set. Foram realizadas pequenas modificações na mesma. O objetivo de previsão na mesma é determinar se uma pessoa ganha mais de 50 mil por ano.
O objetivo de previsão na base de dados credit_data.csv
é determinar se o cliente pagou o empréstimo.
Utilizando-se o algoritmo de Árvore de decisão foi possível encontrar uma precisão de 83,51% na primeira base de dados e de 97% na segunda.
Segue abaixo imagens da Árvore de Decisão da primeira e segunda bases dados, respectivamente: