Este repositório contém uma coleção de projetos e materiais didáticos desenvolvidos em Python e Jupyter Notebooks (.ipynb), explorando conceitos fundamentais de Data Science e Machine Learning. Cada diretório corresponde a um módulo específico, cobrindo diferentes aspectos e técnicas essenciais para análise de dados, visualização, estatística e modelagem preditiva.
-
Pandas
- Introdução ao Pandas, uma das bibliotecas mais poderosas para manipulação e análise de dados em Python. Exemplos de criação de DataFrames, operações básicas e avançadas de filtragem, agregação e transformação de dados.
-
Análise e Visualização de Dados
- Exploração de diferentes técnicas de análise de dados, incluindo sumários estatísticos, correlações e outras métricas. Além disso, este módulo apresenta diversas ferramentas de visualização, como gráficos de linha, barras, histogramas e scatter plots, utilizando bibliotecas como Matplotlib e Seaborn.
-
Criação de gráficos com o Matplotlib
- Foco exclusivo em Matplotlib, uma biblioteca fundamental para criação de gráficos em Python. Este diretório cobre desde os conceitos básicos até personalizações avançadas, como criação de subplots, estilos de gráficos e anotações.
-
Frequências e Medidas
- Explicação de conceitos estatísticos fundamentais, como medidas de tendência central (média, mediana, moda) e dispersão (variância, desvio padrão). Inclui exemplos práticos de cálculo e interpretação dessas medidas.
-
Probabilidade e Amostragem
- Conceitos de probabilidade aplicados a Data Science, abordando desde probabilidades básicas até distribuições de probabilidade comuns (normal, binomial, etc.). Este módulo também inclui técnicas de amostragem, importantes para a construção de modelos representativos.
-
Testes Estatísticos com Python
- Guia prático para realização de testes estatísticos em Python, como testes de hipótese (t-test, ANOVA) e testes não paramétricos. O conteúdo abrange a aplicação desses testes em conjuntos de dados reais e a interpretação dos resultados.
-
Regressão Linear
- Módulo dedicado à Regressão Linear, uma das técnicas mais simples e poderosas em Machine Learning. O diretório inclui a teoria por trás da regressão, bem como exemplos práticos de implementação em Python, com foco na análise e interpretação dos coeficientes.
-
Análise de Experimentos
- Este módulo aborda conceitos fundamentais e práticos relacionados ao planejamento e à análise de experimentos, uma área essencial na estatística aplicada e em projetos de Data Science. O conteúdo é especialmente útil para quem busca entender como estruturar experimentos de forma rigorosa, garantindo a validade dos resultados e a interpretação correta das análises.
Cada diretório contém notebooks que podem ser executados individualmente para aprender e aplicar os conceitos abordados. É recomendável seguir a ordem dos módulos, especialmente para quem está começando na área de Data Science.
Este repositório serve tanto como um guia de estudo quanto como referência para projetos futuros na área de Data Science e Machine Learning. Sinta-se à vontade para clonar, modificar e contribuir com melhorias.