📋 Índice
- Sobre
- Correlação de Pearson
- Fórmula do Coeficiente de Correlação de Pearson
- Interpretação do Coeficiente
- Funcionalidades
- Tecnologias Utilizadas
- Contato
Esse repositório contém notebook descrito no Medium em um artigo referente "CorrelacaoPython" em Python
A Correlação de Pearson é uma medida estatística que indica a força e a direção da relação linear entre duas variáveis quantitativas. Ela é representada pelo coeficiente de correlação de Pearson (r), que varia de -1 a 1:
- r = 1: Correlação positiva perfeita. À medida que uma variável aumenta, a outra também aumenta proporcionalmente.
- r = -1: Correlação negativa perfeita. À medida que uma variável aumenta, a outra diminui proporcionalmente.
- r = 0: Ausência de correlação linear. As variáveis não têm uma relação linear, embora possam estar relacionadas de forma não linear.
A fórmula para calcular o coeficiente de Pearson entre duas variáveis ( X ) e ( Y ) é:
[ r = \frac{\sum (X - \bar{X})(Y - \bar{Y})}{\sqrt{\sum (X - \bar{X})^2} \cdot \sqrt{\sum (Y - \bar{Y})^2}} ]
Onde:
- ( X ) e ( Y ) são as variáveis.
- ( \bar{X} ) e ( \bar{Y} ) são as médias das variáveis ( X ) e ( Y ), respectivamente.
- 0.0 a ±0.3: Correlação fraca ou insignificante.
- ±0.3 a ±0.7: Correlação moderada.
- ±0.7 a ±1.0: Correlação forte.
A correlação de Pearson é amplamente utilizada em estatísticas e análise de dados, mas deve ser aplicada com cuidado, pois é sensível a valores discrepantes (outliers) e só mede relações lineares.
- Databricks
- Pyspark
- Python
Se precisar de mais informações, entre em contato:
Email: [email protected]
LinkedIn: Luciana Sampaio