PT/BR: Esse projeto não é mantido desde 2021, as informações da vacinação contra COVID-19 em Manaus devem ser feitas através do site oficial da Prefeitura de Manaus: https://vacinometro.manaus.am.gov.br/. O antigo domínio do projeto não foi renovado, não está mais em nossa posse, e não temos nenhuma responsabilidade pelo conteúdo lançado lá.
EN: This project has no longer been maintained since 2021, information about COVID-19 vaccination in Manaus must be made through the official website of Manaus City Hall: https://vacinometro.manaus.am.gov.br/. The project's old domain has not been renewed, is no longer in our possession, and we have no responsibility for the content released there.
Este projeto tem como finalidade extrair os dados disponibilizados pela Prefeitura de Manaus sobre a vacinação na cidade e fornecer os dados para o site vacinamanaus.com
Este projeto está organizado nos seguintes diretórios:
src
: Diretório contendo todos os códigos em Python que são executados durante o processo de tratamento e análise dos dados.data/raw
: Diretório contendo todos os relatórios em arquivos PDF disponibilizado pela secretaria de saúde e coletados através de um web crawler.data/cleaned
: Diretório contendo arquivos JSON que foram extraídos dos relatórios e tiveram os campos limpos e normalizados.data/analyzed
: Diretório contendo arquivos CSV que contém analises geradas a partir dos dados limpos. Estes arquivos alimentarão as visualizações do front-end.
Rode make all
para construir a imagem e rodar todo o pipeline
- Docker >= 20.10.1
- Docker Compose >= 1.27.4
Para construir a imagem docker:
make build
Para construir a imagem docker sem dependências armazenadas no cache:
make build-no-cache
Para baixar o último arquivo publicado pela prefeitura:
make download-data
Para extrair os dados dos arquivos .pdf
:
make extract-data
Para processar o arquivo de dados extraídos:
make process-data
Para rodar todo o pipeline de dados:
make data
- Abrindo uma issue reportando um bug ou sugerindo uma melhoria.
- Por favor contribua usando o Github Flow. Cria uma branch, adicione os commits e abra uma pull request.
Veja a LICENÇA