緊急避妊に係る取組について - 厚生労働省のウェブサイトに掲載を希望した緊急避妊にかかる対面診療が可能な産婦人科医療機関等の一覧 https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000186912_00002.html
Github Actionによって1日に一回PDFを全件取得し、PDF -> CSVに変換します。
結果は./output_filesに出力されます。
- dimのインストール
https://github.com/c-3lab/dim?tab=readme-ov-file#install-the-dim
- プロジェクトをclone
$ git clone https://github.com/c-3lab/opendata-pdf-to-csv.git
- プロジェクト初期化
$ dim init
- pdfの一括インストール
$ dim install -P https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000186912_00002.html -e ".pdf" -n "shinryoujo"
※ 最後の2ファイルだけ産婦人科医療機関以外のpdfが混じってしまうので注意
./data_files
以下にダウンロードされたpdfが保存される
- pdfからcsvへ変換
※ poetryのインストール方法: https://cocoatomo.github.io/poetry-ja/
$ poetry shell
$ poetry install
$ python main.py
または
$ pip install tabula-py pandas pdfplumber requests
$ python main.py