Skip to content

自作のデータセットでファインチューニングした言語モデルを使ったアプリを公開しました

Notifications You must be signed in to change notification settings

wolf4032/nlp-token-classification

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 

Repository files navigation

nlp-token-classification

ポートフォリオとして、自作のデータセットでファインチューニングした言語モデルを使ったアプリを公開しました。

概要

固有表現抽出データセットを自作しました。

自作のデータセットを使って言語モデルをファインチューニングしました。

「東京の肉料理で、春に食べられる、鶏肉を使った料理を教えてください」という文章を入力すると、 「東京 → 都道府県/地方(AREA)」 「肉料理 → 種類(TYPE)」 「春 → 季節(SZN)」 「鶏肉 → 食材(INGR)」のように、 固有表現を抽出する言語モデルを作成しました。

ファインチューニングした言語モデルを使ったアプリを公開しました。

外部リンク

デモアプリ

wolf4032/japanese-token-classification-search-local-cuisine

  • 入力文から抽出された固有表現をもとに、日本の郷土料理を検索するアプリ
  • うちの郷土料理:農林水産省
    • こちらのサイトに掲載されている、飯料理、肉料理、野菜料理、魚料理を検索します。

言語モデル

wolf4032/bert-japanese-token-classification-search-local-cuisine

モデルの学習に使ったデータセット

wolf4032/token-classification-japanese-search-local-cuisine

{
    'text': '関西地方あるいは四国地方の、秋に食べられているしいらを使用した魚料理があったら、検索。',
    'entities': [
        {
            'name': '関西地方',
            'span': [0, 4],
            'type': 'AREA'
        },
        {
            'name': '四国地方',
            'span': [8, 12],
            'type': 'AREA'
        },
        {
            'name': '秋',
            'span': [14, 15],
            'type': 'SZN'
        },
        {
            'name': 'しいら',
            'span': [23, 26],
            'type': 'INGR'
        },
        {
            'name': '魚料理',
            'span': [31, 34],
            'type': 'TYPE'
        }
    ]
}

詳細情報

アプリで使用した郷土料理の情報

出典:農林水産省Webサイト(https://www.maff.go.jp/j/keikaku/syokubunka/k_ryouri/)

Releases

No releases published

Packages

No packages published