언어모델을 학습하기 위한 공개 한국어 instruction dataset들을 모아두었습니다.
-
Updated
Jun 5, 2024 - Python
언어모델을 학습하기 위한 공개 한국어 instruction dataset들을 모아두었습니다.
Korean haiku-generetor powered by llm-prompting.
Kiwi(지능형 한국어 형태소 분석기)
KoAlpaca: 한국어 명령어를 이해하는 오픈소스 언어모델
C# API for Kiwi
Python API for Kiwi
KSS: Korean String processing Suite
🔥 Korean GPT-2, KoGPT2 FineTuning cased. 한국어 가사 데이터 학습 🔥
This repository contains Korean Hate Speech dataset for paper, "K-MHaS: A Multi-label Hate Speech Detection Dataset in Korean Online News Comment", accepted by COLING2022.
llm 관련 자료를 찾아보다가 작성하기 시작함
JS library to convert Korean Hangul text
Automatic Korean word spacing with Python
SageMaker Ployglot based RAG opensearch
Lite Korean language model
한국어 자연어처리를 위한 파이썬 라이브러리입니다. 단어 추출/ 토크나이저 / 품사판별/ 전처리의 기능을 제공합니다.
Repo for the paper K-Act2Emo: Korean Commonsense Knowledge Graph for Indirect Emotional Expression
KoBERT on 🤗 Huggingface Transformers 🤗 (with Bug Fixed)
Code and data for "KoDialogBench: Evaluating Conversational Understanding of Language Models with Korean Dialogue Benchmark" (LREC-COLING 2024)
Unofficial parser for NIKL Dictionary files.
Add a description, image, and links to the korean-nlp topic page so that developers can more easily learn about it.
To associate your repository with the korean-nlp topic, visit your repo's landing page and select "manage topics."