Skip to content

Commit

Permalink
Update sentence_splitter.py
Browse files Browse the repository at this point in the history
  • Loading branch information
hyunwoongko authored Apr 16, 2023
1 parent 876a2fc commit 4c0e640
Showing 1 changed file with 2 additions and 2 deletions.
4 changes: 2 additions & 2 deletions kss/_modules/sentences/sentence_splitter.py
Original file line number Diff line number Diff line change
Expand Up @@ -153,8 +153,8 @@ def _sf(self) -> bool:
2. 현재 문자 앞의 공백(SP)과 종결부호(SF)을 제외한 문자가 긍정지정사(VCP)이면 분할하지 않는다.
3. 현재 문자 앞의 공백(SP)과 종결부호(SF)을 제외한 문자가 조사(J*)이면서 다음 문자가 구두점(.)이면 분할하지 않는다.
4. 현재 문자 뒤의 공백(SP)과 종결부호(SF)을 제외한 문자가 긍정지정사(VCP)이면 분할하지 않는다.
5. 현재 문자 뒤의 공백(SP)과 종결부호(SF)을 제외한 문자가 '만', '데+..' 등 이면 분할하지 않는다.
6. 현재 문자 뒤의 공백(SP)과 종결부호(SF)을 제외한 문자가 접속부사(MAJ)이면 분할하지 않는다.
5. 현재 문자 앞의 공백(SP)과 종결부호(SF)을 제외한 문자가 접속부사(MAJ)이면 분할하지 않는다.
6. 현재 문자 앞의 공백(SP)과 종결부호(SF)을 제외한 문자가 '만', '데+..' 등 이면 분할하지 않는다.
7. 현재 문자 뒤의 공백(SP)을 제외한 문자가 마침표(.)가 아니고 그 뒤 문자가 곧 바로 마침표라면 분할하지 않는다.
8. 현재 문자 뒤로 등장하는 한글 문자열이 몇가지 분할하지 않아야 하는 경우에 속하면 분할하지 않는다.
9. 현재 문자가 ' no.', ' No.', ' vol.', ' p.', ' pp.', ' page.', ' al.', ' ed.', ' eds.'
Expand Down

0 comments on commit 4c0e640

Please sign in to comment.