Skip to content

[NLP] 한국어를 새로 배우는 외국인 대상의 T5모델을 활용한 Paraphrasing 모델 제작

Notifications You must be signed in to change notification settings

LimSoYeong/nlp_paraphrasing

 
 

Repository files navigation

스크린샷 2023-07-12 오후 6 55 00

📑 프로젝트 소개

언어를 처음 배우는 모든 사람들이 그렇듯, 언어를 배울 때 유사어를 많이 알수록 어휘력이 향상된다. 한국어는 특히나 단어의 배치 순서에 큰 영향을 받지 않기 때문에 영어보다 더 유동적이고 다양한 문장을 구사할 수 있다.

영어에서는 유사어 웹사이트, paraphrasing 모델을 심심치 않게 찾아볼 수 있지만, 한국어 모델이나 웹사이트는 아직 찾아보기 힘들다. 때문에, 한국어 paraphrasing 모델을 제작하여 외국인들의 한국어 학습을 위한 어플리케이션을 개발하고자 한다. *paraphrasing : 뜻이 바뀌지 않는 선에서 앞에서 쓴 말을 다른 단어 등을 사용하여 표현하는 것

👏 팀 소개

문지원 박민아 송예지 임소영 정대균

🔎 주제 필요성

한류 열풍과 함께 한국어 교육에 대한 수요도 증가하고 있다. 스크린샷 2023-07-12 오후 6 55 38

그러나 한국어를 새로 배우는 외국인들을 위한 교육용 패러프레이징 서비스는 찾아보기 어렵다. 'Paraphrase Tool'같은 한국어 패러프레이징 사이트가 있지만, 한국어 교육용이 아니다.

특히 한국어의 경우 어순에 구애받지 않는다는 점, 높임말이 존재한다는 점에서 패러프레이징의 중요성이 더 대두된다. 스크린샷 2023-07-12 오후 6 55 48

따라서 한국어를 공부하고 싶은 외국인을 대상으로하여 한국어의 특징인 어순에 큰 영향을 받지 않는다는 점과 상황에 따른 높임말이 존재한다는 점에 주의하여 회화 패러프레이징 예문을 제공하는 서비스를 구상하였다. 스크린샷 2023-07-12 오후 6 56 00

🔎 주제 소개

본 프로젝트는 2023 경희대 창의자율과제 공모전에 선발되어 최종 발표인 12월까지 교육 서비스 앱 개발을 목표로 한다. 스크린샷 2023-07-12 오후 6 56 06

🔎 진행 과정

스크린샷 2023-07-12 오후 6 56 13

1. 데이터 수집

스크린샷 2023-07-12 오후 6 56 25

2. 데이터 전처리

스크린샷 2023-07-12 오후 6 56 30

3. 모델 선정

스크린샷 2023-07-12 오후 6 56 46

4. 선정 모델의 문제점 및 Fine Tuning 진행

스크린샷 2023-07-12 오후 6 56 53

5. Fine Tuning 후 결과물

스크린샷 2023-07-12 오후 6 57 00

6. 보완할 점

스크린샷 2023-07-12 오후 6 57 07

About

[NLP] 한국어를 새로 배우는 외국인 대상의 T5모델을 활용한 Paraphrasing 모델 제작

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%