Boostcamp | PStage2
(link)
(link)
(link)
(link)
관계 추출(Relation Extraction)은 문장의 단어(Entity)에 대한 속성과 관계를 예측하는 문제입니다. 관계 추출은 지식 그래프 구축을 위한 핵심 구성 요소로, 구조화된 검색, 감정 분석, 질문 답변하기, 요약과 같은 자연어처리 응용 프로그램에서 중요합니다. 비구조적인 자연어 문장에서 구조적인 triple을 추출해 정보를 요약하고, 중요한 성분을 핵심적으로 파악할 수 있습니다.
위 그림의 예시와 같이 요약된 정보를 사용해 QA 시스템 구축과 활용이 가능하며, 이외에도 요약된 언어 정보를 바탕으로 효율적인 시스템 및 서비스 구성이 가능합니다.
이번 대회에서는 문장, 엔티티, 관계에 대한 정보를 통해 ,문장과 엔티티 사이의 관계를 추론하는 모델을 학습시킵니다. 이를 통해 우리의 인공지능 모델이 엔티티들의 속성과 관계를 파악하며 개념을 학습할 수 있습니다. 우리의 model이 정말 언어를 잘 이해하고 있는 지, 평가해 보도록 합니다.
(link)
모델 제출은 하루 5회로 제한됩니다.
평가는 테스트 데이터셋의 Accuracy 로 평가 합니다. 테스트 데이터셋으로 부터 관계를 예측한 classes를 csv 파일로 변환한 후, 정답과 비교합니다.
(link)
일시 | 내용 | Score |
---|---|---|
21.04.12 ~ 14 | Baseline 이해 및 개인 Code 설계 | 약 57% |
21.04.15 ~ 16 | Backbone Model, 외부 데이터, Entity Token 등 실험 | 약 70% |
21.04.17 ~ 18 | Qeustion Sentence, Dropout 등 실험 | 약 70% |
21.04.19 ~ 20 | Random Masking, Truncation, OOF 등 실험 | 약 72% |
21.04.21 ~ 22 | Back Translation, R-BERT, LSTM Classifier 등 실험 | 약 82% |
Wrap-up Report에 자세히 작성했습니다. (link)