국가과학기술종합정보시스템(NTIS) 기술문서의 분류(중분류 level)를 BERT 기반 분류모델로 수행한 연구에 대한 논문이다.
모델의 구성과 파라미터, 사용한 데이터의 소스와 수량까지 자세하게 설명되어 있어 읽기 상당히 편했다.
관련 연구로는 Transformer와 BERT에 대한 이론적 내용이 담겼는데 이 내용은 다른 항목으로 빼고 이 모델들을 사용한 문서 분류 연구에 대한 내용이 더 있었다면 흥미롭게 찾아 읽을 수 있었을 것 같다는 느낌을 받았다.
분류모델로 연구를 하고 논문을 낸 적은 없어서 이진분류가 아닌 다중분류 문제에서 어떤 성능지표를 쓰는지에 대한 지식이 부족했는데 F1-score를 쓰는 방법에 대한 이해를 얻을 수 있어 도움이 되었다.
다른 논문에서는 Macro F1-Score를 사용했는데 이 논문에서도 해당 성능지표를 사용한 결과를 추가했어도 좋지 않았을까 싶다.
총평 : 흥미로운 논문이자 좋은 학습 자료
한국어 기술문서 분석을 위한 BERT 기반의 분류모델
논문, 학술저널 검색 플랫폼 서비스
www.dbpia.co.kr
'공부공부공부를 합시다 > 논문을 읽어 봅시다' 카테고리의 다른 글
[논문읽기] ClovaCall: Korean Goal-Oriented Dialog Speech Corpusfor Automatic Speech Recognition of Contact Centers (0) | 2022.07.04 |
---|---|
[논문 읽기] 감성 및 감정 단어 마스킹 기반 BERT와 GPT 파이프라인 방식을 통한 감정 문장 생성 (0) | 2022.06.28 |
[논문읽기] 응급의료 영역 한국어 음성대화 데이터베이스 구축 (0) | 2022.06.04 |
[논문읽기] Distributed Representations of Words and Phrases and their Compositiona (0) | 2022.04.22 |
[논문읽기] 수요 패턴 별 최적 머신러닝 수요예측 모델 성능 비교 (0) | 2022.03.14 |
댓글