본문 바로가기
공부공부공부를 합시다/논문을 읽어 봅시다

[논문읽기] 한국어 기술문서 분석을 위한 BERT 기반의 분류모델

by 뻒음 2022. 8. 11.


국가과학기술종합정보시스템(NTIS) 기술문서의 분류(중분류 level)를 BERT 기반 분류모델로 수행한 연구에 대한 논문이다.


모델의 구성과 파라미터, 사용한 데이터의 소스와 수량까지 자세하게 설명되어 있어 읽기 상당히 편했다.
관련 연구로는 Transformer와 BERT에 대한 이론적 내용이 담겼는데 이 내용은 다른 항목으로 빼고 이 모델들을 사용한 문서 분류 연구에 대한 내용이 더 있었다면 흥미롭게 찾아 읽을 수 있었을 것 같다는 느낌을 받았다.


분류모델로 연구를 하고 논문을 낸 적은 없어서 이진분류가 아닌 다중분류 문제에서 어떤 성능지표를 쓰는지에 대한 지식이 부족했는데 F1-score를 쓰는 방법에 대한 이해를 얻을 수 있어 도움이 되었다.
다른 논문에서는 Macro F1-Score를 사용했는데 이 논문에서도 해당 성능지표를 사용한 결과를 추가했어도 좋지 않았을까 싶다.


총평 : 흥미로운 논문이자 좋은 학습 자료

 

 

한국어 기술문서 분석을 위한 BERT 기반의 분류모델

논문, 학술저널 검색 플랫폼 서비스

www.dbpia.co.kr

 

댓글