본문 바로가기
공부공부공부를 합시다/논문을 읽어 봅시다

[논문읽기] 응급의료 영역 한국어 음성대화 데이터베이스 구축

by 뻒음 2022. 6. 4.

응급실에서 음성 데이터를 수집하고 전사하는 프로젝트의 수행과정과 결과에 대한 논문이다. 

내가 현재 준비하고 있고 수행해야 하는 과제와 비슷한 성격의 프로젝트라서 흥미롭게 읽었다.

응급실은 그 특성상 수집이 매우 힘든데, 응급 상황에서 병원을 방문한 환자에게서 데이터 수집에 대한 동의를 얻기도 힘들고 잡음과 소음이 많다.

이 논문에서는 하나의 진료 상황에 대한 음성을 16개 채널의 녹음기에서 수집한다.

이 수집 방법이 상당히 자세하게 나와 있어 아이디어를 얻는데 도움이 되었다. 

전사는 철자전사, 음소전사를 동시에 진행하며, 방언과 잡음, 의료코드는 전사한 텍스트에 표시 및 기입하는 방식을 사용했다.

표준 맞춤법에 맞는 전사와 들리는 대로 하는 전사를 동시에 진행한다는 것이 놀라웠는데, 수집하는 대화의 양이 많지 않아서 가능했을 것 같다.

잡음을 따로 표시하여 음성인식 모델에서 제외하거나 따로 모델링할 때 이용할 수 있도록 한 부분에서 데이터 수집에 대한 많은 고민이 느껴졌다.

수집한 데이터에 공공 데이터를 포함하여 데이터의 양을 늘린 후 모델을 제작했는데, 이 논문이 나온 이후에도 언어모델이 꾸준히 발전하여 현재는 더 좋은 성능을 지닌 모델과 더 많은 기초 데이터를 사용한다면 더 좋은 성능을 낼 수 있지 않았을까 싶다.

 

 

 

 

응급의료 영역 한국어 음성대화 데이터베이스 구축

This paper describes a method of building Korean conversational speech data in the emergency medical domain and proposes an annotation method for the collected data in order to improve speech recognition performance. To suggest future research directions,

www.kci.go.kr

 

댓글