[이현지의 과학 칼럼] 음성 합성 기술, 말할 수 없는 사람들의 소통창구

말할 수 없는 삶을 상상해본 적 있는가? 발성을 통해 직접적으로 소통할 수 없다면, 당신의 삶은 극적으로 달라질 것이다.

 

 

보건복지부 주관 2018년 한국의 등록장애인 총 2,531명 중 청각 장애인의 비율은 363명, 약 14%이다. 이들이 타인과 소통하기 위해서는 수화를 배우거나, 필담을 나눠야 하는데, 수화는 사용 인원이 많지 않아 소통 대상이 한정적이고, 필담은 속도가 느리다는 단점이 존재한다. 또한 전신 마비 환자의 경우, 위의 두 방법이 모두 사용 불가능하다.

 

물론 이들을 위한 기술이 발명되긴 했다. 스크린이 사용자의 시선을 인식하여 눈으로 타자를 치는 방식이 그것이다. 그러나 이 방법으로는 1분에 10단어밖에 입력하지 못한다. 분당 150단어 정도를 말하는 발화 방식에 비해 매우 느리다. 이에 대한 대안으로 등장한 것이 바로 뇌 활동을 이용한 음성 합성이다.

 

 

캘리포니아 대학교의 연구진들은 뇌파를 이용해 발화 시의 근육 활동을 합성하는 방법을 연구했다. 방법은 다음과 같다. 뇌에 전극을 이식한 피실험자가 문장을 읽는 동안 그들의 뇌 활동을 기록한다. 그리고 디코더 알고리즘을 이용해 이 뇌파가 명령하는 발성 기관의 움직임을 분석한다. 이제 이 움직임을 합성기 알고리즘을 이용해 실제 움직임으로 합성한다. 뇌가 발화 명령을 내릴 때 문장이 아닌 발화기관의 움직임을 신호화해 보낸다는 것에서 착안한 것이다. 알고리즘이 합성한 음성을 실제 음성과 비교해 보도록 하자. 아직 합성한 문장을 온전히 알아듣기는 힘들지만, 본래 문장과 매우 유사하게 복원된다는 것을 알 수 있다.

 

이 기술을 통해 앞으로의 대화에 불편을 겪는 사람들의 삶은 조금 더 편리해질 것이 분명하다. 이러한 기술들이 앞으로 계속 연구되어 상용화된다면, 평등한 사회에 한 발짝 다가갈 수 있을 것이다.

 

이 기사 친구들에게 공유하기