[장지연의 통계 칼럼] 코로나19 검사는 완벽한가

위양성과 위음성, 1종오류와 2종오류

코로나19가 시작된 지 반 년 만에 누적 검사 수는 150만 건을 넘었다. 그러나 코로나 진단을 위한 방법은 완벽하지 않다. 얼마 전 광주 중고생 2명의 코로나19 검사결과가  '위양성'인 것으로 판정된 것 등이 그 예이다.1  위(僞)양성이란, 실제로는 음성이지만 검사 결과의 오류로 인해 양성으로 나온 것을 의미한다.2  물론 반대의 경우도 가능하다. 이처럼 코로나19 검사는 늘 정확할 수 없는데, 아직 백신도 개발되지 않은 상태에서 우리는 이 검사에 의존할 수밖에 없다. 따라서 나는 이러한 오류를 통계학적인 관점에서 접근해보고자 한다. 

 

 

앞서 말했듯, 검사에는 오류가 필연적으로 따라온다. 그 중 대표격인 "위양성"과 "위음성"은 각각 검사 대상자의 실제 건강상태와 다른 결과가 나왔음을 의미한다. 정리하자면 다음 표와 같다. 

 

 

통계학에서는 이러한 오류에 각각 "1종오류"와 "2종오류"라는 이름을 붙여 설명한다.3 4 모집단을 조사해 다양한 변수를 고려하여 최적의 결론을 내는 학문이 통계학이고, 이때 "오류"에 관한 논의는 매우 중요해지기 때문이다. 위의 예시처럼 검사결과가 실제와 정반대로 나오는 경우, 통계학에서는 "위양성"을 1종오류, "위음성"을 2종오류라고 명명한다. 

 

이러한 1종오류와 2종오류는 더 다양한 상황에서 쓰인다. 즉, 위양성과 위음성만을 뜻하지 않는다는 것이다. 가령 공장에서 불량품을 걸러내는 과정을 생각해 보자. 생산품 중에는 정상적인 제품도 있고, 불량품인 것도 있을 것이다. 그리고 검사를 통해 이 중 불량품을 판정할 때, 제품에 이상이 없는데도 불량품이라고 결론지을 수 있다. 또한, 반대로 실제로는 불량품임에도 제품이 정상이라는 잘못된 검사결과가 나올 수 있다. 이 경우 전자가 1종오류, 후자가 2종오류가 된다. 이와 같이 어떤 것에 이상(제품의 이상, 항원에 의한 감염 등)이 없는데 이상이 있다고 결론지은 경우가 1종오류, 반대의 경우가 2종오류라고 할 수 있다. 

 

그러나 어떠한 오류이든간에 피해는 필연적으로 발생한다. 이 두 가지 오류또한 마찬가지인데, 각각에 의한 피해 양상은 조금 다르게 나타난다. "위양성"을 생각해보면, 건강한 사람이 양성으로 잘못 판정된 경우이므로 해당 환자는 사실은 받지 않아도 될 치료를 받게 되어 조금의 금전적 피해가 생긴다. 그러나 "위음성"의 경우, 병에 걸린 사람이 건강하다고 판정된 경우이므로 해당 환자는 마땅히 받아야 할 치료를 받지 못하게 되므로 생명과 직결되는 피해를 입는다. 더 나아가, 코로나19와 같이 전염력이 강한 항원에 감염된 경우 지역사회 감염을 일으킬 가능성도 크다. 

 

공장에서 불량품을 검사하는 과정 또한 생각해보자. 여기서 1종오류, 즉 정상적인 제품을 불량품이라고 결론지은 경우, 공장에서는 멀쩡한 제품을 폐기해야 하므로 조금의 금전적 손실을 입게 된다. 그러나 2종오류의 경우, 정상이라고 판정된 불량품이 시장에 유통되어 소비자가 이를 구매할 가능성이 생기고, 실제로 구매했을 경우 해당 소비자는 금전적 손실을 입게 된다. 더불어 기업의 이미지도 떨어질 수 있다. 따라서 흔히 2종오류에 의한 피해가 더 크기 때문에 2종오류의 확률을 줄이는 방향으로 검사의 정확도를 높이게 된다. 이때 2종오류의 확률의 기준점은 주로 5%로 잡힌다. 


그런데 늘 2종오류에 의한 피해가 더 클까? 일반적인 경우에는 그러하나, 예외도 존재한다. 대표적으로는 재판이 있다. 재판에서는 피고에게 무죄 혹은 유죄를 선고한다.  그런데 판결에서도 오류가 발생할 수 있고, 이를 통계학적으로 보자면 다음과 같다. 

 

 

이때 각 오류에 대한 피해의 정도를 비교해 보자. 1종오류의 경우, 무고한 사람이 징역 등 처벌을 받게 될 것이고, 2종오류의 경우에는 범죄를 저지른 사람이 그냥 풀려나 사회는 위험한 상황에 놓일 것이다. 이렇게만 본다면 이때 역시 2종오류에 의한 피해가 사회 전체에 더 큰 악영향을 끼치는 것처럼 보이나, 재판에서는 최대한 억울한 사람이 덜 생기도록 하기 위해 '무죄추정의 원칙'을 따른다는 것을 알아야 한다. 즉, 10명의 살인자를 풀어주더라도 1명의 무고한 자를 만들지 말라는 것이다.5 따라서 사법부가 판결의 과정에서 가장 피하고 싶은 것은 무고한 사람이 억울하게 옥살이를 하게 되는 상황일 것이다. 즉, 재판에서는 1종오류에 의한 피해가 더 크다. 

 

다시 코로나19 검사에 대한 이야기로 돌아와 보자. 앞서 알아 보았듯, 코로나19 검사 결과는 늘 완벽할 수 없으므로 우리는 검사결과를 완전히 신뢰할 수 없다. 즉, 혹자가 실제로는 양성이어도 음성이라는 결과를 받는 것도 가능하고, 검사결과가 양성일 때 실제로는 음성일 가능성도 존재한다. 그렇다면 다음 두 문장은 같은 뜻일지 한번 생각해 보자. 

 

1. 코로나19에 걸렸을 때 검사결과가 양성으로 나올 확률이 90%이다. 

2. 코로나19 검사결과가 양성으로 나왔을 때 내가 실제로 코로나19에 걸렸을 확률이 90%이다. 

 

위 두 문장은 굉장히 비슷해 보이지만, 사실은 엄연히 다른 문장이다. 아래의 경우를 가정해 보자. 

 

 

전체 인구 1000명 중 1%인 10명이 병에 걸렸다고 가정하고, 양성과 음성 각각의 경우에 검사결과의 정확도를 임의로 나타낸 값이다. 이 표를 바탕으로 1번 문장을 생각해 보자. 코로나19에 걸렸을 때 검사결과가 양성으로 나올 확률은 위 표와 같은 상황의 경우 8/10이 되어 80%가 된다. 실제로 양성인 사람의 수가 10명이고, 그 중 검사결과가 양성으로 나온 사람이 8명이기 때문이다. 그러나 2번 문장을 생각해 보면, 코로나19 검사결과가 양성으로 나왔을 때 내가 실제로 양성일 확률은 8/107이 되어 약 7.5%가 된다. 피검사자의 실제 감염여부와 관계없이 검사결과가 양성으로 나온 사람은 총 107명이고, 그 중 실제로 양성인 사람의 수는 8명이기 때문이다. 이렇게 실제로 확률을 계산해 봄으로써 알 수 있듯이 위 두 문장은 엄연히 다른 뜻을 내포하고 있다. 즉, 코로나19 검사의 정확도가 위 표와 비슷할 때, 혹자가 '양성'이라는 검사결과를 받았을 때 본인이 실제로 양성일 가능성은 7.5%로 높지 않다는 것이다. 그럼에도 불구하고 우리는 지역사회 감염을 최소화하기 위해 언제나 조심하는 편이 좋을 것이다. 

 

코로나19 검사는 완벽하지 않고, 완벽할 수 없다. 그렇기 때문에 우리는 늘 코로나19 검사결과를 비판적으로 받아들일 필요가 있다. 통계학은 이러한 객관적인 시각을 길러 줄 수 있는 좋은 도구이다. 앞으로 통계학이 더 널리 알려져 많은 사람들이 코로나19와 같은 현상을 더 통찰력있게 분석할 수 있는 날이 오길 소망해 본다. 

 

 

『참고 및 인용자료 출처』

인용 자료: 한겨레뉴스 http://www.hani.co.kr/arti/society/health/949325.html

2 인용 자료: 네이버 지식백과 https://terms.naver.com/entry.nhn?docId=499226&cid=60408&categoryId=55558

인용 자료: 네이버 지식백과 https://terms.naver.com/entry.nhn?docId=3338491&cid=47324&categoryId=47324

인용 자료: 네이버 지식백과  https://terms.naver.com/entry.nhn?docId=3338492&cid=47324&categoryId=47324

5 참고 자료: 네이버 지식백과 https://terms.naver.com/entry.nhn?docId=943222&cid=47333&categoryId=47333

이 기사 친구들에게 공유하기