[장지연의 통계 칼럼] %와 %p의 차이를 아십니까

많은 사람들이 헷갈려하는 통계 용어 - 퍼센트와 퍼센트 포인트

필자가 이 칼럼을 작성하고 있는 시점은 2021학년도 대수능이 100일 남은 날이다. 현재 고2인 예비 수험생에게도 수능이 주는 긴장감은 꽤 크다. 영어 듣기 시간에는 비행기의 이착륙도 통제할 만큼 수험생들이 12년간 쌓아 온 노력을 검증받는 단 한번의 시험이기 때문이다. 이렇게 중요한 시험인 만큼, 시험 문제 출제 또한 철저한 보안 아래 이루어진다. 대학 교수와 고등학교 교사로 이루어진 출제진이 몇 달간 외부와 격리되어 문제를 출제하기 때문이다. 그러나 이러한 문제에서도 오류가 있을 수 있고, 실제로 지금까지 수능 문제가 복수 정답 혹은 전원 정답처리된 경우가 꽤 있다. 그중 한 예로는 2015학년도 대수능 영어 영역의 문제를 들 수 있다. 간단한 도표 해석 문제이고, 우측에 한글 해설본도 있으니 영어를 잘하지 못하더라도 한번 도전해 보자. 

 

 

결론부터 말하자면, 해당 문제의 정답은 최종적으로 4번과 5번으로 결정되었다. 본래 평가원이 의도했던 정답은 4번뿐이었고, 실제로 많은 학생들이 해당 선지를 답으로 선택했다. '전자 우편 주소' 항목에서 2006년과 2012년의 비율이 각각 29%, 53%이므로 2012년의 비율이 2006년의 비율보다 3배가 더 높다는 설명은 명백히 틀렸기 때문이다. 하지만 5번도 엄밀히 따지면 틀린 선지이다. '휴대전화 번호' 항목에서의 2006년과 2012년의 비율은 각각 2%, 20%이고, 이때 2012년은 2006년보다 18% 증가했다는 설명은 맞는 것 같은데, 왜 틀렸다는 것일까? 비밀은 바로 '퍼센트포인트'에 있다. 5번 문장의 '18 퍼센트'를 '18 퍼센트포인트'로 고쳐야 맞는 문장이 되어 정답에서 제외될 수 있는 것이다. %p라는 기호로도 표현되는 이 퍼센트포인트는 '퍼센트 (%)'와 어떻게 다르길래 수능 문제까지 뒤흔든 것일까? 

 

 

퍼센트(%, percent)는 비율을 쉽게 나타낼 수 있는 기호로, 어떤 양이 전체의 양에 대해 100분의 몇이 되는가를 나타내는 단위이다.1 예를 들어, 올해 대학 A에 지원자의 23%가 합격했다면, 100명 중 23명이 합격했다는 뜻으로 이해할 수 있다. 그런데 이러한 퍼센트 수치를 서로 비교해야 할 때가 생기기 마련이다. 가령 올해 대학 B에 지원자 중 25%가 합격했다고 하자. 그렇다면 대학 B에 지원한 학생의 합격률은 대학 A 지원자의 합격률보다 2% 높은 것이 아니라, 2%p (2 퍼센트포인트) 높은 것이라고 말하는 것이 옳다. 이처럼 두 가지 이상의 퍼센트(%) 수치를 비교할 때, 그 차이는 퍼센트(%)가 아닌 퍼센트포인트(%p)를 사용하여 표현한다. 

 

많은 사람이 이 두 개념을 혼동한다. 주변에서도 이 두 가지를 혼용하여 사용하는 경우를 쉽게 찾을 수 있다. 앞서 소개한 수능 문제에서도 퍼센트포인트가 쓰여야 할 자리에 퍼센트가 쓰였기 때문에 복수 정답 처리가 된 것이다. 이 문제 이후 평가원의 도표 해석 문제에서는 %p를 올바르게 사용한 선지가 출제되어 같은 논란은 더 이상 새로 생기지 않았다. 그리고 이 문제 덕분에 대다수에게 생소한 퍼센트포인트의 개념이 그나마 알려지게 되었다.

 

이제 독자 여러분은 퍼센트포인트의 개념을 확실히 이해했을 테니, 아래 드라마 클립에서 잘못된 부분을 찾아보자. 해당 클립은 작년에 tvN에서 방영한 드라마 '검색어를 입력하세요 WWW' (이하 검블유)의 한 장면이다. 

 

 

영상 첫 장면의 회의를 주도하는 사람은 점유율 1위 포털사이트 '유니콘'의 서비스 전략 본부장 배타미이다. 경쟁 포털 '바로'의 점유율과의 격차가 지난달보다 줄어들었다는 내용을 말하며 직원들에게 경각심을 심어 주고 있다. 영상 46초에는 다음과 같은 대사가 나온다.

 

"4주 전까지 11% 격차였는데 3주째 10% 격차야."

 

사실 해당 문장은 틀린 표현이다. 영상의 내용을 토대로 '유니콘'과 '바로'의 점유율 변화를 정리해 보자면, 4주 전 '유니콘'과 '바로'의 점유율은 각각 52.8%, 41.8%였지만 회의 시점에서는 각각 52.3%, 42.3%였을 것이다. 이를 두고 영상에서 배타미 본부장은 "유니콘이 0.5%를 잃었고 바로는 0.5%를 얻었다"라고 표현한다. 이도 엄연히 말하자면 0.5%p (0.5 퍼센트포인트)라고 말해야 맞는 표현이지만, 전체 점유율 중 0.5%를 지칭한 것으로 이해하면 이 역시 옳다고 할 수도 있다. 그러나 두 포털의 격차가 11%에서 10%로 줄었다는 표현은 엄연히 틀린 표현이다. 앞서 말했듯, 두 가지 이상의 퍼센트(%) 수치를 비교하여 그 차이를 설명할 때는 %p를 사용하는 것이 옳다. 따라서 "4주 전까지 11%p 격차였는데 3주째 10%p 격차야"라고 말해야 옳다. 주인공이 논리적으로 자신의 의견을 피력하는 멋있는 장면에서 이러한 옥에 티가 있다는 점은 조금 안타깝다. 

 

그렇다면 여러 개의 퍼센트 수치의 차이를 설명할 때 퍼센트(%)를 사용할 수는 없는 것일까? 그렇지는 않다. 퍼센트 역시 백분율을 나타내는 기호이기 때문에 이를 올바르게 사용한다면 퍼센트포인트가 아닌 퍼센트를 이용하여 비교하는 것도 가능하다. 위 영상에 나온 데이터를 예로 들어 보자. 회의 시점에서 '유니콘'과 '바로'의 점유율은 각각 52.3%, 42.3%이므로, '유니콘'의 입장에서 보면 타사의 점유율 42.3% 중 10%p라는 수치만큼 '바로'와 차이 나는 것이기 때문에, 10/42.3*100인 약 23.64%만큼의 격차가 난다고 할 수 있다. 따라서 회의에서 "현재 '유니콘'과 '바로'의 점유율 격차는 23.64%이다."라고 말한다면 이것은 옳은 표현이다. 

 

그런데 이렇게 말하면 조금 헷갈릴 수 있다. 그렇다면 퍼센트로 나타내는 점유율이 아닌, 건수로만 나타낼 수 있는 '이용자 수'의 경우를 생각해 보자. 오늘 '유니콘'에 접속한 사람이 523만 명, '바로'에 접속한 사람이 423만 명이라고 가정해 보자. 이때 두 포털의 이용자 수는 100만 명의 차이를 나타낸다. '유니콘'의 입장에서 보면, 타사 포털 '바로'에 접속한 사람이 423만 명인 상황에서 자사 포털에 접속한 사람은 100만 명이 더 많은 것이므로, '유니콘'은 '바로'보다 100/423*100인 23.64%만큼 이용자 수가 더 많은 거으로 이해할 수 있다. 다르게 말하면, '바로'의 이용자 수의 123.64%만큼의 이용자 수를 '유니콘'이 보유하고 있는 것이다. 

 

이렇듯 두 개 이상의 퍼센트 수치를 비교하는 단위로는 퍼센트와 퍼센트포인트 둘 다 쓰일 수 있지만, 그것이 내포하고 있는 의미는 전혀 다르다. 따라서 이 개념을 적절히 사용해 독자를 통계적 착각에 빠트리는 것도 충분히 가능하다. 가령 회사 A의 점유율이 작년 1%에서 올해 1.5%가 되었다고 하자. 올바르게 표현하려면, 이 회사의 점유율이 작년 대비 0.5%p 증가했다고 말해야 한다. 퍼센트 수치 자체는 0.5만큼 증가했기 때문이다. 그런데 "이 회사의 점유율이 작년 대비 50% 증가했다"라는 표현도 맞는 표현이다. 하나씩 따져 보면, 1%의 절반만큼 증가하여 1.5%가 된 것이므로, '절반'을 뜻하는 50%만큼 이 회사의 점유율이 성장했다고 해도 무방한 것이다. 따라서 이 경우 필자가 "회사 A, 작년 대비 점유율 50% 증가!"라는 제목의 기사를 작성해도 틀린 내용을 적은 것이 아니지만, 많은 독자는 마치 이 회사의 점유율이 전체 점유율의 50%만큼 증가했다고 이해할 것이다. 따라서 퍼센트포인트를 제대로 알고 있지 않다면 자신도 모르게 이러한 통계적 낚시에 빠질 수 있다. 

 

 

퍼센트(%)와 같이 우리에게 친숙한 통계 용어도 있지만, 퍼센트포인트(%p)와 같이 다소 생소한 개념도 있다. 이 둘은 비슷해 보이기 때문에 혼용하기 쉽지만, 자칫 잘못 사용했다가는 엉뚱한 표현이 될 수 있다. 문장에서 'point' 한 단어가 안 적혔다는 이유로 수능 문제가 복수 정답 처리된 경우만 봐도 이 둘은 엄격히 구분되는 개념임을 알 수 있다. 

 

때로는 사소해 보이는 것이 정말로 중요할 때가 있다. He 앞에 s가 붙어 she 라는 새로운 단어가 되듯이, % 뒤의 p의 여부로 통계는 완전히 다른 의미를 말할 수 있다. 이러한 차이를 정확히 이해하여 올바르게 사용하는 것도 중요하지만, 매체를 접할 때 이 두 용어에 주의해서 읽어야 통계적 낚시에 걸려들지 않을 수 있다. 많은 사람이 혼동하고 있는 개념인 만큼, 이를 교묘하게 이용하여 '통계적 착각'을 불러일으키는 경우도 많으므로, 이 두 용어를 잘 구분하여 일명 '어그로'에 속지 않는 똑똑한 독자가 되도록 하자. 

 

 

『참고 및 인용자료 출처』

인용 자료: 사이언스올 https://www.scienceall.com/%ed%8d%bc%ec%84%bc%ed%8a%b8percent/

참고 자료: 네이버 지식백과 https://terms.naver.com/entry.nhn?docId=3434286&cid=58456&categoryId=58456

이 기사 친구들에게 공유하기