여론조사 보도 바르게 읽는 법
진보층의 과표집 인한 결과 왜곡이라는 오해
한번의 조사보다는 추세, 적극투표층 표심 중요
남은 기간 추이 뒤집힐 가능성은 거의 없어
대한민국의 운명을 결정하는 총선일이 10일 앞으로 다가왔다. 어떻게 될까?
객관적, 합리적 방법으로 선거 판세를 예측해 볼 수 있는 방법은 현재로선 여론조사 방법밖에 없다. 피부미터가 있다고는 하지만 대체로 자의적, 주관적 경향이 커 객관적 지표로 사용하기는 어렵다. 25년간의 선거컨설팅 경험에 비춰보면 실제로 주변 분위기만 보고 이길 줄 알았다가 크게 지는 낭패를 경험하는 경우가 종종 있었다. 1987년 대선에서 최초로 여론조사가 실시된 이래 여론조사는 때론 투표결과와 상당히 다르기도 하였지만 대체로는 표본오차와 크게 다르지 않은 결과를 보여줌으로써 신뢰를 형성해 왔다. 따라서 이번 선거 또한 여론조사를 통해 예측해 볼 수밖에 없다.
그렇다면 선거일을 앞두고 홍수처럼 쏟아지는 여론조사 보도를 어떻게 바라봐야 할까? 2월에 실시된 조사결과와 완전이 달라진 3월 조사결과를 어떻게 읽어야 할까? 3월 말 발표되는 여론조사 결과는 투표결과로 이어질까?
여론조사는 기본적으로 표심을 객관적으로 분석해 선거전략을 수립하기 위해서 하지만 밴드왜건 효과, 언더독 효과를 자극하기 위해 전략적으로 사용되기도 한다. 이기고 있는 후보는 대세론을 확산하기 위해, 열세인 후보는 동정심을 자극하기 위해 여론조사를 활용한다. 물론 너무 차이가 큰 경우, 언더독은 독으로 작용하기도 한다.
그렇다면 여론조사에서 가장 중요한 개념은 무엇일까? 바로 신뢰수준과 표본오차이다. 여론조사 결과를 보면 95% 신뢰수준이란 말이 나오는데 95% 믿을 수 있다는 뜻이 아니라 100번 조사하면 표본오차 범위 내에서 95번은 같은 결과가 나올 수 있다는 말이다.
오차범위는 샘플 수가 클수록 작아지는데 총선의 경우 지역구 최저 샘플은 500 이상이다. 500 샘플의 오차범위는 4.4%, 1000 샘플은 3.1%, 2000 샘플은 2.2%포인트로 외워두는 것이 편하다.
다음으로 중요한 것이 응답률인데, 조사방식에 따라 차이가 크다. 전화면접조사의 경우 대략 10% 이상, ARS조사의 경우 5% 내외 정도로 나타나는데 응답률이 낮다고 꼭 신뢰도가 낮은 건 아니다.
신뢰도에 더 큰 영향을 주는 것은 일반적으로 표본추출방식과 조사방식이다. 특히 표본추출방식이 중요한데, 통신사 제공 휴대전화 가상번호 100%냐 아니면 휴대전화 가상번호에 유선전화 RDD를 어느 정도 섞었냐에 따라 결과는 크게 달라진다.
유선전화를 쓰는 경우 70대 이상의 농촌, 노인과 자영업자들이 많이 표집되는데, 이 계층의 이념적 성향이 과대표집될 가능성이 크기 때문이다. 따라서 여론조사 결과를 볼 때는 발표된 종합숫자만이 아니라 조사개요를 꼼꼼히 확인하고 비교해 봐야 조사결과의 정확한 의미를 알 수 있다. 조사방식은 전화면접방식이나 ARS방식인데 각기 장단점이 있으므로 어느 것이 더 맞는다고 단정하긴 힘들다. 다만 조사방식의 특성상 ARS방식에 비해 면접방식의 경우 무당층, 각 이슈에 대한 무결정층이 좀 더 높게 나타난다는 점은 주목할 필요가 있다. 선거일이 다가올수록 수렴되는 경향이 있다.
그럼 최근 발표되는 총선 관련 여론조사 결과에 대한 논쟁적 이슈에 대해 살펴보자.
먼저 3월 조사결과를 두고 벌어지는 여론조사 전문가들 사이의 가장 큰 논쟁은 진보층의 과표집에 관한 것이다. 2월 조사는 정상적인데, 3월 조사는 대단히 비정상적으로 진보가 과대표집되고, 보수가 과소표집되었다는 것이다.
대표적으로 거론되는 것이 한국리서치가 조사한 중·성동갑 3월 18~20일 조사이다. 이 조사에서 윤희숙 국민의힘 후보가 28%, 전현희 민주당 후보가 45%로 집계됐는데 엄경영 시대정신연구소장은 “우리나라 이념지형은 보수 30% 초중반, 진보 20% 중반, 중도 30% 중후반대인데, 이 조사 사례 수를 보면 진보 150명, 보수 138명, 가중값을 적용하면 진보 168명, 보수 127명이 됐다”면서 “샘플표집이 정상적으로 됐다면 전현희 35, 윤희숙 35 정도로 나와야 정상”이라며, 실제 선거지형을 봤을 때 중·성동갑은 국민의힘이 이긴다“는 것이다.
우리나라 이념지형을 엄 소장의 경우처럼 분석하는 것이 옳은지는 별개로 하더라도 여론조사는 한 번의 숫자로 보기보단 추세로 보아야 한다는 것이 정설이어서 큰 의미가 있을 것 같지 않지만, 이 같은 주장이 언론 지면에 그럴듯하게 실리고, 그 결과 여론지형이 왜곡될 수 있어 간단히 짚고 넘어가고자 한다.
위 조사의 경우 지지율 차이는 17%인데 비슷한 차이의 무선전화면접, 휴대전화가상번호로 진행한 다른 조사결과를 살펴보자. 먼저 3월 22~4일 실시된 케이스탯여론조사는 두 후보 간 격차가 16%로 가중값 적용기준 진보 137, 보수 146, 중도 185로, 엄 소장이 주장하는 이념지형에 부합하는 조건에서도 전현희 후보가 비슷하게 앞섰다. 3월 17~18일 넥스트리서치 조사는 두 후보 간 격차가 9%로 줄었는데, 가중값 적용기준 진보 138, 보수 156, 중도 161로 중도는 좀 줄었고, 보수는 좀 많이 표집된 결과를 보여줬지만 대세를 바꿀 정도는 아니다. 종합해보면 엄 소장의 주장처럼 두 후보 간 격차가 없어야 한다는 것은 대단히 무리한 주장임을 알 수 있고, 현재의 판세는 전현희 후보가 오차범위 밖에서 앞서고 있다고 해석함이 옳다.
해운대 갑의 경우를 살펴보자. 3월 21~24일 무선전화면접, 100% 가상번호로 진행한 한국리서치 조사에 따르면 홍순헌 후보가 주진우 후보에 4% 앞선 조사가 나왔다. 이 조사에서 진보는 139, 보수는 180, 중도는 162가 표집됐는데 엄 소장의 주장에 따르면 도저히 나올 수 없는 결과다. 이는 부산의 이념지형에서 진보가 과표집되었다고 하더라도, 그 결과로 인한 것이라기보다는 저변에 깔린 정권심판론에 황상무 회칼, 이종섭 도주, 대파 논란 등이 터지면서 숨죽이던 진보가 목소리를 내기 시작했다고 봄이 합리적이고, 중도 표심이 전체 여론향배를 결정한다는 것을 알 수 있다. 여론조사라는 것이 때때로 이해할 수 없이 튀는 조사가 나오기도 하는데 이를 근거로 여론조사나 여론지형 전반을 일반화하는 오류를 범해서는 안 되고, 몇몇 사례를 근거로 한 진보 과표집 논란은 이제 사라져야 할 것이다. 2월 여론조사에서 국민의힘이 압도하던 당시 보수과표집 논란이 있었지만 이를 지적한 언론은 없었다는 점을 상기할 필요가 있다.
다음으로 언론이 대대적으로 보도한 3월 첫 주 한국갤럽 조사를 읽는 방법에 대해서다. 언론이 주목한 것은 ”서울 지역 민주당 지지율 대폭락“이다. 직전 주 조사결과 민주당 26% 대 국민의힘 43%에서 민주당 24% 대 45%로 격차가 좀 더 벌어진 것을 두고, 그렇게 보도한 것이다.
전국단위 1000 샘플 조사는 위에서 살펴본 바와 같이 표본오차가 ±3.1P이고, 서울지역 187 샘플의 표본오차는 95% 신뢰수준에 ±7%P에 달해, 대폭락이 아니라 오차범위를 살짝 벗어난 것에 지나지 않는다. 대폭락으로 호들갑을 떨어야 할 일이 아니라는 것이다. 940만 명의 서울 여론을 187 샘플로 단정하는 것은 좀 더 조심스러워야 한다. 21% 차이는 비슷한 시기에 500 샘플로 조사된 서울의 각 지역별 조사의 흐름과 너무나 간극이 너무 크고, 그것으로 서울여론을 일반화하려는 보도태도는 납득하기 어렵다. 전국단위 조사의 경우 전국적 흐름과 추세를 보는 것으로 제한되어야 한다. 정론을 추구하는 언론이라면 이점을 직시하여 향후에는 어떤 정치적 의도로 확대해석하거나 왜곡하는 보도 태도를 자제할 필요가 있다. 데이터는 데이터일 뿐이다.
다음으로 여론조사를 읽을 때 중요하게 봐야 하는 몇 가지 키포인트에 대해 알아보자.
첫 번째는 여론조사는 위에서 언급했던 바와 같이 추세로 읽어야 한다는 것이다. 한 번의 조사에서 나타난 숫자에 큰 의미를 부여해선 안 된다. 최소한 2회 이상의 조사를 종합하고, 역대 선거 결과와 비교한다면 상당히 실체적 진실에 근접한 결과를 도출할 수 있을 것이다. 일례로 최근 여론조사에서 기존 흐름과 확연히 다른 결과를 보여주고 있는 부산 여론의 경우 16개 구청장 선거 중 13곳에서 승리한 2018년 지방선거와 비슷한 추세와 체감온도를 보여준다는 것을 근거로 판단해 본다면 18개 지역구 중 민주당 3곳, 진보당 1곳은 확실한 우세, 9곳에서는 치열한 경합이 벌어지고 있다고 해석할 수 있다.
두 번째는 적극 투표층의 표심이 어떤지를 봐야 한다. 여론조사는 투표에 관계없이 성별, 연령별, 지역별 가중치를 두어야 하지만 투표율은 그렇게 일률적으로 나타나지 않는다. 따라서 여론조사에서는 적극 투표층의 표심이 실체 투표율에 더 가깝다고 보는 것이 합리적이다. 소극 투표층이나 무관심층은 투표에 참여할 가능성이 조금은 떨어진다고 봐야 한다.
세 번째는 이념성향별 투표 경향이 어떤지가 중요하다. 이념성향별 표집규모와 각 성향별 지지성향을 보면 현재 판세와 투표 결과를 어느 정도는 예측할 수 있다. 충남 홍성·예산에서 각축을 벌이고 있는 민주당 양승조 후보와 국민의힘 강승규 후보의 경우 역대 선거 결과와 초기 여론 추이를 보면 최소 오차범위를 넘어서는 10% 이상의 격차를 보일 것이라고 예상되었다.
그런데 정권심판론 바람이 불고 국민의힘에 여러 악재가 터지면서 3월 18일 윈지코리아 조사에서 700 샘플 중 보수가 337, 중도가 207, 진보가 136 샘플이 표집되었지만 전체적으로는 양승조 후보 44.5%, 강승규 후보 47.7%로 3.2% 차 오차범위 내의 접전을 벌이고 있으며, 적극 투표층에서는 2.2% 차의 초접전 양상을 보이고 있다.
이것이 가능한 것은 보수임에도 정권심판론에 동참하는 흐름이 나타나고 있고, 결정적으로는 양승조 후보가 중도에서 24.8% 차이의 압도적 지지를 얻었기 때문이다.
이처럼 이념성향별 과표집의 문제를 지지율로 연결하여 분석하기는 어렵다. 같은 지역의 3월 23~24일 조원씨앤아이 조사에서는 양승조 후보 46.5%, 강승규 후보 46.3%로 0.2% 차이, 적극 투표층에서는 1.2% 차이로 오차범위 내에서 양승조 후보가 앞선 것으로 나타나고 있다. 한 치 앞을 보기 어려운 선거가 된 것이다. 추세로 보면 양승조 후보의 상승세가 예상된다고 볼수 있는 것이다.
넷째로는 정당 지지도, 정권심판론과 대통령 국정수행 지지도에 대한 상관관계를 어떻게 볼 것이냐다.
일부 전문가들이 정권심판론과 거대야당심판론이 대동소이하기 때문에 정당 지지도, 대통령 국정수행 지지도를 중심으로 봐야 한다고 주장하고 있지만 이는 윤석열 정권심판론의 강도에 대한 몰이해에서 비롯된 것으로 볼 수 있다.
부산·경남에서 정당 지지도에서는 국민의힘이 10% 이상 앞서고 있는 반면 정권심판론과 대통령 국정수행 부정평가가 50%를 상회하면서 각종 여론조사 결과 양당 간 접전을 펼치고 있다는 사실을 설명할 수 없다. 이번 총선의 판세는 정당 지지율만으로 해석하기 어렵다.
마지막으로 투표결과에 가장 크게 영향을 미치는 것은 투표율이다. 전문가들의 대체적 의견은 민주당과 국민의힘 간 승패를 가르는 기준은 60% 내외이다. 만약 21대 총선 투표율 66.2%를 넘어선다면 역대 선거 득표율 추이와 세대별 투표율 양극화 문제는 선거판세에 큰 영항을 미치지 않는다. 현재와 같이 민주당에 유리한 선거결과가 예측된다. 이번 총선 투표율은 조국혁신당의 역할에 따라 큰 영향을 받게 될 것이라는 점에 이론의 여지는 없는 듯하다.
4월 3일 이후에는 여론조사 결과를 발표할 수 없는 깜깜이 선거를 해야 한다. 최근의 여론조사 결과 추이가 뒤집어질 가능성이 있을까? 단정할 순 없지만 가능성은 거의 없다고 본다. 현재로선 국민의 힘의 반전카드는 딱히 없다.
회심의 기획이었던 의대 정원 확대까지 악재로 끝나버린 상황에서 추락하는 것에는 날개가 없다는 말이 새삼스럽다.
여론조사 결과와 관련한 자세한 내용은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다.