22대 총선 여야 의석 예측, 민들레가 가장 정확했다
세 차례 판세 분석 기사 통해 정당별 득표율 도출
‘문어’들 엉터리 전망과 달리 실제 결과와 매우 유사
갤럽과 꽃 여론조사 데이터 근거로 여러 변수 고려
지역구 정당 득표율 차이 6%p 전망…결과 5.4%p
범야권 190 이상, 국힘 110 미만…조국당 12 예상
출구조사, ‘샤이 보수’ 무응답층 분석 오류 가능성
(본 기사는 음성으로 들을 수 있습니다.)
22대 총선이 ‘민주당 압승’으로 막을 내렸다. 지상파 방송 3사의 합동 출구조사가 발표되는 순간 범야권 200석 이상을 상상하기도 했으나 실제 의석수는 출구조사 예측치를 빗나갔다. 박빙의 승부를 가리는 초접전 선거구가 많았기 때문이다.
수많은 ‘문어’들이 총선 전망을 했지만 시민언론 민들레만큼 정당별 의석수를 실제 결과에 가깝게 예측한 매체나 전문가는 없었던 것으로 나타났다. 시민언론 민들레가 3회에 걸쳐 게재한 판세 분석과 총선 전망을 되짚어 봤다. 아울러 한국갤럽과 여론조사꽃의 장·단점도 살펴봤다. 방송 3사의 출구 조사가 왜 예측치를 벗어났는지에 대해서도 그 원인을 따져 봤다.
민들레는 총선 기간 동안 거의 매주 자체 조사를 하는 한국갤럽(이하 갤럽)과 여론조사꽃(이하 꽃) 조사를 토대로 총선 D-50일(갤럽‧꽃 2월 3주차 여론조사), D-15일(갤럽‧꽃 3월 3주차 여론조사), D-6일(갤럽‧꽃 3월 4주차 여론조사) 등 세 차례에 걸쳐 총선 판세 분석과 정당별 예상 득표율로 의석수를 예측했다. 두 기관을 선택한 것은 매주 자체 여론조사를 실시하는 데다 과학적인 조사 방법을 실시한다는 공통점이 있기 때문이다. 여기에 기관의 성향이 달라 데이터 비교가 가능한 것도 큰 장점 가운데 하나다. 두 기관의 총선 전망은 비슷하기도, 빗나가기도 했다.
민들레 총선 판세 분석은 갤럽과 꽃 두 기관의 데이터를 근거로 민주당과 국민의힘의 예상 득표율을 도출했다. 어느 당이 총선에서 승리할 것인가를 가늠하고 정당별 의석수를 전망하는 ‘선거 예측 모델’이다. 지금까지 어느 매체에서도 시도해본 적이 없는 새로운 방식이었다. 세 차례 판세 분석과 예상 득표율 및 의석수는 뒤에서 자세히 살펴보겠지만 선거 결과와 거의 비슷했다. 방송 3사의 출구조사도 하지 못한 정당별 의석수를 상당히 정확하게 예측한 것만으로도 큰 성과라고 할 수 있다.
민들레 총선 예측, 지역구 정당 득표율 차이 6%p 전망
실제 결과는 민주당 50.5%, 국힘 45.1%로 5.4%p 차
‘정당 지지율로 여야 총선 득표율을 예측해 본다면’이라는 제목으로 총선 D-50 시점에 분석한 글에서 갤럽이나 꽃 조사 모두 민주당이 국힘보다 6%가량 더 많은 득표를 할 것으로 전망했다. 여론조사 정당 지지율을 근거로 실제 득표율을 예측했다는 것은 정당 지지율을 기본 데이터로 삼고 ‘하우스 효과’ 등 여러 변수를 고려해 득표율을 추산했다는 의미이지 단순히 여론조사 정당 지지율로만 분석한 것은 아니다. 자세한 내용은 민들레 기사를 참고하기 바란다.
“갤럽 조사를 근거로 정당 득표율을 예측하면 4·10일 총선에서 민주당은 총선 득표율이 49% 안팎, 국힘은 43% 언저리로 예측된다. 여론조사꽃 조사를 근거로 추론하면 총선 득표율은 민주당 50% 안팎, 국힘은 44%가량이 될 것으로 보여 득표율 차이는 6%p 정도다. 이 같은 예측치는 민주당 입장에서 20대 총선(-1.3% 차이)보다는 좋은 환경이지만 21대 총선(8.4% 차이)에 비해서는 2% 부족하다.” (민들레 2월 22일자 참조)
22대 총선 실제 정당 득표율은 민주당 50.5%, 국힘 45.1%로 5.4%p 차이로 민들레 예측치와 가장 비슷한 결과를 보였다. D-50 분석에서 22대 총선 투표율은 고려하지 않고, 여론조사에 나타나는 지표만을 대상으로 조사했다. 다시 말해 투표율 100%를 가정한 예측치여서 실제 투표율과 연계한 분석은 아니었지만 실제 투표 결과와 거의 일치하게 나타났다. 당시 갤럽은 국민의힘 정당 지지율이 민주당을 크게 앞서 있었고, 꽃 조사는 민주당이 국힘을 앞서고 있었지만 두 기관의 여론조사 데이터에 대한 분석은 민주당의 넉넉한 승리를 전망했다.
민들레 예측 범야권 190석 이상, 국힘 110석 미만
실제 총선 결과는 범야권 192석, 국힘 108석
총선 D-15 분석은 좀 더 자세한 내용을 담았다. 갤럽과 꽃의 여론조사 연령별 정당 지지율을 토대로 21대 총선 연령별 실제 투표율을 대입해 22대 예상 득표율을 추론했다. 실제 21대 총선 결과와 비교해 22대 총선 판세를 읽기 위한 시도였다. 투표율은 66.2%를 대입했지만 인구 구성비의 변화로 실제 적용한 투표율은 68.3%(이후 69.8%로 정정)였다. 22대 총선 투표율이 실제 67%여서 1.3%p 높은 투표율 수치를 대입한 셈이다. 투표율에서는 차이가 났지만 결과는 D-50 분석과 차이가 없었다.
“투표율이 21대 총선 때와 같다는 것을 전제로 데이터 분석 결과부터 이야기하면 민주당은 4·10 총선에서 21대 총선 결과에 버금가는 성적표를 받을 것으로 전망된다. 민주당 지역구 의석수는 21대 총선 결과와 비슷하고, 조국혁신당 비례 의석을 포함한 범야권의 의석수는 190석(비례 27~28석 포함) 이상이 될 수도 있다. 반대로 국민의힘은 비례대표 18~19석을 포함해 110석 달성이 쉽지 않아 보인다. 투표율이 높아지면 높아질수록 대통령 거부권 행사를 제한할 수 있는 ‘선거혁명’을 통한 ‘명예혁명’ 가능성도 현실이 될 수 있다.” (민들레 3월 27일자 <총선 D-15 판세는…민주당 지역구 160석 이상 가능> 기사)
민주당과 국힘의 총선 결과 의석수를 거의 비슷하게 전망했지만 갤럽 기준 예상 득표율과 총선에서 실제 득표율은 2%p 차이를 보였다. 이때는 조국혁신당이 세력을 확장하면서 정권 심판론이 총선 판을 압도하는 분위기였다. 갤럽 조사는 민주당 득표율이 국힘에 비해 7%p, 꽃 조사로는 12.2%p 차로 민주당이 크게 앞서는 분석 결과가 나왔다. 21대 총선보다 더 좋은 결과를 기대할 수도 있겠다는 생각을 하게 됐다.
실제 지역구 의석수는 민주당 161석, 국민의힘 90석, 진보당 1석, 새로운미래 1석, 개혁신당 1석 등으로 의석수는 민주당 175석을 포함해 범야권이 192석을 얻었다. 의석수는 정확하게 예측했지만 예상 득표율과 실제 득표율은 2%p 차이였다. 예상 득표율과 실제 득표율은 차이가 날 수밖에 없다. 분석시 적용한 투표율이 68.3%이고, 실제 투표율은 67%였다. 여기에 여론조사는 표본오차가 있어 득표율 차이가 나는 것은 당연한 결과라고 할 수 있다.
민들레 예측 민주당 총선 압승, 국힘은 21대보다 몇 석 더 얻어
총선 결과는 민주당 총선 압승, 국힘 21대보다 지역구 6석 추가
총선 D-6 판세 분석에서는 상당한 오류가 있었다. 데이터를 인위적으로 조작하지는 않았지만 강력한 정권심판 분위기에 편승해 민주당에 유리한 데이터를 좀 더 반영했다. 여기에 꽃 여론조사가 갖고 있는 하우스 효과를 간과해 예상 득표율과 실제 득표율 차이가 더 벌어졌다. 출구조사를 하면서도 총선 분위기가 반영돼 가중치 적용에서 잘못이 있었음을 인정한다. 지나간 이야기지만 가중치 부여에 좀 더 신중을 기했다면 투표율 차이에도 불구하고 총선 결과와 최소한 오차범위 내 예측은 가능했을 것으로 보고 있다.
“갤럽 조사는 민주당이 51.1%를 득표하고, 국힘이 43.3%를 득표할 것으로 전망하고 있다. 민주당은 D-50 조사에서 6%p, D-15 조사에서 7%p 앞선 바 있다. 이번 분석에서는 민주당은 국힘에 7.8%p 앞서 득표율 차이를 조금 더 벌렸다. 보수언론과 국힘의 네거티브 공세에도 불구하고 민주당의 견고한 상승 흐름이 이어지고 있음을 확인할 수 있다. 민주당-국힘 득표율 7.8%p 차이는 21대 득표율 8.4% 차이에 비해 0.6%p 낮은 수치다. 따라서 민주당과 국힘 지역구 의석수는 21대 총선과 비슷하거나 국힘이 몇 석 더 얻을 수 있는 상황이라고 할 수 있다. (…) 꽃 여론조사를 기준으로 분석하면 민주당 득표율 55%, 국힘 득표율 38.4%로 두 당의 예상 득표율 차이는 16.6%p로 크게 벌어진다.” (민들레 4월 8일자 <D-6 마지막 여론조사는 '민주당 압승'을 가리킨다> 기사)
갤럽 분석으로는 21대 총선에 비해 22대 총선에서 국힘이 몇 석 더 얻을 것으로 전망했지만 꽃 분석에서 오류가 있었다. 갤럽 조사와도 오차범위를 벗어나 있고, 22대 총선 실제 결과와도 큰 차이가 발생했다. 꽃 분석에서 문제의 원인은 두 가지로 요약할 수 있다. 하나는 꽃 정당 지지율 조사와 갤럽 정당 지지율 ‘조사 형식’의 차이점이다. 갤럽은 조국혁신당을 정당 지지율에 포함한 반면 꽃은 조사에서 제외했다. 따라서 꽃 조사의 기타 정당 지지율 상당수를 민주당 정당 지지율에 합산해 민주당 지지율을 높게 잡았다.
투표 결과는 민주당 지역구 득표율은 50.4%인데 반해 비례투표에서 민주당과 조국혁신당의 합은 50.9%로 0.5%p 차이밖에 나지 않았다. 기타 정당 지지율 상당수가 민주당 지지일 것으로 본 것은 데이터를 제대로 읽지 못한 결과라고 할 수 있다. 아울러 꽃이 가진 하우스 효과를 과소 평가했다. 이 두 가지 요인이 갤럽과 꽃의 득표율 차이를 오차범위 밖으로 벗어나게 했다.
민들레 비례 예측, 조국혁신당 12석
실제 총선 결과도 조국혁신당 12석
총선 D-6 분석에서는 비례대표 의석수도 예측했다. 갤럽 조사로는 비례대표 의석수를 가늠할 수 있었으나 꽃 조사로는 무당층 해석이 쉽지 않았다. 따라서 정당별 비례대표 의석수는 갤럽 조사로만 전망했다.
“갤럽 조사로 비례대표를 분석한 결과 국민의미래가 39.4%를 얻어 19석, 더불어민주연합은 25.7%로 12석, 조국혁신당 24.9%로 12석, 개혁신당은 4.24%로 3석을 확보할 것으로 예측됐다. 녹색정의당은 2,2%, 새로운미래 2.1%, 자유통일당은 1.9%를 각각 얻어 비례대표 획득이 쉽지 않아 보인다.” (민들레 4월 8일자 <D-6 마지막 여론조사는 '민주당 압승'을 가리킨다> 기사)
투표 결과 정당별 비례 득표율과 의석수는 국민의미래 36.67%로 18석, 더불어민주연합 26.69%로 14석, 조국혁신당 24.25%로 12석, 개혁신당 3.61%로 2석을 얻었다. D-6 분석에서 민주당과 조국혁신당의 비례 득표율 합은 50.6%로 실제 득표율 합 50.9%와 비교하면 0.3%p 밖에 차이가 나지 않는다. 전망치는 과녁을 약간 빗나갔다. 하지만 조국혁신당 바람이 거센 상황에서 더불어민주연합이 조국혁신당보다 비례 득표를 더 많이 하고, 조국혁신당 비례 의석수를 정확하게 예측한 것만으로 나쁘지 않은 분석이었다고 자평한다.
대충 보아도, 너무 자세히 보아도 안 된다
한국갤럽과 여론조사꽃의 ‘하우스 효과’ 확인
갤럽과 꽃 조사를 통한 3회에 걸친 총선 판세 분석을 되돌아보면서 얻은 교훈은 여론조사 데이터를 분석하면서 ‘대충 보아도, 너무 자세히 들여다보아도 안 된다’는 점이다. 난치병 치료를 주업으로 하는 지인이 입버릇처럼 하는 이야기인데 데이터 분석을 하는 사람들이 귀담아 들으면 좋을 내용이다. 대충 보면 바른 길을 찾지 못하고, 너무 자세히 들여다보면 미로 속을 헤매게 된다. 여론조사 꽃 비례정당 데이터 분석을 포기한 것은 너무 자세히 들여다보다 길을 잃고 미궁에 빠졌기 때문이다.
총선 판세 결과만 놓고 보면 갤럽이 꽃보다 여론조사 품질이 좋은 것처럼 생각할 수 있다. 그러나 이는 여론조사 품질과는 차원이 다른 문제다. 데이터를 분석하는 사람의 오류이지 갤럽과 꽃의 데이터에는 죄가 없다.
갤럽은 역사가 오래된 여론 조사기관으로 많은 데이터가 축적되어 있다. 갤럽 조사를 분석하기 시작한 지도 10년 이상이어서 갤럽 수치를 읽는 데 큰 어려움이 없다. 하지만 꽃은 여론조사를 시작한 지 1년밖에 안 된 데다 전국적인 선거는 처음이어서 데이터의 속성을 파악하는 데 어려움이 있었다.
갤럽이 보수정당에 유리한 지지율이 나오는 것처럼 꽃은 진보성향 정당에 유리한 결과가 나오는 건 부인할 수 없는 사실이다. 하지만 ‘하우스 효과의 정도’를 파악하는 데 어려움이 있었다. 꽃이 가진 하우스 효과를 추산해 민주당 지지율을 줄이고, 국힘 지지율을 더하자 갤럽 조사를 보정한 숫자와 같거나 오차 범위를 벗어나지 않았다. 따라서 정당 지지율이 서로 다른 두 여론조사는 어느 하나가 틀린 것이 아니라 두 기관의 성향 차이에서 비롯됐다는 점을 다시 한 번 확인 할 수 있었다.
갤럽은 여론조사를 통해 가스라이팅을 하고 있다는 비판을 받기도 한다. 꽃이 나오기 전까지만 해도 그게 어느 정도인지 알지 못했다. 하지만 꽃과 비교한 결과 갤럽이 고의적으로 여론조사 가스라이팅을 하고 있다는 증거는 찾을 수 없었다. 기관이 갖고 있는 성향 탓으로 보는 게 타당하다. 이번 총선에서 꽃은 기울어진 운동장인 여론조사 분야에서 진보 진영에 한 줄기 빛과 같은 역할을 톡톡히 했다.
양당 득표율 차이에 비해 실제 의석수 차이가 너무 크다?
국힘이 여당이란 점 간과…지난 대선 땐 불과 0.7%p 차
총선이 끝나자 정당별 득표율 차이에 비해 실제 의석수 차이가 너무 많이 난다는 기사들이 줄을 이었다. 21대 총선에서 민주당과 국힘 지역구 득표율이 8.4%p 차이에서 22대 총선에서는 5.4%p로 그 차이가 줄었는데 의석수는 너무 큰 차이가 발생했다는 내용이다. 국힘이 22대 총선에서 선전했다는 것을 에둘러 말하고 싶은 속셈을 모르는 바 아니지만 21대 총선에서 국힘은 야당이었고 지금은 여당이라는 점을 간과하고 있다. 여당이 총선에서 이렇게 참패한 것도, 반대로 야당이 총선에서 압승한 것도 처음 있는 일이라는 사실을 직시해야 한다.
소선거구제를 채택하고 있는 우리나라 총선에서는 단 1표 차이로도 당락이 결정된다. 산술적으로는 득표율이 1%p 차이만 나도 전 지역구에서 승리할 수 있다. 이번 총선에서 민주당과 국힘 득표율 5.4%p 차이는 21대 총선 8.4%p 차이에 비해 격차가 줄어든 것은 사실이지만 결코 만만하게 생각할 수치가 아니다. 지난 대통령 선거 득표율 차이는 0.7%p에 불과했다.
정당 득표율 차이와 의석수 차이에는 분명 인과 관계가 존재한다. 단정적으로 말할 수 없을 뿐이다. 민주당과 국힘 득표율 차이가 2.3%p 차이인 충북에서 의석수는 5대3이고, 투표율 4.4%p 차이인 충남은 8대3, 11.4% 격차를 보인 대전은 민주당과 국힘 의석수가 7대0이었다.
승부처인 서울은 민주당과 국힘간 득표율 차이가 5.94%p였지만 의석수는 민주 37석, 국힘 11석이었다. 득표율 11.8%p로 큰 차이를 보인 경기도는 민주 52석, 국힘 6석으로 민주당 쏠림 현상이 컸다. 인천 역시 득표율 차이는 8.66%p이지만 의석수는 12대 2로 민주당이 압승했다. 반대로 부산에서는 국힘 득표율이 민주당보다 8.84%p 많았다. 의석수는 16대1의 결과로 나타났다. 이러한 결과는 향후 득표율 차이로 총선 판세와 의석수를 예측하는 데 유용한 자료가 될 것으로 보인다.
출구조사, 사전투표 여론조사와 무응답층 분석에 오류 가능성
강력한 정권심판론이 ‘샤이 보수’ 양산해 여론조사에 안 잡힌 듯
박빙 승부처를 민주당 후보에게 유리한 쪽으로 분류했을 수도
총선 예측 조사에서 출구 조사를 빼놓을 수 없다. 방송 3사가 공동으로 실시한 출구조사는 MBC KBS SBS 등 3사 모두 예상치를 벗어났다. MBC 출구조사는 민주당과 민주연합을 합쳐 184석~197석, 국힘과 국민의미래가 85~99석을 차지할 것으로 예측했다. KBS는 민주당과 민주연합이 178∼196석을, 국힘과 국민의미래는 87∼105석을 얻을 것으로 전망했다. SBS는 출구 조사 결과 민주당과 민주연합이 183~197석, 국힘과 국민의미래가 85∼100석을 얻을 것으로 발표했다.
방송 3사가 모두 출구조사 예측에 실패한 원인은 선거 당일 출구조사의 표본 추출에 문제가 있는 게 아니라 사전투표를 한 유권자를 대상으로 실시한 여론조사 분석에 있지 않을까 한다. 이번 총선은 정권 심판론이 강하게 불면서 범야권이 200석을 넘길지 여부가 관심을 받기도 했다. 강력한 정권심판 여론은 모든 총선 이슈를 빨아들이는 블랙홀 역할을 했다. 이런 상황에서는 민주당이나 범야권을 지지한 유권자들은 적극적으로 여론조사에 응답하지만 보수성향 유권자들은 여론조사에 잡히지 않거나 제대로 응답하지 않고 침묵하게 된다. 여론조사에서 크게 이기던 후보가 실제 투표에서 지는 원인은 ‘침묵의 나선 이론’ 외에는 설명할 길이 없다.
이와 함께 사전투표율 분석에서 연령별 투표율과 가중치 적용에 어려움이 있었을 것으로 판단된다. 역대 가장 높은 31.3%의 사전투표율에다 60대의 사전투표율이 가장 높아 가중치 적용에 오류가 있었을 것으로 보인다.
오차범위 내 박빙의 승부처를 총선 분위기상 국힘 후보보다는 민주당 후보에게 유리한 쪽으로 분류했을 가능성도 배제할 수 없다. 출구조사는 아니지만 자체 분석을 시도한 JTBC는 민주당이 168~193석, 국힘이 87~111석을 얻을 것으로 전망해 방송사 가운데는 가장 정확도가 높았다고 자평했다.
여기서 방송 3사와 JTBC 모두 국민의힘 예상 의석수 중간값이 100석 이하라는 것을 알 수 있다. 이는 방송사 모두 범야권이 200석 이상을 얻을 가능성에 무게를 실었다는 것을 보여준다. 박빙의 여론조사 결과를 예측할 때 총선 분위기가 중요하다는 것은 앞에서도 언급했다. 방송사 출구조사에 총선 분위기가 영향을 미쳤을 것이라는 합리적인 의심을 하게 된다. 민들레 판세 분석에서도 고려할 수밖에 없었다. 앞에서 이야기한 다양한 요인들이 상승 작용해 출구조사 예측치가 과녁을 벗어나는 결과를 초래했을 것으로 보인다.
민들레 분석 방식, 총선 전망 유용성 확인
대통령 선거와 달리 총선은 의석수를 정확하게 예측하기가 어렵다. 출구조사를 제대로 한다면 통계적으로는 불가능하지는 않지만 이마저도 박빙 지역에서는 우열을 점치기 힘들다.
시민언론 민들레가 처음으로 시도한 개별 지역구가 아닌 전국 단위의 득표율 차이로 예상 의석수를 전망하는 분석 방식은 이번 총선을 통해 그 가능성과 유용성이 확인됐다고 말할 수 있다. 출구조사를 하지 않고도 총선 예상 득표율과 의석수를 전망할 수 있는 장점이 있지만 의석수를 보다 정확하게 예측하기 위해서는 득표율과 의석수와의 상관관계를 좀 더 연구해 보완해야 하는 과제들이 남아 있다.
(이 글에서 언급한 자료는 한국갤럽과 여론조사꽃 2월 3주차, 3월 3주차, 3월 4주차 여론조사입니다. 자세한 내용은 중앙여론조사심의위원회 홈페이지를 참고하시기 바랍니다.)