2012/12/18 23:55

예측 한 번만 더 Views by Engineer

  [점쟁이 흉내] 대선 결과 점치기에서 조금만 더. 

  10~11일의 KBS 여론조사는 재미있는 비교점을 제공한다.  내 트윗을 보면 KBS의 원래 트윗도 볼 수 있다.  표로는;

 박근혜문재인
서울40.848
인천·경기42.642
충청5137.1
전라11.871.6
경북72.915.5
경남54.135.6
강원·제주43.426.5

 박근혜문재인모름/무응답
19~2932.452.315.3
30~392658.215.8
40~4939.944.615.5
50~5956.234.49.4
≥ 606918.712.3
총계44.941.4 차이; 3.5%

  트랙백해온 포스팅을 보면 연령별 지역별 인구 통계가 있다.  여기 넣어서 같은 논리로 계산해 보았으며, 편의상 '모름/무응답'의 비율은 응답자 비율대로 두 사람에게 나눠 배분했다(다른 후보는 일단 편의상 무시하기로 하자.  그리고 이렇게 해도 부동층 비율이 크지 않아 차이 자체는 위의 수치와 거의 동일하다).  결과 요점은

  1) 19대 국회의원 연령별 선거율을 넣어 계산하면 박근혜 206만표 우세. 
     그런데 지역별 수치를 쓰면 차이가 80만표 정도로 변한다.  여기에는 표본을 분할할 때의 크기 등 여러
     문제가 있기 때문에 불가피하며, 정확한 예측이 어려움도 알 수 있다.  변동이 자그마치 100만표 이상...

    단, 국회의원 선거는 선거율이 너무 낮다.  다른 수치로 바꿔 보자.

  2)
선관위의 공식 예측 기사에는 연령비가 없다. 하지만 한겨레 허재현 기자의 트윗에는 비율이 나와 있다. 
     "20대 이하 74.5%, 30대 71.8%, 40대 78.3%, 50대 82.8%, 60대 이상 91.5%"며 이 비율의 유권자수
     근거 평균은 79.9%다.

    * 이 비율대로 계산해 보면, 여전히 박근혜가 204만표 우세하다.
    * 그러나 예측 비율이 전체적으로 너무 높다.  선관위도 70% 부근일 것이라고 추산했다.  물론 연령별로는
      알 수 없으나, 젊은 층에서 위의 비율보다 상대적으로 덜 줄어들 것이라 보고(즉 젊은 사람들이 투표율이 많
      이 올라갈 것이라 간주), 각 연령대 별로 6,8,10,12,14%씩 줄여 잡겠다.  결국
       
       "20대 이하 68.5%, 30대 63.8%, 40대 68.3%, 50대 70.8%, 60대 이상 77.5%(평균 69.9%)"

      를 기준으로 계산하였다.  이 경우 차이는 155만 표가 된다.  위에 비해 대략 50만 표 줄었다.

  3) 나는 개인적으로 KBS의 조사에서 나타난 지지율 격차가 그대로 지금까지 갈 거라 생각지 않는다.  
     안철수 적극 지지 유세, 이정희 사퇴, 그리고 3차 토론의 결과로 분명히 문재인 지지율이 높아졌을 것이다.
     차이를 좁혀야 하는데, 일률적으로 각 연령대에서 같은 %를 빼서 문재인 지지층으로 넣었다.  그랬더니..
    
     * 차이를 3.5에서 1.5%로 좁히면; 격차는 89만 표.
     * '균형점'은 문재인의 평균 지지도가 1.2% 우위인 지점이었다.  즉 박근혜가 연령별 지지율과 투표
       율 차로 인해 갖는 이점은 전체 평균 지지도 기준으로 1.2% 정도로 볼 수 있다.

  이 정도를 뒤집을 수 있을지 참 흥미롭다(개인적으로는 충분히 가능할 수 있다고 본다).

  漁夫


   


덧글

  • 명품추리닝 2012/12/18 23:57 # 답글

    아멘
  • 漁夫 2012/12/19 10:32 #

    이번도 인증샷? ^^;;
  • Crete 2012/12/19 01:08 # 삭제 답글

    그런데 구글 트렌드로보면 막판에 좁혀졌다 다시 벌어지는 걸로 나옵니다. 링크 달고 갈게요.

    http://crete.pe.kr/27873#comment_27931

    구글 트렌드는 좋은 의미던 나쁜 의미던 검색량에만 의존하는 단점이 있죠. 가령 2차토론 끝나고도 박근혜후보의 검색량이 여전히 문재인후보보다 높게 나오죠. 그건 아이패드나 신천지같은 검색어로 유입되는 박근혜 검색량이 엄청나게 늘어나서 그렇습니다. 반면에 문재인의 경우 TV 토론이란 검색어로 검색량이 늘어나는데 내용상으로보면 나쁘지 않죠.

    다만 문제는 어제는 특별히 어느쪽에 치우친 특별한 검색어 없이 박근혜의 검색량이 다시 늘어나면서 문재인과 차이가 벌어지고 있어요.

    아마 100만표 이내로 아슬아슬하게 질 거 같은데요....
  • 漁夫 2012/12/19 10:39 #

    잘 보았습니다.

    그런데 검색으로 뭘 알아볼 정도면 아마도 50대보다는 점차 젊은층에서 훨씬 비중이 있기 때문에, 이번처럼 연령별로 심각하게 편차가 있는 선거에서는 좀 편중된 결과를 내놓지 않을까 싶습니다. 박근혜의 핵심 동력이 50대 이상이기 때문에 웹 검색으로는 가려진 부분이 너무 많아 보여서 제 포스팅에서는 지난 번 언급하신 것을 보고도 방법론으로 채택을 하지 않았던 것이지요. (부정적 검색도 포함한다는 단점도 있습니다)

    연령 편차를 고려할 경우 문제가 되는 점이라면 휴대전화:핸드폰 비율인데, 이제는 8:2 정도로 해도 별반 문제가 없으리라 봅니다. 진짜 나이 많이 먹으신 양반들도 대개 휴대폰을 갖고 있다고 압니다(물론 지역별 편차까지는 저도...). 저 KBS 조사의 문제라면 비율이 1:1이란 것이지요.
  • Outis 2012/12/19 10:55 # 답글

    지금까지의 여론조사가 신뢰성이 상당히 낮다는 점에 비추어 볼 때, 여론조사에 의한 판세 분석도 적절치 않다고 판단됩니다.

    유세에 참여하는 사람수가 문재인 후보가 우세하다는 점에서 적극적이고 활동적인 지지층이 박근혜 후보에 비해 비교적 많다고 추측할 수 있습니다. 이런 활동적인 지지층이 주변 사람들에게 영향을 미친다고 한다면, 위에 말씀하신 여론조사의 지지도 차를 충분히 극복할 수 있지 않을까라고 조심스럽게 생각해봅니다.
  • 漁夫 2012/12/19 11:52 #

    '적절하지 않다'고 말하기에는 근거가 부족합니다.

    물론 결과를 정확히 예측하기에는 문제가 있습니다만, 그건 이번처럼 차이가 작은 여론조사에서는 언제건 그럴 수 있습니다. 저는 http://parkjonghee.wix.com/research 이 분의 방법론이 가장 적절하다고 봅니다. 극단을 제외하고 어느 정도에 수렴하는 값을 준다는 것은, 수치 자체도 어느 정도 신뢰성이 있음을 의미합니다. 이 부분에서 분명하지 않은 것은, 선거 전 한 주 동안 경향을 우리가 알 수 없다는 것이지요.
  • 누군가의친구 2012/12/22 00:16 # 답글

    지금 다시보니 다른건 몰라도 차이는 거의 일치했습니다.ㄷㄷㄷ
  • 漁夫 2012/12/22 00:53 #

    네. 모름/무응답이 거의 고르게 분배되었던 모양입니다.
댓글 입력 영역
* 비로그인 덧글의 IP 전체보기를 설정한 이글루입니다.


내부 포스팅 검색(by Google)

Loading

이 이글루를 링크한 사람 (화이트)

833

통계 위젯 (화이트)

169204
880
1247609