본문 바로가기
정치시사Q

[대선 D-1]빅데이터 ESM 선거예측시스템, 이재명 압승 예측

by 예리성 2022. 3. 8.
반응형

[대선 D-1]빅데이터 ESM 선거예측시스템, 이재명 압승 예측

2022년 3월 8일(화), 드디어 대선 하루 전입니다. 우상호 충괄선대위원장은 1.5% 신승할 것으로 예상했고, 반면에 이준석 국민의힘 대표는 10% 이상 압승할 것이라고 자신감을 보여줬습니다. 언론은 대부분 박빙을 예상하고 있습니다.

이재명후보와 윤석열 후보의 유세현장/연합뉴스

빅데이터 전문가인 김상민 교수는 블로그를 통해 D-1 ESM 상세한 예측 수치 결과를 발표하려 하였으나 압도적인 표차를 발표할 경우 이재명 투표에 악영향을 준다는 의견이 있고 투표 마지막까지 선거운동을 독려하기 위해 최종 예측치는 내일 6시부터 카톨릭 평화방송 유튜브 채널 방송에서 발표하겠다고 밝혔습니다. 열린뉴스김상민TV블로그 내용을 살펴보겠습니다.

2022년 3월 8일, 이재명 후보 광화문 청계광장 유세

2022년 3월 8일, 이재명 후보 광화문 청계광장 유세/뉴시스

※ [대선 D-1]빅데이터 ESM 선거예측시스템 "이재명 이재명 당선..윤석열의 난 진압될것"- 김만배 육성녹음 막판 변수 "대장동 몸통 윤석열·박영수..법조 게이트 이재명 누명벗어"

[대선 D-1]빅데이터 ESM 선거예측시스템 "이재명 이재명 당선..윤석열의 난 진압될것"- 김만배 육성

이재명 후보의 마지막 유세 실시간 방송 ESM 빅데이터 선거 예측시스템으로 20대 대통령 선거를 예측할 ...

blog.naver.com

 
3일부터 여론조사 공표가 금지됨에 따라 사전선거가 시작되는 이제 빅데이터만이 대중이 알수있는 민심을 측정하는 유일한 바로미터가 되었다. 최근 선거 결과를 미리 예측하기 위해 수많은 여론조사가 쏟아지고 있다. 그러나 조사기관의 유무선 비율, 질문지 구성, 응답률에서 그 신뢰성에서 크게 의심받고 있다. 여론조사에서 낮은 응답률, 신뢰성없는 표본의 추출, 유도성 질문지, 특정 지지층의 과표집 등 많은 문제를 내포하고 있다. 또한 난립한 여론조사 업체에서는 향후에도 응답을 할 것인가라고 질문하여 기 응답자의 성향을 미리 수집 파악하여 의뢰자가 원하면 응답자 표본을 임의로 설계하여 의뢰자가 원하는 대로 돈만 지불하면 원하는 결과치를 얻어내는 것이 아닌가 의심된다. 즉 사실상 여론 조사가 아니라 여론조작 수준이다.

D-1, 3월 7~8일 1일간 구글 트렌드

3월7~8일 구글트렌드 비교

ESM 빅데이터 선거 예측시스템으로 20대 대통령 선거를 예측할 수 있을까?

여론조사가 과학적인 통계학에 바탕을 뒀다지만 족집게처럼 선거 결과를 알아맞히기만하는 것은 아니다. 여론조사는 자연과학을 예측할 때 측정하는 통계학 방법론을 그대로 채택하고 있지만 실제 선거 결과가 매우 다른 경우도 생기는데 지난 2016년 총선과 2020년 총선의 경우이다.

2020 년 총선에서의 예측과 실제 의석수 결과


2016년 총선에서 당시 모든 언론과 여론조사기관들은 집권당인 새누리당(현 국민의힘)이 압승을 거둘 것으로 예상했지만 개표 결과 가장 많은 의석을 차지한 당은야당이었던 더불어민주당 123석이었다. 또한 2020년 총선에서 190석에 달하는 미래통합당을 제외한 범여권의 표를 여러 여론조사를 거의 예측하지 못했다.

그러나 ESM은 거의 정확하게 득표율을 예측할 수 있었다. 기존의 여론조사가 채택하는 샘플링 기반의 빈도수를 측정하는 모수 통계학은 복잡한 인간의 심리를 측정하는 방법으로 부정확하기 때문이다. 반면 ESM은 비모수 베이지안 통계학에 기반한 인공지능 알고리즘으로 측정하여 여론조사 보다 더 뛰어난 예측을 할 수 있다.

2017 대선 ESM 예측, 갤럽, 구글, 최종 득표 분석


2017년 대선에서도 이와 비슷한 양상을 표시하고 있다. 당시 구글의 빅데이터를 주로 이용한 ESM 만이 정확한 예측을 하였다.

3일 안철수 후보가 단일화를 이유로 사퇴하고, 언론들은 이재명 후보와 윤석열 후보의 박빙의 선거 결과를 예측하고 있는 가운데 역대 선거에서 선거 결과에 근접한 예측을 해온 ESM 빅데이터 선거예측 시스템의 분석에 따르면 이재명 후보가 여론조사 기관의 발표와 달리 큰 차이로 승리하는 것으로 예상되고 있다.

최근까지 여론조사는 수십개의 여론조사 기관이 난립하고 같은 조사 방식에서도 조사 기관마다 여론 조사결과가 큰 차이를 보여 그 신뢰도가 크게 훼손된 상황에서 여론조사 공표까지 금지되면서 일반인은 빅데이터만이 선거 판세를 읽는 유일한 수단이 된 상황이다.

4일과 5일 실시된 20대 대선 사전투표에서 사전 투표율은 19대 사전투표율과 비교해 보았을 때 전국적으로 26.06%에서 36.93%로 10.87% 높은 투표율을 보였으며 전통적으로 민주당 지지가 높은 호남 지역에서는 전국 평균보다 훨씬 높은 50%대의 사전투표율을 보였다.

이는 진영간 결집을 보여주면서 한편으로는 이재명 지지층의 결집이 눈에 띄었다. 이같은 결과는 지역별 사전투표율과 빅데이터 상에서 나타난 이재명 후보에 대한 상관 관계를 통해 확인할 수 있다.

지역별 관심도와 사전투표율

5일 선관위가 발표한 16개 광역 시도별 사전 투표율을 살표보면, 구글트렌드에서의 이재명에 대한 관심도 순위 점수와 사전투표율과의 상관관계를 살펴보면 상관계수(1에 가까울 수록 상관도가 정비례하여 높고 -1에 가까울 수록 반비례하여 낮음)가 0.88로 매우 높은 상관관계가 있음을 알수 있다. 즉 다시말해 이재명 후보에 대한 결집이 윤석열 후보의 결집보다 훨씬 높다고 볼수 있다.

구글트렌드 지역별 관심도

그러나 선거 막판이 다가오자 지역별로 볼때 19대에서는 보수세가 강한 영남지역과 민주당 세가 강한 호남과의 격차를 12%에서 3.4%로 사전 투표율간의 격차가 좁혀 졌다. 즉 경북의 결집도를 보았을 때 보수의 결집도 상당 이루어져 사전투표가 끝나면서 부동층이 거의 사라지고 19대 대선에서 3자 구도로 인해 무효표와 기권표가 거의 사라지고 보수진영의 결집도 뚜렷해져 진영간 치열한 대결 양상이 관측된다.

막판에 전통적인 핵심 보수층에서 윤석열 후보가 박근혜를 특검으로 수사하여 45년형을 구형하고 이후 사면에도 반대한 것으로 알려지면서 대구 경북에서 박사모를 중심으로 보수층이 윤석열 지지에서 박근혜 지지로 이탈하는 모습이 뚜렷하다.

※ 박근혜 전 대통령 서포터즈 중앙회 김동렬 회장, 윤석열 ,권순일 등에 의한 사법피해자들의 이재명 대통령 후보 지지선언 기자회견

열린뉴스김상민TV 유튜브 채널


박근혜 전 대통령 서포터즈 29개 단체 대표인 김동렬 중앙회장은 4일 오후 국회에서 기자회견을 통해 "죄없는 박근혜 대통령을 일주일에 4번씩 수갑을 채워 전국민이 보는 가운데 재판장에 끌고 다녔고 1천명 애국동지들을 수사하여 약 2백여명을 구속시켰으며 이재수 장군외 6명을 자살케 하였고 단돈 1원한장 받지 않은 대통령을 45년 구형을 하고 빠른 시간안에 사저마저 경매 처분해 버린 야비한 인간이 대통령이 되어선 절대로 안된다"며 "무슨 일이 있을 때마다 측근들과 만나 폭탄주나 마시면 나라에 긴급한 일이 생겼을 때 술이 덜깬 상태에서 어떻게 바른 결단을 하겠습니까"라고 윤석열 후보를 절대 반대한다고 밝혔다.

그러면서 "지금의 대한민국 실정에는 강단있고 추진력 있고 위기에 강한 후보, 눈물밥을 먹어본 이재명 후보야 말로 국정을 잘 이끌고 가리라 확신한다"고 이재명후보에 대한 지지를 선언했다. 조원진 후보도 유세현장에서 선데이저널이 폭로한 윤석열 4시간 녹음 파일을 틀며 윤석열 후보에 대한 공세를 지속하고 있다.

호남에서는 그간 경선에서 이낙연 후보를 밀던 표가 이재명으로 주저하는 모습이었으나 투표일이 다가오자 호남에서 역대급의 결집이 일어나는 모습이다.

구글트렌드 관련 검색어


구글의 연관 검색어에서도 윤석열 후보는 대장동 게이트의 몸통이 윤석열과 박영수라는 김만배의 녹취록이 급등하고, 윤석열이 김정은의 버르장머리를 고치겠다는 호전적 발언, 이제까지의 말과 달리 자신이 페미니스트라는 워싱턴포스트와의 인터뷰, 선데이저널이 공개한 윤석열 후보의 박근혜 전 대통령에 대한 육성 녹취록, 가족의 일본의 극우 사이비 무속 종교 관련, 윤후보 측근의 남묘호렌게쿄 관련 의혹 등 연관 검색어가 급등하고, 이는 안철수와의 단일화 검색어 보다 관심이 높다.

또 본부장 리스크 관련, 일본 자위대의 한반도 진입도 가능하다는 윤석열 발언 등 부정적인 키워드 검색이 압도적으로 많다. 또 눈에 띄이는 것중에는 사전투표시 윤석열이 줄을 서지 않고 새치기한 것으로 알려져 이에 대한 검색량이 급등하는 모습이다.

이같은 부정적 검색으로 네이버와 유튜브 등에서 네이버 검색량이 증가하고 있으나 이는 윤석열에 대한 부정적 관심도로 윤석열에 대한 득표율 감소로 ESM에서 예측되고 이재명과 윤석열과의 격차를 더 벌리고 있다.

이재명 후보는 야당에서 시흥시 거북섬에 대한 특혜의혹을 제기함에 따라 검색어가 급등하였으나 여권에서는 근거없는 모략이라고 반박하고 있으며, 역대 대선에서 당선자만을 인터뷰했다는 타임지와의 인터뷰와 관련한 검색, 박근혜 전 대통령 박근령씨의 이재명 지지 등 상대적으로 윤석열 후보보다 긍정적인 키워드 검색이 많다.

네이버데이터랩 검색어트랜드


네이버 검색어 트렌드에서는 우크라이나,경제, 형수, 대장동 등 이재명에 대한 부정적 키워드 검색이 많으며, 윤석열에 대해서도 본부장리스크, 장모, 부인 김건희씨등 부정적 관련 검색이 압도적으로 많다. 네이버의 빅데이터가 구굴에 비해 실시간 제공, 데이터 처리량 등에서 구글 빅데이터에 미치지 못한다. 또 네이버에서는 보수 언론 다수를 차지하는 형편과 신천지 등 종교단체의 댓글 부대 동원 의혹 등 상대적으로 이재명 후보에 대한 부정적 댓글 비중이 압도적으로 높아 ESM 에서는 구굴 빅 데이터 분석을 주로 하였다.

대선 D-3, ESM 득표 예측 결과 


하이퍼 인공지능 예측시스템 ESM은 빅데이터에서 트렌드을 이용하여 선거결과를 예측할때 최종의 관심도가 아니라 기간중 시간을 X축으로 놓고 트렌드 관심도를 Y축으로 놓고 적분하고 최근 데이터에 가중치를 주는 방식으로 득표율을 예상하였다.

또 단순 트렌드가 아니라 연관 키워드 분석을 통해 키워드에 따른 지지율의 가감을 하고 네이버 검색 데이터를 보정하여 인공지능 예측 모델을 이용하여 정확한 예측을 기하였다.

ESM을 이용한 20대 대선의 최종 결과 사전투표가 역대 가장 높은 투표율을 보여주면서 부동층이 대체로 사라지고 양진영의 결집이 이루어 지면서 하이퍼 인공지능 예측시스템 ESM에 의하면

최근의 득표율 추이를 지속하며 뚜렷한 이재명의 압승을 예측하고 있다.

ESM 득표율 예측 추이


스피치로그로 본 이재명 후보의 당선 가능성

선거 예측 연구에 의하면 언급량 지표나 검색량 지표는 지지도와의 연계성이 있으며 언급량이 후보에 대한 관심도를 나타내 주는 것으로 지지도 지표로 연결될 수 있다.

미국의 연구에서도 언급량 지표는 미국의 경우 미국 하원 선거에서 406개 선거구중 404개의 선거구의 승패를 정확하게 예측한 바도 있다고 하고 있다. 또 미국 언론에 의하면 2016년 트럼프와 힐러리의 대선, 2020년 트럼프와 바이든의 대선에서 승리를 예측한 것이 관심도의 측정이었다고 한다.

최근 일주일간 스피치로그에서 분석한 이재명 후보와 윤석열 후보의 뉴스와 소시얼미디어에서의 언급량은 관심도 지표로 볼 수 있으며 주간 일간 평균 언급량이 이재명 후보가 윤석열 후보에 비해 약 10%가량 높다고 볼수 있다. 필자의 분석과 상당 부분 상통한다고 할 수 있다.

스피치로그 이재명, 윤석열 뉴스 발언량 비교


결론적으로 보면 D-16 부터 ESM 분석에 의하면 D-11일 부터 이재명 후보가 윤석열 후보에 비해 3.5% -> 7.0 -> 9%->10% -> 11%->8%로 득표율 격차를 벌이다 D-3일인 6일에는 경북, 경남, 울산에서 뚜렷한 윤석열 후보로이 결집이 사전투표가 끝나자 다시 이재명 후보로 관심도가 높아지면서 부동층이 점차 사라지고 양 후보간에 득표율 예측은 9% 로 격차를 벌렸다.

금일 D-1 ESM 상세한 예측 수치 결과를 발표하려 하였으나 압도적인 표차를 발표할 경우 이재명 투표에 악영향을 준다는 의견이 있고 투표 마지막까지 혼신의 힘으로 선거운동을 독려하기로 하기위해 최종 예측치는 카톨릭 평화방송에서 내일 6시부터 유튜브로 방송하기로 하였다.

이준석등 윤석열 캠프에서는 10%압승이라는 허구적인 수치를 발표하고 있으나 이는 압도적 열세를 감지하고 이재명 지지층의 투표포기를 유도하려는 수작으로 볼수 있다.

결론적으로 대장동 게이트의 몸통이 윤석열로 밝혀지고 이재명의 무고가 김만배 녹취록에서 확인됨에 따라 이재명 후보는 누명을 벗고 법조 카르텔이 주도한 윤석열의 난이 진압될 것으로 내일 대선에서는 압도적인 득표차로 오차범위 밖에서 이재명 후보의 당선이 확실시 되고 있다.

내일 카톨릭 평화방송 유튜브 방송에서 자세한 ESM 예측치를 발표할 예정입니다. 많은 시청 바랍니다.

※ [이기상의뉴스공감 Pick 인터뷰] 배종찬 "미래 100년 결정할 선거"…김상민 "막판 변수는 평화"

평화방송 이기상의 뉴스공감 유튜브 채널
728x90
반응형

댓글