MIT 박사 연구팀 “미시간서 최소 6만9천표 조작 흔적 발견”

한동훈
2020년 11월 15일 오전 4:03 업데이트: 2020년 12월 13일 오후 10:55

미국 명문 공과대학인 MIT(매사추세츠 공과대학) 박사 출신이 이끄는 연구팀이 이번 미국 대선 개표과정에서 조작 흔적을 발견했다고 주장했다.

시바 아야두라이(Shiva Ayyadurai) 박사팀은 지난 12일(현지 시각) 자신의 트위터에 “분석 결과에 따르면, 미시간주에서 컴퓨터 알고리즘이 6만9천표를 이전한 것 같다”고 썼다.

앞서 지난 10일 시바 박사는 자신의 유튜브 채널에서 대선 투표 데이터 분석 과정을 생중계했다. 영상은 당일 조회수 20만 이상을 기록했다.

그는 미시간주 카운티 총 80여곳 중 인구가 가장 많은 웨인, 오클랜드, 매콤, 켄트 등 4곳의 데이터를 분석해 3곳에서 비정상적인 데이터를 관측했다고 밝혔다.

트럼프 대통령 표를 6만9천표 줄이고 바이든 표가 6만9천표를 늘려 총 13만8천표의 득표차를 발생시킨 프로그램 조작 흔적을 찾아냈다는 것이다.

또한 공화당 지지도가 높은 지역일수록 비정상적인 데이터가 많이 포착됐다고도 했다. 이 같은 조작이 공화당 우세 지역을 주로 겨냥했음을 시사했다.

현재 개표율 99%인 미시간에서 두 후보 간 득표차는 14만6천표다. 개표 조작이 선거인단 16명의 판세를 좌우했을 가능성까지 점쳐진다.

 

어떻게 분석했나?

미국 대선은 상·하원 선거 등과 동시에 치러진다. 올해도 마찬가지였다.

대선을 통해 대통령 후보의 득표율을, 상·하원 선거를 통해 정당에 대한 지지율을 알 수 있다.

이때 투표와 개표가 정상적으로 진행됐다면 한 선거구에서 대선 후보 득표율은 정당 지지율과 비슷하게 나타난다. 일반적으로 A정당을 지지하는 유권자는 A당 대선 후보에 투표하기 때문이다.

시바 박사는 이 점에 착안했다.

먼저 투표와 개표가 정상적으로 진행됐을 경우의 결과를 그래프로 시각화했다.

<그래프 1> 정상적인 투표 결과(선거구 1곳) | Dr. Shiva Ayyadurai 유튜브

위 <그래프 1>에서 Y축은 ‘트럼프 득표율에서 공화당 지지율을 뺀 값’(이하 격차 값)이다. 트럼프 득표율 > 공화당 지지율이면 격차 값은 플러스(+), 그 반대면 마이너스(-)가 된다.

X축은 그 지역의 공화당 지지율이다. 왼쪽으로 갈수록 낮아지고 오른쪽으로 갈수록 높아진다(공화당 우세 지역).

파란색 점은 선거구다. 위 그래프에서 파란 점의 좌표는 (60%, 5%)다. 그 선거구의 공화당 지지율이 60%, 격차 값 5%이라는 의미다.

가운데 빨간색 수평선은 격차 값 0% 기준선이다. 이번 대선은 트럼프의 인기가 공화당 지지율보다 높았다. 따라서 파란색 점은 대체로 빨간 선 위쪽에 그려져야 한다.

<그래프 2> 정상적인 투표 결과(선거구 25곳) | Dr. Shiva Ayyadurai 유튜브

위 <그래프 2>는 선거구가 25곳에서 대선과 상·하원 선거가 정상적으로 진행됐을 경우를 나타냈다.

파란 점이 빨간 선 위아래에 위치한다. 격차 값(트럼프 득표율에서 공화당 지지율을 뺀 값)은 ±7% 이내다. 둘의 차이가 크지 않다는 의미다.

파란 점(선거구) 25개는 빨간 선 아래에 10개, 위에 15개 찍혔다. 각각 트럼프 득표율이 공화당 지지율보다 낮거나 높은 경우다. 실제로 대선기간 여론조사에서 트럼프 개인 지지율은 공화당 지지율보다 높았다.

또한 파란 점들은 수평으로 늘어선 형태를 보인다. 그 지역 공화당 지지율이 높거나 낮으면, 트럼프 득표율도 오르고 내려 차이가 상쇄되므로 격차 값은 늘 ±7% 정도로 유지된다.

예를 들어, 어떤 지역의 공화당 지지율이 12%면 트럼프 득표율 10%이며, 지지율 60%면 득표율 65% 같은 식이다. 언제나 격차 값은 ±7% 정도가 나와야 일반적이다.

 

미시간주 카운티 4곳 실제 집계 결과

그렇다면 실제 집계 결과를 분석한 그래프는 어떻게 그려졌을까.

<그래프 3> 오클랜드 카운티 전체 선거구에서 사전투표 집계 결과 | Dr. Shiva Ayyadurai 유튜브

위 <그래프 3>은 인구 125만명(2019년 기준)인 오클랜드 카운티 전체 선거구에서 사전투표 집계 결과를 나타낸다.

그래프 왼쪽 부분, 공화당 지지율(X 좌표) 0~20%인 지역은 통계적인 이상이 관측되지 않는다.

‘트럼프 득표율-공화당 지지율'(Y좌표)은 10% 이내다. 트럼프의 개인적 지지율이 공화당 지지율보다 7% 정도 높다는 기존 관측과 잘 맞아떨어진다.

프로그램에 의한 조작 흔적이 보이지 않는다. 공화당 열세 지역이니 손댈 필요 없었다는 해석도 가능하다.

<그래프 4> 오클랜드 카운티 전체 선거구에서 사전투표 집계 결과를 정상구간(왼쪽)과 비정상구간(오른쪽)으로 비교했다. | Dr. Shiva Ayyadurai 유튜브

그래프 중앙 부분(<그래프4> 오른쪽)부터 오른쪽으로 갈수록 파란색 점은 하향 곡선을 그리며 통계학적 이상을 나타낸다. 특히 공화당 지지율(X 좌표) 40~60% 구간에서는 격차 값(Y좌표)이 마이너스 10~25%로 추락했다.

공화당 지지율이 높아질수록, 즉 오른쪽으로 갈수록 파란색 점이 하향하는 추세를 나타냈다. 또한 일정한 기울기로 직선이 그려졌다.

이는 공화당 우세 지역일수록 바이든에게 더 많이 투표했다는 비정상적 결과를 의미한다. 공화당 지지율 60% 지역에서는 공화당을 찍은 3명 중 1명이 바이든에게 투표했다는 식이다.

만약 공화당 지지자들이 트럼프에 실망해 바이든을 찍더라도 일정한 추세가 나타나는 것은 통계학적으로 불가능하다. 파란 점이 붉은 선 아래에 무작위로 분포해야 한다.

시바 박사는 이를 일정한 규칙과 비율에 따라 표 조작이 이뤄진 흔적이며 왜곡된 데이터만이 일직선 배열을 나타낸다고 지적했다.

그는 공화당 지지율이 20%를 넘으면 자동으로 트럼프의 표를 줄이는 알고리즘의 작용이라고 봤다. 공화당 지지율이 높아질수록 트럼프 득표율이 떨어지는 기현상이 발생했다는 것이다.

미시간주 오클랜드 카운티의 집계 결과. 왼쪽은 사전투표, 오른쪽은 대선 당일 투표를 나타낸 그래프다. 모드 같은 추세선이 나타난다. 투표 완료 후 집계 과정에서 같은 알고리즘에 따른 조작이 가해졌음을 추론하게 하는 부분이다. | Dr. Shiva Ayyadurai 유튜브

 

미시간 최대 인구 밀집 지역, 웨인 카운티는 왜 빠졌나

시바 박사 연구팀은 미시간주의 인구수 상위 4개 카운티를 대상으로 분석했지만, 3곳에서만 이런 결과가 나타났다.

나머지 1곳, 인구 185만(2019년 기준)의 미시간 최대 카운티이자 디트로이트시를 포함한, 민주당 콘크리트 지역인 웨인 카운티에서는 개표 조작의 흔적이 발견되지 않았다.

실제로 시바 박사가 분석한 웨인 카운티 집계 결과에서는 파란색 점(각 선거구) 대부분이 공화당 지지율(X축) 15% 이내 구간에서 머물렀다.

미시간 주 웨인 카운티의 집계 결과를 분석한 그래프. 통계적 이상이 나타나지 않았다. | Dr. Shiva Ayyadurai 유튜브

눈길을 끄는 것은 이 그래프에서 트럼프의 득표율이 공화당 지지율보다 평균 10% 이상 높게 나타났다는 점이다. 조작의 흔적이 없는 상황에서 실제 트럼프의 득표율이 어떻게 나타나는지 확인 시켜 줬다는 평가가 나온다.

 

결론

시바 박사는 유튜브 분석 영상에서 “집계 과정에 문제가 많다”며 집계 소프트웨어는 모든 코드가 투명하게 공개돼야 하고, 전자계표기가 스캔한 이미지 파일을 삭제하지 말고 보관해야 한다고 했다. 투표지 폐기이므로 연방법 위반이라는 것이다.

그는 지난 10일 트위터에 이 결과를 알리며 도널드 트럼프 대통령과 민주당 조 바이든 대선후보를 향해 “(분석 결과를) 비판적이고 투명하게 함께 검토할 용의가 있다”며 선거의 투명성 확보를 위한 공동 조사를 제안했다.

한편, 시박 박사는 과학자겸 발명가, 공학자로 생명과학과 컴퓨터 과학분야 전문가다. 그는 오늘날 사용되는 이메일 시스템의 개념을 처음 구상한 것으로 알려지기도 했지만 일각에서는 일방적인 주장이라는 지적도 나온다.

이번 연구분석에는 데이터 분석가 겸 소프트웨어 공학자인 베니 스미스, 클렘슨 대학의 공학자 겸 데이터 분석가 필 에반스가 참여했다.