“바이든 우편투표 득표율, 통계적으로 이해 안 돼”…논란 가열

자카리 스티버(Zachary Stieber)
2020년 11월 9일 오후 4:44 업데이트: 2020년 11월 10일 오전 2:10

통계조작 잡아내는 ‘벤포드 법칙’ 위반 발견
미시간, 사전투표 바이든 지지율 최고 82%…
낮은 지역과의 평균이 85%로 오르는 기현상

 

미국 대선에서 ‘숫자’가 최대 쟁점으로 떠오를 전망이다.

민주당 조 바이든 후보의 득표율을 통계적으로 분석했을 때 나오는 수상한 숫자들이다.

2020년 미국 대선이 법정 다툼과 사기 의혹으로 얼룩지자, 미국 네티즌들은 ‘벤포드의 법칙’으로 선거 관련 통계를 들여다보기 시작했다.

‘벤포드 법칙’은 물리학자 프랭크 벤포드가 1938년 발표한 공식으로, 통계 데이터에서 조작된 숫자를 찾아내는 데 유용하게 쓰인다.

법칙은 매우 간단하다. 큰 규모의 데이터를 들여다보면 ‘시작 숫자’는 1이 제일 많고 그다음 2, 3, 4 순이라는 게 전부다. 시작 숫자는 맨 앞자리 숫자다. 예를 들어 763이라는 숫자가 있다면 시작 숫자는 7이다.

이 법칙에 따르면, 어떤 데이터를 분석했을 때 시작숫자의 빈도가 1>2>3>4 순이 아니라면 그 데이터는 조작됐을 가능성 높다.

이 법칙은 수학적으로 증명되지는 않았지만 경험적으로 잘 들어맞는다는 것이 발견돼 데이터의 진위 판별에 활용된다.

미시간 대학교 정치학과 월터 미베인 교수가 2009년 이란 선거에 부정행위를 찾아내는 증거로 사용됐다.(PDF 링크·영문) 일부 연구자들은 지난 2016년 대선 위스콘신 개표에서도 이 법칙으로 부정행위를 확인했다.

이제 2020 대선에서도 ‘벤포드의 법칙’이 다시 한번 가동하고 있다.

지난 6일, 온라인 저장소인 ‘깃허브’의 한 이용자는 2020년 대선을 통계적으로 분석한 글을 게시했다(트위터 링크). 대상 지역은 ▲조지아의 풀턴 카운티 ▲플로리다의 마이애미-데이드 ▲시카고 ▲밀워키 ▲펜실베이니아 알레게니 카운티였다.

그에 따르면, 조지아·플로리다에서는 대체로 법칙이 지켜졌지만, 위스콘신·일리노이·펜실베이니아에서는 바이든 쪽으로 상당히 기울어진 결과가 나타났다.

한 트위터 사용자는 밀워키의 개표 결과를 분석해, 4일 오전 3시 이후 나온 표가 통계적 관점에서 이상할 정도로 바이든에게 쏠렸다고 지적했다. 시간대에 따라 두 후보 간 득표율 격차가 40%포인트 이상 나기도 했다.(트위터 링크)

이와 관련한 에포크타임스의 논평 요청에 밀워키 카운티는 응하지 않았다.

펜실베이니아에서도 2가지 통계적 이상을 지적하는 글이 게재됐다.

한 블로그에 따르면 펜실베이니아주 개표 결과에서는 지난 4일 오후 9시께 선거구 3곳에서 트럼프 표 약 1만장이 삭제됐다(블로그 링크). 개표가 진행될수록 표가 적든 많든 늘어나야 정상인데, 오히려 표가 줄었다는 것이다. 이 결과를 그래프로 나타내면 브이(V)자로 감소 구간이 그려졌다.

이 블로그에서는 또한 6일 오전 9시께, 갑자기 2만7천표가 추가되면서 바이든이 트럼프를 역전하는 상황이 발견됐다고 했다.

에포크타임스는 이 현상에 관해 펜실베이니아 주 국무장관에게 문의했지만 즉각적인 답변을 얻지는 못했다.

현재 펜실베이니아는 개표가 진행 중인 가운데 바이든이 앞서고 있으며, 트럼프 캠프는 집계와 관련해 법적 소송을 제기한 상태다.

바이든이 근소한 차이로 앞서고 있는 미시간에서도 통계적 특이점이 나타났다.

대선 개표현황을 실시간으로 나타내는 사이트 ‘Decision Desk HQ’(DDHQ)는 지난 4일 오전 5시경 미시간주 개표상황을 업데이트했다. 바이든은 13만8339표가 추가됐지만, 트럼프는 0표 증가했다(트위터 링크).

통계적으로 상상하기 힘든 현상을 목격한 사람 사이에서는 “투표가 불법적으로 집계에 추가됐다”는 추측이 무성했다.

DDHQ는 약 40분 뒤 업데이트에서 바이든 표 11만796장을 빼고 트럼프에 1만6638장을 추가했다. 추후 “사무직원 실수” 데이터가 잘못 배포돼 수정됐다는 해명이 잇따랐다(트위터 링크).

또한 10분 뒤인 오전 5시 54분과 6시 5분 두 차례 업데이트에서는 두 후보 모두 표가 단 한 표도 늘어나지 않았다.

그러다 6시 18분 업데이트에서는 바이든이 15만8902표, 트럼프가 2만9295표 증가했다. 이 업데이트만 놓고 본다면 바이든의 득표율이 무려 85%로 치솟았다. 통계적으로 매우 이례적인 상황이었다.

일각에서는 이를 “바이든에게 유리한 부재자 투표함(우편투표 포함)을 개봉했기 때문”이라고 설명했다.

그러나 바이든 지지율이 가장 높았던 미시간주 와시트너 카운티 부재자 투표에서도 바이든의 득표율은 82%에 살짝 못 미쳤다. 득표수도 12만5927표였다.

이 표만으로는 6시 18분 업데이트에서 바이든이 얻은 약 16만표 보다 3만표가 부족하다. 따라서 지지율이 더 낮은 지역의 표가 합산되어야 한다.

지지율이 82%에서 떨어졌으면 떨어졌지 85%까지 올라갈 수는 없는 것이다.

이러한 통계학적, 논리적으로 모순된 집계 결과에 대해 미시간 주 국무장관 대변인은 에포크타임스의 질의에 응답하지 않았다.