‘투표소-유권자 간 거리’는 투표율에 영향을 미치는 주요한 요인일 것입니다.
그렇다면 이 둘 간의 거리를 연산하여 투표율과 상관성이 있는지 밝혀보도록 하겠습니다. 또한, 정당별 지지율과도 어떠한 관계가 있는지도 살펴보도록 하겠습니다.
‘투표소-유권자간
거리’를 정확하게 파악하려면 두 가지 정보가 필요합니다.
투표소의
주소정보와 모든 유권자의 거주지 주소정보를 알아야
합니다.
투표소의
주소정보는 중앙선관위에서 공개하고 있어 어렵지
않게 취득할 수 있습니다.
취득된
주소정보를 Geocoding
(텍스트
주소를 지적도에 매칭하는 기술)하여
전자지도 상에 위치를 확인할 수 있습니다.
하지만,
유권자의
주소정보는 취득하는 것은 사실상 불가능합니다.
그래서
간접적인 추정 방법을 활용하여야 합니다.
일종의
시뮬레이션 작업인 셈이죠.
BIZ-GIS.com에서 제공하는 XsDB 중 거주인구 Point가 있습니다.
(이 자료는 지적도 기반으로 추정된 인구데이터이며, 통계청의 통계정보를 활용하여 검증한 결과 90~95% 수준의 정확도가 있는 것으로 확인됐습니다.)
이 거주인구 Point를 투표권을 가진 유권자로 가정하겠습니다.
이제, 유권자별 투표소의 위치를 간접적으로 추정하는 과정이 남았습니다.
추정을 위해 다음과 같은 기준을 설정하는 것은 어떨까요?
합리적 기준: “유권자가 위치한 곳에서 가장 가까운 투표소를 해당 유권자가 투표하는 곳으로 가정”
투표소 대부분이 유권자의 접근성을 고려하여 합리적으로 위치한다는 전제 조건이라면 위 기준은 적절할 것으로 생각합니다. 다만, 골목 단위로 적용하여 검증한다면 세부적인 지역에서 오차가 있겠죠. 하지만, 전체적인 분석결과에 영향을 미치지는 않을 것으로 봅니다.
(이 검증 작업을 보다 객관적으로 진행하려면 무작위로 임의의 투표소를 선정하고 실제 그 투표소별 권역을 일일이 구축하여 위 기준과 비교하여야 합니다. 그래서 ‘추정치와 약 OO% 정도의 정확도 오차가 있다’ 라는 결과를 가지고 분석의 실효성을 따져봐야겠죠. 아마도 이런 검증은 전문적으로 연구하시는 분들의 몫일 것입니다.^^)
‘서울시 거주인구 데이터’와 ‘서울시 투표소 데이터’ 하나하나를 거리 연산하여 거주 인구별로 가장 가까운 투표소의 정보를 확인할 수 있다.
이해를 돕도록 아래 그림을 보겠습니다.
아래 지도는 은행의 고객을 가장 가까운 지점으로 연산한 결과를 보여줍니다. 고객들의 위치에서 가장 가까운 은행을 선으로 연결하였습니다. 방사선 형태로 펼쳐진 선들의 중심에 은행이 있습니다. 이러한 방법은 GIS 분석 때 자주 활용되는 분석 방법이기도 합니다.
가장 가까운 투표소로 연산하는 과정도 이와 같습니다.
다음 지도가 그 결과입니다.
붉은색 사각형이 투표구의 위치이며, 색으로 구분된 작은 Point들이 유권자들 분포입니다.
색이 같은 유권자는 투표구가 같다고 보시면 됩니다.
이제 투표소별로 유권자를 매핑하였으니, ‘투표소-유권자간 평균’ 거리만 계산하면 됩니다.
거리 연산은 GIS 툴로 간단하게 가능합니다.
여기서는 툴 사용법을 생략하기로 하겠습니다.
다음 표가 그 결과입니다.
자 그렇다면 전체 평균을 Chart로 확인해보겠습니다.
당연한 결과와 재밌는 결과가 동시에 나타납니다.
당연한 결과는 투표소까지 거리가 가까울수록 투표율이 높다는 것입니다.
재밌는 결과는 거리별로 새누리당과 민주당의 득표율이 엇갈린다는 것입니다.
투표소까지 거리가 가까울수록 민주당에 유리하고 거리가 멀수록 새누리당에 유리합니다.
이는 다양한 해석이 가능합니다.
민주당 지지자들은 상대적으로 정당충성도(이런 표현이 올바른지 모르겠습니다.)가 낮은 것으로 보입니다. 즉, 투표소까지 거리가 멀면 투표를 포기하는 경향이 높다는 것이죠.
반면, 새누리당은 그 반대입니다.
위 표와 Chart를 식으로 표현하면 다음과 같습니다.
*y: 투표율 x: ’유권자-투표소’ 거리
| 추세선 수식
| 의미
|
투표율
| y=-0.0001x+0.5715
| ‘유권자-투표소’ 거리가 100m 가까워지면 1% 증가
|
새누리
| y= 0.0002x+0.3834
| ‘유권자-투표소’ 거리가 100m 가까워지면 2% 감소
|
민주당
| y=-0.0002x+0.4124
| ‘유권자-투표소’ 거리가 100m 가까워지면 2% 증가
|
보다 객관적이고 정량적인 수치를 도출할 수 있습니다.
좀 더 나간다면, 선거불편지역(거리가 멀어서 투표하기 어려운 지역)에 새로운 투표소를 만든다고 가정한다면 다음과 같은 시나리오가 가능합니다.
대부분 아래와 같은 현실적인 조건이 제시될 것입니다.
조건: "한정된 예산 때문에 신규 투표소 설치는 1,000개로 한정한다."
그렇다면, 다음과 같은 작업이 가능합니다.
1. 인구밀집지역 중 투표소 미설치지역 파악
2. 유권자 규모가 큰 순으로 1,000개 지역 List up
3. 해당 지역에 투표소가 설치됐다고 가정하고 위의 분석을 재차 실시
4. 추세선 식을 이용하여 투표율이 몇% 상승할 것인지 예측
추세선 식을 이용하여 각 정당의 득표율의 변화양상 측정도 가능하겠죠. 잘 모르겠지만, 특정 정당은 매우 싫어하지 않을까 싶습니다. ^^
정리하며....
위 분석은 간단한 GIS 분석으로 지난 국회의원 선거를 조금은 다른 각도에서 해석한 내용입니다.
이러한 분석의 근거를 기반으로 다가오는 대통령 선거를 이해하고 예측하는 것도 의미 있는 일이라 생각합니다.
또한, 각 정당도 이러한 객관적이고 과학적인 진단을 기반으로 자신을 지지하는 유권자의 특성을 이해하는 것도 중요할 것으로 판단됩니다.
더 추가적인 분석도 가능할 것 같은데, 정치적인 문제라 자칫 민감해질 수 있어 여기서 마무리 할까 합니다.
>> 활용 자료 <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
- 19대 국회의원선서 투표구별 자료(정당비례투표자료) 중 서울지역만(출처: 중앙선관위 홈페이지)
- 서울시 주거인구 Point(출처: BIZ-GIS.com)
정말 멋진 분석 같습니다^^ 유권자와 투표소와의 거리에 따른 지지율 변화와 지지 충성도까지 끌어 내시다니...적용 스킬도 대단하시지만..해석기법도 출중하십니다..그러나 거리와 지지율을 단순 비교하기엔 조금 낯선 느낌이 드네요!
1. 요즘 선거의 흐름이 예전의 선거흐름과는 상당히 다른것 같습니다 - 결정적 요소는 통신기기의 발달과 정보매체의 엄청난 증가
2. 선거는 여론의 흐름에 많은 영향을 받음
3. 지금의 여론은 분초를 나누듯이 출렁
4. 무당파 및 정치의 혐오성 증가
5. 따라서, 선거 전에 발생했던 이슈, sns에 노출빈도수, 웹사이트 인물 순위등 유기적 데이타를 사용함이 추세에 부합하지 않을까요?
6. 골수지지층들은 투표소가 어디에 붙어있든 투표하지 않을까요^^