09

2012-Nov

투표소-유권자 거리 가까울수록 야권에 유리

작성자: 김한국 IP ADRESS: *.35.162.102 조회 수: 13255

‘투표소-유권자 간 거리’는 투표율에 영향을 미치는 주요한 요인일 것입니다.
그렇다면 이 둘 간의 거리를 연산하여 투표율과 상관성이 있는지 밝혀보도록 하겠습니다. 또한, 정당별 지지율과도 어떠한 관계가 있는지도 살펴보도록 하겠습니다.

투표소-유권자간 거리’를 정확하게 파악하려면 두 가지 정보가 필요합니다.

투표소의 주소정보와 모든 유권자의 거주지 주소정보를 알아야 합니다.

투표소의 주소정보는 중앙선관위에서 공개하고 있어 어렵지 않게 취득할 수 있습니다. 취득된 주소정보를 Geocoding (텍스트 주소를 지적도에 매칭하는 기술)하여 전자지도 상에 위치를 확인할 수 있습니다.


하지만, 유권자의 주소정보는 취득하는 것은 사실상 불가능합니다. 그래서 간접적인 추정 방법을 활용하여야 합니다. 일종의 시뮬레이션 작업인 셈이죠


BIZ-GIS.com에서 제공하는 XsDB 중 거주인구 Point가 있습니다.
(이 자료는 지적도 기반으로 추정된 인구데이터이며, 통계청의 통계정보를 활용하여 검증한 결과 90~95% 수준의 정확도가 있는 것으로 확인됐습니다.)

이 거주인구 Point를 투표권을 가진 유권자로 가정하겠습니다.
이제, 유권자별 투표소의 위치를 간접적으로 추정하는 과정이 남았습니다.
추정을 위해 다음과 같은 기준을 설정하는 것은 어떨까요?

합리적 기준: “유권자가 위치한 곳에서 가장 가까운 투표소를 해당 유권자가 투표하는 곳으로 가정”

투표소 대부분이 유권자의 접근성을 고려하여 합리적으로 위치한다는 전제 조건이라면 위 기준은 적절할 것으로 생각합니다. 다만, 골목 단위로 적용하여 검증한다면 세부적인 지역에서 오차가 있겠죠. 하지만, 전체적인 분석결과에 영향을 미치지는 않을 것으로 봅니다.

(이 검증 작업을 보다 객관적으로 진행하려면 무작위로 임의의 투표소를 선정하고 실제 그 투표소별 권역을 일일이 구축하여 위 기준과 비교하여야 합니다. 그래서 ‘추정치와 약 OO% 정도의 정확도 오차가 있다’ 라는 결과를 가지고 분석의 실효성을 따져봐야겠죠. 아마도 이런 검증은 전문적으로 연구하시는 분들의 몫일 것입니다.^^)

‘서울시 거주인구 데이터’와 ‘서울시 투표소 데이터’ 하나하나를 거리 연산하여 거주 인구별로 가장 가까운 투표소의 정보를 확인할 수 있다.

이해를 돕도록 아래 그림을 보겠습니다.
아래 지도는 은행의 고객을 가장 가까운 지점으로 연산한 결과를 보여줍니다. 고객들의 위치에서 가장 가까운 은행을 선으로 연결하였습니다. 방사선 형태로 펼쳐진 선들의 중심에 은행이 있습니다. 이러한 방법은 GIS 분석 때 자주 활용되는 분석 방법이기도 합니다.
가장 가까운 투표소로 연산하는 과정도 이와 같습니다.
1.jpg



다음 지도가 그 결과입니다.
붉은색 사각형이 투표구의 위치이며, 색으로 구분된 작은 Point들이 유권자들 분포입니다.
색이 같은 유권자는 투표구가 같다고 보시면 됩니다.
2.jpg



이제 투표소별로 유권자를 매핑하였으니, ‘투표소-유권자간 평균’ 거리만 계산하면 됩니다.
거리 연산은 GIS 툴로 간단하게 가능합니다.
여기서는 툴 사용법을 생략하기로 하겠습니다.

다음 표가 그 결과입니다.
3.jpg

19대국선_서울지역투표소-유권자-거리.xlsx   <- (실제 사용된 엑셀자료를 첨부하였으니 궁금하신 분들은 참고하시기 바랍니다.)


자 그렇다면 전체 평균을 Chart로 확인해보겠습니다.
4.jpg


당연한 결과와 재밌는 결과가 동시에 나타납니다.

당연한 결과는 투표소까지 거리가 가까울수록 투표율이 높다는 것입니다.
재밌는 결과는 거리별로 새누리당과 민주당의 득표율이 엇갈린다는 것입니다.

투표소까지 거리가 가까울수록 민주당에 유리하고 거리가 멀수록 새누리당에 유리합니다.
이는 다양한 해석이 가능합니다.

민주당 지지자들은 상대적으로 정당충성도(이런 표현이 올바른지 모르겠습니다.)가 낮은 것으로 보입니다. 즉, 투표소까지 거리가 멀면 투표를 포기하는 경향이 높다는 것이죠.
반면, 새누리당은 그 반대입니다.

위 표와 Chart를 식으로 표현하면 다음과 같습니다.
*y: 투표율   x: ’유권자-투표소’ 거리

 

 추세선 수식

 의미

 투표율 

 y=-0.0001x+0.5715 

 ‘유권자-투표소’ 거리가 100m 가까워지면 1% 증가 

 새누리

 y= 0.0002x+0.3834

 ‘유권자-투표소’ 거리가 100m 가까워지면 2% 감소

 민주당

 y=-0.0002x+0.4124

 ‘유권자-투표소’ 거리가 100m 가까워지면 2% 증가



보다 객관적이고 정량적인 수치를 도출할 수 있습니다.
좀 더 나간다면, 선거불편지역(거리가 멀어서 투표하기 어려운 지역)에 새로운 투표소를 만든다고 가정한다면 다음과 같은 시나리오가 가능합니다.

대부분 아래와 같은 현실적인 조건이 제시될 것입니다.
조건: "한정된 예산 때문에 신규 투표소 설치는 1,000개로 한정한다."

그렇다면, 다음과 같은 작업이 가능합니다.
1. 인구밀집지역 중 투표소 미설치지역 파악
2. 유권자 규모가 큰 순으로 1,000개 지역 List up
3. 해당 지역에 투표소가 설치됐다고 가정하고 위의 분석을 재차 실시
4. 추세선 식을 이용하여 투표율이 몇% 상승할 것인지 예측

추세선 식을 이용하여 각 정당의 득표율의 변화양상 측정도 가능하겠죠. 잘 모르겠지만, 특정 정당은 매우 싫어하지 않을까 싶습니다. ^^




정리하며....

위 분석은 간단한 GIS 분석으로 지난 국회의원 선거를 조금은 다른 각도에서 해석한 내용입니다.
이러한 분석의 근거를 기반으로 다가오는 대통령 선거를 이해하고 예측하는 것도 의미 있는 일이라 생각합니다.

또한, 각 정당도 이러한 객관적이고 과학적인 진단을 기반으로 자신을 지지하는 유권자의 특성을 이해하는 것도 중요할 것으로 판단됩니다.
더 추가적인 분석도 가능할 것 같은데, 정치적인 문제라 자칫 민감해질 수 있어 여기서 마무리 할까 합니다.



>> 활용 자료 <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
 - 19대 국회의원선서 투표구별 자료(정당비례투표자료) 중 서울지역만(출처: 중앙선관위 홈페이지)
 - 서울시 주거인구 Point(출처: BIZ-GIS.com)
profile

bintop

2012.11.19 13:51
*.209.144.91

정말 멋진 분석 같습니다^^ 유권자와 투표소와의 거리에 따른 지지율 변화와 지지 충성도까지 끌어 내시다니...적용 스킬도 대단하시지만..해석기법도 출중하십니다..그러나 거리와 지지율을 단순 비교하기엔 조금 낯선 느낌이 드네요!

1. 요즘 선거의 흐름이 예전의 선거흐름과는 상당히 다른것 같습니다 - 결정적 요소는 통신기기의 발달과 정보매체의 엄청난 증가

2. 선거는 여론의 흐름에 많은 영향을 받음

3. 지금의 여론은 분초를 나누듯이 출렁

4. 무당파 및 정치의 혐오성 증가

5. 따라서, 선거 전에 발생했던 이슈, sns에 노출빈도수, 웹사이트 인물 순위등 유기적 데이타를 사용함이 추세에 부합하지 않을까요?

6. 골수지지층들은 투표소가 어디에 붙어있든 투표하지 않을까요^^

profile

김한국

2012.11.19 19:41
*.246.72.66
말씀대로 지난번 선거부터 sns 가 제법 중요한 요인이 됐습니다. 이러한 자료까자 매핑이 된다면 참 좋겠죠^^
gis와 통계분석(모든 분석이 마찬가지겠지만)의 근본적인 한계는 과거를 기준으로 평가한다는 것입니다. 굉장히 중요한 포인트입니다. 과거 데이터로는 변화하는 시대의 흐름을 파악할 수 없습니다.
때문에, gis와 통계의 예측에는 한계가 있는 것이죠.
탁월한 분석가는... 아마도, 과거의 데이터와 사회적 변화 기류를 동시에 이해하여 발전적인 대안을 제시하는 사람일 것입니다.

그렇게 되기위해 많은 분석 경험을 쌓는 것도 필요하고... 분석한 결과를 다른 전문가들에게 검증하는 과정도 필요한 것 같습니다.

그리고 어떤 때는 gis 자체가 무의미한 경우도 제법 됩니다.
그럼에도 지도에 먼저 매핑하게 되는 건 직업병인 듯 합니다.

이번 대선 후 결과를 분석하면 기존 선거결과와 패턴이 유사한 지역, 변화한 지역이 발생할 텐데... 이 두 지역을 들여다 봐도 재밌을 듯 싶습니다.^^
List of Articles
번호 제목 글쓴이 날짜 조회 수
70 간단한 분석으로 입지전략 수립하기 file 황선영 2016-10-14 5578
69 땅따먹기 놀이를 백화점 상권분석 활용한다면... file 김한국 2016-08-04 4147
68 사드 위험 반경 분석(경북 성주 성산리) file + 2 김한국 2016-07-13 3883
67 보육시설 입지 및 주변 환경 분석 file + 3 황선영 2015-06-10 4480
66 Data 및 GIS 분석 서적 소개(데이터 분석과 저널리즘) file 김한국 2015-02-27 4962
65 Seoul Taxi, 2014 - 1 황선영 2015-02-26 2025
64 수자원관리 부문에서 수혜자부담원칙 경제적 평가에 관한 연구(Biz-Gis 연구지원) file 석사생 2014-11-21 2480
63 중원에서 힘 키운 진보, 동쪽으로 약진 file + 2 황선영 2014-06-20 3703
62 공공기관 정책지도 사례 file 김한국 2014-02-24 8154
61 최근 높아지는 공간정보의 활용 수요와 GIS 업계 file + 3 김한국 2014-02-21 6272
60 언론보도 GIS 활용사례 - 골칫거리 '멧돼지' 어느 동네서 자주 출몰? 73%가 이 지역 file 황선영 2013-10-12 7609
59 4.1 부동산 대책 진단 file + 1 김한국 2013-06-03 8629
58 지자체 상수도 업무와 GIS file 김한국 2013-06-03 8764
57 WindRose 다이어 그램을 이용한 시각화방법 file + 4 김한국 2013-04-24 13844
56 GIS활용, 부동산시장 흐름 읽어낸다 file + 1 황선영 2013-02-28 11954
55 승하차 인구 많은 서울 10개 노선 file 황선영 2013-02-28 11157
54 전국 노인정에 투표소 설치하면 여당이 불리! file + 5 김한국 2012-11-09 9752
» 투표소-유권자 거리 가까울수록 야권에 유리 file + 2 김한국 2012-11-09 13255
52 최근 이슈 검색어 매핑하기 - Twitter Map file + 3 황선영 2012-08-21 16558
51 보육소외지역 진단과 서울시의 국공립어린이집 추가공급지역 비교 + 1 박용재 2012-07-31 12377