적어도 일주일에 한번은 에세이에 관련한 글을 올리겠다는 다짐을 했었는데 바쁘다는 핑게로...^^
오늘 얘기할 내용은 GIS와 통계입니다.
주변에 GIS를 전공한 사람이 적지 않게 있습니다.
또한 통계 분석하는 사람도 적지 않게 있습니다.
하지만 GIS와 통계를 잘 결함하여 분석하는 사람은 거의 없습니다.
그렇다면 GIS와 통계는 무슨 관련이 있을까요?
자연과학 분야 GIS에서는 통계가 요구되는 경우가 많지 않습니다.
비가 내리면 물은 위에서 아래로 흘러갑니다. 이건 자연의 이치입니다.
때문에 수리수문 분석하는 사람들 입장에서는 물은 위에서 아래로 흐르는 것을 전제로 여러가지 알고리즘을 반영합니다.
하지만 인문사회분야 GIS에서는 사정이 좀 다릅니다.
예를들어 생각하면..
자신의 집에서 가까운 할인점이 2곳이 있습니다.
1km 떨어진 곳에 홈에버가 있고 1.5km 떨어진 곳에 이마트가 있습니다.
이 경우 모든 사람이 거리가 가깝다고 홈에버로 가지는 않을 것입니다.
이마트를 아주 좋아하는 사람의 경우 500미터의 거리차이는 중요하지가 않습니다.
하지만 이마트를 살짝 좋아하는 사람의 경우 500미터는 고민하게 만들 수 있는 거리입니다.
별 생각 없는 사람들은 홈에버로 갈 것이구요...
바로 이러한 인문사회학적인 요소들이 있기 때문에 "고객들은 반드시 가까운 곳에 있는 할인점을 이용한다"는 것을 전제로 분석을 할 수 없습니다.
아마도 "고객들이 할인점을 선택할 때 접근성을 어느 정도 고려한다"라는 전제를 이용하는 것이 무난할 것입니다.
그렇다면 "이 어느 정도"라는 것이 문제입니다. "할인점을 선택하는 결정 - 거리"간 의미있는 관계를 파악한다면 정량화된 매출액 수치 등을 추정해 볼 수 있습니다.
바로 이 역할이 통계의 역할입니다.
그렇다면 실제 GIS와 통계를 이용하여 의미있는 분석결과를 도출한 야쿠르트 사례를 살펴보도록 하겠습니다.
야쿠르트 사례는 (주)GIS United의 GIS 분석가들이 참여하여 수행한 프로젝트입니다.
야쿠르트가 판매하는 제품은 아래와 같습니다. 아래는 대표적인 제품만 나타낸 것입니다.
| |||||||||
전세계에세 유일한 야쿠르트만의 판매방식(야쿠르트 아줌마들에 의한 방판 판매)이 있습니다.
아실지 모르겠지만 야쿠르트 제품은 수퍼나 마트에서는 판매하지 않고 오로지 친숙한 야쿠르트 아줌마에의해서만 판매됩니다.
이를 방판판매라고 하는데 이러한 판매방식은 전 세계적으로 사례를 찾아보기 어렵습니다.
그리고 재밌는건 야쿠르트 아줌마들은 자신들만의 고유영역이 존재합니다.
이 고유 영역을 야쿠르트 아줌마들끼리 침범하지 않고 판매를 하고 있는 것이죠...
이 영역은 야쿠르트 본사가 아줌마들에게 일정 수익을 보장하는 차원에서 할당해준 영역이라 생각하시면 됩니다.
가령 어떤 야쿠르트 아줌마가 아직은 영업이 서툴러서 수익을 많이 내지 못한다면 돈이 잘벌리는 영역을 조금더 떼내서 그 아줌마 영역으로 편입시켜주고 일정 수준의 매출을 보장해줍니다.
국내 대형 편의점 본사가 편의점 점주의 판매권을 전혀 보장해주지 않고 동일 지역에 여러 개의 편의점을 오픈시켜주는 것에 비하면 야쿠르트는 참 인간적입니다. ^^
야쿠르트는 야쿠르트 아줌마들이 모두 동일한 급여를 받을 수 있게 배려를 해주는 방식으로 영역을 관리하고 있습니다.
달리 말하면 매출 평준화 정책을 사용하고 있다는 것이죠...
그런데 야쿠르트 본사에서는 궁금한게 있습니다.
매출과 해당지역 내 특징(아파트, 인구, 직장인수, 상가 등)간 상관관계가 있지 않을까?
위 질문에 대한 답을 찾기 위해 "GIS + 통계분석" 작업을 수행한 것입니다.
그렇다면 실제 분석 단계별로 살펴보도록 하겠습니다. 지역은 영등포 지역을 위주로 살펴보겠습니다.
1 단계 : 야쿠르트 영역을 구축하고 해당 영역내 인문사회정보(인구, 아파트, 상가수, 직장인수 등)를 매핑하여 통계분석
1) 종이지도에 그려져 있는 야쿠르트 영역을 디지타이징 작업을 통하여 GIS데이터화 한 그림입니다. (여의도, 영등포 지역)![]()
2) 상가, 인구, 아파트 등의 데이터를 위 영역에 공간연산과정을 통하여 붙였습니다. 아래는 특정 영역 내 정보를 조회한 화면이구요... 아래와 같은 정보가 야쿠르트 영역에 새롭게 추가됐다고 보시면 됩니다.
apt_hous: 아파트 새대수
hous_20u: 20평 미만 아파트 세대수
hous_20: 20평 미만 아파트 세대수
...
이런식의 데이터 입니다.![]()
3) 운이 좋은 경우 기존의 영역에다가 GIS 정보를 붙이는 것만으로 통계적으로 의미있는 결과가 나오기도 합니다.
이 경우 GIS분석은 그다지 중요하지가 않습니다. 오히려 통계분석능력이 중요합니다. ^^
아래 그림은 SPSS라는 툴을 이용하여 데이터를 로드한 화면입니다. 매출액과의 상관관계를 살펴보기 위해 상가개수, 학생수, 교직원수, 버스정류장수 등의 데이터를 로드한 걸 알수 있습니다.
![]()
4) 분석을 수행하고 상관관계를 살펴봤습니다. 아래 그림이 결과화면입니다.
| Correlations | ||
| 매출총계 | ||
| KT 상가 개수 | Pearson Correlation | 0.015 |
| Sig. (2-tailed) | 0.846 | |
| N | 161 | |
| 학생수 | Pearson Correlation | -.165(**) |
| Sig. (2-tailed) | 0.000 | |
| N | 451 | |
| 교직원수 | Pearson Correlation | -.144(**) |
| Sig. (2-tailed) | 0.002 | |
| N | 451 | |
| 버스정류장 | Pearson Correlation | 0.007 |
| Sig. (2-tailed) | 0.875 | |
| N | 451 | |
| 버스노선 | Pearson Correlation | 0.045 |
| Sig. (2-tailed) | 0.343 | |
| N | 451 | |
| H종업원수 | Pearson Correlation | .199(**) |
| Sig. (2-tailed) | 0.000 | |
| N | 451 | |
| apt_hous | Pearson Correlation | -.163(**) |
| Sig. (2-tailed) | 0.001 | |
| N | 451 | |
| hous_20u | Pearson Correlation | -.243(**) |
| Sig. (2-tailed) | 0.000 | |
| N | 451 | |
| hous_20 | Pearson Correlation | -.106(*) |
| Sig. (2-tailed) | 0.024 | |
| N | 451 | |
| hous_30 | Pearson Correlation | -0.024 |
| Sig. (2-tailed) | 0.616 | |
| N | 451 | |
| hous_40 | Pearson Correlation | 0.059 |
| Sig. (2-tailed) | 0.210 | |
| N | 451 | |
| hous_50 | Pearson Correlation | .163(**) |
| Sig. (2-tailed) | 0.001 | |
| N | 451 | |
| 인구 | Pearson Correlation | -.229(**) |
| Sig. (2-tailed) | 0.000 | |
| N | 451 | |
| 매출총계 | Pearson Correlation | 1 |
| Sig. (2-tailed) | ||
| N | 451 | |
| **. Correlation is significant at the 0.01 level (2-tailed). | ||
| *. Correlation is significant at the 0.05 level (2-tailed). | ||
| Correlations | ||
| 매출액지수 | ||
| 세대수지수 | Pearson Correlation | .710(**) |
| Sig. (2-tailed) | 0.000 | |
| N | 307 | |
| 상가지수 | Pearson Correlation | .889(**) |
| Sig. (2-tailed) | 0.000 | |
| N | 307 | |
| 직장인지수 | Pearson Correlation | .789(**) |
| Sig. (2-tailed) | 0.000 | |
| N | 307 | |
| 토탈지수 | Pearson Correlation | .970(**) |
| Sig. (2-tailed) | 0.000 | |
| N | 307 | |
| 매출액지수 | Pearson Correlation | 1 |
| Sig. (2-tailed) | ||
| N | 307 | |
| **. Correlation is significant at the 0.01 level (2-tailed). | ||

안녕하세요.
biz-gis.com 운영자입니다.
즐거운 커뮤니티 형성을 위해 노력하겠습니다.
만약 툴을 사용하셨다면 툴에 대해 설명해주실 수 있을까요?? 계속 찾던 기능이었거든요..ㅠ.ㅠ
부탁드려요..ㅠ.ㅠ 툴의 원리도 궁금해요..ㅠ.ㅠ