안녕하세요,
서울대병원 응급의학과에서 일하는 이의중입니다.
최근에 저희가 하는 프로젝트가 있습니다.
이름하여 심정지 환자 생존율 향상을 위한 지역사회 중재입니다.
연구 개요는
1.
저희에게 3년간 모은 심정지 환자의 발생 주소 자료가 있습니다. 이 주소로 위치를 지오코딩합니다.
지오코딩한 후 발생 위치의 100미터 버퍼를 생성하고,
그 위치에 있는 지리정보를 취득합니다. 이 때 취득할 정보는 건물의 용도(아파트, 쇼핑몰, 도로, 산 등)과 인구사회학적 정보(그 건물의 상주 인원, 유동인구, 65세 이상 인구의 비율 등)입니다.
취득한 정보를 independent variable로 하여 어떤 지역에서 환자가 발생할 relative risk가 높은지 분석합니다. 또한 앞으로 심정지 환자가 발생할 만한 지역을 예측합니다.
2. 심정지 환자가 발생한 지역, 또는 앞으로 발생할 지역을 예측하였다면 그 위치에 심정지 환자를 살릴 수 있는 효과적인 방법이라고 되어 있는 자동제세동기(심장충격기)를 설치합니다.
이 때 심장충격기를 설치할 지역과 설치하지 않은 지역으로 나눠서 randomized controlled study를 할 예정입니다.
그런데 이 과정에서 설치할 지역과 설치하지 않을 지역을 무작위로 배정하는 방법이 어렵습니다.
인터넷을 찾아보니 spatially balanced survey sampling과 관련한 자료는 있고, 이걸 이용하면 특정 지역(서울시)의 어떤 곳을 뽑아서 측정(대기오염등)을 해야 확률적으로 가장 타당한 측정이 되는지에 대한 자료는 있습니다.
그러나 저희가 하려는 것은 이거과는 다릅니다.
즉, 서울시 종로구의 어떤 지역에는 제세동기를 설치하고 어떤 곳을 제세동기를 설치하지 않아서 앞으로 관찰을 하면서 제세동기 설치후 생존율이 얼마나 높아질 수 있는지에 대한 그 효과를 분석하는 것입니다.
이 과정에서 종로구를 특정한 지역으로 나누고(예를 들어 300mX300m grid, 또는 행정동 또는 법정동 등), 그 나눠진 지역을 무작위로 제세동기 배치지역, 배치 않는 지역으로 나눠야 합니다.
그리고 결과적으로 그 두 지역의 지리적 특성(건물 용도, 비율, 인구특성)이 무작위로 배정한 후에 비슷해야지 제대로된 무작위 배정이라고 할 수 있습니다.
하지만 이런 개념을 가지고 진행한 연구를 찾기가 어렵네요.
일단 어느 정도의 단위로 나눠야 할지, grid 개념이 낫을지 행정동 법정동이 낫을지부터가 막막합니다.
어려운 이유는 grid 별로 나눴을때 그 grid내의 지리적 특성 원천자료를 구축하지 못하 가능성이 크며, 행정동 별로 나누면 그 지역의 범위가 너무 넓어져서 제대로된 무작위 배정이 되지 않을 가능성이 있습니다.
문제를 정리하면,
1. 지리정보 가운데 지오코딩된 좌표(포인트나 지적도상 위치)에 따른 건물용도, 인구사회학적 정보에 대한 자료원은 어떻게 구축할 수 있을까요? 구 단위의 인구현황 등은 통계청에 있지만 자세한 단위의 자료는 찾기 어렵네요.
오픈메이트 등 회사에는 있을 것도 같은데 정부 용역과제가 비용이 너무 적어서 예산상 어려움이 있습니다.
2, 위 자료를 바탕으로 지역을 임의의 단위로 나눠 무작위 배정을 해야 하는데 이렇게 할 수 있는 효과적인 방법이 있을까요?
질문이 매우 기네요.
여기 저기 찾고 고민하다가 이 사이트를 알게 되어 질문을 납깁니다.
혹시 도움을 주실 수 있는 전문가(학계, 회사 등)가 계시면 소개해 주시면 더욱 감사하겠습니다.
안녕하세요.
몇일 전 등록을 하고 부지런히 로그인해서 관련 자료와 정보를 검색하고 있는 GIS 관심자 입니다.
간단히 저의 의견을 말씀드립니다.
1. 무작위 배정 지역에 대한 의견
-> 연구자께서는 무작위/작위 지역 선정 이후 이 두 지역의 지리적 특성이 유사하기를 원하고 있습니다. 저의 짧은 식견으로는 1) 공간통계학적 기법의 사용(예: Geographical Weighted Regression, GWR)을 한번 사용해 보시면 어떨까 합니다. 2) 집계구 자료를 최대한 이용하시면 어떨까 합니다. 물론 조합문제(combinatorial problem)을 공간 단위에 연결해서 응용하시면 어느 정도 해결할 수 있을 듯 합니다. 또한 최적 입지를 탐색하는 문제도 해결 방안중의 하나일 것 같습니다.
2. 공간단위(spatial units)에 대한 의견
-> 아마도 이 문제는 영원히 해결할 수 없을 듯 합니다. GIS 공간분석에서 이러한 문제를 MAUP(Modifiable Areal Unit Probelm, 공간단위설정문제 ?)이라고 하는데 최적의 공간문제를 해결하는데 적합한 공간단위를 찾는다는 것은 불가능합니다. 대신 가장 오차가 적은 공간단위를 찾는 방법으로 고민을 해결하시는 편이 나을 듯 합니다. 이를 위해서는 1) 가능한 최소 공간단위를 이용하거나 (우리나라의 경우, 집계구가 현재는 가장 최소 단위) 아니면 2) 분석 기법 또는 알고리즘의 정교화를 추구해야 합니다. 2) 분석 기법의 정교화의 경우, 질문하신 분의 경우, 최대한 정교한 공간통계기법을 찾아보시는 것이 나을 듯 합니다.
3. 그리드 단위( xxx by xxx, 100m by 100m 등)
-> 위의 1번과 2번과 연관됩니다. 그리드 방법의 경우, 최소한 관련 사회경제적 자료를 이용하려면 포인트로 된 자료를 이용해야 되는데 저의 경험으로는 우리나라의 사회경제적 지리정보의 질과 제공 제한으로 인해 만족할 만한 결과를 얻지 못할 것 같습니다. 아니면 Areal Interpolation 방법을 가지고 집계구 자료를 토대로 추정하거나 최대한 얻을 수 있는 포인트 형태의 사회경제적 지리정보 자료를 바탕으로 그리드에 연결하여 분석할 수 밖에 없을 것 같군요. 즉 잠재 수요량 추정 방법이지요.
적고 보니 GIS 공간분석 전문가들이 주로 사용하는 용어를 마치 나열한 것 같아 죄송합니다.
저의 느낌으로는 어찌하면 될 것도 같은데... 위에 답변을 해 주신 분 처럼 어느 정도 현재의 우리나라 GIS 자료의 질과 제공 여부에 맞추어 본인이 심적으로 타협(?)할 수 밖에 없을 것 같습니다.
저도 항상 느끼지만 우리나라에서 인문사회적인 현상을 GIS로 분석할 때는 너무 큰 욕심을 버릴려고 합니다.
민간회사의 경우, 나름대로 축적한 자료를 가지고 마치 GIS를 활용하면 굉장한 분석이 된다고 하지만 막상 연구기관이나 학계의 경우, 이러한 자료 활용의 제한에 묶여 제대로 된 이론과 기법이 있음에도 불구하고 적당히(?) 타협할 수 밖에 없는 현실에 고민합니다.
연구 목적과 방법의 고민이 상당히 정교해서 저도 도움이 되었습니다.
기대하시는 분석 결과가 도출되시길 진심으로 기원합니다.
안녕하세요.
연구내용을 무척 소상하게 남겨주셨네요.
3번 정도 읽어 봤는데 이 분야의 문외한이라 정확한 내용을 파악하기 어렵습니다.^^
다만, 그동안 GIS 분석 경험을 통해 파악한 점을 몇 가지 말씀을 드려보면...
1. 초기에 세웠던 연구 방법론대로 연구가 진행되는 것은 매우 어렵다는 점입니다.
- 해당 연구를 진행하는 데 필요한 제반사항(데이터, 지오코딩 등의 기술)을 적절한 시점에 지원받기가 쉽지 않기 때문입니다.
- 또, 모델링과 예측을 기반으로 한 연구의 경우 실제 의미 있는 모델링 수치가 나오지 않은 경우가 대부분입니다.
(사회적인 현상을 몇 가지의 변수만으로 규정하려는 분석 자체의 무모함, 지리정보 데이터의 한계/특성을 파악하지 못하고 모델링을 수행하는 경우 등에 의해 의미있는 수치가 나오지 않음)
- 연구진행과정 중에 이러한 문제에 맞닥뜨리면 대부분 두 가지 의사결정을 하게 됩니다.
첫째. GIS 활용자체를 포기하는 경우
둘째. 형식적으로 GIS를 활용하는 경우
2. 때문에, 연구의 실질적인 (활용) 목적을 보다 선명하고 뚜렷하게 고민하는 것이 필요합니다. 이를 통하여 지속적으로 연구방법론을 수정 및 발전시키도록 하는 것이 효율적입니다.
- “통계적인 예측 방법론”만을 가지고 모델링을 하는 것은 위험(통계적 수치가 나오지 않을 경우)할 수 있습니다.
그래서 “정책적인 의사결정의 관점”에서도 접근을 해야 합니다.
- 예를 들면, 환자가 많은 곳을 매핑하여 분석을 하면 다음과 같은 함정에 빠지기 쉽습니다.
심정지 환자의 위치에서 반경 100m 반경 내 각종 지리정보를(인구, APT 가격, 상가수 등등) 추출하여 분석하면 “인구가 많은 곳에 심정지 환자도 많다.”는 결론에 도달하기 쉽습니다.
하지만, 이 분석 결과는 너무나 당연한 결과입니다. 인구가 많을 수록 환자가 많은 확률이 높아지기 때문입니다.
인구가 많은 곳에 상가도 많을 것입니다. 당연히 토지가격이나 APT 가격도 일정수준 이상이 될 것입니다. (물론 의미 있는 통계결과가 나올 수도 있습니다)
- 만약, 연구의 최종목적이 “심정지 환자 생존율 향상을 위한 심장충격기 설치”라고 한다면, 정책적 목표에 따라 다음과 같은 기준 설정이 가능할 것입니다.
*과거 심정지 환자 발생이 빈번한 지역부터 심장충격기를 설치하는 방안
=> 심정지 환자 위치 매핑을 통한 지역 선정
*심정지 환자 발생이 빈번하면서도 인근에 응급의료센터가 없는 지역에 우선 설치하는 방안
=> 심정지 환자 위치 매핑과 응급의료센터(또는 병원) 접근성을 고려한 지역 선정
*이번 정부의 보건의료분야 정책이 빈곤층에 우선순위를 두고 있다고 하면(가정한다면) 소득이 낮은 지역에 우선 설치하는 방안
=> 토지가격이나 APT 가격 정보 등을 통해 연구지역의 소득 지수를 개발하고 소득이 낮은 지역 중 심정지환자 발생이 높은 지역(또는 가능성이 큰 지역)을 중심으로 우선 설치하는 방안
3. 각 학문의 전문가들이 GIS를 의미 있게 활용하려 했을 때, 첫 번째 장애물은 안타깝게도 GIS 전문가(GIS 업계)들의 태도와 자세입니다.
GIS 전문가들이 해당 연구과제의 해법을 찾아내는 데 목적을 두지 않고 “금액이 얼마인지” 이후에 솔루션 프로젝트(구축 비용이 높은)로 발전할 가능성이 있는지”를 먼저 파악하여 지원하는 것이 현실입니다.
때문에, 연구비용은 적지만 GIS를 결합하였을 때 의미 있는 성과물이 나올 수 있는 연구를 지원하는 사례는 많지 않습미다. 안타까운 일이 아닐 수 없습니다.
GIS가 진정 그 활용 가치를 인정 받기 위해서는 GIS 외부의 전문가들에게 GIS 가능성을 인정받는 것입니다. 그렇기 때문에 금전적인 이해타산을 떠나 의미있는 연구를 지원하는 것은 꼭 필요한 일입니다.
4. 연구에 목적에 맞게 지오코딩된 좌표에 따른 건물용도, 인구사회학적 정보에 대한 자료를 구하는 것이 가능합니다.
제일 궁금한 내용일 텐데요.
우리나라의 행정동은 3000여개 입니다. 통계청이 이를 기준으로 통계자료를 발표하고 있습니다.
문제는 전국을 3000여개로 나눈 통계 수치가 의미는 있지만 국지적인 연구범위인 경우 분명히 한계가 있습니다.
다행히 통계청이 지난해 집계구 단위의 통계데이터를 공개하였습니다.
집계구의 개수가 10만개 정도입니다. 산술적으로만 계산하면 지금의 행정동 수준보다 30배 이상 정교합니다. 당연히 지리정보 형태로 공개를 했구요.
집계구의 통계 수치는 엑셀파일로 첨부했으니 확인해보세요.
집계구별 통계 제공항목코드.xls
(통계청에 요청하여 제공 받으시면 됩니다. 그 과정이 번거로우시면 GIS 유나이티드(창업 준비 중인 회사)에서 확보하고 있는 데이터를 제공해드리겠습니다)
제 판단이지만 집계구 데이터를 이용하면 하시려는 연구의 많은 도움이 될 것으로 생각합니다.
5. 데이터만 확보한다고 해서 GIS 분석이 원만하게 이뤄지지는 않는 것 같습니다.
이번 연구를 진행하는 데 GIS 분석가들의 역량이 필요하시면 언제든지 연락을 주시기 바랍니다.
(저희가 의료분야 전문가가 아니기 때문에 저희의 역할은 하시고자 하는 연구가 보다 수월하게 진행될 수 있도록 약간의 지원 정도 일 것 같습니다)
현재 주변의 GIS 전문가들과 창업을 준비하고 있습니다. 새로운 회사를 설립하면서 합의한 것 중 하나는 "의미있는 연구에 대해서는 돈을 바라지 않고 지원하자"라는 것입니다.
그리고 최근에 의료관련한 분석 작업을 지원한 적이 있습니다. 그 일부 결과물은 저희 동료인 황선영씨가 GIS 에세이란에 올렸구요.. http://www.biz-gis.com/19012 참고헤보세요.
사무실은 여의도 CCMM(국민일보) 빌딩이니 방문하셔도 되구요. 문의하실 것이 있으시면 언제든지 연락주세요. 김한국 010-8613-8033