20
2012-Jun
shp파일에서 랜덤하게 추출하기작성자: 김한국 IP ADRESS: *.131.108.77 조회 수: 8960
GIS 분석 작업을 하다보면 빅데이터(대용량 데이터)를 처리해야 할 때가 제법 많습니다.
특히나 거주 인구 등과 같은 정보는 1000만개 이상의 Point로 구성되어 있어 분석 작업 자체가 부담스럽습니다.
이런 경우 일부를 샘플링하여 분석할 필요성이 간혹있습니다.
작업 절차를 순서대로 말씀을 드리면...
1. 샘플링하여 추출한 데이터를 저장할 geodatabase를 생성합니다.
2. ArcMap에 샘플링할 대상 레이어를 추가합니다.(아래 그림에선 약 100만개 point로 구성된 고소득_위치 레이어입니다.)
3. Data Management Tools > Feature Class > Create random points
.
4. output Location에 1에서 만든 geodatabase를 선택합니다.
그리고 나머지 항목들을 적당히 설정합니다.
자세한 설정은 아래 문서 참조하세요.
5. 결과입니다.
6. 결과가 잘 나왔는지 한번 살펴보겠습니다. 녹색이 원본이며, 자주색이 샘플링한 결과입니다.
7. 검증을 위해서 하나를 선택하였습니다. 하늘색으로 보이는 것이 선택된 것입니다.
8. 좌측의 테이블이 원본입니다. 그리고 우측의 테이블이 샘플링한 결과입니다.
샘플링한 결과 테이블에 CID라는 것이 만들어졌습니다. 이 CID는 원본의 FID와 매칭이 됩니다.
샘플링 기능이 필요한 신 분들에게 도움이 됐으면 좋겠습니다. ^^