GIS/gis로 시각화 자료 만들기

Geocoding지오코딩_2. Geocoding 활용하기

조달송 2021. 1. 20. 21:49
728x90

urbn-ds.tistory.com/9

 

Geocoding지오코딩_1. Geocoding 프로그램 다운받기

 이런저런 데이터를 찾다보면, 데이터를 친절하게 shp파일로 제공하여 Qgis나 Arcmap에서 바로 열 수 있게 제공해주는 경우도 있지만, 리스트를 던져주고 알아서 쓰라는 경우도 많다. 만약 학교와

urbn-ds.tistory.com

앞선 포스팅에서 지오코딩 프로그램을 다운받았다. 이번 포스팅에서는 지오코딩을 활용하는 방법을 설명하도록 하겠다. 지오코딩 프로그램 중에서는 bizGIS에서 제공하는 Geocoding Tool(v20.10.15)를 활용하였다. 

 


1. 원하는 주제의 데이터 중 주소가 포함된 데이터 다운로드(엑셀파일, txt파일 등)

서울시 내 고등학교의 위치를 지도위에 표현하고 싶다고 가정하자. 필자는 서울시내 데이터를 확인할 때 종종 이용하는 서울열린데이터광장에서 검색을 하여, 아래 링크의 데이터를 다운 받았다. 엑셀파일 형태의 .xlsx 파일로 받았고, 엑셀로 열어 보면 파일에는 교육청, 소재구, 학교명, 홈페이지 주소, 고등학교유형(설립유형, 자율고 등의 유형, 남녀공학과 같은 유형), 우편번호, 주소, 전화번호 등등 꽤 자세한 데이터가 포함되어 있다. 

data.seoul.go.kr/dataList/OA-12061/S/1/datasetView.do

 

서울시 고등학교 현황

서울교육통계시스템에서 제공하는 서울시 소재 고등학교 현황 통계 자료입니다.

data.seoul.go.kr

2. 정확한 주소가 포함되어 있는지 확인

고등학교 데이터는 주소가 하나의 열에 포함되어 있지만, 어떤 데이터의 경우에는 도로명 주소와 지번 주소가 함께 작성되어 있고 몇몇 주소는 비어있는 경우가 있다. 그럴 경우 지오코딩 과정에서 누락되기 때문에 도로명 주소이든 지번 주소이든 하나의 열에 주소를 정확하게 기입해주는 작업이 필요하다. 

3. csv 파일로 저장하기

지오코딩 프로그램에서 지원하는 파일 형식은 .txt, .csv, .xls, .xlsx로 필자는 보통 .csv를 이용한다. csv파일은 엑셀에서 다름이름으로 저장하기 할때 파일 형식을 csv로 저장해주면 된다. 

4. 지오코딩 프로그램 실행, 좌표계 설정

지오코딩 프로그램을 실행하고, 가장 먼저 해야할 것은 좌표계를 설정하는 것이다. Geocoding Tool에서는 카텍과 TM중부, 경위도, UTMK를 좌표계로 설정할 수 있는데, 필자의 경우에는 그냥 EPSG 코드가 명시되어 있는 TM중부로 설정한다. 

5. 파일 불러오기 및 지오코딩 실행

다음으로는 지오코딩을 실행하면 된다. 파일로 처리하기를 클릭하면 아래와 같은 화면이 뜬다. 아까 저장한 csv파일을 클릭하면, 그 파일의 열 중 어떤 열이 주소에 대한 열인지 지정하는 창이 뜬다. 보통 칼럼명을 주소로 해두면 자동으로 인식하지만, 다른 이름으로 해두었을때는 한번 더 확인할 필요가 있다.

 

6. 지오코딩 완료 후 데이터 확인

지오코딩이 완료되면 아래의 창이 뜬다. 친절하게 Shp 파일을 만들어주기도 하고 지도에서 확인하게 해주기도 하지만 필자의 경우에는 폴더열기를 해서 제대로 변환이 안된 데이터가 있는지 한번 더 확인하는 과정을 거친다. '폴더열기'를 하여 확인하면 지오코딩으로 인해 .add파일과 .err파일이 뜬 것을 확인할 수 있다. 우리가 봐야할 것은 .add 파일로 이 파일은 더블클릭해서 열리지 않고, 엑셀에서 열어주어야한다. 두번째 사진에서 보듯이, 파일형식을 모든 파일로 설정하여 add파일을 열어주어야 한다. 

7. add 파일 확인 

add 파일을 클릭하면 텍스트 마법사가 뜬다. 1단계에서는 기본으로 설정되어 있듯이 원본데이터 형식을 구분 기호로 분리됨으로 선택하고, 다음을 눌러준다. 2단계에서는 어떤 구분기호로 구분되어있는지 입력시켜주는 것인데, 아래 데이터 미리보기 창에서 데이터가 제대로 구분되어 있으면 다음을 눌러주면 된다. 그리고 3단계는 데이터 서식을 지정하는 것이라 딱히 여기서 설정해줄 필요는 없다. 파일을 열고 오른쪽 열 방향으로 데이터를 보면 원본 데이터에서 입력주소와 x, y, clss, PNU, 주소구분 등 새로운 열들이 생성된 것을 확인할 수 있다. 이 과정에서 확인해야 할 것은 CLSS로 정좌표가 아닌 좌표에 대해서는 수작업이 필요하다. 다행히 이 데이터에서는 모두 정좌표로 변환이 되었고, 만약 정좌표가 아닌 인근좌표나 시군구 좌표 등으로 변환된 데이터가 있다면 네이버지도나 카카오지도를 키고 그 지점에 대한 주소를 정확하게 검색한 후 지오코딩 프로그램에서 한건씩 처리하기로 좌표를 추출하여 x, y 좌표 부분을 수정해주면 된다. 

 

8. 다시 csv파일로 저장 후 GIS 프로그램에서 열기

이제 GIS 프로그램에서 불러들이기 위해 다시 csv 파일로 저장해준다. 앞서 했듯이 하면 된다. 이때도 까먹지 말고 파일명에 어떤 좌표계를 썼는지 EPSG 코드로 써주자. 이제 GIS 프로그램을 켜고 이 데이터를 불러와보자. 레이어-데이터 원본 관리자를 켜서 '구분자로 분리된 텍스트' 탭을 누르면 아래와 같은 창이 뜬다. 이때 방금 저장한 csv 파일을 불러오고, 도형 정의에서 포인트 좌표를 클릭하여 x좌표와 y좌표에 대한 열을 지정해준다. 이때도 보통 자동으로 되니 크게 걱정할 필요는 없다. 그리고 도형 좌표계 또한 아까 지오코딩할때 했던 EPSG:5174로 설정해준다. 그리고 추가를 눌러주면 두번째 사진과 같이 고등학교 위치에 점이 찍혀있는 것을 확인할 수 있다(배경지도는 잘보이기 위해 필자가 임의적으로 깔았다.). 이렇게 하면 완료이다. 기존에 통일시키던 좌표가 있으면, 좌표계를 다시 다른이름으로 저장해서 통일하려는 좌표로 꼭 설정하자. 

이 일련의 과정은 이래저래 활용이 많이 되는 것이라 많은 도움이 되면 좋겠다.

반응형