Publications

Detailed Information

지리정보탐색 기법을 활용한 트위터 데이터의 위치정보 분석 연구

DC Field Value Language
dc.contributor.advisor유기윤-
dc.contributor.author어승원-
dc.date.accessioned2017-07-14T04:19:21Z-
dc.date.available2017-07-14T04:19:21Z-
dc.date.issued2016-08-
dc.identifier.other000000136944-
dc.identifier.urihttps://hdl.handle.net/10371/124338-
dc.description학위논문 (석사)-- 서울대학교 대학원 : 건설환경공학부, 2016. 8. 유기윤.-
dc.description.abstractSNS 데이터는 사용자들의 일상적인 대화내용 뿐만 아니라 특정 지역에 관한 이벤트, 경제, 사회적, 산업적, 학문적 관점과 같은 복잡한 지식정보를 제공한다는 점에서 분석 활용가치가 뛰어나, 지리정보시스템(GIS) 분야에서도 꾸준히 연구되어 왔다. 그러나 극히 일부에 해당하는 지오태깅된 SNS 데이터의 수로 인해 분석 대상이 될 수 있는 데이터의 수가 부족해지는 현상이 발생해 왔다. 이러한 데이터의 비효율성으로 인해서, 지오태깅이 설정되어 있지 않은 데이터들은 분석대상에서 제외되어 연구 결과 도출을 위한 분석 범위에 포함시킬 수 없었다.
이에 본 연구에서는 지리정보탐색 기법(Geographic Information Retrieval)을 활용하여 사용자 개인이 생성한 단일 데이터가 의미하는 공간적 정보를 추출하는 기법을 제안하고, 이를 활용하여 데이터의 비효율성을 최소화하고, 분석에 활용될 수 있는 데이터의 수를 확장해 보고자 한다. 자연어처리(Natural Language Processing)와 형태소 분석, 그리고 자체 구축한 공간정보 사전(lexical resource)을 활용하여 트윗 데이터에서 공간적 단서가 될 만한 개체를 추출하고, 해당 개체들이 의미하는 후보 관심지점들을 도출하였다. 이를 기반으로 분석 대상이 되는 트윗 데이터가 의미하는 지리적 정보를 관심지역(Area of Interest, AOI)으로 표출하였다.
본 연구의 분석 수행 결과 분석 대상이 되는 트윗의 구문에 지명정보와 공간적 단서가 포함되었는지의 여부에 따라 5가지 유형의 트윗에서 위치정보를 추출할 수 있었다. 총 60개의 트윗 중 45개(75%)의 트윗에서 위치정보를 추출하여 데이터의 비효율성을 해소할 수 있었다.
-
dc.description.tableofcontents1. 서론 1
1.1. 연구 배경 및 목적 1
1.2. 연구 범위 및 방법 4

2. 이론적 논의 및 관련 연구 7
2.1. 지리정보탐색 9
2.1.1. 정의 및 수행과정 9
2.1.2. 자연어 처리를 통한 개체 탐지 11
2.1.3. 지명 정보의 명확화 18
2.2. 트위터(Twitter) 데이터 21
2.2.1. 트윗의 특징 22
2.2.2. 트윗의 공간적 단서 25

3. 지리정보탐색을 이용한 트윗의 위치정보 생성 기법 27
3.1. 트윗에서 개체 탐지 32
3.1.1. 자연어처리 32
3.1.2. 토픽 모델링 36
3.2. 지명을 포함한 후보 개체 집합 생성 39
3.2.1. 공간정보 사전 구축 39
3.2.2. 최소 편집거리 알고리즘을 활용한 시멘틱 매칭 42
3.2.3. 연관 키워드 조합을 통한 후보 개체 집합 형성 44
3.3. 후보 개체 집합의 위치정보 생성 47
3.3.1. 개체 집합의 위치정보(X, Y) 후보군 추출 49
3.3.2. 위치정보 후보군 간 유사도 측정 50
3.3.3. 계층적 군집 분석 51
3.3.4. 군집 지역 격자 생성 및 공간 조인 55

4. 실험 적용 및 결과 57
4.1. 지리정보탐색 수행 환경 57
4.2. 데이터 수집 및 전처리 59
4.3. 트윗 유형별 적용 결과 61
4.3.1. 지명정보가 서술되지 않은 트윗 61
4.3.2. 1개의 지명정보가 서술된 트윗 62
4.3.3. 1개의 지명정보와 상호명이 서술된 트윗 64
4.3.4. n개의 지명정보가 서술된 트윗 66
4.3.5. n개의 지명정보와 상호명이 서술된 트윗 68
4.4. 데이터의 비효율성 해소 결과 71

5. 활용 방안 75

6. 결론 80

참고 문헌 83

부록 90

Abstract 124
-
dc.formatapplication/pdf-
dc.format.extent8018333 bytes-
dc.format.mediumapplication/pdf-
dc.language.isoko-
dc.publisher서울대학교 대학원-
dc.subject지리정보탐색-
dc.subject공간정보 사전-
dc.subject시멘틱 매칭-
dc.subject관심지역-
dc.subject.ddc624-
dc.title지리정보탐색 기법을 활용한 트위터 데이터의 위치정보 분석 연구-
dc.typeThesis-
dc.description.degreeMaster-
dc.citation.pages124-
dc.contributor.affiliation공과대학 건설환경공학부-
dc.date.awarded2016-08-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share