
Detailed Information

서울시 인구이동패턴을 통한 지역 분석 : Extracting human dynamics from smart phone and transportation data
통신 및 교통 데이터를 활용한 멀티레벨 군집분석을 기반으로

Cited 0 time in Web of Science Cited 0 time in Scopus


Issue Date
서울대학교 대학원
학위논문(석사)--서울대학교 대학원 :환경대학원 환경계획학과,2020. 2. 김태형.
Because of the diversified lifestyles, the functions of urban areas also became various and their characteristics are rapidly changing. In order to cope with these changes, specific urban planning policies to each area had to be established quickly, but it was not easy to grasp the detailed characteristics of each region accurately. For this reason, the necessity of understanding the characteristics of the microscopic area has emerged through the pattern of human dynamics.
However, administrative statistics and surveys, which were mainly used in previous studies, are too far behind to represent real-time change. Therefore, studies using location-based big data are receiving attention, but no matter how big the data is, one kind of data is not enough to explain the pluralism of urban areas. In this study, based on the time-series patterns of the de facto and the mobile population during a day, the function and the characteristics of the region with similar patterns were analyzed.
The de facto population is based on Cellular LTE Signal Data and the mobile population, which is the number of people flowing into or out of the area at the time period, is based on smartcard and taxi pick-up and drop-off data. In order to classify regions with similar patterns in both the de facto and the mobile population for 24 hours a day, two- level of hierarchical clustering were conducted separately using the correlation coefficient as similarity measures. Five clusters were formed by the first-level clustering based on the de facto population pattern, then the second-level clustering was followed to classify the mobile population patterns of the regions belonging to the three largest clusters from the first-level clustering. As a result, a total of 11 subclusters were formed. ANOVA showed that the difference in the mean of each subcluster for the 25 variables that determine regional characteristics was statistically significant. Finally, the regional characteristics of each subclusters were interpreted based on the results of ANOVA.
The results of this study are as follows. First, it is revealed that both the de facto and mobile population repeat specific time-series pattern according to the regional characteristics. Secondly, even in areas with similar de facto population patterns, the mobile population may appear in a variety of different patterns. Areas with similar urban dynamics patterns for both populations have unique characteristics that distinguish them from other areas as summarized below.
1) Cluster1, where the de facto population is high between 8 am and 6 pm
- Subcluster1-1 : Traffic passing areas where people pass by as there is a main road connecting downtown Seoul
- Subcluster1-2 : Residential and recreational areas where keep the de facto population high due to the constant mobile population from 6 pm to 10 pm, as well as during the daytime
- Subcluster1-3 : Business center area where most of the mobile population flows in at 8 am, and flows out at 6 pm
- Subcluster1-4 : Business and recreational areas surrounding the business center district. There are peak inflows at 8 am and peak outflow at 6 pm, but the mobile population continues steadily throughout the day.
(2) Cluster2, where the de facto population is increasing from 8 am to 6 pm and reaches the highest peak at 10 pm : Nightlife areas where people stop by as they move between other areas. Major subway transfer stations are located in these areas.
3) Cluster3, where the de facto population is decreasing from 8 am to 6 pm and reaches the lowest point at 10 pm : natural recreational areas where people stay only during the daytime. Major Parks and hiking trails are located in these areas.
4) Cluster4, where the de facto population is low between 8 am and 6 pm
- Subcluster4-1 : Isolation areas with few mobile population due to poor transportation infrastructure
- Subcluster4-2 : Residential center areas where most of the mobile population flows in between 6 pm to 10 pm, and flows out at 8 am
- Subcluster4-3 : Transition areas located at the border of the residential center area. There are comparatively higher inflows from 6 pm to 10 pm and higher outflow at 8 am.
5) Cluster5, where the de facto population is high between 8 am to 6 pm and highest at 10 pm
- Subcluster5-1 : Residential and recreational areas where people stop by before taking the last mile mobility or their final destination due to the well-equipped transportation infrastructure. Surrounded by residential areas.
- Subcluster5-2 : Residential and nightlife areas located at the border of the residential area where residents spend their time
This study explicitly shows it is necessary to use data from various sources at the same time in order to accurate understanding of regional characteristics. Although the first-level clustering was conducted with the time-series pattern of the de facto population based on Cellular LTE Signal Data, various subclusters were distinguished within each cluster through the second-level clustering with mobile population based on mobility data.
Because of the term Big Data, it is believed that everything can be explained with just one big data. However, the complex use of different data is essential to capture the subtle differences between each urban space. This methodology can be used to establish detailed urban management policies by accurately understanding regional characteristics in the future.
개인의 생활양식이 다양해짐에 따라 도시지역의 기능 또한 다양하게 분화되었으며 동시에 그 성격이 빠르게 전환되고 있다. 이에 대응하기 위하여 각 도시지역에 특화된 도시계획정책이 신속하게 수립되어야 함에도 불구하고, 각 지역의 특성을 정확하고 세부적으로 파악하기조차 쉽지 않았다. 이러한 배경에서 시간에 따른 인구이동(Human Dynamics)의 패턴을 통하여 미시지역의 특성을 이해해야 할 필요성이 대두하였다.
하지만 기존의 연구에서 주로 활용하였던 행정통계자료나 설문조사는 실시간으로 달라지는 지역의 특성을 쫓기에 큰 시차가 있다, 그 때문에 위치기반 빅데이터을 활용한 연구가 관심을 받고 있지만, 데이터의 크기가 아무리 커도 한 종류의 데이터만으로는 도시지역의 다원성을 설명하기에 충분치 않다. 따라서 본 연구에서 하루 동안 나타나는 현주인구와 이동인구의 시계열 패턴을 바탕으로 유사한 형태를 보이는 지역의 기능과 성격을 세밀하게 관찰하였다.
이를 위하여 통신 데이터에 기반을 두어 현주인구의 규모를 구축하였으며, 스마트카드와 택시 승하차 데이터를 취합하여 그 지역으로 유입되거나 유출된 이동인구를 집계하였다. 하루 24시간 동안 현주인구와 이동인구 모두 유사한 패턴을 보이는 지역을 분류하기 위하여 상관계수를 유사성 척도로 하는 계층적 군집분석을 두 번에 걸쳐 실시하였다. 그 결과, 시간당 현주인구 변화를 바탕으로 1차 군집분석을 시행하여 총 5개의 군집이 형성되었으며, 이 중 규모가 큰 3개 군집에 속하는 지역들의 이동인구 패턴을 통하여 2차 군집분석을 한 결과 총 11개의 세부군집을 형성하였다. 지역특성을 결정짓는 변수 27개를 활용하여 전체 세부군집 간 평균의 차이가 있음을 일원배치 분산분석을 통하여 확인하였으며, 그 결과 총 25개의 변수에 대해서 통계적으로 유의한 차이가 있음을 보였다. 이후 세부군집의 특성을 분산분석의 결과를 바탕으로 해석하였다.
연구의 결과는 다음과 같다. 먼저 현주인구와 이동인구 모두 지역에 따라 고유한 패턴을 반복한다는 것을 확인하였다. 하지만 현주인구의 시계열 패턴이 유사할지라도, 그에 속하는 지역의 이동인구는 다양하게 다른 패턴으로 나타날 수 있다. 두 패턴을 모두 고려하였을 때에도 유사한 인구이동패턴을 보이는 지역은 서로 구분되는 고유한 특성이 있으며 그 내용을 아래와 같이 요약할 수 있다.
1) 현주인구가 8시부터 18시 사이에 높게 나타나는 군집1
- 세부군집1-1 : 서울 시내외를 연결하는 주요 도로가 위치해서 인구가 스쳐가는 교통통과지역
- 세부군집1-2 : 8시뿐 아니라 18시부터 22시까지 이동인구가 꾸준하게 발생하여 현주인구를 높게 유지되는 거주 및 오락기능지역
- 세부군집1-3 : 8시에 이동인구 대부분이 유입되어, 18시에 한꺼번에 유출되는 업무중심지역
- 세부군집1-4 : 8시의 유입인구와 18시에 유출인구가 대규모로 발생하지만 하루 종일 이동인구가 꾸준하게 이어지며 업무중심지구를 둘러싼 업무 및 오락기능지역
2) 현주인구가 8시부터 18시 사이에 증가하여 22시 사이에 높게 나타나는 군집2 : 주요한 지하철 환승역이 위치해서 다른 기능지역을 이동하던 중에 인구가 머물렀다가 가는 유흥기능지역
3) 현주인구가 8시부터 18시 사이에 감소하여 22시 사이에 낮게 나타나는 군집3 : 공원 및 등산로가 위치해서 주간에만 머무르는 자연휴양기능지역
4) 현주인구가 8시부터 18시 사이에 낮게 나타나는 군집4
- 세부군집4-1 : 교통기반시설이 잘 갖춰지지 않아 이동인구가 적은 교통고립지역
- 세부군집4-2 : 18시와 22시 사이에 인구가 유입되어, 8시에 한꺼번에 유출되는 주거중심지역
- 세부군집4-3 : 유입인구와 유출인구 모두 8시와 18시부터 22시 사이에 집중되고 주거중심지역의 경계지역에 위치한 주거전환지역
5) 현주인구가 8시부터 18시 사이에 높았다가 22시까지 더 높게 나타나는 군집5
- 세부군집5-1 : 주거중심지역 내부에 위치하지만 교통기반시설이 잘 갖춰져 있어서 사람들이 머물렀다 가는 주거 및 유흥기능지역
- 세부군집5-2 : 주거중심지역 외부에 위치하여 거주자가 주로 머무르는 주거 및 유흥기능지역
본 연구는 데이터의 종류에 따라서 보여줄 수 있는 지역의 특성이 상이하기 때문에, 다양한 출처에 기반을 둔 데이터를 동시에 활용해야지만 다원화된 지역의 특성을 정확하게 포착할 수 있음을 보였다는 것에 큰 함의를 가진다. 통신 데이터에 기반한 현주인구 시계열 패턴을 대상으로 1차 군집분석을 시행하였었지만, 교통 데이터 기반의 이동인구를 추가적으로 고려하자 동일한 유형 내에서도 서로 다른 세부유형이 구분되었다.
빅데이터라는 명성 때문에 데이터의 크기만 크다면 단 하나의 잣대를 이용하여 모든 지역을 설명할 수 있다고 믿어진다. 하지만 도시 공간에서 일어나는 활동이 얼마나 다채로운지를 고려해본다면, 본 연구와 같이 다양한 데이터를 동시에 활용할 필요성을 이해할 수 있다. 이러한 방법론은 향후 도시공간의 다양한 특성을 정확하게 포착하여 세밀한 도시관리정책을 수립하는데 활용될 수 있다.
Files in This Item:
Appears in Collections:


Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.
