공간제약 동적 커뮤니티 탐지법:시간대별 지역 간 흐름 데이터에 기반한 서울 생활권 분류에 적용
Abstract
Exploring functional regions by considering spatial interactions beyond administrative boundaries is crucial for understanding urban structures. However, existing studies that use community detection methods face limitations in deriving spatially continuous communities and capturing temporal variations. To address these gaps, this study introduces a "spatially constrained dynamic community detection method." First, spatially disconnected components of a community are either separated into independent communities or relocated to one of the spatial neighborhoods, based on the increase in modularity. Second, we apply temporal smoothing techniques to derive stable communities for each period. Third, we examine the evolutionary process by visualizing the identified evolving events. A case study using phone-based mobility data in Seoul over a 24-hour period was conducted to verify the proposed method. The results show that this method can effectively detect robust living zones and support systematic tracking of the evolution of individual communities in interaction with other communities.
Keywords:
Community Detection, Spatially Constrained Algorithm, Temporal Smoothing, Living Zone, Functional Regions키워드:
커뮤니티 탐지, 공간제약 알고리즘, 시계열적 평활화, 생활권, 기능지역Ⅰ. 서 론
특정 도시 현상을 설명하기 위해 적절한 공간 단위를 설정하는 것은 문제를 이해하고 진단하고, 분석하며, 해결책을 찾기 위한 첫걸음이다(이상일 외, 2012; 김을식 외, 2015). 그동안 도시계획가들은 도시문제 해결을 위한 도시정책 전개 과정에서 행정구역을 중심으로 한 경계 설정의 모호성을 꾸준히 지적한 바 있다. 이에 도시계획, 도시경제, 지리학 등 공간 관련 학문 분야에서는 도시 경계를 넘어 실질적인 사람, 물자, 경제활동의 범위를 고려하여 권역을 설정할 필요가 있다고 보고 공간적 상호작용을 고려한 기능지역(functional region)의 탐색을 강조했다.
Brown and Holmes(1971)가 정의한 “외부와의 연결보다 서로 간의 상호작용이 더 긴밀한 지리적 집합체”라는 기능지역의 정의에 따라 다양한 스케일에서 발생하는 여러 공간 상호작용에 대해 다양한 방식으로 기능지역을 구획하고 식별하는 연구가 수행되었다. 도시 내 스케일에서 생활권(하재현·이수기, 2016; 김규혁 외, 2021; 조윤·성현곤, 2021; 하정원 외, 2024)과 택시사업구역의 설정(김규혁·송태진, 2022) 문제뿐만 아니라, 도시 간 스케일에서 지역노동시장권(고영우 외, 2020; 이상호·고영우, 2015)이나 통근권, 주택시장지역(이상일 외, 2012; 구형모, 2012; Brown and Hicks, 2008)을 넘어 초광역권(박경현 외, 2022; 박경현 외, 2023), 기능적 경제권(박소현 외, 2020)을 설정하는 데까지 다양하게 확장되었다.
다양한 공간구획 방법론 중 최근 기능지역 식별을 위해 가장 많이 활용되고 있는 방법은 네트워크 과학 분야에서 개발된 커뮤니티 탐지법(community detection)이다. 이 방법은 강한 내부적 응집성과 최소한의 외부적 상호작용이라는 기능지역 고유의 정의에 부합하면서도 연구자의 임의적 판단을 최대한 줄이면서 복잡한 공간적 상호작용 패턴 속에서 기능지역을 식별할 수 있다는 장점이 있어 국내외 다양한 기능지역 식별 연구에 활용되고 있다(Farmer and Fotheringham, 2011; Zhong et al., 2014; 하재현·이수기, 2016; 권규상 외, 2019).
하지만 기능지역 식별 방법으로서 커뮤니티 탐지법은 크게 두 가지 한계를 지니고 있다. 첫째, 커뮤니티가 공간적으로 분리되거나(spatial discontinuity), 극단적으로 매우 작은 커뮤니티가 도출될 가능성이 있다. 대부분의 커뮤니티 탐색법은 비공간적(aspatial) 알고리즘에 기반을 두어 내부의 강한 응집성과 같이 목적함수의 최적화를 통해 지역을 식별하기 때문에 멀리 떨어진 두 지역이 하나의 커뮤니티를 형성하는 경우가 종종 발생한다. 둘째, 목적함수를 최적화하는 과정에서 시간대별로 통행량 변동이 존재하기 때문에 시계열적으로 다양한 구조의 커뮤니티가 도출될 수 있다.
도시계획 차원에서 정책집행의 공간 단위로 기능지역을 활용할 경우 공간적 분리나 시간적 변동은 매우 성가신 문제이다. 도시 계획이나 정책사업은 공간적으로 인접한 지역을 대상으로 중장기적 관점에서 수행되는 것이 일반적이기 때문이다. 정책을 집행할 단위가 공간적으로 나뉘어 있거나 매 시기 그 단위가 변한다면 명확한 정책 방향을 수립하기 어렵다. 특정 시간대 자료를 활용하여 도출된 커뮤니티 탐지 결과를 신뢰하기 어려울 뿐만 아니라, 만약 시간대에 따라 커뮤니티가 변화하는 양상을 포착하고자 한다면 그 동적인 진화 과정을 어떻게 탐지할 것인지 분석 방법이 명확하지 않다. 따라서 커뮤니티 탐지법의 장점은 최대한 살리면서 위 한계를 극복할 새로운 방법론이 필요하다.
본 연구는 기능지역 식별에 사용된 커뮤니티 탐지법의 한계를 극복하기 위해 “공간제약 동적 커뮤니티 탐지법(spatially constrained dynamic community detection method)”을 제안한다. 본 연구에서는 공간적 분리와 시간적 변동을 두 가지 방법으로 돌파한다. 첫째, 커뮤니티의 주된 지역들과 공간적으로 분리된 공간 단위는 공간제약 조건을 반영하여 독자적 커뮤니티로 분리하거나 인접 커뮤니티로 재분배할 새로운 할당 방식을 제시한다. 둘째, 시간대별 커뮤니티 결과를 종합한 ‘컨센서스 네트워크(consensus network)’를 작성하고 컨센서스 네트워크 내에서 커뮤니티를 구획함으로써 시계열적으로 안정된 커뮤니티를 도출하고 이를 바탕으로 커뮤니티의 진화 과정을 탐색한다. 본 연구는 제안된 방법론을 2024년 서울시 생활이동 데이터를 활용한 서울시 생활권 분석에 적용함으로써 기계획된 서울시 생활권 및 기존 방법론과의 차이를 비교하고 그 효용성과 함의를 제시한다.
이를 위한 연구구조는 다음과 같다. 우선 2장에서는 기능지역 식별에서 커뮤니티 탐색법이 활용된 선행연구들을 검토하고 다양한 연구들에서 공간적 분리와 시간적 변동이 나타나고 있음을 보이고자 한다. 특히 커뮤니티 탐지법을 공간연구에 적용하는 과정에서 이를 극복하기 위해 제안된 여러 대안적 방법을 폭넓게 검토하고 본 연구에서 제안한 방법이 갖는 함의를 제시한다. 3장에서는 본 연구에서 제안하는 방법론의 특성과 구조를 설명한다. 4장에서는 제안한 방법론을 활용한 서울시 생활권 구조의 시간대별 변화를 검토하고, 기계획된 생활권 계획과 타 연구 결과와 비교하여 그 차이와 함의를 제시한다. 마지막으로 결론에서는 연구 결과를 요약하고 향후 연구 방향을 제안한다.
Ⅱ. 선행연구 고찰
1. 기능지역 도출을 위한 커뮤니티 탐지법
기능지역을 식별하는 것은 사람, 상품, 서비스 등 다양한 사회경제적 활동들의 공간적 상호작용 특성과 그 범위를 이해하는 데 매우 중요하다. 일찍이 도시계획이나 지리학 분야에서는 기능지역 식별의 중요성을 인식하고 이를 도출하기 위한 다양한 방법론을 개발했으며, 요인분석법(factor analysis), 지역노동시장권(local labor market area) 탐색법, 지오컴퓨테이션 기법 등 공간적 상호작용에 기반하여 기능지역을 도출하는 방법이 주로 활용되었다(권규상, 2019).
그중에서 최근 국내외에서 활발히 사용된 기능지역 분석 방법은 네트워크 과학에 기반을 둔 커뮤니티 탐지법이다. 커뮤니티 탐지법은 복잡하고 규모가 큰 네트워크 내에서 노드들을 그들 간 링크 강도에 따라 몇 개의 집단인 커뮤니티로 구분하는 방법이다(Newman and Girvan, 2004). 특히 커뮤니티 탐지법은 세밀한 공간 단위의 상호작용 정보를 포함한 이른바 플로우(flow) 빅데이터가 다수 공개되면서 이를 효율적으로 처리하고 분석할 수 있는 도구로서 최근 도시 및 공간연구에서 주목받고 있다.
커뮤니티 탐지법이 도시 및 공간연구에 도입된 것은 대략 2000년대 후반과 2010년대 초반 사이로 Farmer and Fotheringham (2011)의 연구가 대표적이다. 그들은 기존 활용되었던 여러 지역설정 방법(예: 지역노동시장권 분석법, 계층적 클러스터링 등)이 연구자의 주관적인 판단에 지나치게 의존하고 이론적 토대가 없어 지역설정의 결과가 현실을 적절히 반영하는지 판단할 수 없다고 주장했다(Farmer and Fotheringham, 2011). 기존 방법의 대안으로 그들이 제시한 것이 바로 커뮤니티 탐지법이다. 이는 커뮤니티 내부의 연결 밀도는 최대화하고 커뮤니티 간 연결 밀도는 최소화하는 네트워크 분할을 찾는 과정으로써 Brown and Holmes (1971)가 제시한 기능지역의 정의와 직관적으로 부합한다. 그뿐만 아니라, 적합한 지역식별을 위한 통계적 기준이 명확하고, 하나의 공간 단위를 하나의 기능지역으로 분류하며, 연구자의 임의적 판단에 의존하는 파라미터가 없는 등 다양한 장점이 있다(Farmer and Fotheringham, 2011; 권규상, 2019). 이러한 커뮤니티 탐지법의 유용성을 받아들여 이후 도시 및 공간연구자들은 지역노동시장권의 설정(Kropp and Schwengler, 2016), 주택 시장의 설정, 도시 및 지역 공간구조의 탐색(Zhong et al., 2014) 등에 커뮤니티 탐색법을 활발히 활용하였다.
국내에서도 다양한 주제와 스케일에서 기능지역을 도출하기 위해 커뮤니티 탐지법이 활용되고 있다. 도시 내 스케일에서는 생활권 도출에 가장 많이 사용되었다(하재현·이수기, 2016; 김규혁 외, 2021; 하정원 외, 2024; 조윤·성현곤, 2021; 전병윤 외, 2021; 전병윤 외, 2022; 김수현 외, 2020; 이지민·이수기, 2023). 예를 들어 하재현·이수기(2016)는 처음 커뮤니티 탐지법을 국내 공간연구에 도입하면서 커뮤니티 탐지 알고리즘 중 하나인 인포맵(infomap)을 가구통행실태조사 자료에 적용하여 공간 위계에 따라 서울시 생활권을 구분하였다. 그 결과 2020 서울도시기본계획과 비교했을 때 커뮤니티 탐지법을 사용할 경우 실제 시민들의 일상생활 패턴에 근거하여 객관적으로 생활권을 구분할 수 있음을 제시하였다. 최근에는 모바일 데이터를 사용하여 택시사업구역을 설정하는 문제(김규혁 외, 2021; 김규혁·송태진, 2023), 주거 구역의 탐지(유재성, 2021) 등에도 활발히 사용되고 있다. 도시 간 스케일에서는 특히 다양한 목적통행에 기반한 (대)도시권 및 초광역권 구분 연구(변필성 외, 2020; 박경현 외, 2022; 박경현 외, 2023), 통행뿐만 아니라 카드 매출데이터 등 다양한 데이터를 활용하여 인구감소지역 특별법상 생활권(이원도·유수동, 2023)을 탐색한 연구, 기업 간 거래망을 고려하여 기능적 경제권을 구분한 연구(박소현 외, 2020) 등이 수행되었다. 특히 최근에는 빅데이터에 기반하여 목적 통행별, 다양한 공간 상호작용 흐름별, 다양한 집단별로 기능지역을 구분하는 연구로 확장되고 있다.
2. 기존 커뮤니티 탐지법의 한계
커뮤니티 탐지법을 사용하여 기능지역을 구분하는 기존 연구들이 직면하는 가장 큰 문제점은 커뮤니티의 공간적 분절과 시간적 변화에 대한 탐지의 어려움이다(Farmer and Fotheringham, 2011; Chen et al., 2015; Guo et al., 2018; Wang et al., 2021; Zhao et al., 2023).
공간적 분절은 Farmer and Fotheringham(2011)이 기능지역 식별에 커뮤니티 탐지법을 도입하였을 때부터 지적된 문제였다. 커뮤니티 탐지법은 비공간적 방법론으로 거리 조락과 같은 공간적 제약조건을 반영하고 있지 않기 때문에 공간적으로 분리된 지역들이 같은 커뮤니티에 속할 수 있으며, 과도하게 크거나 작아 특정 규모를 충족하지 않는 커뮤니티가 나타날 가능성도 있다.1) 하지만 실천적 측면에서 기능지역을 계획수립 및 정책집행, 평가의 단위로 삼는 경우 이는 매우 성가신 결과다. 정책은 기본적으로 정책을 개발하고 집행하는 특정한 공간 단위에서 작동하기 때문에 공간적 분절은 그 자체로 의미가 있더라도 정책 단위로 기능하지 못하기 때문이다. 또한 너무 작은 커뮤니티는 그 자체로 의미 있는 공간적 배열의 결과라기보다 목적함수 극대화 과정에서 나온 부산물일 가능성도 크다. 즉 약간의 목적함수 향상만 있다면 어떻게든 노드를 움직이거나 둘을 서로 다른 커뮤니티로 분리하는 것이 더 나을 수 있기 때문이다. 약간의 모듈성(modularity) 손실을 감수하더라도 공간적으로 연속된 커뮤니티를 얻을 수 있다면 정책집행에서 얻는 이익은 그 이상이 될 수 있다.
시간적 변동 탐지의 어려움은 우선 시간적 불안정성에 기반한다. 커뮤니티 탐지법은 시점별 투입된 네트워크를 활용하여 알고리즘별 특정한 목적함수를 최적화하는 분할을 찾는 방식이다. 이 과정에서 특정 노드를 다른 커뮤니티로 옮기는 것이 목적함수를 개선하는 것으로 나타난다면 커뮤니티 구조가 바뀔 수 있다. 문제는 지역 간 상호작용을 다루는 공간 데이터에서 다음과 같은 이유로 인해 이런 상황이 매우 빈번하게 발생한다는 점이다. 첫째, 지역 간 상호작용은 대체로 완벽하게 측정한 데이터가 아니라 일부 데이터를 바탕으로 추정한 데이터이기 때문에 시점별 추정마다 오차가 발생할 수밖에 없다. 둘째, 지역 간 상호작용은 상대적으로 규모가 작은 지역 간에는 그 흐름이 매 시기 변동성이 심하다는 특징이 있다. 특히 모듈성 기반 커뮤니티 탐지법은 관측된 연결강도 대비 기대 연결강도의 차이가 극대화되도록 커뮤니티를 탐지하는데, 상호작용 강도가 약한 노드들은 관측된 연결 강도와 기대 연결 강도의 차이가 작아서 약간의 관측 연결 강도 변화에도 민감하게 반응한다. 셋째, 특정 시기에 발생한 어떤 사건이 영향을 미치기도 한다. 일례로 코로나로 인해 지역 간 상호작용은 특정 지점에는 매우 크게 영향을 미쳤다가 다시 회복되기도 하는데 그 자체가 주된 분석 대상이기도 하겠지만 일시적 변동 혹은 측정 시기의 차이가 너무 과도하게 영향을 미치기도 한다. 이러한 변동성은 크게 두 가지의 문제를 유발하는데 첫째, 도출한 커뮤니티 결과를 신뢰하기 어렵고, 둘째, 기준점이 부재하기 때문에 커뮤니티의 진화 과정을 탐색하는 데도 어려움을 겪는다.
3. 대안적 방법론
비공간적 방법인 커뮤니티 탐지법 적용 시 식별된 기능지역이 공간적으로 분절될 수 있어 정책평가 및 의사결정의 어려움을 초래할 수 있다는 점은 이미 많은 연구에서 인식 되어왔다. 여러 연구가 이를 극복하기 위해 다양한 방법을 제안 및 활용했으며 그 대응은 크게 두 가지로 구분된다.
첫째, 공간적 제약조건을 목적함수에 투입하는 것이다. 이는 대개 모듈성 기반 탐지 방법론에서 활용된 방식이다. 두 노드 간 관측된 연결강도와 랜덤 네트워크를 가정한 영 모델(null model)을 통해 추정한 연결강도 간 차이를 극대화하는 모듈성 함수 내 관측 강도에 거리 조락 특성을 부여하거나(Farmer and Fotheringham, 2011; Chen et al., 2015), 두 노드 간 연결 강도를 추정하는 영 모델에 공간적 인접성과 거리 조락 등 공간 특성을 부여하는 것이다(Guo et al., 2018; Wan et al., 2023). 이 경우 다양한 공간적 영 모형(spatial null model)이 제안될 수 있다. 하지만 이 방식의 경우 결과를 시뮬레이션하는 과정이 매우 복잡할 뿐만 아니라 거리 조락에 대한 추가적인 가정이 필요하고 어떤 영 모델을 사용할지 선택해야 하며, 공간 특성을 반영하더라도 여전히 공간적으로 분절된 기능지역이 도출될 우려가 있다(Wan et al., 2023; Wang et al., 2021).
둘째, 비공간적 커뮤니티 탐지법을 수행한 후 공간적 제약조건을 부여하여 일부 공간 단위를 재할당하는 방식이다. 예를 들어 Zhong et al.(2014)은 스마트카드 데이터를 사용하여 싱가포르의 공간구조를 파악하는 과정에서 공간적으로 분절된 포인트들을 페이지랭크 지수가 가장 높은 인접 커뮤니티로 할당하는 방법으로 이를 해결하고자 하였다. 하재현·이수기(2016) 또한 Zhong et al.(2014)의 방법을 채택하여 공간적으로 분절된 행정동을 배정하는 방식을 사용하였다. 하지만 이와 같은 방식은 통계적 기준 없이 재할당을 반복한다는 문제점이 있다. Wang et al.(2021)은 이러한 문제를 해결하기 위해서 공간적 인접성과 최소 지역 기준(minimal regional size) 기준을 사용하여 공간적으로 분리된 지역들은 최소 지역 기준을 충족시키면서 모듈성을 극대화하는 이웃 커뮤니티로 재할당하는 방식을 제안하였다.
한편 커뮤니티의 동적 변화를 탐색하는 문제는 커뮤니티 탐지법 초창기부터 활발히 논의된 주제이다. 그동안 논의된 동적 커뮤니티 탐지법은 크게 네 가지 종류로 구분된다(Cazabet and Rossetti, 2019; Dakiche et al., 2019). 첫째, 정적인 커뮤니티 탐지법을 시간대별로 수행하여 스냅샷을 얻은 후 이전 기(t-1)의 커뮤니티와 단순 비교하는 방식이다(Palla et al., 2009). 이는 한 번에 시간대별 커뮤니티 구조를 얻을 수 있다는 장점이 있지만 커뮤니티의 불안정성은 그대로 유지된다. 둘째, 정적인 커뮤니티 탐지법을 시간대별로 수행하고 이전 기의 커뮤니티와 비교한다는 점은 위의 방식과 같지만, 비교 시 유사성 척도를 통해 일정 수준 이상 유사할 경우에만 같은 뿌리를 지닌 커뮤니티로 간주하는 방법이다(Hopcroft et al., 2004). 이 방법은 첫 번째 방법의 장점은 유지한 채, 불안정한 커뮤니티 구조를 해소할 수 있다는 장점이 있다. 셋째, 이전 기의 커뮤니티 구조를 반영하여 평활화(smoothing) 함수를 통해 변화를 최소화하도록 다음 기의 커뮤니티 구조를 탐색하는 방법이다. 이 경우 동시에 시기별 커뮤니티 구조를 파악할 수는 없다. 넷째, 모든 시간대의 네트워크를 동시에 모형에 투입하고 평가하여 커뮤니티 구조를 파악하는 방식이다. 이때 모든 시간대의 노드와 시간대별 동시에 존재하는 링크를 사용하여 새로운 네트워크를 만들고 이를 통해 커뮤니티를 도출한다(Jdidia et al., 2007).
그동안 제시된 다양한 방법들은 커뮤니티의 시간대별 변화가 안정적인 경우에는 그 변화양상을 적절히 식별하는 것으로 알려져 있으나, 반대로 시간대별 변화가 급격하게 나타나 유사성이 매우 낮을 경우 너무 많은 커뮤니티를 식별하는 등의 문제점을 안고 있다(Zhao et al., 2023). 이에 대한 대안으로 Zhao et al.(2023)은 Lancichinetti and Fortunato(2012)의 컨센서스 클러스터링 기법과 Hopcroft et al.(2004)의 ICDM (Independent Community Detection and Matching) 접근법을 결합하여 시간대별 변동이 심한 네트워크 내에서도 안정적인 커뮤니티 구조를 도출하고 진화 양상을 파악하는 모형을 제시하였다. 컨센서스 커뮤니티는 일종의 모든 스냅샷 커뮤니티의 평균값을 구한 것으로, 이를 기본 도시 구조라고 가정하고 개별 커뮤니티 내 하위 수준에서 세부적인 시간대별 커뮤니티를 도출하고 이의 진화 과정을 분석하는 것이다. 컨센서스 커뮤니티를 활용하는 것은 시간적 안정성을 확보하는 합리적인 방안이라고 평가할 수 있다. 다만 상위 수준의 커뮤니티를 컨센서스 커뮤니티로 고정한 상태로 하위 수준에서의 동적 커뮤니티 변화를 진화 이벤트의 개수 등 지표 변화 패턴을 통해 분석했다. 이는 상위 수준의 기능지역 변화를 포착하지 못하며, 너무 많은 이벤트가 식별되어 구체적인 변화 과정을 이해하기 어렵다는 한계가 있어 이를 해결할 방안이 함께 모색될 필요가 있다.
공간적 분절과 시간적 변동성 각각을 고려하는 기존 연구들은 이처럼 다양하게 제시되었다. 하지만 국내에서는 소수의 연구(하재현·이수기, 2016; 권규상, 2019)를 제외하고 이 한계를 인식하거나 해결하기 위한 대응 방안을 거의 제시하지 못하고 있다. 특히, 적어도 우리의 지식으로는 기능지역 도출 과정에서 공간적 분절과 시간적 변동성을 함께 해결하면서 커뮤니티의 진화 양상을 파악하는 커뮤니티 탐지법은 국내뿐만 아니라 해외 학계에서도 충분히 제시되지 못했다. 본 연구는 그동안의 연구 성과들을 결합하여 커뮤니티 탐지법에서 발생할 수 있는 공간적 분절 문제를 적절히 해결하고 시간적 변동성을 고려하여 강건한(robust) 동적 커뮤니티 구조를 도출하는 방법을 제안하고자 한다.
Ⅲ. 공간제약 동적 커뮤니티 탐지법
본 연구에서 제안하는 방법론은 시계열적 네트워크 데이터에 적용할 수 있는 커뮤니티 구조 탐지법으로 크게 세 가지 단계로 구성된다(그림 1). 첫 번째 단계에서는 각 스냅샷 데이터로부터 커뮤니티 구조를 추출한 후, 공간적으로 비연속적인 노드들을 재배치함으로써 공간적으로 제약된, 즉 공간적으로 연속적인 커뮤니티 구조를 탐지한다. 두 번째 단계에서는 앞서 추출한 스냅샷 커뮤니티 구조를 기반으로 시간대별 컨센서스 네트워크를 구축한다. 유사한 커뮤니티 구조를 지닌 연속적인 스냅샷을 식별해 시계열 군집을 추출하고, 각 군집의 컨센서스 커뮤니티 구조를 도출한다. 마지막 단계에서는 시간대별 컨센서스 커뮤니티의 진화 패턴을 분석한다. ICDM 방법론에 의거 커뮤니티 쌍을 매칭하고 탄생, 소멸, 결합, 분리 등 6개 진화 이벤트를 식별한다. 이를 시각화해 커뮤니티 구조의 동적 진화 패턴을 탐색한다. 단계별 구체적인 방법은 다음과 같다.
1. Step 1: 시점별 공간제약 커뮤니티 탐지
첫 번째 단계에서는 시점별 네트워크 데이터에 대해 Wang et al.(2021)이 제시한 바와 유사한 방식으로 공간적으로 제약된 커뮤니티 구조를 탐지한다. 우선 루뱅(Louvain), 라이덴(Leiden), 인포맵(Infomap) 알고리즘 등 기존 제시된 정적(static) 커뮤니티 구조 탐지 알고리즘을 각 시점의 스냅샷 데이터에 적용해 커뮤니티 구조를 추출한다.
그 후 공간적 인접성을 보장하기 위해 각 커뮤니티에서 공간적으로 연결된 요소(spatially connected components)를 감지하고, 요소가 2개 이상일 경우 각 시나리오에 따라 비연속 요소들을 다른 커뮤니티로 재배치한다. 비연속 요소의 노드 개수가 3개 이하일 경우, 공간적으로 이웃한 커뮤니티 중 모듈성을 가장 많이 증가시키는 커뮤니티로 재배치한다. 비연속 요소의 노드 개수가 4개 이상일 경우, 하나의 독립된 커뮤니티로 재정의한다. 결과적으로 모든 시점에 대해 공간적으로 제약된 커뮤니티 구조가 탐지된다.
2. Step 2: 시간대별 컨센서스 커뮤니티 탐지
두 번째 단계에서는 안정적으로 동적 특성을 분석하기 위해 정규화된 상호정보량(Normalized Mutual Information, NMI)과 컨센서스 구조 탐지 기법을 활용해 앞 단계에서 탐지한 스냅샷의 커뮤니티 구조를 요약한다.
시계열 데이터는 변화가 급격하게 나타나는 경우일지라도 많은 경우 일정 기간 유사한 구조가 이어지고 점진적으로 변화하는 양상을 보인다. 예를 들어, 하루 24시간 동안의 통행 네트워크 데이터를 바탕으로 커뮤니티 구조를 1시간 단위로 분석할 경우, 커뮤니티 구조가 매시간 계속해서 유의미하게 변화하지는 않는다. 새벽 시간대, 아침 첨두시간대 등 짧게는 2~3시간 길게는 8~9시간가량 유사한 커뮤니티 구조를 보일 수 있다. 1년 동안의 통행 네트워크의 경우에도 마찬가지로 매달 유의미한 변화가 일어나기보다는 특정한 계절적 패턴이 관찰된다. 이러한 특성을 고려할 때, 전체 스냅샷의 모든 시간 간격에 대해 일일이 진화 패턴을 분석하는 것보다 시계열적으로 연속되는 커뮤니티의 구조적 유사성을 바탕으로 군집화를 시행하고 군집의 진화 과정을 분석하는 편이 더 효율적이고 견고한 해석을 가능케 할 것이다.
따라서 본 연구에서는 군집화를 위해 NMI를 활용한다. NMI는 정보 이론에 기반을 두어 두 개의 커뮤니티 구조 간 유사성을 파악하는 지표로, 다음 식 (1)을 통해 계산된다(Danon et al., 2005):
(1) |
두 개의 커뮤니티 Ct와 Ct+1를 비교하기 위해 혼동행렬(confusion matrix) Ν을 정의하는데, 행렬의 요소인 Nij는 커뮤니티 i에 속한 노드 중 커뮤니티 j에 나타나는 노드의 수를 의미한다. 비교 대상이 되는 두 커뮤니티 구조 내 전체 커뮤니티 수를 각 |Ct|, |Ct+1|로 표기하며, Ni는 행 i에 대한 합(즉, 실제 커뮤니티 i에 속한 노드의 총 수), Nj는 열 j에 대한 합, N은 노드의 총 개수를 나타낸다(Danon et al., 2005). 이는 두 커뮤니티의 상호정보량(mutual information)을 평균 엔트로피로 정규화한 값으로, 두 개의 커뮤니티가 완전히 같으면 1, 완전히 독립적일 경우 0의 값을 갖는다. 서로 다른 알고리즘으로 추출한 커뮤니티 구조를 비교하거나(Lancichinetti and Fortunato, 2009), 시계열에 따른 커뮤니티 구조의 변화양상을 파악하는(강수영, 2017) 등 여러 방식으로 활용된 바 있다. 본 분석에서는 시계열적으로 연속되는 커뮤니티에 대한 NMI 값을 계산하고 상대적으로 낮은 값을 나타내는 지점이 상대적으로 급격한 구조적 변화를 나타낸다고 가정, 이를 기준으로 군집을 구분한다. 이러한 데이터 기반(data-driven) 접근방식을 통해 기존 데이터에 대한 사전 정보가 충분하지 않은 경우에도 효율적으로 커뮤니티의 군집화를 수행할 수 있다.
다음으로 군집화된 커뮤니티에 대해 컨센서스 커뮤니티 구조를 탐지해 시계열 평활(temporal smoothing)을 수행한다. 컨센서스 클러스터링은 일종의 커뮤니티 평균값을 추출하는 방법으로, 모듈성 등 목적함수의 값을 개선하는 기법은 아니지만 안정적이고 강건한 커뮤니티 구조를 탐지할 수 있다는 장점이 있다(Lancichinetti and Fortunato, 2012; Rossetti and Cazabet, 2018). 기존 연구에서는 시계열 데이터로부터 평균적인 커뮤니티 구조를 탐지하거나(Zhao et al., 2023), 각기 다른 데이터로부터 얻어진 커뮤니티 구조를 결합하는 등(Andris et al., 2023) 여러 연구 목적을 위해 활용된 바 있다.
본 연구에서는 복수의 스냅샷 커뮤니티로 구성된 각 군집에 대해 컨센서스 커뮤니티 구조를 탐지한다. 우선, 각 스냅샷 커뮤니티에서 동일한 커뮤니티로 분류된 두 노드 사이에 링크를 연결한 커뮤니티 멤버십 그래프를 구축한다. 이는 무방향(undirected)이고 가중치가 없다. 그 후, 동일한 군집 내 스냅샷 커뮤니티 멤버십 그래프를 결합해 컨센서스 네트워크를 구축한다. 링크의 가중치는 두 노드가 커뮤니티 멤버십을 유지하는 기간을 총 스냅샷 수로 정규화한 것으로, 시계열적 관점에서 두 노드 간의 상호작용 강도를 정량화한다. 예를 들어, 노드 A와 B가 4개의 스냅샷 커뮤니티 중 3번 동일한 커뮤니티로 분류되었다면 두 노드 간 링크의 가중치는 0.75가 된다. 이렇게 구축된 컨센서스 네트워크에 대해 선택한 커뮤니티 탐지 알고리즘을 적용한다. 이로써 시계열 군집의 개수만큼 컨센서스 커뮤니티를 탐지하게 된다.
3. Step 3: 컨센서스 커뮤니티의 진화 패턴 분석
마지막 단계에서는 ICDM 접근법을 활용해 앞서 탐지한 시간대별 컨센서스 커뮤니티의 진화 패턴을 분석한다. ICDM 접근법은 Hopcroft et al.(2004)가 제시한 프레임워크에 기반을 둔 것으로(Zhao et al., 2023),2) 두 개의 커뮤니티로부터 연속되는 개별 쌍을 탐지해 그 변화 과정을 살피는 것이다. 이는 기존 알고리즘을 활용해 동적 특성을 포착할 수 있다는 장점이 있는 한편, 지나치게 분절된 이벤트를 탐지해 해석이 복잡하다는 한계가 있다(Sun et al., 2022). 이에 본 연구는 군집화된 컨센서스 커뮤니티에 대해 ICDM 접근법을 적용함으로써 좀 더 강건한 구조를 탐지할 수 있다.
본 연구에서는 두 개의 커뮤니티로부터 연속되는 개별 쌍을 탐지하기 위해 우선 유사성 지표를 기반으로 두 연속적인 커뮤니티 구조 내에서 연속되는 개별 커뮤니티 쌍을 매칭한다. 유사성은 다음 식 (2)와 같이 자카드 지수(Jaccard index)를 기반으로 정량화한다:
(2) |
노드의 교집합 대비 노드의 합집합을 기반으로 시간 t에 식별된 커뮤니티 Cit와 시간 t+1에 식별된 커뮤니티 Cjt+1 간 유사성을 계산할 수 있다. 이는 0과 1 사이의 값을 가지며, 커뮤니티의 변화 정도에 따라 1 대 1, 1 대 다, 다 대 다 매칭을 생성할 수 있다. 그 이후, 연구자가 정의한 유사성 임곗값 θm을 기반으로 Palla et al. (2009)이 제시한 범주에 의거 총 여섯 가지 진화 이벤트(evolving events)를 정의한다(표 1).
마지막으로, 두 가지 방식으로 커뮤니티의 진화 과정을 시각화한다. 우선, Rosvall and Bergstrom(2011)이 제안한 방식을 기반으로 생키(Sankey) 다이어그램을 생성한다. 여기서 각 노드는 커뮤니티 소속에 따라 수직적 위치가 결정되며 시간이 흐르면서 그 소속이 변화하는 과정이 수평적 흐름을 통해 연속선으로 표기된다. 특정 시간대에 같은 커뮤니티에 소속된 노드들은 연속적으로 배치되며 같은 색깔로 표시된다. 이를 통해 노드가 시간의 흐름에 따라 어떤 커뮤니티로 이동하는지 시각화할 수 있다. 이에 더해 Rossetti and Cazabet(2018)이 제안한 커뮤니티 생애 주기 시각화를 통해 각 커뮤니티가 어떠한 진화 이벤트를 경험하는지, 어떤 커뮤니티들이 상호작용하는지 등을 시각화함으로써 개별 커뮤니티의 변화 과정을 체계적으로 분석한다.
Ⅳ. 사례연구: 서울 생활권 탐색과 진화 분석
본 연구에서는 앞서 제안한 방법론의 유용성과 함의를 살펴보기 위해 서울시 생활이동 데이터를 활용한 생활권 도출을 시도하였다. 서울시 생활이동 데이터는 KT 휴대폰 시그널을 가공해 어떠한 사람들이 언제 어디서 어디로 이동했는지 그 이동량의 추정값을 제공한다(서울특별시 외, 2023).3) 본 연구에서는 24시간 동안 1시간 간격으로(즉, 스냅샷 24개) 서울시 내 행정동 간 이동 네트워크 데이터로부터 공간제약 동적 커뮤니티를 탐지했다. 분석 대상은 2024년 4월 주중 이동량 전체로, 각 스냅샷은 평균 424개 행정동 간 125,710개 링크(네트워크 밀도 0.70), 15,088,617명의 이동량으로 이루어져 있다. 평일 하루 평균 이동량은 18,106,341명으로 아침 7시와 9시 사이, 저녁 5시와 7시 사이에 이동량이 많고, 오전 0시부터 4시까지의 이동량은 상대적으로 적은 것으로 나타났다(그림 2). 불규칙 변동을 조절하기 위해 이동량 10 이하 링크는 제거했다. 앞서 제안한 방법론을 Python으로 구현했으며, 시각화에는 R을 활용했다.
1. 24개 시점별 공간제약 커뮤니티 탐지
루뱅 알고리즘을 적용해 시점별 통행 데이터로부터 정적 커뮤니티 구조를 추출한 후, 공간제약 규칙을 적용해 비연속 요소들을 재배치했다. 재배치를 위한 공간적 이웃은 Queen 인접성 척도와 최근접 이웃(k=3)의 합집합으로 정의했다.4) 루뱅 알고리즘은 확률적(stochastic) 방법론으로서 수행에 따라 조금씩 다른 결과물을 도출한다. 따라서 알고리즘을 99번 반복하여 랜덤화를 통한 검정을 진행했으며, 최종 결과는 반복 실행을 통해 얻은 평균값을 사용했다.
반복마다 평균 3.2개의 비연속 요소가 발견되었다. 요소들이 재배치됨에 따라 모듈성이 다소 증가하거나 감소해 평균 0.58의 값을 보였다. 재배치 전과 후의 모듈성 값은 평균적으로 0.005% 감소했다. 공간 기반 규칙을 통해 가중치와 관계없이 노드가 재배치됨에 따라 모듈성이 감소하는 경우도 있으나. 연결이 잘되지 않거나 분리된 커뮤니티를 생성할 수 있는(Tragg et al., 2019) 루뱅 알고리즘의 단점이 노드 재배치를 통해 보완되면서 모듈성이 증가하는 경우도 발견되었다(Wang et al., 2021). 이 방법은 선택가능한 재배치 대안 중 모듈성을 극대화하는 대안을 채택한다는 점에서 그 효용성이 있다.
<그림 3>은 루뱅 알고리즘 적용 결과로 몇 비연속 요소들이 발견되고, 이후 비연속 요소들이 재배치되는 예시를 보여준다. 예를 들어, 오전 6시 시점의 스냅샷 커뮤니티에서 서초구 잠원동이 서남권 커뮤니티로, 종로구 가회동이 서북권 커뮤니티로 분류되어 지리적으로 비연속적인 요소로 탐지되었다(그림 3(a)). 이후 공간 제약 규칙을 적용한 결과, 잠원동은 지리적으로 이웃한 세 개의 커뮤니티 중 모듈성을 가장 증가시킬 수 있는 동남권으로 재배치되었다. 가회동은 지리적 이웃인 동북권 커뮤니티로 재배치되었다. 이를 통해 모듈성 감소를 최대한 방지하면서 공간적으로 연속적인 커뮤니티를 얻을 수 있다.
2. 4개 시간대별 컨센서스 커뮤니티 구조 탐지
우선, 앞서 탐지한 총 24개 스냅샷 공간제약 커뮤니티에 대해 컨센서스 커뮤니티를 추출한 결과, <그림 4(a)>와 같이 총 6개의 생활권이 도출되어 지리적 입지를 기준으로 이름을 부여했다. 강북에서는 총 세 개의 생활권이 탐지되었다. 서북권은 은평구, 서대문구, 마포구, 용산구를 포괄하며, 동북권역에서는 노원구, 도봉구, 강북구, 성북구를 포함하는 동북권1와 중랑구, 광진구, 동대문구, 성동구를 포함하는 동북권2가 추출되었다. 종로구와 중구는 서북권과 동북권2 양 생활권으로 분할되었다. 강남에서는 세 개의 생활권이 탐지되었다. 서남권은 강서구, 양천구, 영등포구, 구로구, 금천구, 동작구, 관악구를 포함한다. 동남권의 경우 서초구와 강남구를 포함하는 동남권1, 송파구와 강동구를 포함하는 동남권2가 각 생활권을 구성하는 것으로 나타났다. 일반적으로 커뮤니티 경계가 자치구 경계와 일치하는 한편, 동대문구 일부가 동북권1에 포함되며, 관악구와 동작구 일부가 동남권1로 분류되었다.
다음으로, 24개 스냅샷 커뮤니티 구조의 NMI 값을 계산하고(그림 4(b)), 7시, 11시, 19시, 23시를 기준으로 총 4개의 군집을 구분했다. 즉, 유사한 커뮤니티 구조를 보이는 시계열적 군집으로 밤/새벽시간(23-6시), 아침첨두(7-10시), 낮시간(11-18시), 저녁첨두(19-22시)를 추출했다. 각 군집의 모든 스냅샷 커뮤니티로부터 컨센서스 네트워크를 구축하고, 루뱅 알고리즘을 적용해 시간대별 컨센서스 커뮤니티를 탐지했다(그림 5). 아침첨두와 저녁첨두에는 총 5개의 커뮤니티가 추출되어, 밤/새벽시간과 낮시간에 6개의 커뮤니티가 탐지된 것에 비해 커뮤니티의 개수가 줄어드는 것으로 나타났다. 도출된 시간대별 컨센서스 커뮤니티는 각 시간대의 안정적인 핵심 커뮤니티로 커뮤니티의 동적 진화과정 파악을 위한 기반으로 간주할 수 있다.
3. 생활권의 동적 진화 과정 분석
시간대별 컨센서스 커뮤니티에 대해 ICDM 접근법을 적용한 결과(임곗값(θm) 0.35)), 시간이 흐름에 따라 시간대마다 각 7건, 5건, 4건의 진화 이벤트가 발생한 것으로 나타났다. 전체 이벤트의 69%가 성장 혹은 쇠퇴로 점진적 변화가 일어난 한편, 2건의 분리와 2건의 결합, 1건의 소멸이 발생해 부분적으로 다소 급진적인 변화 또한 발생했다. <그림 6>과 같이 동적 진화 패턴을 살펴볼 수 있다.
급진적 진화 이벤트 중심의 생활권 진화 과정은 다음과 같다. 밤/새벽시간에서 아침첨두로 바뀌는 과정에서 동북권2 커뮤니티가 소멸함에 따라 동북권1과 동남권1로 나뉘어 흡수된다. 동남권1은 분리되어 서쪽 일부가 서남권으로 흡수된 한편, 나머지는 동북권1의 광진구, 중랑구, 성동구 일부와 결합하면서 한강을 가로질러 넓은 범위를 포괄하는 커뮤니티를 형성한다. 아침첨두에서 낮시간으로 변하는 과정에서 동남권1 커뮤니티가 다시 분리되면서 동북권2 커뮤니티가 재형성된다. 또한 서북권 커뮤니티가 종로구, 중구 전체와 성북구 일부를 포함하며 성장한다. 마지막으로 저녁첨두 시간대에는 동남권1과 동남권2가 결합해 하나의 큰 커뮤니티를 형성하며, 동북권2가 종로구와 중구, 서대문구 일부를 포괄하며 성장해 아침첨두와는 또 다른 커뮤니티 구조를 보인다.
4. 서울 생활권 분석 시사점
본 연구에서 제안한 공간제약 동적 커뮤니티 탐색 알고리즘을 하루 24시간 동안의 서울 생활권 분석에 적용해 기능지역 단위에서 일상생활의 리듬을 분석할 수 있었으며, 기존 생활권 계획을 보완할 수 있음을 보였다.
첫째, 일상생활의 리듬(daily rhythms)이 반영된 기능지역의 변화를 확인하였다. 여기서, 리듬은 일상생활 활동이 일정한 높낮이를 지닌 운율처럼 공간에 재현되는 것을 지칭한다(앙리 르페브르, 2013). 특히 시공간 제약(Hägerstrand, 1970)하에서 나타나는 일상생활의 리듬은 지역으로의 유입과 다른 지역으로의 유출을 나타내는 인구 유동성(the influx of the population)을 통해 변화양상을 확인할 수 있으며, 규칙적이며 반복적인 특성을 지닌다(Schläpfe et al., 2021). 특히 개인 일상생활의 집합적 공간 행동(조창현, 2007; 2013)의 분포가 시간의 흐름에 따라 변화함에 따라 기능지역의 공간적 범위도 확장되거나 분절되는 등 변화를 경험한다. 예컨대, 하루 중 첫 번째 통행 목적지는 일, 학업과 같은 선순위 활동 수행에서 선택되며, 이후엔 각기 다른 시공간 자원과 개인 선호가 고려되어 지역 내 혹은 지역 간 이동 후 새로운 지점에서 여가, 외식, 친지 방문 등 차순위 활동이 진행된다(Arentze and Timmermans, 2004). 이러한 맥락에서 서울 생활권 또한 선순위 활동이 발생하는 아침첨두 시간대를 중심으로 기능지역의 변화가 역동적으로 발생하는 것으로 나타났다. 밤/새벽시간과 낮시간에는 생활권이 더 분화하고, 아침첨두 및 저녁첨두 시간에는 더 장거리의 통근 패턴이 반영되어 생활권의 규모가 상대적으로 커진다고 해석할 수 있다. 이는 점심시간, 주말 등 비통근 시간대에 생활권이 더 분화하는 양상을 발견한 기존 연구 결과와도 합치한다(김규혁 외, 2021; 하정원 외, 2024).
더불어, 본 연구에서 제안한 방법론을 통해 개별 커뮤니티의 리듬을 구체적으로 탐색할 수 있다(그림 7). 대표적으로, 동북권2(중랑구, 광진구, 동대문구, 성동구 일대)는 주요 서울시 주거지역으로 정주 인구가 많고, 지하철 환승역이 포함된 교통의 요지이다. 해당 커뮤니티는 아침 첨두시간대에 동북권1(노원구, 도봉구, 강북구, 성북구 일대)과 동남권1(서초구와 강남구 일대)로 분할 결합되면서 소멸하지만, 낮시간부터 다시 생성되어 저녁과 밤/새벽시간 동안 성장한다. 이러한 커뮤니티의 진화는 아침첨두에 선순위 활동 수행을 위한 인구 유출로 인해 소멸되었다가, 이후 후순위 활동 수행을 위한 통행으로 커뮤니티가 재생성되고 더 넓은 범위로 확장되는 것으로 해석할 수 있다.
둘째, 해당 분석은 동적 특성이 고려된 유연한 생활권 계획이 필요함을 시사한다. 생활권은 특정한 공간 현상 또는 관계를 공유하는 공간을 구획하는 방법으로, 도시기본계획과 도시관리계획의 중간단계로서 지역 간의 다양한 흐름을 고려한 정책으로 평가받고 있다(권규상, 2019). 이는 앞서 밝힌 인구 유동성, 즉 지역 간 유출입을 기반으로 생활권 간의 이질성(heterogeneity)과 생활권 내 유사성(homogeneity)을 최대화하기 때문이다(김규혁 외, 2021; 이원도·유수동, 2023). 서울생활권계획은 도심권, 동북권, 서북권, 서남권, 동남권으로 크게 5개 권역(대생활권)과 이를 구성하는 자치구(소생활권)의 위계적 구조로 구성되어 있고, 이를 바탕으로 각 지역 특성을 고려한 발전 방향과 생활환경 개선 과제가 수립된 바 있다(서울특별시, 2014). 본 사례연구뿐 아니라 여러 선행연구에서도 실증적으로 탐지된 생활권이 기존 자치구 경계와 어느 정도 일치하는 경향을 보여 행정구역이 하나의 생활권역으로서 일정 부분 유효한 기능을 하고 있다고 판단할 수 있다. 그러나 데이터 기반의 실질적 기능지역과 생활권의 동적 특성을 포착하기 위한 연구들에 따르면(김규혁 외, 2021; 하정원 외, 2024), 시간대 및 통행 목적에 따라 생활권의 개수 및 규모가 변화하는 동적 특성이 보고된 바 있다. 다만 해당 연구들은 유의미한(semantic) 시간대별 구분을 통한 변화 과정에 대한 분석보다는 시점별 커뮤니티의 배열을 통해 생활권의 개수와 이들의 공간적 범위 변화를 탐지하는 데 한정되었다.
본 연구에서 제안한 방법론은 각 생활권이 하루 동안에 성장과 소멸과 같은 어떠한 변천 과정을 경험하는지, 특히 다른 생활권과의 상호작용 안에서 그 과정을 분석할 수 있다. 예를 들어, 본 분석에서 탐지한 동남권1(서초구, 강남구)은 생활권 중 가장 많은 진화 이벤트를 경험하는 것으로 나타났다. 인접한 타 생활권들과 결합과 분리를 반복하며 가장 역동적인 변화가 발생했다. 해당 권역은 대표적인 업무지구이면서 상업시설이 집중된 곳으로, 오전첨두에는 강북 지역과 연결된 넓은 통근권역을 형성한다. 그뿐만 아니라, 저녁첨두에는 주요 여가, 외식과 같은 차순위 활동 수행이 활발하게 일어나며 송파구와 강동구를 아우르며 생활권이 공간적으로 확장된다. 특히 아침첨두와 저녁첨두에 상당히 상이한 구조의 생활권이 형성됨을 고려할 때, 상대적으로 다양한 인구가 여러 목적으로 유입 및 유출되는 역동적인 지역이라고 판단할 수 있다. 또 다른 예로 기존 서울생활권계획상 도심권에 속하는 종로구와 중구는 본 분석에서 독립적인 생활권으로 분류되지 않고 시간대마다 새로운 생활권으로 계속해서 재배치된다. 특히 밤/새벽시간과 오전첨두에는 자치구가 양분되어 각기 다른 생활권으로 분류된다. 이렇듯 특정 시간대에 기존 자치구 경계와 상당히 다른 형태의 생활권이 발견되는 것은 기존 행정구역 중심의 생활권 계획 방식에 대한 재검토가 필요함을 시사한다. 예를 들어, 같은 종로구일지라도 부암동과 혜화동은 하루 중 절반가량 다른 생활권으로 분리되어 있는 분석 결과를 고려할 때 자치구 단위의 생활권 계획은 실질적 수요를 반영하지 못할 가능성이 있다.
이러한 권역 생활권의 동적 특성을 서울생활권계획에 반영하여 시간에 따라 집중된 인구와 경제활동으로 인해 발생할 수 있는 다양한 문제(예: 교통체증, 과밀 위험지역)에 유연하게 대처할 수 있다. 도시계획적 측면에서 시간대별로 유입 및 유출되는 인구의 특성을 고려한 도시서비스 공급 방안 및 도시활력 증진 방안을 논의해야 할 것이며, 시점별로 같은 생활권을 형성하는 지역과 협의체를 구성하는 등 유연한 거버넌스 구조에 대한 논의도 수반되어야 한다.
Ⅴ. 결 론
본 연구는 공간적 제약과 시간적 변동을 동시에 고려한 커뮤니티 탐지 방법론을 제안하고, 이를 통해 서울 생활권을 설정하는 사례를 분석했다. 제안된 방법론은 크게 세 가지 단계를 통해 공간적으로 연속적인 기능지역을 식별하고, 이 구조의 시간적 변동성을 간명하게 포착하고 해석할 수 있는 프레임워크로 다음과 같은 시사점을 제공한다.
첫째, 공간적으로 제약된 커뮤니티를 탐지하기 위해 비연속 요소를 모듈성 향상을 기준으로 이웃 커뮤니티에 재배치하는 규칙을 적용했다. 재배치 과정에 통계적 기준치를 도입함으로써 도시계획 및 정책적으로 실용적이면서도 데이터 기반(data-driven)의 의사결정을 지원할 수 있다. 둘째, 표준화된 상호정보량(NMI)을 활용하여 연속적인 시간대별로 유사한 커뮤니티 구조를 군집화하고, 각 군집에 대한 컨센서스 커뮤니티를 도출했다. Zhao et al.(2023)이 제안한 컨센서스 클러스터링 기법을 시계열적 군집에 적용함으로써 유의미한 시간적 변동을 안정적으로 포착할 수 있다. 해당 기법은 향후 빅데이터 기반의 더 많은 수의 스냅샷에 대한 분석을 시행할 때 더욱 효과적인 방식일 것으로 기대된다. 셋째, ICDM 접근법을 적용하여 시간대별 컨센서스 커뮤니티의 진화 과정을 살펴보았다. 시간대별 이벤트의 발생과 노드의 이동을 시각화함으로써 커뮤니티의 성장 과정을 체계적으로 들여다볼 수 있다. 넷째, 제안한 기법을 서울 생활권 분석에 적용함으로써 생활권의 동적 특성을 생활권 계획수립에 참고할 수 있음을 보였다.
본 연구의 한계점을 토대로 살펴본 향후 연구 방향은 다음과 같다. 첫째, 다양한 알고리즘 적용과 방향성 있는 지역 간 흐름을 고려한 커뮤니티 탐지 알고리즘에 관한 연구가 필요하다. 본 연구에서 활용한 모듈성 기반의 루뱅 알고리즘과 더불어 인포맵, 링크콤(Linkcomm) 알고리즘 등을 선택할 수 있는 방법론의 범용화 작업이 필요하다. 연구자가 연구 목적에 따라 모듈성 지표 외에도 문화적/정치적 근접성, 물리적 이동시간 등을 고려한 규칙을 적용하는 방안을 고려해 실용성을 제고할 수 있다. 둘째, 다양한 평활화 기법이 적용된 결과를 비교하고, 적합한 기법을 선택해 최종 결과물을 작성하는 과정이 포함되어야 한다. 본 연구에서 채택한 NMI 및 컨센서스 커뮤니티 방식을 활용한 시계열적 평활화 기법은 커뮤니티 구조를 지나치게 단순화함으로써 특정 맥락에서 중요할 수 있는 섬세한 변화 및 차이가 누락될 수 있다는 한계가 있다. 셋째, 탐지된 커뮤니티 구조에 대한 객관성 확보가 필요하다. 본 연구가 여러 방식을 통해 안정적인 커뮤니티 구조를 탐지하고자 했음에도 불구하고 확률적 방법론이라는 알고리즘의 특성상 매번 고유한 솔루션으로 수렴할 것을 보장할 수 없다. 대체로 탐지된 커뮤니티에 일관성이 있지만, 연구자 자의적 선택이 개입될 수밖에 없다. 따라서 결과에 대한 전문가 설문 등의 방식으로 이를 보완할 필요가 있다. 마지막으로, 향후 본 연구에서 제안한 방법론을 다양한 시공간적 스케일과 다양한 데이터에 적용하여 그 유효성을 검증하고, 연구 질문에 맞게 방법론을 정교화해야 할 것이다. 본 사례연구에서는 하루 24시간 동안의 데이터를 분석함으로써 일상생활의 리듬 관점에서 반복되는 생활권 구조를 탐색했다면, 월별, 연간 데이터를 다룰 경우 점진적으로 변화해 나가는 커뮤니티 구조를 설명할 수 있는 방식에 대한 탐구가 필요하다. 공간적 측면에서도 마찬가지로 전국 단위의 분석을 시행할 경우, 광역권과 생활권 간 위계적 구조와 그의 동적 특성을 어떻게 포착할 것인가에 대한 세부적인 알고리즘 조정이 이루어져야 한다. 특히 도시계획의 효율성을 고려해 분석이 정책 결정 과정에서의 실질적인 적용 방안으로 이어질 수 있도록 심도 있는 논의가 필요하다.
Acknowledgments
이 연구는 대한민국 과학기술정보통신부와 교육부, 한국연구재단의 지원을 받아 수행된 연구임(RS-2022-00165821, NRF-2023S1A5A8078509).
Notes
References
-
강수영, 2017. “아시아 항공 네트워크의 공간 구조적 특성, 복잡 네트워크 접근”, 서울대학교 석사학위논문.
Kang, S., 2017. “Spatial Structural Characteristics of Air Transport Network in Asia: Complex Network Approach”, Master Thesis, Seoul National University. -
고영우·임슬기·한이철, 2020. 「한국의 지역노동시장권 2015: 지역노동시장의 공간적 범위와 특성 연구」, 세종: 한국노동연구원.
Koh, Y., Lim, S., and Han, Y., 2020. 2015 Local Labour Market Areas in Korea, Sejong: Korea Labor Institute. -
구형모, 2012. “향상된 계층적 합역 방법을 이용한 서울 대도시권의 기능 지역 구분”,「한국지도학회지」, 12(2): 25-35.
Koo, H., 2012. “Improved Hierarchical Aggregation Methods for Functional Regionalization in the Seoul Metropolitan Area”, Journal of the Korean Cartographic Association, 12(2): 25-35. -
권규상, 2019. “네트워크 커뮤니티 발견법을 활용한 기능지역 구분의 의미와 효용성”, 「대한지리학회지」, 54(3): 405-420
Kwon, K., 2019. “Network Community Detection as a Method to Delimitate Functional Regions”, Journal of the Korean Geographical Society, 54(3): 405-420. -
김규혁·송태진, 2022. “모바일폰 네트워크 데이터 기반 생활통행권 도출을 통한 택시사업구역 재설정 연구”, 「국토계획」, 57(6): 61-73.
Kim, K.H. and Song, T.J., 2022. “A Data-driven Approach for Adjusting Taxi Business Zone based on Travel Boundary using Mobile Phone Network Data”, Journal of Korea Planning Association, 57(6): 61-73. [ https://doi.org/10.17208/jkpa.2022.11.57.6.61 ] -
김규혁·이동엽·김동호·원민수·홍성민·송태진, 2021. “모바일 생활통행데이터 기반 도시 인구 규모별 생활권 분류 및 특성 파악”, 「대한교통학회지」, 39(5): 662-679.
Kim, K., Lee, D., Kim, D., Won, M., Hong, S., and Song, T., 2021. “A Study on the Classification and Understanding of Travel Boundary by City Population Scale Based on Mobile Travel Data”, Journal of Korean Society of Transportation, 39(5): 662-679. [ https://doi.org/10.7470/jkst.2021.39.5.662 ] -
김수현·임형준·허준, 2020. “휴대전화 빅데이터 기반 기종점 통행량 자료를 활용한 서울시 생활권 분석”, 「대한공간정보학회지」, 28(1): 3-10.
Kim S., Lim, H., and Heo, J., 2020. “Analysis of Seoul Living Sphere using Origin-Destination Data from a Mobile Phone Network”, Journal of Korean Society for Geospatial Information Science, 28(1): 3-10. [ https://doi.org/10.7319/kogsis.2020.28.1.003 ] -
김을식·최석현·조무상, 2015. “기능지역 (functional area) 개념을 활용한 지역고용 정책권역 설정에 관한 연구-수도권 지역을 중심으로”, 「한국거버넌스학회보」, 22(3): 189-215.
Kim, E., Choi, S.H., and Cho, M., 2015. “Alternative Approach to Defining Local Government’s Administrative Division for Employment Policy using Functional Area”, Korean Governance Review, 22(3): 189-215. [ https://doi.org/10.17089/kgr.2015.22.3.009 ] -
박경현·고사론·이소현·신휴석·정유선, 2023. 「통합적 지역발전을 위한 초광역권 육성방안」, 세종: 국토연구원.
Park, K., Ko, S., Lee, S., Shin, H., and Jung, Y., 2023. Mega-city Development for Integrated Regional Development, Sejong: Korea Research Institute for Human Settlements. -
박경현·윤영모·정우성·고사론, 2022. 「초광역권 육성을 위한 정책적 지원방안 연구」, 세종: 국토연구원.
Park, K., Yoon, Y., Jung, W., and Ko, S., 2022. Policy Measures to Support Mega City Region, Sejong: Korea Research Institute for Human Settlements. -
박소현·권규상·박소영, 2020. “기업 간 거래망에 기초한 기능적 경제권의 설정”, 「한국경제지리학회지」, 23(1): 1-17.
Park, S., Kwon, K., and Park, S., 2020. “Delineation of Functional Economic Areas in Korea based on Inter-firm Transaction Networks”, Journal of the Economic Geographical Society of Korea, 23(1): 1-17. -
변필성·권규상·이효란·김다윗·김동한·김승범, 2020. 「도시의 영향권과 기능 연계권 분석을 통한 도시권 획정 연구」, 세종: 국토연구원.
Byun, P., Kwon, K., Lee, H., Kim, D., Kim, D., and Kim, S., 2020. A study on the Delimitation of Metropolitan Regions in Korea, Sejong: Korea Research Institute for Human Settlements. -
서울특별시, 2014. 「2030 서울도시기본계획」, 서울.
Seoul Metropolitan Government, 2014. Seoul 2030 Comprehensive Plan, Seoul. -
서울특별시·한국교통연구원·KT, 2023. 「서울 생활이동 데이터 매뉴얼」, 서울.
Seoul Metropolitan Government, Korea Transport Institute, and KT, 2023. Seoul Living Population Manual, Seoul. -
앙리 르페브르, 2013. 「리듬분석: 공간, 시간, 그리고 도시의 일상생활」, 정기헌 역, 서울: 갈무리.
Lefebvre, H., 2013. Rhythmanalysis: Space, Time and Everyday Life, Translated by Jeong, K.H., Seoul: Galmuri. [ https://doi.org/10.5040/9781350284838 ] -
유재성, 2021. “가구형태별 주거이동구역 설정: 동적 관점의 커뮤니티 탐지 방법을 이용하여”, 「국토연구」, 111: 45-65.
You, J., 2021. “Delimitation of Residential Mobility Areas by Households Types: Using Network Community Detection as Markov Dynamics”, The Korea Spatial Planning Review, 111: 45-65. -
이상일·김감영·제갈영, 2012. “지오컴퓨테이션 접근에 의한 주택시장지역의 설정: 우리나라 수도권에의 적용”, 「한국도시지리학회지」, 15(3): 59-75.
Lee, S.I., Kim, K.Y., and Jaegal, Y., 2012. “A Geocomputational Approach to the Delineation of Housing Market Areas: An Application to the Capital Region in South Korea”, Journal of the Korean Urban Geographical Society, 15(3): 59-75. -
이상호,·고영우, 2015. “부산과 광주의 지역노동시장권 비교분석”, 「지역고용노동연구」, 7(1): 47-68.
Lee, S. and Koh, Y., 2015. “Comparative Analysis on Local Labor Market Areas of Busan and Gwangju”, Journal of the Korean Regional Employment Association, 7(1): 47-68. -
이원도·유수동, 2023. 「인구감소 위기 대응을 위한 생활권 활성화 방안」, 원주: 한국지방행정연구원.
Lee, W. and Yoo, S., 2023. Strengthening Inter-regional Partnerships for Depopulation Areas in South Korea, Wonju: Korea Research Institute for Local Administration. -
이지민·이수기, 2023. “서울시 장애인콜택시 이용특성 및 대기시간 영향요인분석: 장애인 콜택시 빅데이터와 Community Detection을 활용하여”, 「국토계획」, 58(1): 75-90.
Lee, J. and Lee, S., 2023. “Analysis of Characteristics of Call Taxi Usage and Factors Influencing the Waiting Time for the Mobility Disabled in Seoul, Korea: Using the Disability Call Taxi Big Data and Community Detection”, Journal of Korea Planning Association, 58(1): 75-90. [ https://doi.org/10.17208/jkpa.2023.02.58.1.75 ] -
전병윤·김규혁·리우 시페이·이만형, 2021. “연령별 고령인구의 통행 특성을 고려한 공간 위계별 생활권 분석 – 충청북도 2016 년 가구통행실태조사 자료를 중심으로”, 「도시설계」, 22(6): 129-145.
Jeon, B-Y., Kim, K-H., Liu, S., and Lee, M-H., 2021. “Spatial Hierarchy Analyses of the Zone of Life Reflecting upon Travel Characteristics of the Elderly Population – Focused on the 2016 Chungbuk Household Travel Survey Data”, Journal of The Urban Design Institute of Korea, 22(6): 129-145. [ https://doi.org/10.38195/judik.2021.12.22.6.129 ] -
전병윤·리우 시페이·홍영교·이만형, 2022. “지역 내 통행 특성을 고려한 청주시 중생활권의 도시기반시설별 서비스 권역 분석: 네트워크 분석 방법을 중심으로”, 「한국산학기술학회논문지」, 23(1): 704-716.
Jeon, B.Y., Liu, S., Hong, Y.K., and Lee M.H., 2022. “Analysis of Urban Infrastructure Service Areas in the Mid-Living Areas of Cheongju City Considering the Characteristics of Local Traffic: Focusing on the Network Analysis Method”, Journal of the Korea Academia-Industrial cooperation Society, 23(1): 704-716. [ https://doi.org/10.5762/KAIS.2022.23.1.704 ] -
조윤·성현곤, 2021. “통행패턴에 기반한 일상 생활권 설정: 충청권역을 중심으로”, 「국토계획」, 56(3): 92-103.
Cho, Y. and Sung, H., 2021. “Establishing the Daily Living Areas Based on Travel Patterns: Focused on the Chungcheong Area”, Journal of Korea Planning Association, 56(3): 92-103. [ https://doi.org/10.17208/jkpa.2021.06.56.3.92 ] -
조창현, 2007. “도시 일상활동 분석의 방법론적 연구 – 활동기반 접근법에 의하여 –”, 「국토지리학회지」, 41(2): 165-176.
Joh, C. H., 2007. “A Methodological Study on the Analysis of Daily Activity Pattern – Activity-Based Approach –”, The Geographical Journal of Korea, 41(2): 165-176. -
조창현, 2013. 「도시 일상생활 연구의 시공간적 접근: 활동기반 이론에 의한 통행 행태 연구의 확장」, 파주: 푸른길.
Joh, C. H., 2013. A Time-Space Approach to Urban Daily Life Study: An Activity-based Extension of Travel Behavior Research, Paju: Purungil. -
하재현·이수기, 2016. “통행특성별 OD 자료와 Community Detection 기법을 활용한 공간위계별 생활권 설정 연구 – 2010년 수도권 가구통행실태조사자료를 중심으로 –”, 「국토계획」, 51(6): 79-98.
Ha, J. and Lee, S., 2016. “A Study on the Designation of Living Zones by Its Spatial Hierarchy Using OD Data and Community Detection Technique – Focused on the 2010 Household Travel Survey Data of the Seoul Metropolitan Area –”, Journal of Korea Planning Association, 51(6): 79-98. [ https://doi.org/10.17208/jkpa.2016.11.51.6.79 ] -
하정원·김예진·이수기, 2024. “서울시 COVID-19 전·후 기능적 생활권 변화 및 통행거리 영향 요인 분석: 생활이동 빅데이터와 Community Detection을 활용하여”, 「국토계획」, 59(2): 73-92.
Ha, J., Kim, Y., and Lee, S., 2024. “Analysis of Functional Living Zones Changes and Influencing Factors of Travel Distance Before and After COVID-19 in Seoul, Korea: Using Mobile Phone-based Mobility Bigdata and Community Detection”, Journal of Korea Planning Association, 59(2): 73-92. [ https://doi.org/10.17208/jkpa.2024.04.59.2.73 ] - Andris, C., Koylu, C., and Porter, M.A., 2023. “Human-network Regions as Effective Geographic Units for Disease Mitigation”, EPJ Data Science, 12: 60. [https://doi.org/10.1140/epjds/s13688-023-00426-1]
- Arentze, T.A. and Timmermans, H.J.P., 2004. “A Learning-based Transportation Oriented Simulation System”, Transportation Research Part B: Methodological, 38(7): 613-633. [https://doi.org/10.1016/j.trb.2002.10.001]
- Brown, L.A. and Holmes, J., 1971. “The Delimitation of Functional Regions, Nodal Regions, and Hierarchies by Functional Distance Approaches”, Journal of Regional Science, 11(1): 57-72. [https://doi.org/10.1111/j.1467-9787.1971.tb00240.x]
- Brown, P.J. and Hincks, S., 2008. “A Framework for Housing Market Area Delineation: Principles and Application”, Urban Studies, 45(11): 2225-2247. [https://doi.org/10.1177/0042098008095866]
- Cazabet, R. and Rossetti, G., 2019. “Challenges in Community Discovery on Temporal Networks”, in Temporal Network Theory, Edited by Petter Holme and Jari Saramaki, 185-202. Cham: Springer International Publishing. [https://doi.org/10.1007/978-3-031-30399-9_10]
- Chen, Y., Xu, J., and Xu, M., 2015. “Finding Community Structure in Spatially Constrained Complex Networks”, International Journal of Geographical Information Science, 29(6): 889-911. [https://doi.org/10.1080/13658816.2014.999244]
- Dakiche, N., Tayeb, F.B.S., Slimani, Y., and Benatchba, K. 2019. “Tracking Community Evolution in Social Networks: A Survey”, Information Processing & Management, 56(3): 1084-1102. [https://doi.org/10.1016/j.ipm.2018.03.005]
- Danon, L., Diaz-Guilera, A.D., Duch, J., and Arenas, A., 2005. “Comparing Community Structure Identification”, Journal of Statistical Mechanics: Theory and Experiment, P09008. [https://doi.org/10.1088/1742-5468/2005/09/P09008]
- Farmer, C.J. and Fotheringham, A.S., 2011. “Network-based Functional Regions”, Environment and Planning A, 43(11): 2723-2741. [https://doi.org/10.1068/a44136]
- Guo, D., Jin, H., Gao, P., and Zhu, X., 2018. “Detecting Spatial Community Structure in Movements”, International Journal of Geographical Information Science, 32(7): 1326-1347. [https://doi.org/10.1080/13658816.2018.1434889]
- Hägerstrand, T., 1970. “What about People in Regional Science?”, Papers in Regional Science, 24(1): 7-24. [https://doi.org/10.1111/j.1435-5597.1970.tb01464.x]
- Hopcroft, J., Khan, O., Kulis, B., and Selman, B., 2004. “Tracking Evolving Communities in Large Linked Networks”, Proceedings of the National Academy of Sciences, 101: 5249-5253. [https://doi.org/10.1073/pnas.0307750100]
- Jdidia, M.B., Robardet, C., and Fleury, E., 2007. “Communities Detection and Analysis of Their Dynamics in Collaborative Networks”, Paper presented at 2007 2nd International Conference on Digital Information Management, Lyon, France.
- Kropp, P. and Schwengler, B., 2016. “Three-Step Method for Delineating Functional Labour Market Regions”, Regional Studies, 50(3): 429-445. [https://doi.org/10.1080/00343404.2014.923093]
- Lancichinetti, A. and Fortunato, S., 2009. “Benchmarks for Testing Community Detection Algorithms on Directed and Weighted Graphs with Overlapping Communities”, Physical Review E, 80: 1-8. [https://doi.org/10.1103/PhysRevE.80.016118]
- Lancichinetti, A. and Fortunato, S., 2012. “Consensus Clustering in Complex Networks”, Scientific Reports, 2: 336. [https://doi.org/10.1038/srep00336]
- Newman, M.E. and Girvan, M., 2004. “Finding and Evaluating Community Structure in Networks”, Physical Review E, 69(2): 026113. [https://doi.org/10.1103/PhysRevE.69.026113]
- Palla, G., Pollner, P., Barabási, A.L., and Vicsek, T., 2009. “Social Group Dynamics in Networks”, in Adaptive Networks: Theory, Models and Applications, Edited by Gross, T. and Sayama, H., 11-38, Berlin, Heidelberg: Springer Berlin Heidelberg. [https://doi.org/10.1007/978-3-642-01284-6_2]
- Rossetti, G. and Cazabet, R., 2018. “Community Discovery in Dynamic Networks: A Survey”, ACM Computing Surveys, 51(2): 1-37. [https://doi.org/10.1145/3172867]
- Rosvall, M. and Bergstrom, C.T., 2011. “Multilevel Compression of Random Walks on Networks Reveals Hierarchical Organization in Large Integrated Systems”, PLoS ONE, 6(4):e18209. [https://doi.org/10.1371/journal.pone.0018209]
- Schläpfer, M., Dong, L., O’Keeffe, K., Santi, P., Szell, M., Salat, H., Anklesaria, S., Vazifeh, M., Ratti, C., and West, G.B., 2021. “The Universal Visitation Law of Human Mobility”, Nature, 593(7860): 522-527. [https://doi.org/10.1038/s41586-021-03480-9]
- Sun, Z., Sun, Y., Chang, X., Wang, F., Pan, Z., Wang, G., and Liu, J., 2022. “Dynamic Community Detection Based on the Matthew Effect”, Physica A: Statistical Mechanics and Its Applications, 597: 127315. [https://doi.org/10.1016/j.physa.2022.127315]
- Tragg, V.A., Waltman, L., and van Eck, N.J., 2019. “From Luvain to Leiden: Guaranteeing Well-connected Communities”, Scientific Reports 9: 5233. [https://doi.org/10.1038/s41598-019-41695-z]
- Wan, Y., Tan, X., and Shu, H., 2023. “Finding and Evaluating Community Structures in Spatial Networks”, ISPRS International Journal of Geo-Information, 12(5): 187. [https://doi.org/10.3390/ijgi12050187]
- Wang, C., Wang, F., and Onega, T., 2021. “Network Optimization Approach to Delineating Health Care Service Areas: Spatially Constrained Louvain and Leiden Algorithms”, Transactions in GIS, 25(2): 1065-1081. [https://doi.org/10.1111/tgis.12722]
- Zhao, Y., Chen, B.Y., Gao, F., and Zhu, X., 2023. “Dynamic Community Detection Considering Daily Rhythms of Human Mobility”, Travel Behaviour and Society, 31: 209-222. [https://doi.org/10.1016/j.tbs.2022.12.009]
- Zhong, C., Arisona, S.M., Huang, X., Batty, M., and Schmitt, G., 2014. “Detecting the Dynamics of Urban Structure through Spatial Network Analysis”, International Journal of Geographical Information Science, 28(11): 2178-2199. [https://doi.org/10.1080/13658816.2014.914521]