Korea Planning Association
[ Article ]
Journal of Korea Planning Association - Vol. 60, No. 7, pp.92-110
ISSN: 1226-7147 (Print) 2383-9171 (Online)
Print publication date 31 Dec 2025
Received 28 Dec 2024 Revised 31 May 2025 Reviewed 17 Jun 2025 Accepted 17 Jun 2025
DOI: https://doi.org/10.17208/jkpa.2025.12.60.7.92

수도권 지역 장시간 통근통행 영향요인 분석

김재훈** ; 이수기***
Analysis of Factors Influencing Long-Time Commutes in the Seoul Metropolitan Area
Kim, Jaehoon** ; Lee, Sugie***
**Master's Candidate, Department of Urban Planning & Engineering, Hanyang University (First Author) kjh128050@hanyang.ac.kr
***Professor, Department of Urban Planning & Engineering, Hanyang University (Corresponding) sugielee@hanyang.ac.kr

Correspondence to: ***Professor, Department of Urban Planning & Engineering, Hanyang University (Corresponding: sugielee@hanyang.ac.kr)

Abstract

This study aims to establish criteria for long-time commuting in the Seoul Metropolitan Area (SMA) of Korea and analyze the changes in the factors influencing this trend, with the goal of deriving policy implications to reduce such commutes. In the SMA, long-time commuting has increased due to the expansion of commuting zones, which is driven by large-scale housing development and the enhancement of transportation infrastructure. However, research specifically addressing long-time commuting and its determinants remains limited. Additionally, the definition and outcomes of long-time commuting vary depending on the study area, as well as demographic, social, economic, and cultural contexts.

Using data from the 2010 Household Commuting Survey and the 2021 Individual Commuting Survey, this study identifies long-time commuting using a Gaussian Mixture Model and investigates its influencing factors through multilevel logistic regression analysis. The results show that the threshold defining long-time commuting increased by approximately five minutes between 2010 and 2021, alongside a rise in the number of long-time commuters. The likelihood of long-time commuting was higher among individuals aged 20–39, men, and high-income earners. Additionally, housing costs and public transportation were found to significantly influence commuting patterns.

This study presents a clear criterion for long-time commuting, analyzing its determinants, and highlighting temporal changes, thereby contributing meaningful policy insights for reducing long commutes in the SMA.

Keywords:

Commuting, Long Commute, Gaussian Mixture Model, Multilevel Logistic Regression

키워드:

통근통행, 장시간 통근, 가우시안 혼합 모델, 다수준 로지스틱 회귀모형

Ⅰ. 서 론

1. 연구의 배경

서울은 오랜 시간 높은 인구밀도와 주택 부족 문제에 직면해 왔다. 이에 따라 정부는 주택 공급 확대와 부동산 시장 안정화를 목표로 수도권 지역에 신도시를 개발하고, 교통수단과 도시 인프라를 확충함으로써 서울의 도시 생활권을 크게 확장해 왔다. 생활권 확장은 서울의 인구 분산을 촉진하여 주변 지역의 인구 증가와 활동량을 증가시키고, 주택단지 공급 및 주거 환경 개선과 같은 긍정적인 효과를 가져왔다. 그러나 이러한 도시 확장은 몇 가지 부정적인 결과도 초래하였다. 대표적으로 통근권이 확장되면서 장시간·장거리 통근이 증가하는 현상이 발생하였다.

서울은 고용과 교육의 중심지로 높은 지가를 형성하고 있어 저소득층의 주거선택에 제약을 초래하였으며, 이에 따라 저소득층은 저렴한 주택을 찾아 도시 외곽으로 이동하였다. 그러나 외곽지역은 이동하는 인구에 비해 충분한 산업 이전이 형성되지 않았고, 이는 양질의 일자리 부족으로 인해 다시 서울과 같은 고용중심지로 통근이 증가하게 되었다. 이러한 요인은 장시간·장거리 통근의 증가와 밀접한 관계를 가지고 있다(김재익·권진휘, 2013).

통근은 직장에 출근하는 대다수 사람들이 직접 겪는 경험으로, 통근 시간과 거리의 증가는 전 세계 공통적으로 나타나는 현상이다. 많은 도시에서 통근 시간의 증가는 통근자의 삶의 질을 저하시킬 뿐만 아니라 건강에도 악영향을 미친다. 통근 시간이 길어질수록 주관적 웰빙(Subjective Well-Being, SWB)과 관련된 여가 생활, 가사 활동, 휴식 등 대부분의 활동에 참여할 수 있는 시간이 줄어들고, 업무 시간은 증가하는 경향을 보인다. 또한, 식사 시간이 부족해 외식 빈도가 증가하는 양상도 나타난다(Morris et al., 2020).

더불어, 통근 시간이 길수록 배우자와의 이혼 가능성이 높아지고(Sandow, 2014), 결근할 확률도 증가한다(Van Ommeren and Gutiérrez-i-Puigarnau, 2011). 건강 측면에서도 긴 근무 시간은 수면장애에 영향을 미치며, 통근 시간이 길면 근무 시간이 길지 않더라도 수면장애에 부정적인 영향을 줄 수 있다(Kim et al., 2019). 이러한 현상은 직장인뿐만 아니라 학생에게도 나타난다. 대학생의 통근 시간이 길어질 경우 학교 방문 빈도가 줄어들고, 평균 성적이 낮아지는 결과로 이어진다(Kobus et al., 2015). 이와 같이 장시간·장거리 통근은 현대사회에서 해결해야 할 중요한 문제로 지목되고 있다.

2. 연구의 필요성 및 목적

장시간·장거리 통근은 개인과 사회 전반에 걸쳐 다양한 부정적 영향을 미치는 현상으로, 오랜 기간 동안 여러 학문 분야에서 지속적으로 논의되어 왔다. 그럼에도 불구하고 현재까지 장시간·장거리 통근에 대한 명확하고 합의된 기준은 제시되지 않았으며, 기존 연구들은 주로 통근 시간이나 통근 거리의 증감에 초점을 맞추어 통근이 과도한지 혹은 적정한지를 판단할 수 있는 객관적 기준을 충분히 제시하지 못하고 있다. 통근 시간은 교통 여건, 주거지와 직장 간 거리, 대중교통 체계 등 다양한 요인의 영향을 받으며, 이러한 요인들은 시대적·지역적 특성에 따라 상이하게 작용한다. 따라서 변화하는 통근 환경을 충분히 반영하지 못한 단일 기준으로는 통근 행태를 효과적으로 설명하는 데 한계가 있다. 이에 따라 장시간 통근에 대한 명확한 기준을 설정하고, 이를 토대로 통근 시간의 변화와 그 영향 요인을 분석하는 것은 학술적·정책적 측면에서 중요한 의의를 지닌다.

본 연구는 통행 데이터를 활용하여 장시간 통근 기준을 정의하고, 이를 바탕으로 장시간 통근에 영향을 미치는 요인의 변화를 분석하는 것을 목적으로 한다. 이를 위해 2010년과 2021년 데이터를 활용하여, 시대적·지역적 특성을 반영한 장시간 통근 기준을 설정하고, 통근 시간 변화의 동태적 특성을 규명하였다. 본 연구에서는 2010년 가구통행실태조사와 2021년 개인통행실태조사 데이터를 사용하였으며, 가우시안 혼합 모델(Gaussian Mixture Model, GMM)을 적용하여 장시간 통근 기준을 도출하였다. 또한 개인 수준과 지역 수준의 요인을 동시에 고려한 다수준 로지스틱 회귀분석을 통해 장시간통근에 영향을 미치는 주요 요인을 분석하였다. 본 연구는 통근에 대한 명확한 기준을 제시하고, 통근 시간 변화와 그 영향요인을 심층적으로 분석함으로써 통근자의 삶의 질 개선과 교통 정책 수립에 기여할 것으로 기대된다.


Ⅱ. 선행연구 고찰

1. 통근통행 행태 연구

통근통행에 대한 연구는 오랜 기간 이어져 오며 다양한 데이터, 방법론이 사용되었고, 여러 결과가 도출되었다. 예를 들어, Zhao et al.(2020)의 연구에서는 베이징의 휴대전화 데이터를 통해 장시간 통근자의 다수가 35세 이상의 젊은 층임을 확인하였고, 주택비용이 임금보다 중요한 통근 요인으로 작용한다는 결론을 제시했다. Li and Zhao(2022)는 베이징 주변 신도시를 6가지 유형으로 분류하여 회귀분석한 결과, 고소득층과 주거형 신도시 거주자들이 더 긴 통근 거리와 시간을 가지는 경향을 보인다고 밝혔다.

Mitra and Saphores(2019)의 연구는 캘리포니아에서 토지 이용, 주택 비용, 가구 특성과 장거리 통근 간의 관계를 구조 방정식으로 분석하였다. 이 연구는 거주지의 직장-주택 비율이 높고 주택 가격이 낮을수록 장거리 통근 확률이 감소하며, 반대로 근무지 주택 가격이 높을수록 장거리 통근 확률이 증가한다는 결과를 도출했다. Ha et al.(2024)의 연구는 LA에서 고용센터의 존재가 통근 거리에 미치는 영향을 분석하여, 고용센터와 가까울수록 통근 거리가 감소하고, 대체로 저소득층은 짧은 통근 거리를, 고소득층은 긴 통근 거리를 선택하는 경향이 있음을 확인했다.

유럽 15개국을 대상으로 한 Giménez-Nadal et al.(2022)의 연구에서는 남성 근로자가 여성보다 출퇴근에 더 많은 시간을 할애하며, 통근 결정 요인이 국가마다 다름을 밝혀냈다. 캐나다를 대상으로 한 연구는 연령과 주거지 변화에 따른 통근 거리 분석 결과 남성, 기혼자, 자녀가 있는 경우와 나이가 들수록 통근 거리가 증가하다가 퇴직 연령대에서 감소하였고, 거주 기간이 길어질수록 통근 거리는 감소하는 경향이 나타났다(Newbold, 2024).

그러나 기존의 통근 연구는 주로 유럽, 북미 등 비교적 저밀도의 도시를 대상으로 이루어지고 있어 한국 수도권과 같은 고밀도 도시를 대상으로 한 연구의 필요성이 제기된다. 이러한 배경에서 Zhu et al.(2023)의 연구는 고밀도 도시인 홍콩을 대상으로 이동 행태를 연구하여 건축 환경이 통행 수단 선택에 미치는 영향을 분석하였고, 특히 노인에게 더 강한 영향을 미칠 수 있음을 밝혔다.

Jun(2012)은 서울 신도시 개발이 통근 시간에 미치는 영향을 시뮬레이션한 결과, 신도시 개발이 교통 혼잡을 완화하여 교통비 절감 효과를 가져오는 한편, 통근 및 쇼핑 이동 시간 증가와 화석 연료 배출 확대라는 상반된 결과를 초래할 수 있다고 제시하였다. 이어서 Jun(2020)은 다중 중심지 구조로 성장하는 서울을 대상으로 고용 중심지의 변화가 통근 패턴에 미치는 영향을 분석하였다. 분석 결과, 중심지에서는 통근 거리 감소와 대중교통 접근성 향상이라는 긍정적 효과가 나타난 반면, 교외 지역에서는 확장된 일자리 시장의 영향으로 통근 시간이 증가하는 경향이 확인되었다.

최성수·주익현(2019)의 연구에서는 가구 소득과 부부의 통근 시간 관계를 분석하여, 부부의 합산 소득이 높거나 소득이 비슷할수록 통근 시간이 증가하는 경향이 있음을 밝혔으며, 이는 수도권 중상위 소득계층의 맞벌이 부부가 장시간 통근에 불이익을 경험할 수 있음을 시사한다. 하재현·이수기(2017)는 생애주기 단계별 통근 시간을 분석하여, 부모와 함께 생활하는 개인이 가장 긴 통근 시간을 보였으며, 자녀가 있는 중년 가구의 통근 시간은 짧은 경향을 확인하였다. 마지막으로, 김성주·송재민(2023)은 서울 수도권의 다양한 소득계층을 대상으로 XGBoost 머신러닝 기법을 활용하여 통근 시간의 결정 요인을 분석하였다. 이 연구에 따르면 저소득층은 직장 근접성과 대중교통 접근성이 중요한 요인으로 나타났으며, 모든 소득계층에서는 직장 근처에 비용 효율적인 주택을 제공하는 것이 통근 시간 감소에 효과적임을 시사했다.

그러나 이와 상반되는 연구 결과가 도출되기도 하였다. 고은주·전승봉(2017)의 연구는 자원 유출(Resource Drain) 이론과 보상(Compensation) 이론 관점에서 통근 시간과 삶의 질 관계를 분석하여, 장거리 통근이 짧은 근무 시간과 높은 소득으로 보상될 경우 삶의 질에 부정적 영향을 미치지 않는다는 결론을 제시했다. 이처럼 통근에 대한 연구는 통근자의 주거 환경, 소득, 교통 인프라, 개인적 특성 등 다양한 요소에 따라 서로 다른 결론을 도출하고 있다. 이는 통근 연구에서 개별 도시와 국가의 특성에 맞는 맞춤형 접근이 필요함을 시사하며, 한국과 같은 고밀도 도시 환경에서의 연구 필요성을 뒷받침한다.

2. 임계 통근 시간 연구

장거리·장시간 통근의 명확한 기준이 정해지지 않은 상황에서, 통근 거리가 멀고 시간이 오래 걸리는 것이 통근자의 주관적인 인식에 따라 다른 만족도를 유발한다는 관점이 주목받고 있다. 통근 만족도는 임계 통근 시간과 밀접한 관계를 가지며, 주로 설문조사를 통해 통근자가 희망하는 통근 시간이나 감수할 수 있는 최대 통근 시간을 조사하여 자료를 수집한다. 이를 통해 실제 통근 시간, 이상적 통근 시간, 임계 통근 시간 등의 개념을 활용하여 통근 만족도가 어떤 요인들에 의해 변화하는지를 분석한다.

중국 쿤밍을 대상으로 한 연구에서는 He et al.(2016)이 임계 통근 시간이 30~40분일 때 통근 만족도가 가장 높으며, 전체 통근자의 81%가 50분 미만의 임계 통근 시간을 가진다고 보고했다. 이 연구에서 교육 수준이 높고 자녀가 없으며 대중교통을 이용하는 젊은 여성일수록 더 긴 임계 통근 시간을 가질 가능성이 높은 것으로 나타났다. 통근 시간의 임계점은 통근 형태뿐만 아니라 개인의 행동과 태도에 따라 크게 달라질 수 있다. Jang and Ko(2019)의 연구에 따르면, 일부 통근자는 높은 품질의 주거 환경을 얻기 위해 긴 통근을 수용하며, 통근 시간과 만족도 간에는 ‘V’ 형태의 비선형 관계가 나타났다. 36~54분의 통근 시간이 가장 낮은 만족도를 보였으며, 이 구간을 벗어나면 만족도가 증가하는 경향이 확인되었다.

그러나 이러한 연구에도 한계가 존재한다. Humagain and Singleton(2020)은 실제 통근 시간, 이상적 통근 시간, 이동시간 만족도 간 관계를 분석하며, 응답자가 주관적으로 인식하는 시간이 객관적인 통근 시간보다 더욱 중요할 수 있음을 지적한다. 또한, 현실적으로 실제 통근 시간과 이상적 통근 시간 간의 간극을 조정하기 어려운 상황에서 이상적 통근 시간을 자기합리화하는 경향이 존재할 가능성도 제시했다. 이는 설문조사를 통해 데이터를 수집하고, 분석하는 통근 만족도 연구에 대한 자료의 한계이다.

3. 장시간 통근 연구

장시간·장거리 통근은 명확한 기준이 합의되어 있지 않으며, 특히 한국의 경우 통근 만족도, 통근 시간, 통근 거리 등에 관한 연구는 다수 존재하지만, 장시간·장거리 통근의 기준을 체계적으로 제시한 연구는 상대적으로 부족하다. 장재민 외(2019)는 ‘경기도민 삶의 질 조사’를 활용하여 통근 시간으로 인해 이주를 고려하는 응답자들의 평균 통근 시간을 51.4분으로 파악하였으며, 통근 만족도가 주로 50~65분 구간에서 변동하고 57.5분에서 변곡점이 나타난다는 점을 근거로 약 58분을 장시간 통근의 기준으로 제시하였다. 한편, 고승욱 외(2023)는 장시간 통근의 기준을 1시간으로 설정하고, 60분 이상의 통근자를 장시간 통근자로 정의하여 다수준 이항 로지스틱 회귀모형을 분석하였다. 이 기준은 통계청(2021)의 ‘장시간 통근·통학 인구 비율’에서 제시된 구분을 활용한 것이나, 1시간을 기준으로 설정한 명확한 근거는 제시되지 않았다.

국외 연구 또한, 국가별로 장시간·장거리 통근 기준이 다르며, 연구마다 기준에 대한 구체적인 분석적 근거는 드물다. 다수의 연구는 국가기관이나 언론 기관의 기준을 참고하거나 임의의 기준을 사용한다. Limtanakool et al.(2006)에 따르면 국가별 차이로 인해 장거리 통근에 대한 표준 정의가 존재하지 않는다. 예를 들어, 미국 인구조사국과 일부 언론에서는 90분 이상의 통근자를 ‘극단적 통근자(Extreme commuting)’로 정의하며, Marion and Horner(2007)는 이 기준을 사용하여 통근 패턴을 분석했다. Vincent-Geslin and Ravalet(2016)은 대도시에서의 ‘극단적 통근’이 도시 규모에 따라 상이하게 나타난다고 주장하였다. 이들은 Joly and Vincent-Geslin(2016)의 연구에서 제시한 일일 100~120분 이상의 통근 기준을 참고하여, 일일 통근 시간이 120분 이상인 경우를 극단적 통근자로 분류하였다. 그러나 장시간·장거리 통근은 일반적인 상황에서 직주 불일치, 통근 수단 선택 등이 원인으로 지목되고 있으나, 극단적 통근은 교통망 부족, 경제적 요인 등 도시계획의 근본적 문제를 반영하는 경우로 두 개념에는 차이가 존재한다.

장시간 통근을 연구한 Sandow and Westin(2006)은 설문조사를 통해 버스나 기차로 통근할 수 있는 최대 시간을 약 45~50분으로 추정했다. 이 외에도, Cassel et al.(2013)은 설문조사를 통해 임계통근시간인 40분 이상을 장시간 통근으로 간주했다. He and Zhao(2017)Zhao et al.(2020)는 위와 같은 연구들을 근거로 45분을 장시간 통근의 기준으로 제시했다. 이처럼 장시간 통근의 기준을 제시한 다양한 연구 중 극단적 통근과 같은 일부를 제외한 연구는 대부분 편도 45~60분 사이의 시간을 장시간 통근 기준으로 제시하고 있다(표 1). 그러나 이들 연구들은 대부분 구체적인 근거를 제공하지 않는 경우가 많아 연구 간에 순환참조(Circular Reference) 문제가 발생하고 있다.

Examples of criteria for long-time commuting in previous studies

4. 연구의 차별성

기존의 통근 관련 연구들은 장시간 통근의 기준을 설정할 때 주관적 만족도, 정부기관의 가이드라인, 혹은 선행연구의 반복 인용에 의존하는 경우가 많았다. 예컨대, Sandow and Westin(2006)이나 He and Zhao(2017), 고승욱 외(2023) 등의 연구는 45분 또는 60분과 같은 특정 시간을 기준으로 삼았지만, 이러한 기준은 통일성과 근거 측면에서 한계가 있으며, 순환참조 문제를 발생시킬 수 있다. 본 연구는 이러한 한계를 극복하고자 가우시안 혼합 모델(Gaussian Mixture Model, GMM)을 활용하여 장시간 통근의 기준을 데이터 기반으로 객관적으로 도출하였다. GMM은 통근 시간의 분포를 정규분포의 혼합 형태로 모델링함으로써, 인위적 기준 설정 없이 데이터 내재의 구조를 기반으로 통근 시간을 단시간, 중시간, 장시간으로 구분할 수 있게 한다. 이 접근은 주관적 설문조사에 의존하지 않고 통계적 신뢰성을 확보할 수 있다는 점에서 기존 연구와 차별된다.

기존에도 클러스터링 기법을 활용한 연구는 다수 존재하지만, 본 연구는 GMM을 적용함으로써 더욱 유연하고 정교한 분포 기반 분석이 가능하도록 하였다. GMM은 다양한 분야에서 효과적으로 사용되어 왔으며, 예를 들어 열 쾌적성 분석(Wang and Gou, 2024), 도시열섬 분석(Boccalatte et al., 2023), 통근 공간 및 시간(Verma et al., 2021), 교통 상태 데이터 분석(Gemma et al., 2024) 등에 적용되어 그 유용성이 입증된 바 있다. 또한, 본 연구는 2010년과 2021년 두 시점의 통근 데이터를 활용하여, 도시 구조 및 통근 패턴의 변화에 따른 장시간 통근 기준의 변동을 동적으로 추정하였다. 이중 시점 분석을 통해 시간의 흐름에 따라 통근 행태가 어떻게 변화하였는지를 실증적으로 검토할 수 있으며, 고정된 기준 대신 변화에 유연하게 반응하는 기준을 제시할 수 있다는 장점을 가진다.

더불어 본 연구는 통근 시간에 영향을 미치는 요인을 단일한 개인 수준에서만 분석하지 않고, 개인 특성과 지역 특성을 이중 수준으로 분석하여 통근 시간이 도시 구조와 어떻게 상호작용하는지를 입체적으로 규명하였다. 이와 같은 다층 분석은 도시 및 교통 정책 설계에 실질적 근거를 제공할 수 있는 실증 연구로서의 가치를 높일 수 있다.

본 연구는 다음과 같은 차별성을 가진다. 첫째, GMM을 활용한 통계적 군집화를 통해 주관적 기준이 아닌 객관적 기준으로 장시간 통근을 정의하였다. 둘째, 두 시점의 데이터 분석을 통해 통근 시간 분포의 변화를 동적으로 추적함으로써 시간에 따른 기준 변화에 대응하였다. 셋째, 개인 수준과 지역 수준을 통합적으로 고려한 다층 분석을 통해 통근 시간에 영향을 미치는 복합 요인을 규명하였다. 이러한 분석 접근은 한국과 같은 고밀도 도시 환경에서 통근 문제를 보다 실증적이고 정책 친화적으로 이해하는 데 효과적인 방법론으로 기능할 수 있으며, 향후 통근 관련 정책 수립 및 도시 계획에 실질적 기여를 할 수 있을 것으로 기대된다.


Ⅲ. 연구 범위 및 방법

1. 연구의 범위

본 연구는 한국 수도권 지역(서울, 인천, 경기)을 대상으로 하여, 고밀도·고밀집 도시 환경에서의 장시간 통근 특성과 영향요인을 분석하였다. 수도권은 한국 인구의 절반 이상이 거주하는 지역으로, 서울을 중심으로 고용, 교통, 교육 등 주요 기능이 집중되어 있으며, 도시 과밀화를 해소하기 위해 주변지역으로 신도시가 형성된 독특한 공간 구조를 지닌다. 이는 통근 환경에서도 한국만의 특수성을 반영하며, 수도권을 중심으로 한 통근 연구의 필요성을 가진다.

본 연구에서는 통행 목적이 ‘통근(출근)’인 경우에 한하여 분석을 수행하였다. 원자료 중 결측치와 오기입 데이터를 제외한 표본 수는 2010년 214,553건, 2021년 24,575건이며, 데이터 전처리 과정을 거쳐 최종적으로 2010년 136,632건, 2021년 16,211건을 분석에 활용하였다. 연구의 시간적 범위는 2010년과 2021년으로 설정하여 약 10년간 통근 행태의 변화와 이에 영향을 미치는 요인을 비교·분석하였다. 이러한 기간 설정은 교통 인프라 및 사회·경제적 환경 변화의 추세를 파악하기에 충분한 시간적 간격으로 판단된다. 공간적 범위는 서울·인천·경기로 구성된 수도권으로 한정하였으며, 분석 단위는 행정동으로 설정하였다. 수도권 외 지역은 조사 방식의 차이로 인해 자료의 일관성을 확보하기 어렵다는 점에서 분석 대상에서 제외하였다.

본 연구는 통근 시간을 중심으로 분석을 진행하였다. 통근 연구는 일반적으로 시간과 거리라는 두 가지 주요 측면에서 이루어진다. 먼저, 통근 거리는 배경이 되는 시간대에서 교통 인프라, 기술, 수단 등의 발전에 따라 영향을 받는다. 기술의 발달은 더 먼 거리를 더 빠르게 이동할 수 있는 환경을 제공하며, 이는 미래 기술의 발전에 따라 통근 거리가 지속적으로 증가할 가능성을 시사한다. 반면, 통근 시간은 하루 24시간이라는 제한된 자원 내에서 사회적 교류와 경제 활동에 절대적 제약을 가한다. 이는 시간이 가지는 절대적이고 고정된 성격을 보여준다. 또한, 시간은 신체적·사회적 활동에 영향을 미칠 수 있다. 예를 들어, 건강한 삶을 유지하기 위해 하루 8시간 이상의 수면이 권장되며, 이는 하루에 적정한 수준의 시간이 존재한다는 점을 보여준다. 이러한 시간의 한계는 통근 시간 증가가 개인의 신체적·사회적 균형에 미칠 수 있는 영향을 시사한다. 따라서 본 연구는 시간의 절대적 성격과 통근 시간이 개인 및 사회에 미치는 영향을 고려하여 통근 시간을 분석 대상으로 설정하였다.

2. 분석 데이터 및 변수선정

1) 분석 데이터

본 연구는 국가교통DB에서 제공하는 ‘가구통행실태조사(2010년)’와 ‘개인통행실태조사(2021년)’ 자료를 활용하여 통근자들의 통근 시간과 개인 특성을 분석하였다. 또한, 통근에 영향을 미치는 지역적 특성을 반영하기 위해 SGIS에서 제공하는 ‘집계구·행정구역별 통계(인구, 가구, 주택)’, ‘센서스용 행정구역 경계’, 카카오의 ‘Kakao Map API’, 국토교통부 실거래가 공개 시스템의 ‘아파트 실거래가 자료’, 국토교통부 KRic(레일포털)의 ‘도시철도역사정보’, 국토지리정보원의 ‘전국 연속수치지도’, 산림빅데이터거래소의 ‘산림기능 구분도 전국 데이터’ 자료를 추가로 활용하였다.

가구통행실태조사와 개인통행실태조사는 여객 기종점통행량(O/D) 조사의 일환으로, 국가교통계획 및 사회간접자본(SOC) 투자 사업의 타당성 평가를 위한 기초자료로 활용되고 있다. ‘국가교통DB구축사업’은 「국가통합교통체계효율화법」 제12조에 근거하여 5년 주기로 전국 여객 기종점통행량 조사를 시행해 왔다.

2010년 가구통행실태조사의 표본 추출 과정은 특정 지역에 표본이 집중되지 않도록 읍·면·동별로 표본 수를 설정한 후, 각 읍·면·동 내에서 '통' 단위로 표본을 추출하는 집락 추출(Cluster Sampling)을 적용하였다. 최종적으로 선택된 ‘통’ 내 가구 중 일부를 무작위 추출(Random Sampling)하여 표본을 구성하였다. 가구통행실태조사의 표본 수 산정 시에는 교통조사지침에 따라 교통존별 인구수를 고려한 최고 유효표본율을 적용하였다(표 2). 또한, 교통존별 인구수 경계 범위에서 표본 수 감소를 예방하기 위해 인구수 5,000명-6,205명, 10,000명-12,081명 구간의 경우 유효표본수표를 참조하여 설명하였다. 가구통행실태조사의 유효표본가구 수는 437,001가구로, 이는 2010년 총가구의 약 2.5%에 해당된다.

Minimum effective sampling rate considering population size

2021년 개인통행실태조사의 데이터 모집단은 2021년 7월 기준으로 전국 만 5세 이상의 국민으로 설정되었으며, 모집단에서 일반 가구에 거주하는 국민을 대상으로 하였다. 표본 산출 기준은 상대오차 30%, 신뢰수준 95%로 설정되었다. 표본추출틀은 SK텔레콤 가입자 중 마케팅 활용에 동의한 약 2,100만 명으로 전 국민의 43%에 해당하고 시군구 및 읍면동 단위 표본 배분이 가능하며, 지역별 및 연령별 분포가 2019년 인구총조사의 인구구조와 유사하여 대표성을 확보할 수 있다.

조사 표본 산정 과정에서 당시 2020년 인구총조사 결과가 아직 공표되지 않았기 때문에, 2019년 인구총조사 자료를 기준으로 표본 규모를 결정하였다. 전국 2019년 인구주택총조사 기준 만 5세 이상 인구 46,835,367명의 0.23%에 해당하는 107,016명을 목표로 하였다. 표본 배분 방식은 6개 주요 권역(수도권, 부산·울산권, 대구권, 광주권, 대전·세종·충청권, 제주권)에 속한 시군구는 읍면동 수준에서 성별 비례 배분법을 적용하였으며, 기타 권역의 시군구에서는 성별과 연령대 인구수에 비례하여 표본을 할당하였다.

2) 변수 선정

본 연구에서 사용된 변수들에 대한 설명과 출처는 <표 3>에 나타냈다. 연구의 종속 변수는 장시간 통근 여부를 나타내는 이항변수로, 비장시간 통근을 0, 장시간 통근을 1로 정의하였다. 독립변수는 1수준(개인 수준)과 2수준(지역 수준)으로 구분하였다. 1수준 변수는 통근자의 소득, 성별, 연령, 직업을 포함한 개인 특성으로 구성된다. 성별은 여성 0, 남성 1로 분류하였으며, 연령은 미성년(5세-19세), 청년(20세-39세), 중년(40세-64세), 노년(65세 이상)으로 구분하고 청년을 준거 변수로 하였다. 가구통행실태조사와 개인통행실태조사에서 제공하는 가구 소득은 1-6의 범위를 가지며, 연구는 이를 저소득(1-2), 중소득(3-4), 고소득(5-6)으로 분류하고 저소득을 준거 변수로 설정하였다. 직업은 두 데이터 간 기준 차이를 고려하여 전문직, 사무직, 판매·서비스직, 기타직으로 분류하고 기타 직업을 준거 변수로 설정하였다. 기타직은 전문직, 사무직, 판매·서비스직 외의 모든 업종을 포함한다.

Variable description and sources

2수준 변수는 출발 지역(거주지)의 특성으로, 주거·직장, 교육, 부동산, 교통, 서울 3도심과의 거리로 구성된다. 주거·직장 특성은 행정동 내 주택 밀도, 직장 밀도, 그리고 주택 수 대비 직장 수 비율인 직주비로 측정하였다. 주택 밀도와 직장 밀도는 각각 행정동의 시가화 면적을 기준으로 산출되었으며, 이 변수들은 SGIS의 통계 자료를 활용하여 도출하였다. 교육 특성은 행정동 내 교육시설 수와 사설학원 수로 구성하였다. 교육시설은 보육시설과 초·중·고등학교 수의 합이며, 사설학원은 교습학원, 어학원, 예체능 학원 수로 정의하였다. 해당 데이터는 Kakao Map API를 통해 관심지점(Point of Interest, POI) 데이터를 크롤링하여 수집하였다.

부동산 특성은 해당 연도에 거래된 아파트의 평당 가격(억 원)을 기준으로 하였다. 이는 거주자의 경제적 배경과 주거 환경의 질을 반영하는 지표로, 높은 가격의 아파트는 더 나은 주거 환경을 제공하여 통근 시간 증가를 감수할 가능성을 설명하는 변수로 활용되었다. 데이터는 국토교통부 실거래가 공개 시스템을 통해 수집하였다. 교통 특성은 수도권 대중교통의 통근 시간 영향을 평가하기 위해 도시철도를 변수로 채택하였다. 동일 행정동 내 정차하는 노선의 수를 기준으로 하여 밀도를 산출하였으며, 행정동의 시가화 면적을 기준으로 산출되었다. 지하철역 정보는 국토교통부 KRic(레일포털)에서 제공받았다. 마지막으로, 행정동 중심점에서 서울 3도심까지의 거리(유클리드 거리 기준)를 ArcGIS Pro 3.1.0을 통해 산출하였다. 서울 3도심은 고용 밀도가 높고 산업 밀도가 높으나 수도권 외곽지역은 저밀도 지역으로 두 공간은 큰 차이를 보이기 때문에, 해당 거리 변수를 제곱하여 통근 시간과 비선형적 관계를 분석에 반영하였다.

3. 연구 방법론

1) 가우시안 혼합 모델

본 연구는 장시간 통근을 구별하기 위해 통근 시간 하나의 단일 차원에 클러스터링 기법을 적용하였다. 단일 차원에 적용할 수 있는 대표적 클러스터링 방법으로는 가우시안 혼합 모델(GMM)과 K-means가 있으며, 이 두 기법의 군집 적합도를 비교하기 위해 실루엣 스코어를 사용하여 평가하였다. 분석 결과, 두 방법이 유사한 적합도를 보였으나, K-means는 2차원 평면에서 데이터를 여러 그룹으로 분할하여 거리 기반의 비유사도 함수 또는 비용 함수를 최소화하는 방식으로 이루어진다. 이 과정에서 동일 그룹 내 데이터 간의 유사도는 높아지고, 다른 그룹 간 유사도는 낮아지게 된다.

GMM은 특정한 정의나 패턴을 사전에 설정하지 않고, 대규모 데이터셋에서 자동으로 군집 구조를 학습하는 비지도 학습 알고리즘의 일종으로, 개별 데이터가 여러 가우시안 분포에 속할 확률을 계산하여 할당하는 방식으로 동작한다(Verma et al., 2021). GMM은 데이터가 서로 다른 평균과 분산을 가지는 다변량 가우시안 분포로 구성된다는 가정을 바탕으로 한다. 여기서 다변량 분포는 평균과 분산이 각각 다른 분포를 의미한다. 따라서 본 연구는 반복 추정 과정을 통해 최적 클러스터를 도출하는 GMM이 K-means보다 적합하다고 판단하여, GMM을 통해 장시간 통근을 구별하였다. 단일 가우시안 분포의 확률 밀도 함수는 식 (1)로 정의된다.

(1) 

여기서 f(x|μ,σ2)는 평균 μ와 분산σ2를 가지는 단일 가우시안 분포에서 데이터 x가 나올 확률을 나타낸다. 그러나 GMM은 단일 분포가 아닌, 여러 개의 가우시안 분포들의 혼합으로 데이터를 모델링하며, 혼합 확률 밀도 함수는 식 (2)로 정의된다.

(2) 

여기서 K는 클러스터의 개수, πkk번째 가우시안 분포의 가중치 , μk는 평균, ∑k는 공분산 행렬을 나타낸다. GMM은 이러한 혼합 모델을 통해 클러스터링 결과를 확률적 값으로 제공하므로, 통근 시간 구분의 기준을 설정하는 데 유연성을 제공한다.

GMM의 학습 과정에서는 기댓값 최대화 알고리즘(Expectation-Maximization algorithm, EM알고리즘)을 사용한다. EM알고리즘은 관측되지 않은 잠재 변수에 의존하는 확률 모델에서 최대가능도(Maximum Likelihood)를 추정하기 위한 반복 알고리즘이다. 이 알고리즘은 기댓값(E) 단계에서 각 데이터가 특정 클러스터에 속할 확률(책임도, rik)을 계산하며, 이는 식 (3)으로 정의된다.

(3) 

최대화(M) 단계에서는 rik값을 기반으로 각 가우시안 분포의 파라미터를 업데이트한다. 이 과정에서 평균 μk, 공분산 ∑k, 가중치 πk식 (4)를 통해 추정된다.

(4) 

GMM은 클러스터 개수를 지정할 수 있으며, 이를 평가하기 위해 AIC와 BIC 지표를 사용하여 최적 클러스터 개수를 결정할 수 있다. 본 연구에서는 AIC와 BIC를 통해 최적의 클러스터 개수를 도출하였으며, 각 군집 개수에 따른 AIC와 BIC 값을 표로 정리하였다(표 4). 이때 표의 “Number of Components”는 클러스터링 된 군집의 수를 나타내며, 이를 통해 각 군집 수에 따른 모형의 적합도를 비교할 수 있도록 하였다. 〈부록 1〉은 클러스터 개수에 따른 GMM 분석 결과를 제시한 것이다. 여기서 Components는 GMM을 구성하는 개별 클러스터를 의미하며, 예를 들어 GMM이 9개의 클러스터로 구성된 경우 Components는 1부터 9까지 각 클러스터의 결과를 나타낸다. 분석 결과, 2010년과 2021년 데이터 모두 9개의 클러스터가 가장 높은 정확도를 나타내었으나, <부록 1>의 가우시안 분포 시각화 결과에서 클러스터 개수가 4개 이상일 경우 군집이 명확하게 구별되지 않는 문제가 발생하였다. 이는 데이터 부족으로 인한 것으로 판단된다. 또한, 일반적으로 시간을 5분 단위로 응답하는 특성상, <부록 1>과 같이 데이터가 5분 간격으로 군집하는 경향을 보인다. 이에 클러스터 개수에 대한 평가는 의미가 없다고 판단하였다. 따라서 본 연구는 군집이 구별되는 클러스터 개수 중 가장 높은 정확도를 보이는 3개의 클러스터를 설정하여 각각 단시간, 중시간, 장시간으로 정의하고 분석을 진행하였다.

Evaluation results of AIC and BIC by number of GMM clusters

2) 다수준 로지스틱 회귀분석

본 연구의 종속변수는 GMM을 통해 도출된 장시간 통근을 기준으로 한 비장시간 통근(0)과 장시간 통근(1)의 이항 변수로 구성되며, 개인과 행정동 단위의 2개 수준을 독립 변수로 포함하고 있다. 이에 적합한 분석 방법으로 다수준 로지스틱 회귀모형을 사용하였다. 다수준 로지스틱 회귀모형은 개인(1수준)과 지역(2수준) 등 두 개 이상의 계층 구조를 동시에 고려하는 위계적 분석 방법으로, 일반적인 로지스틱 회귀모형을 확장한 형태이다. 식 (5)는 1수준의 로지스틱 회귀 방정식을 나타내며, 식 (6)과 (7)은 2수준의 변수들이 절편과 기울기에 미치는 영향을 설명하는 모형이다. i는 개인 수준의 식별자이며, j는 집단 수준의 식별자이다.

1수준 모형인 식 (5)Pij는 집단 j에 속한 개인 i가 장시간 통근을 할 확률이다. Pij는 집단 j의 절편(β0j), 집단 j의 기울기(β1j), 개인 수준 독립변수(Pij )로 나타낸다.

(5) 

식 (6)은 2수준 모형의 절편에 대한 방적식으로, 전체 집단의 평균 절편(γ00)과 집단 수준 변수(Wj ), Wj가 절편에 미치는 영향(γ01), 집단 j의 무작위 효과(μ0j)로 이루어진다.

(6) 

마지막 2수준 모형에서 기울기에 대한 식으로, 전체 집단의 평균 기울기(γ10)와 Wj가 기울기에 미치는 영향, 집단 j의 무작위 기울기로 구성된다(μ1j)(식 (7)).

(7) 

본 모형을 통해 개인과 지역 수준의 변수가 장시간 통근 여부에 미치는 영향을 효과적으로 추정할 수 있으며, 이는 연구의 위계적 구조와 분석 목적에 적합한 접근 방식이다.


Ⅳ. 분석 결과

1. GMM 결과를 통한 장시간 통근 분류

본 연구는 가우시안 혼합 모델(GMM)을 활용하여 통근 시간을 군집화하고(그림 1, 2), <표 5>와 <그림 3>에 GMM 분석 결과를 요약하였다. 최적의 클러스터링 개수를 3개로 설정하였으며, 이는 <그림 1>과 <그림 2>에 제시된 GMM의 클러스터로 결과에 각각 Gaussian 1, 2, 3으로 표시되었다. 도출된 클러스터를 통해 클러스터별 장시간 통근 여부를 구별하고 분석을 진행하였다.

Figure 1.

GMM clustering results (2010)

Figure 2.

GMM clustering results (2021)

Results of GMM clustering

Figure 3.

Changes in GMM clustering proportions

<표 5>와 <그림 3>에 나타낸 GMM 분석 결과에 따르면, 2010년의 통근 시간은 단시간 통근이 10분-23분, 중시간 통근이 24분-44분, 장시간 통근이 45분-70분으로 나타났다. 2021년은 단시간 통근이 10분-20분. 중시간 통근이 25-45분, 장시간 통근이 50분-80분으로 나타났다. 각 시간대의 비율을 비교한 결과, 단시간 통근이 28.78%에서 22.40%로 감소했고, 중시간 통근과 장시간 통근은 42.58%에서 45.83%, 28.64%에서 31.76%로 증가하였다. 이러한 변화는 통근 시간이 전반적으로 증가하고 있음을 보여준다. 특히, 평균 통근 시간이 2010년 35.12분에서 2021년 38.61분으로 약 3.49분이 증가한 결과로 나타났다.

GMM은 통근 시간과 같이 다양한 평균과 분산을 가진 다봉분포(Multimodal Distribution)의 데이터를 효과적으로 설명할 수 있는 분석 도구로 평가되며, 도시 통행 분석 분야에서도 이미 활용된 바 있다(Verma et al., 2021). 본 연구에서도 GMM을 통해 사전 기준이나 주관적 판단 없이 데이터 자체의 구조에 따라 군집을 도출하였으며, 이로부터 2010년 45분, 2021년 50분이라는 장시간 통근 기준을 객관적으로 제시하였다. 해당 기준은 기존 선행연구들이 제시한 장시간 통근 기준(보통 45~60분 범위)과도 일치하여, 실증적 타당성과 분석 방법론의 적절성을 동시에 확보하고 있다.

2. 장시간 통근통행 기종점 통행 변화 분석

장시간 통근자들이 통근하는 지역을 확인하기 위해 장시간 통근자의 기종점 통행(Origin-Destin, OD)을 시각화하였다(그림 4). 그림은 푸른색 지점이 출발지, 붉은색 지점이 도착지이며, 선이 굵을수록 통행량이 많음을 의미한다. 분석 결과 2010년과 2021년 장시간 통근자들의 OD 패턴에는 큰 차이를 보이지 않았다. 두 그림 모두 공통적으로 서울 외곽, 근교 지역에서 대다수의 장시간 통근자가 출발했으며, 그중 대부분 서울 중심지로 통근하였다.

서울로 도착하는 지역을 살펴보면 영등포구, 중구, 강남구인 서울 3도심 지역에서 가장 진하게 나타났으며, 그 외 마포구, 종로구, 서초구에서도 상대적으로 많은 도착을 보였다. 특히 인천은 광역시이면서 항만물류, 산업단지 등 많은 일자리가 있음에도 불구하고 양질의 일자리를 찾아 서울로 통근하는 모습을 확인할 수 있다. 이는 서울의 인구 및 기능 집중을 완화하기 위해 서울 외곽과 인접 지역을 중심으로 주택 공급이 이루어졌음에도 불구하고, 일자리를 찾아 다시 서울로 통근하는 구조가 지속되고 있음을 시사한다. 이러한 현상은 신규 주거지 조성과 함께 충분한 규모의 일자리가 동시에 이전되지 못한 데 기인한 것으로 해석된다. 이는 고용 중심지와 가까울수록 통근 거리가 짧아지는 선행 연구의 결과(Jun, 2020; Ha et al., 2024)와 일치하며, 대도시 주변 신도시 거주자들이 더 긴 통근을 경험한다는 연구 결과(Jun, 2012; Jun, 2020; Li and Zhao, 2022)와도 맥락을 같이 한다.

또한, 수도권 외곽지역에서는 수원시, 평택시를 제외한 지역에서 장시간 통근자가 상당히 적은 것으로 나타났다. 수도권 외곽에서 시간이 짧은 통근이 주를 이루며, 대부분 장시간 통근이 서울 외곽지역을 중심으로 나타난 것을 통해 서울의 영향이 상대적으로 적게 받는 지역에서 장시간 통근이 적게 나타난 것으로 판단된다.

Figure 4.

Visualization of long-time commuting OD flows (Left: 2010, Right: 2021)

3. 다수준 로지스틱 회귀분석

1) 기초통계 분석

<표 6>은 본 연구에서 사용한 변수들의 기초 통계 분석 결과를 제시한다. 연구는 장시간 통근과 연관된 요인에 집중하기 위해 장시간 통근과 그렇지 않은 비장시간 통근으로 구분하여 이항 다수준 로지스틱 모형을 활용하였다. 종속 변수인 수도권 장시간 통근 비율은 2010년 29.49%에서 2021년 33.43%로 증가하여 장시간 통근이 증가하는 경향을 보였다.

Results of descriptive statistics

1수준 변수에서 성별 분포는 남성 비율이 65.44%에서 56.06%로 감소하여 성비가 보다 균형을 이루었다. 연령 분포에서는 2010년과 2021년 모두 미성년과 노년 비율이 0.18%와 0.35%, 3.35%와 4.04%로 매우 낮게 나타났으며, 청년과 중년 비율이 90% 이상을 차지했다. 이는 통행 목적이 통근으로 직장에 출근하는 생산가능인구 연령대가 대부분을 차지하는 것으로 나타났다. 소득 분포는 2010년 대비 2021년 저소득과 고소득 비율이 감소하고 중소득 비율이 7.74% 증가하였다. 직업 특성에서는 전문직 비율이 12.9%에서 7.14%로 감소한 반면, 사무직 비율은 31.67%에서 36.68%로 증가하였다. 판매·서비스직 비율은 28.75%에서 23.17%로 감소하였고, 기타 직종 비율은 26.68%에서 33.01%로 증가했다. 특히, 코로나19 팬데믹 동안 사무직은 재택근무 전환이 상대적으로 용이했음에도 불구하고 비율이 증가한 반면, 재택근무 전환이 어려운 전문직 및 판매·서비스직 비율은 감소하여 코로나19 팬데믹이 자료에 미치는 영향이 최소화되었음을 확인할 수 있었다.

2수준 변수는 주거·직장 특성, 교육 특성, 부동산 특성, 교통 특성, 3도심 거리로 구분하였다. 주거·직장 특성은 주택 밀도, 직장 밀도, 직주비로 측정되었다. 주택 밀도는 평균이 558.49에서 634.73으로 증가하고 표준편차 및 최댓값 증가했다. 직장 밀도 또한 평균, 표준편차, 최솟값, 최댓값이 모두 증가하여 수도권 일자리 수가 증가했으며 수도권 일자리 집중이 심화하였음을 보여준다. 직주비는 주택 수에서 일자리 수를 나눈 값으로 직주비가 높을수록 주택의 비율이 높은 것으로 해석된다. 2010년 평균이 5.76에서 2021년 3.81로 감소하였으며, 표준편차도 감소하여 주택과 일자리의 비율이 개선되었음을 의미한다. 교육 특성은 교육시설과 사설학원 수로 측정되었다. 행정동 내 어린이보육업 및 초·중·고등학교 수를 합한 교육시설 수는 평균 18.72에서 21.88로 증가하였다. 이에 따라 교습학원, 어학원, 예체능 학원을 포함한 사설학원 수 또한 평균 51.06에서 82.15로 증가하여, 수도권 지역으로의 인구 유입과 신도시 개발에 따른 교육 인프라가 증가하였음을 보여준다.

부동산 특성은 1년 동안 행정동 내 매매 아파트의 평당 가격을 분석한 결과, 0.14억 원에서 0.33억 원으로 2배 이상 증가하였다. 2021년 당시 코로나19 팬데믹으로 인한 저금리 정책으로 부동산 과열 현상이 반영된 결과로, 최솟값은 비슷한 수준이었으나 최댓값이 0.52억 원에서 0.77억 원으로 크게 상승하였으며, 이에 따라 표준편차 또한 증가했다. 교통 특성에서는 지하철 밀도를 변수로 설정했다. 행정동 내 정차하는 지하철 노선의 수를 시가화 면적으로 나눈 값이다. 지하철역은 건설 이후 변동이 어려워, 2010년 대비 2021년 평균이 소폭 증가하였으며 최솟값과 표준편차는 동일하게 유지되었다. 마지막으로 3도심 거리 변수는 행정동 중심점과 서울 3도심 간의 유클리드 거리를 제곱하여 산출하였다. 평균이 소폭 증가하고 최솟값이 감소하였으나 표준편차와 최댓값은 거의 변동이 없어 행정동의 분할·통합에 따른 일부 차이를 제외하고는 큰 변화를 보이지 않았다.

2) 다수준 로지스틱 회귀분석

<표 7>은 다수준 로지스틱 모형의 분석 결과를 나타내며, 비교를 위해 일반 로지스틱 모형의 결과도 포함하고 있다. 데이터 수는 2010년 1수준 136,632개, 2수준 636개와 2021년 1수준 16,211개, 2수준 756개이다. 모형 1과 모형 2는 2010년 데이터를, 모형 3과 모형 4는 2021년 데이터를 활용하였다. 여기서 모형 1과 모형 3은 개인 수준의 특성만을 고려한 일반 로지스틱 모형의 결과이며, 모형 2와 모형 4는 개인 특성과 행정동 수준의 지역 특성을 함께 고려한 다수준 로지스틱 모형의 결과를 보여준다.

Result of multilevel logistic regression analysis

모형 1과 모형 3에서는 대부분 독립변수가 예상된 방향으로 통계적으로 유의미한 결과를 보였다. 예를 들어, 남성은 장시간 통근에 긍정적인 상관관계를 보였으며, 고소득은 장시간 통근 가능성을 유의미하게 증가시키는 것으로 나타났다. 다만 일반 로지스틱 모형은 여러 수준의 데이터를 동시에 고려할 수 없는 한계를 가지고 있다. 이를 보완한 다수준 로지스틱 모형(모형 2, 4)에서는 주거지의 특성과 같은 지역 수준의 변수가 장시간 통근에 미치는 영향이 추가적으로 고려되었으며, 이는 일반 로지스틱 모형에서 포착되지 않았던 결과이다.

분석 모형의 설명력 비교를 위해 Akaike Information Criterion(AIC)과 Bayesian Information Criterion(BIC) 값을 활용하였다. AIC와 BIC는 여러 모형 중 설명력이 높은 모형을 선택하는 기준으로, 값이 작을수록 모형의 적합도가 높음을 나타낸다. <표 7>에서 모형 적합도를 비교하기 위해 사용된 AIC와 BIC 결과에 따르면, 2010년 데이터에서 일반 로지스틱 모형(모형 1)의 AIC는 163,070.3이지만, 다수준 로지스틱 모형(모형 2)의 AIC는 160,126.3으로 약 2,944의 차이를 보인다. 2021년 데이터에서도 유사한 경향이 관찰되며, 일반 로지스틱 모형(모형 3)의 AIC는 20,394.32, 다수준 로지스틱 모형(모형 4)의 AIC는 19,974.25로 약 420의 차이를 보인다. 이러한 결과는 장시간 통근의 영향을 확인하는 데 있어, 개인 수준을 넘어 지역 수준을 함께 고려하는 것이 더 적합함을 시사한다.

다수준 로지스틱 모형(모형 2, 4)의 Intraclass Correlation Coefficient(ICC) 결과를 통해 개인과 행정동 수준의 전반적인 설명력이 확인된다. 2010년 데이터에서 ICC는 2.2%로 나타났으며, 이는 장시간 통근 여부에 대해 개인과 지역 특성이 일부 영향이 있음을 의미한다. 2021년 데이터에서는 ICC가 2.9%로 소폭 상승하였는데, 이는 시간이 지남에 따라 지역 특성의 영향이 커졌음을 시사한다. 다만, ICC 값이 2%대로 타 연구와 비교했을 때, 낮은 수준의 설명력을 보이는 점은 한계로 작용할 수 있다. 그러나 LR test vs. ologit 결과, 모형 2와 모형 4 모두 통계적으로 유의미한 값을 나타내어 모형의 적합성이 높음을 뒷받침한다. 이는 다수준 로지스틱 모형이 일반 로지스틱 모형보다 데이터를 더 잘 설명하며, 개인 특성과 지역 특성을 함께 고려하는 것이 장시간 통근 여부를 분석하는 데 있어 적합하다는 점을 시사한다.

개인수준에서 개인 특성 중 성별은 남성이 여성보다 장시간 통근할 확률이 높았으며, 2021년에 소폭 증가했다. 연령의 경우 청년층(20세-39세)을 준거 변수로 설정하였고, 모든 연령대가 청년층과 비교해 장시간 통근할 확률이 낮은 것으로 나타났다. 결과에 따르면 중년층(40세-64세)이 청년층 다음으로 높은 장시간 통근 확률을 보였고, 미성년과 노년층이 그 뒤를 이었다. 소득 변수는 저소득을 준거 변수로 설정했다. 중소득과 고소득 집단 모두 장시간 통근과 양의 관계를 보여, 저소득 집단에 비해 장시간 통근 확률이 더 높은 것으로 나타났다. 특히 중소득의 장시간 통근할 승산비는 1.09에서 1.12로, 고소득은 1.14에서 1.20으로 증가하여, 소득이 높을수록 장시간 통근 확률이 증가하는 경향이 뚜렷하게 나타났다.

직업 특성에서는 준거 변수를 기타 직종으로 설정하였다. 전문직은 2010년 장시간 통근과 양의 관계였으나 2021년에는 음의 관계로 전환되었다. 사무직은 두 시점 모두 양의 관계를 유지했으며, 2021년에는 장시간 통근할 승산비가 증가했다. 판매·서비스직은 2010년 음의 관계를 보였으나 2021년에는 유의미한 관계를 보이지 않았다. 판매·서비스직의 경우, 시간제 근무와 같이 근무지가 거주지와 인접한 경우가 많아 장시간 통근과 음의 관계가 나타난 것으로 해석된다. 2021년에는 코로나19 팬데믹으로 인한 재택근무 확대, 경제 불황, 소비 트렌드 변화 등의 복합적 요인이 영향을 미친 것으로 보인다. 이러한 결과는 엔데믹 이후 추가적인 분석이 필요함을 시사한다.

종합적으로 개인 수준에서 소득이 높고 청년층에 속하며 사무직에 종사하는 남성일수록 장시간 통근 확률이 높은 경향을 보였다. 이는 경제활동이 활발하고 건강과 체력이 상대적으로 좋은 집단일수록 장시간 통근을 수용할 가능성이 높음을 의미한다. 이는 고소득층, 청년층, 남성의 장시간 통근 경향을 지적한 선행연구들(최성수·주익현, 2019; Zhao et al., 2020; Giménez-Nadal et al., 2022; Li and Zhao, 2022; Ha et al., 2024; Newbold, 2024)과 일치하는 결과이다. 반면, 소득이 낮을수록 통근시간이 길어지는 경향을 보인 연구(이민주·박인권, 2016)도 존재하여 소득 변수에 대한 심층 연구의 필요성이 있다.

2수준은 기점을 기준으로 행정동 수준에서 장시간 통근에 영향을 미치는 요인을 분석하였다. 주거·직장 특성에서 주거 밀도는 2010년과 2021년 모두 장시간 통근과 양의 관계를 보였고, 직장 밀도는 음의 관계가 나타났다. 이는 거주지가 주택이 밀집한 지역일수록 장시간 통근 확률이 증가하며, 직장이 많은 지역일수록 그 확률이 감소하는 것으로 분석되었다. 직주비 또한 장시간 통근과 양의 관계를 나타내 주택 비율이 높은 지역일수록 장시간 통근 확률이 높았다. 이는 거주지의 직장-주택 비율이 높거나 균형을 이룰수록(Mitra and Saphores, 2019; 권성문·박길환, 2020), 일자리 밀집 지역에 거주할수록 통근이 짧은 경향을 보이는 연구(신상영, 2003; 전명진·정지은, 2011; 권성문·박길환, 2020)와 일치하는 결과이다.

교육 특성의 교육시설과 사설학원 수를 분석한 결과, 교육시설은 장시간 통근과 유의미한 관계가 없는 것으로 나타났다. 이는 자녀 교육을 위해 학교와 인접한 곳으로 거주지를 이동한 가정의 경우 부모의 장시간 통근이 특별한 영향을 받지 않음을 의미한다. 한편, 사설학원은 2010년 장시간 통근과 양의 관계를 보였으나 2021년에는 유의미한 관계를 나타내지 않았다. 이는 2007년 개정된 「학원의 설립·운영 및 과외교습에 관한 법률」에 따른 수도권 학원의 심야교습 금지 조례로 인해 사설학원 인근으로의 주거이동 부담이 줄어든 것으로 해석된다. 부동산 특성에서는 행정동 내 매매 아파트의 평당 가격이 2010년에 음의 관계를 보였으나 2021년에는 유의미한 관계를 보이지 않았다. 이는 도심 고용 중심지의 높은 부동산 가격과 장시간 통근 감소와의 관계로 해석되며, 2021년에는 코로나19 팬데믹으로 인한 저금리 정책이 주택 시장에 영향을 미친 결과로 볼 수 있다.

교통 특성에서는 지하철 밀도를 분석하였다. 2010년에는 유의미한 관계가 없었으나, 2021년에는 음의 관계가 나타나 행정동 내 정차하는 지하철 노선이 많을수록 장시간 통근 확률이 감소하는 것으로 나타났다. 이는 교통 중심지의 지리적 이점이 통근 시간을 단축하는 데 기여함을 시사한다. 이러한 결과는 대중교통 이용률이 높은 지역에서는 통근 거리와 시간이 길어지는 경향을 확인한 연구(현준용·김재익, 2014)와 상반되는 결과로 나타났다. 마지막으로 행정동 중심에서 3도심까지의 거리가 멀어질수록 장시간 통근 확률이 감소했다. 이 결과는 수도권 외곽 지역에서 통근 시간과 장시간 통근 비율이 감소하는 경향과 일치한다. 종합적으로, 2수준 분석 결과는 주거 및 직장 밀도와 직주비, 그리고 교통 접근성이 장시간 통근에 중요한 영향을 미치는 요인임을 시사한다. 특히, 주거지와 직장 간 불균형 및 교통 인프라의 분포가 장시간 통근의 주요 요인으로 작용하며, 이러한 특성은 지역별 개발 전략 및 교통 정책에 중요한 시사점을 제공한다.

이러한 통근 시간의 증가는 단순한 교통 문제를 넘어, 서울 및 수도권의 도시 구조적 불균형과 사회경제적 변화가 복합적으로 작용한 결과로 해석될 수 있다. 특히 서울시 주거비 상승과 수도권 외곽의 신도시 개발은 장시간 통근 인구의 증가와 관련이 있을 것으로 판단된다. 아울러 맞벌이 가구의 증가, 자녀 교육 여건을 고려한 주거지 선택 등 주거입지에 있어 가구의 다양한 선호의 반영은 장시간 통근의 증가와 관련이 있을 수 있다. 이러한 맥락에서, 단순히 통근 시간을 단축하기 위한 교통 기반시설 확충만으로는 한계가 있으며, 직주균형과 교통 인프라의 지역 간 형평성 확보 등 공간 구조 전반에 대한 통합적 대응이 요구된다.


Ⅴ. 결 론

1. 결론 및 시사점

본 연구는 통행 데이터를 활용하여 장시간 통근을 정의하고, 그에 영향을 미치는 요인을 분석하였다. 장시간 통근의 구분은 GMM을 사용해 통근 시간을 클러스터링하는 방식으로 수행되었으며, 도출된 장시간 통근 결과를 종속변수로 설정하여 다수준 로지스틱 회귀분석을 통해 영향요인을 분석하였다.

수도권 행정동별 평균 통근 시간 분석 결과, 2010년 대비 2021년에 서울 외곽지역을 중심으로 평균 통근 시간이 가장 길게 나타났다. 특히 서울 외곽지역의 평균 통근 시간이 전반적으로 증가하였으며, 장시간 통근을 보이는 지역의 공간적 범위 또한 확대되는 경향을 보였다. 수도권 외곽 일부 지역에서도 통근 시간이 증가하는 양상이 확인되었으나, 대부분의 외곽지역은 여전히 짧은 통근 시간을 유지하는 것으로 나타났다. 서울 도심은 3도심 지역(영등포구, 중구, 강남구)에서 통근 시간이 짧은 곳으로 나타났으며, 이는 도시 인프라와 고용 중심지로서 많은 인구가 집중되는 지역적 특성과 맞물려 있다.

장시간 통근을 도출하기 위해 통근 시간을 기준으로 가우시안 혼합 모델(GMM)을 적용하였으며, 3개를 최적의 클러스터링 개수로 설정하였다. GMM 분석 결과, 통근 시간은 2010년 기준으로 10분-23분(단시간), 24분-44분(중시간), 45분-70분(장시간)으로 구분되었으며, 2021년에는 10분-19분(단시간), 20분-49분(중시간), 50분-80분(장시간)으로 분류되었다. 이에 따라 본 연구는 2010년 45분, 2021년 50분을 장시간 통근의 기준으로 설정하였다. 두 시점을 비교한 결과, 2021년에는 단시간 통근 비율이 감소하고 중·장시간 통근 비율이 증가하여 평균 통근 시간이 증가하는 모습을 보였다.

두 시점의 장시간 통근기준이 다른 결과는 시간대에 따라 통근 시간에 직·간접적으로 영향을 미칠 수 있는 다양한 영향들에 대한 유동성으로 해석할 수 있다. 예를 들어 개인차량이 보급된 마이카(My Car) 시대를 기준으로 전·후의 통근 시간에는 확연한 차이를 보일 수 있다. 또한 대중교통 개혁을 통해 환승시스템이 적용되거나, 광역교통체계, GTX 등 다양한 요인들이 존재하며, 이들은 통근 시간이 변화하게 되는 주요 요인들이다. 이는 본 연구에서 언급한 바와 같이 단일 기준으로 장시간 통근의 기준을 정의할 수 없음을 강조하며, 각 시간대의 시대적 상황에 따른 변동적인 기준을 적용할 수 있음을 제시한다.

아울러 장시간 통근의 기준을 명확히 정의하는 것은 연구의 신뢰성과 분석의 명확성을 확보하는 데 중요한 역할을 한다. 명확한 기준은 연구 범위를 합리적으로 한정하고 분석 대상 집단을 체계적으로 구분함으로써, 결과 해석의 일관성을 높이고 기존 연구와의 비교 가능성을 제고한다. 특히 본 연구는 연도별로 상이한 기준을 적용함으로써 시대적·지역적 맥락에 따른 통근 시간 변화의 특성을 반영하고, 분석 결과의 정확성과 타당성을 강화하였다.

장시간 통근자들의 통행 패턴을 시각화한 결과, 대부분이 서울 외곽 및 근교에서 출발해 서울 도심으로 향하는 패턴이 두드러졌으며, 특히 3도심 지역으로의 집중도가 높았다. 따라서 수도권 지역의 통근 패턴은 서울 근교 지역에서 가장 높은 통근 시간을 보이며, 해당 지역에서 서울로 통근하는 장시간 통근자가 대다수임을 확인하였다. 이는 서울 인근에 신도시가 개발되었으나 충분한 일자리 제공이 이루어지지 않아, 신도시 거주자들이 다시 서울로 통근하게 되었음을 시사한다. 반면, 수도권 외곽에서는 장시간 통근자의 수가 거의 나타나지 않았는데, 이는 서울과의 물리적인 거리로 인해 서울의 영향을 상대적으로 적게 받았기 때문으로 판단된다.

다수준 로지스틱 회귀분석 결과, 개인 수준에서는 고소득의 20세-39세 사무직 남성일수록 장시간 통근 확률이 높은 것으로 나타났다. 이는 개인의 체력 및 건강과 경제적 여건, 직업적 특성이 장시간 통근 수용에 중요한 역할을 한다는 점을 보여준다. 행정동 수준에서는 주거 밀도와 직장 밀도가 장시간 통근에 중요한 영향을 미치는 요인으로 확인되었다. 주거밀도가 높고 직장밀도가 낮은 지역에서는 장시간 통근 확률이 증가하였으며, 직주비(직장 대비 주거 비율)가 높을수록 장시간 통근이 증가하는 경향이 뚜렷하게 나타났다. 이러한 결과는 직주 불균형이 장시간 통근을 유발하는 주요 원인 중 하나임을 시사한다.

교육 특성의 경우, 2021년에 장시간 통근에 유의미한 영향을 미치지 않는 것으로 나타났으며, 부동산 특성에서는 2010년 기준으로 아파트 평당 가격이 낮을수록 장시간 통근 확률이 증가하는 경향이 확인되었다. 이는 자녀 교육이 장시간 통근에 영향을 미치지 않으며, 주거비용이 장시간 통근 결정에 영향을 미쳤음을 보여준다. 한편, 교통과 3도심 거리 특성에서는 지하철 밀도가 높고 도심과의 거리가 멀수록 장시간 통근 확률이 낮아지는 경향이 관찰되었다. 교통 특성의 경우 교통 인프라의 접근성 및 효율성이 장시간 통근을 완화하는 데 중요한 역할을 할 수 있음을 시사한다.

이러한 결과는 개인적 요인뿐 아니라 지역적 요인이 장시간 통근에 중요한 영향을 미친다는 점을 강조한다. 특히, 개인 수준에서는 양질의 일자리가 장시간 통근 수용에 영향을 미치는 요인으로 작용하며, 지역 수준에서는 주거와 직장의 균형적 배치가 장시간 통근을 줄이는 데 핵심적인 역할을 할 수 있음을 보여준다. 이는 단순한 직주근접보다 생활권 내 주거와 직장이 적절한 수준으로 조화가 이루어질 필요가 있음을 시사한다. 따라서 도시계획적 관점에서 장시간 통근 문제를 해결하기 위해서는 직주 간 접근성을 높이는 도시계획 및 주거·교통 정책의 개선이 필요하다.

결론적으로, 수도권의 장시간 통근 문제는 여전히 해소되지 않고 있는 것으로 나타났다. 수도권 지역 주택 공급은 서울 외곽으로 확산되었지만, 고용의 공간적 분산과 신도시의 자족성 확충은 충분히 이루어지지 않아 장시간 통근이 지속되고 있는 것으로 볼 수 있다. 따라서 신도시 내에 양질의 일자리를 창출하고, 직장 인근에 합리적인 가격의 주택을 공급함으로써, 생활권 내 직주근접을 통한 효율적인 공간구조 대안 마련이 필요다. 이는 단순히 통근 시간을 단축하는 접근을 넘어, 일상생활의 공간 구조를 재편하는 통합적 도시정책의 필요성을 시사한다.

또한, 본 연구는 기계학습 기법인 가우시안 혼합 모델을 활용하여 장시간 통근의 기준을 데이터 기반으로 제시하였다. 이는 향후 장시간·장거리 통행을 분석할 때 데이터에 기반한 객관적인 기준을 도출할 수 있는 방법론적 기반을 제공하며, 자료 구축 비용을 절감하고 통근자의 삶의 질 개선 및 교통 정책 수립의 기초 자료 마련에 기여할 수 있을 것으로 기대된다.

종합적으로 본 연구는 통근 시간의 분포 변화와 장시간 통근의 확산 경향을 실증적으로 확인함으로써, 수도권에서 장시간 통근이 일상화되고 있는 사회 구조적 현실을 보여준다. 이는 단순한 교통 문제를 넘어, 주거, 고용, 교육, 도시계획 전반의 불균형 구조에 대한 근본적 재정비의 필요성을 제기한다. 향후 도시정책은 통근 시간의 단축만을 목표로 하기보다, 삶의 질 향상을 위한 공간 불균형 해소와 통합적 생활권 설계를 포함하는 방향으로 전환되어야 할 것이다.

2. 연구의 의의 및 한계점

본 연구는 고밀도 도시 환경인 한국 수도권을 대상으로 장시간 통근의 특성과 영향을 분석하여 차별성을 지닌다. GMM을 활용해 실증적으로 장시간 통근 기준을 설정하고, 개인 및 지역 특성을 고려한 다수준 로지스틱 회귀모형을 통해 장시간 통근의 영향을 다각적으로 분석함으로써 연구의 객관성과 신뢰성을 높였다. 또한, 2010년과 2021년 데이터를 비교·분석하고, 장시간 통근 패턴을 시각화했으며, 교통 인프라, 주거 및 고용 특성, 주거비용 등을 포괄적으로 분석하여 수도권 장시간 통근에 대한 심층적 이해를 제공한다.

본 연구는 2010년 가구통행실태조사와 2021년 개인통행실태조사 자료를 기반으로 GMM을 활용해 장시간 통근을 구별하고 영향 요인을 분석했다. 그러나 통행시간을 구분하기 위해 GMM을 사용한 연구의 사례가 많지 않아 추가 연구가 필요할 것으로 판단된다. 또한, GMM의 확률적 특성을 충분히 반영하지 않고, 클러스터링 결과를 확정적인 값으로 활용한 점도 개선할 여지가 있다.

연구 방법론 외 자료에 대한 한계가 존재한다. 2021년 자료는 코로나19 팬데믹 기간에 수집된 데이터로, 당시 시행된 사회적 거리두기 정책이 통행행태에 영향을 미쳤을 가능성이 있다. 또한, 원데이터의 크기가 작아 특정 변수의 표본 수가 매우 적은 것으로 나타났다. 이에 따라 팬데믹이 종료된 이후에 수집된 자료를 활용한 후속 연구가 필요하다. 또한, 연구에 사용된 가구통행실태조사 자료와 개인통행실태조사 자료는 수집 방식의 차이뿐만 아니라 조사 내용과 양의 차이도 존재하여 자료의 일관성이 부족할 수 있다. 이와 같은 한계를 극복하기 위해 향후 이동통신 기반 시계열 생활 이동 데이터 등을 활용한 추가 연구가 요구된다.

아울러 장시간 통근은 다양한 복합적 요인의 영향을 받으며 이에 따른 여러 결과를 도출할 수 있다. 그러나 본 연구는 제한된 변수만을 사용하여 결과를 도출하여 과도한 해석에 주의할 필요가 있다. 이는 본 연구에서 단일변수로 이루어진 특성의 경우 결과 해석에 주의가 필요하며, 추가적인 변수 구축을 통한 연구가 필요함을 시사한다. 또한, 본 연구는 장시간 통근에만 집중하여 단시간 통근과 중시간 통근 영향요인에 대한 추가 연구가 필요하다. 나아가 수도권은 매우 넓고 이질적인 지역으로, 서울 및 인근 지역은 고밀도 도시 지역인 반면, 수도권 외곽은 저밀도 비도시 지역으로 차이가 존재한다. 따라서 도시 밀도와 인프라 수준의 차이를 충분히 반영하지 못한 점은 본 연구의 한계로 지적될 수 있다. 이는 추가적인 변수 구축과 더불어 다양한 지역적 특성을 반영한 연구가 필요함을 시사한다.

Acknowledgments

이 논문은 2024년 한국지역학회 후기 학술대회에서 발표한 논문을 수정·보완하여 작성하였으며, 주저자의 한양대학교 석사학위논문 일부 내용을 발췌하여 작성하였음.

References

  • 고승욱·정승진·이승일, 2023. “서울시 공공임대주택 입주자의 개인 및 가구특성과 주거지의 공간적 특성이 장시간 통근 여부에 미치는 영향 연구: 다수준 이항 로지스틱 회귀모형을 활용하여”, 「국토계획」, 58(2): 52-66.
    Go, S.W., Jung, S.J., and Lee, S.I., 2023. “A Study on the Effect of Individual and Household Characteristics with Regional Residential Characteristics in Public Rental Housing in Seoul on Long Time Commuting: A Multilevel Binomial Logistic Regression Model Study”, Journal of Korea Planning Association, 58(2): 52-66. [https://doi.org/10.17208/jkpa.2023.04.58.2.52]
  • 고은주·전승봉, 2017. “경기도민의 통근 시간과 삶의 질 – 생활시간 및 소득과의 관계를 중심으로”, 「GRI 연구논총」, 19(3): 25-49.
    Ko, E.J. and Jeon, S.B., 2017. “The Quality of Life and Commuting: Considering Time – Use and Income of Kyunggi Resident”, GRI Review, 19(3): 25-49.
  • 권성문·박길환, 2020. “직주균형이 통근 시간에 미치는 영향의 공간계량경제학적 분석”, 「한국지역개발학회지」, 32(2): 137-161.
    Gwon, S.M. and Park, G.H., 2020. “Spatial Panel Econometric Analyses of the Effects of Jobs-Housing Balance on Commuting Time”, Journal of The Korean Regional Development Association, 32(2): 137-162.
  • 김성주·송재민, 2023. “기계학습을 활용한 소득계층별 통근 시간 영향요인”, 「국토계획」, 58(6): 85-99.
    Kim, S.J. and Song, J.M., 2023. “Influencing Factors of Commuting Time by Income Class: A Machine Learning Approach”, Journal of Korea Planning Association, 58(6): 85-99. [https://doi.org/10.17208/jkpa.2023.11.58.6.85]
  • 김재익·권진휘, 2013. “수도권 통근통행의 공간적 변화와 직주분리수준의 분석”, 「교통연구」, 20(4): 79-90.
    Kim, J.I. and Kwon, J.H., 2013. “The Spatial Changes of Commuting Pattern and Its Effect on Jobs-Housing Mismatch: The Case of Seoul Metropolitan Region”, Journal of Transport Research, 20(4): 79-90. [https://doi.org/10.34143/jtr.2013.20.4.79]
  • 신상영, 2003. “직주접근성과 통근통행: 수도권을 사례로”, 「국토계획」, 38(4): 73-87.
    Shin, S.Y., 2003. “Jobs-Housing Accessibility and Commuting: The Case of Seoul Metropolitan Area”, Journal of Korea Planning Association, 38(4): 73-87.
  • 이민주·박인권, 2016. “지역 특성에 따른 소득별 직주불일치에 관한 연구”, 「지역연구」, 32(1): 67-82.
    Lee, M.J. and Park, I.K., 2016. “A Study on the Spatial Mismatch by Income and Regional Characteristics”, Journal of the Korean Regional Science Association, 32(1): 67-82.
  • 장재민·이병호·고준호, 2019. “근로자의 통근 시간 만족도 결정 요인 연구: 경기도 거주자를 중심으로”, 「대한교통학회지」, 37(4): 290-301.
    Jang, J.M., Lee, B.H., and Ko, J.H., 2019. “Determinants of Commute Time Satisfaction: Focusing on the Residents of Gyeonggi Province”, Journal of Korean Society of Transportation, 37(4): 290-301. [https://doi.org/10.7470/jkst.2019.37.4.290]
  • 전명진·정지은, 2011. “수도권 직주불일치 수준 및 초과통근 분석”, 「국토계획」, 46(4): 189-197.
    Jun, M.J. and Jeong, J.E., 2011. “Analysis on Spatial Mismatch and Excess Commuting of the Seoul Metropolitan Area Using Cubic Spline Function and Linear Programming”, Journal of Korea Planning Association, 46(4): 189-197.
  • 최성수·주익현, 2019. “시간은 돈이다?: 가구소득에 따른 부부 통근 시간의 계층화: 가구소득에 따른 부부 통근 시간의 계층화”, 「한국인구학」, 42(1): 1-31.
    Choi, S.S. and Joo, I.H., 2019. “Can Our Money Save Our Time on Road?: Family Income and Commute Time in South Korea”, Korea Journal of Population Studies, 42(1): 1-31. [https://doi.org/10.31693/KJPS.2019.03.42.1.1]
  • 하재현·이수기, 2017. “개인의 생애주기 단계에 따른 통근 시간 영향요인 분석 – 2010년 수도권 가구통행실태조사자료를 중심으로 –”, 「국토계획」, 52(4): 135-152.
    Ha, J.H. and Lee, S.G., 2017. “Analysis on the Determinant Factors of Commuting Time by Individuals’ Life Cycle Stage – Based on the 2010 Household Travel Survey Data of the Seoul Metropolitan Area –”, Journal of Korea Planning Association, 52(4): 135-152. [https://doi.org/10.17208/jkpa.2017.08.52.4.135]
  • 현준용·김재익, 2014. “대중교통이용률과 직주균형 수준이 통근 통행에 미치는 영향”, 「교통연구」, 21(4): 17-32.
    Hyun, J.Y. and Kim, J.I., 2014. “The Effects of Transit-Share and Job-Housing Balance on Commuting Travel”, Journal of Transport Research, 21(4): 17-32. [https://doi.org/10.34143/jtr.2014.21.4.17]
  • Boccalatte, A., Fossa, M., Thebault, M., Ramousse, J., and Ménézo, C., 2023. “Mapping the Urban Heat Island at the Territory Scale: An Unsupervised Learning Approach for Urban Planning Applied to the Canton of Geneva”, Sustainable Cities and Society, 96: 104677. [https://doi.org/10.1016/j.scs.2023.104677]
  • Cassel, S.H., Macuchova, Z., Rudholm, N., and Rydell, A., 2013. “Willingness to Commute Long Distance among Job Seekers in Dalarna, Sweden”, Journal of Transport Geography, 28: 49-55. [https://doi.org/10.1016/j.jtrangeo.2012.10.011]
  • Gemma, A., Mannini, L., Crisalli, U., and Cipriani, E., 2024. “Improving Urban Travel Time Estimation Using Gaussian Mixture Models”, IEEE Transactions on Intelligent Transportation Systems, 25(10): 14154-14163. [https://doi.org/10.1109/TITS.2024.3390792]
  • Giménez-Nadal, J.I., Molina, J.A., and Velilla, J., 2022. “Trends in Commuting Time of European Workers: A Cross-country Analysis”, Transport Policy, 116: 327-342. [https://doi.org/10.1016/j.tranpol.2021.12.016]
  • Ha, J., Lee, S., Kim, J.H., and Hipp, J.R., 2024. “Do Employment Centers Matter? Consequences for Commuting Distance in the Los Angeles Region, 2002–2019”, Cities, 145: 104669. [https://doi.org/10.1016/j.cities.2023.104669]
  • He, M. and Zhao, S., 2017. “Determinants of Long-duration Commuting and Long-duration Commuters' Perceptions and Attitudes toward Commuting Time: Evidence from Kunming, China”, IATSS Research, 41(1): 22-29. [https://doi.org/10.1016/j.iatssr.2016.08.001]
  • He, M., Zhao, S., and He, M., 2016. “Tolerance Threshold of Commuting Time: Evidence from Kunming, China”, Journal of Transport Geography, 57: 1-7. [https://doi.org/10.1016/j.jtrangeo.2016.09.007]
  • Humagain, P. and Singleton, P.A., 2020. “Investigating Travel Time Satisfaction and Actual Versus Ideal Commute Times: A Path Analysis Approach”, Journal of Transport & Health, 16: 100829. [https://doi.org/10.1016/j.jth.2020.100829]
  • Jang, J. and Ko, J., 2019. “Factors Associated with Commuter Satisfaction across Travel Time Ranges”, Transportation Research Part F: Traffic Psychology and Behaviour, 66: 393-405. [https://doi.org/10.1016/j.trf.2019.09.019]
  • Joly, I. and Vincent-Geslin, S., 2016. “Intensive Travel Time: An Obligation or a Choice?”, European Transport Research Review, 8: 1-14. [https://doi.org/10.1007/s12544-016-0195-7]
  • Jun, M.J., 2012. “The Effects of Seoul's New-town Development on Suburbanization and Mobility: A Counterfactual Approach”, Environment and Planning A: Economy and Space, 44(9): 2171-2190. [https://doi.org/10.1068/a44635]
  • Jun, M.J., 2020. “The Effects of Polycentric Evolution on Commute Times in a Polycentric Compact City: A Case of the Seoul Metropolitan Area”, Cities, 98: 102587. [https://doi.org/10.1016/j.cities.2019.102587]
  • Kim, S., Kim, Y., Lim, S.S., Ryoo, J.H., and Yoon, J.H., 2019. “Long Commute Time and Sleep Problems with Gender Difference in Work–life Balance: A Cross-sectional Study of More Than 25,000 Workers”, Safety and Health at Work, 10(4): 470-475. [https://doi.org/10.1016/j.shaw.2019.08.001]
  • Kobus, M.B., Van Ommeren, J.N., and Rietveld, P., 2015. “Student Commute Time, University Presence and Academic Achievement”, Regional Science and Urban Economics, 52: 129-140. [https://doi.org/10.1016/j.regsciurbeco.2015.03.001]
  • Li, S.A. and Zhao, P., 2022. “Examining Commuting Disparities across Different Types of New Towns and Different Income Groups: Evidence from Beijing, China”, Habitat International, 124: 102558. [https://doi.org/10.1016/j.habitatint.2022.102558]
  • Limtanakool, N., Dijst, M., and Schwanen, T., 2006. “The Influence of Socioeconomic Characteristics, Land Use and Travel Time Considerations on Mode Choice For Medium-and Longer-distance Trips”, Journal of Transport Geography, 14(5): 327-341. [https://doi.org/10.1016/j.jtrangeo.2005.06.004]
  • Marion, B. and Horner, M.W., 2007. “Comparison of Socioeconomic and Demographic Profiles of Extreme Commuters in Several US Metropolitan Statistical Areas”, Transportation Research Record, 2013(1): 38-45. [https://doi.org/10.3141/2013-06]
  • Mitra, S.K. and Saphores, J.D.M., 2019. “Why Do They Live So Far from Work? Determinants of Long-distance Commuting in California”, Journal of Transport Geography, 80: 102489. [https://doi.org/10.1016/j.jtrangeo.2019.102489]
  • Morris, E.A., Ettema, D., and Zhou, Y., 2020. “Which Activities Do Those with Long Commutes Forego, and Should We Care?”, Transportation Research Interdisciplinary Perspectives, 5: 100119. [https://doi.org/10.1016/j.trip.2020.100119]
  • Newbold, K.B., 2024. “Age and Domestic Migration Effects on Workers’ Commuting Distance”, Transportation, 51(2): 673-688. [https://doi.org/10.1007/s11116-022-10341-5]
  • Sandow, E., 2014. “Til Work Do Us Part: The Social Fallacy of Long-distance Commuting”, Urban Studies, 51(3): 526-543. [https://doi.org/10.1177/0042098013498280]
  • Sandow, E. and Westin, K., 2006. Vill Människor Pendla Längre, TRUM.
  • Van Ommeren, J.N. and Gutiérrez-i-Puigarnau, E., 2011. “Are Workers with a Long Commute Less Productive? An Empirical Analysis of Absenteeism”, Regional Science and Urban Economics, 41(1): 1-8. [https://doi.org/10.1016/j.regsciurbeco.2010.07.005]
  • Verma, T., Sirenko, M., Kornecki, I., Cunningham, S., and Araújo, N.A., 2021. “Extracting Spatiotemporal Commuting Patterns from Public Transit Data”, Journal of Urban Mobility, 1: 100004. [https://doi.org/10.1016/j.urbmob.2021.100004]
  • Vincent-Geslin, S. and Ravalet, E., 2016. “Determinants of Extreme Commuting. Evidence from Brussels, Geneva and Lyon”, Journal of Transport Geography, 54: 240-247. [https://doi.org/10.1016/j.jtrangeo.2016.06.013]
  • Wang, M. and Gou, Z., 2024. “Gaussian Mixture Model Based Classification for Analyzing Longitudinal Outdoor Thermal Environment Data to Evaluate Comfort Conditions in Urban Open Spaces”, Urban Climate, 53: 101792. [https://doi.org/10.1016/j.uclim.2023.101792]
  • Zhao, P., Liu, D., Yu, Z., and Hu, H., 2020. “Long Commutes and Transport Inequity in China’s Growing Megacity: New Evidence from Beijing Using Mobile Phone Data”, Travel Behaviour and Society, 20: 248-263. [https://doi.org/10.1016/j.tbs.2020.04.007]
  • Zhu, P., Wang, K., Ho, S.N.R., and Tan, X., 2023. “How Is Commute Mode Choice Related to Built Environment in a High-density Urban Context?”, Cities, 134: 104180. [https://doi.org/10.1016/j.cities.2022.104180]
  • 국가데이터처, 2021. “장시간통근통학인구비율”, https://www.index.go.kr/unify/idx-info.do?idxCd=5080
    Ministry of Data and Statistics, 2021. “Ratio of Long-time Commuting and School-going Population”, https://www.index.go.kr/unify/idx-info.do?idxCd=5080

Appendix

Results of GMM analysis by the number of clusters

Figure 1.

Figure 1.
GMM clustering results (2010)

Figure 2.

Figure 2.
GMM clustering results (2021)

Figure 3.

Figure 3.
Changes in GMM clustering proportions

Figure 4.

Figure 4.
Visualization of long-time commuting OD flows (Left: 2010, Right: 2021)

Table 1.

Examples of criteria for long-time commuting in previous studies

Table 2.

Minimum effective sampling rate considering population size

Table 3.

Variable description and sources

Table 4.

Evaluation results of AIC and BIC by number of GMM clusters

Table 5.

Results of GMM clustering

Table 6.

Results of descriptive statistics

Table 7.

Result of multilevel logistic regression analysis

Appendix 1.

Results of GMM analysis by the number of clusters