
아파트 가격 결정요인에 대한 기계학습적 접근: 서울시 강남3구와 강북3구를 비교하여
Abstract
Amid the rapid rise in apartment prices in Seoul, spatial disparities in housing values between the Gangnam 3-gu and Gangbuk 3-gu districts have increasingly intensified. This study compared and analyzed the factors determining apartment prices in the Gangnam 3-gu (high-priced areas) and Gangbuk 3-gu (low-priced areas) of Seoul. Random forest and eXplainable Artificial Intelligence (also known as XAI) were used for analysis. First, random forest use (vs. the hedonic price model) provides a more accurate estimation of apartment prices, and the R² value of random forest (vs. the hedonic price model) was higher, while the mean absolute error (also known as MAE) and RMSE values were lower. Second, the importance of the influencing factors of apartment prices differed between Gangnam 3-gu and Gangbuk 3-gu. This showcases that related analyses should consider the determinants of apartment prices by submarkets, as well as design and implement policies that consider these determinants. Certain variables, such as proximity to subway stations, the Han River, and public sports facilities, had different impacts on apartment prices between Gangnam 3-gu and Gangbuk 3-gu. The results of this study underpin a need for apartment designs to reflect the preferences of apartment buyers according to each of these regions.
Keywords:
Housing Price, Gangnam 3-gu, Gangbuk 3-gu, Machine Learning, Explainable Artificial Intelligence키워드:
주택가격, 강남3구, 강북3구, 머신러닝, 설명가능한 인공지능Ⅰ. 서 론
서울 아파트 m2당 매매 평균가격은 2025년 1월 기준 약 1,644 만원으로 2014년 1월 대비 약 2.8배 상승했다(한국부동산원, 2025). 특히 코로나19로 인해 팬데믹 발생 이전부터 팬데믹 기간(2018년 1월 대비 2022년 1월)에는 약 1.7배 상승하여 단기간동안 아파트 가격이 크게 상승했다(한국부동산원, 2025). 서울 아파트 가격이 급격하게 상승한 상황에서 지역 간 주택가격의 격차도 심화되고 있다. 실제로 KB부동산(2025)에서 제공하는 주택가격동향조사 결과에 따르면, 2025년 3월 기준 강남3구(강남구, 서초구, 송파구)와 강북3구(노원구, 도봉구, 강북구) 간의 아파트 ㎡당 매매평균가격 차이는 약 1,848만 원으로, 통계 집계를 시작한 이후 격차가 가장 크다. 그런데 주택가격격차가 심화되는 것은 단순히 주택가격의 차이가 커지는 것에만 머물지 않고 사회적 통합을 저해하는 등 사회 전반에 영향을 미칠 수 있다(이주석·조주현, 2010). 그러므로, 강남3구와 강북3구의 주택가격결정요인을 비교하여 주택가격 상승기에 강남3구와 강북3구 간 상승폭의 차이가 커지며 지역 간 불균형이 심화된 원인을 확인할 필요가 있다.
또한 부동산의 고유한 특성 때문에 부동산 시장은 지역, 소득 등에 따라 분화되며, 지역별 하위시장(sub-market)이 형성될 수 있다(박천규 외, 2012). 따라서 아파트 가격 결정요인을 분석할 때 하위시장으로 나누어 하위시장만의 특징을 확인하면 더 정확한 추정이 가능할 수 있다. 한국의 수도인 서울에서 강남3구(강남구, 서초구, 송파구)는 아파트 가격이 높은 하위시장으로, 강북3구(노원구, 도봉구, 강북구)는 아파트 가격이 낮은 하위시장으로 사람들이 인식하고 있다. 이 두 개의 하위시장은 가격 차이로 인해 아파트를 매수하고자 하는 사람들의 특성이나 수요 등이 상이해서 아파트 가격 결정요인이 다를 수 있다.
특히, 강남3구와 강북3구는 주택가격 외에도 교육환경, 인프라, 전반적인 소득수준 등에서 차이가 나타나고 있다. 강남3구는 강북3구에 비해 교육환경이나 대중교통 등 주거환경이 더 우수한 것으로 알려져 있다(이규환·서승제, 2009). 또한, 국세청(2025)에서 공개한 시군구별 근로소득 연말정산 신고현황에 따르면, 2020년 근로소득 연말정산으로 신고된 강남3구의 급여총액은 강북3구보다 4배 이상 더 많은 것으로 나타났다. 이러한 지역 간 거주민들의 소득수준 및 강남3구와 강북3구 간 주거환경의 차이는 사람들이 주택을 구입할 때도 영향을 미칠 수 있어 하나의 도시에 위치하더라도 아파트 가격 결정요인이 다르게 나타날 수 있다. 그럼에도 불구하고 기존의 연구에서는 주택가격을 추정할 때 소득수준과 같은 인문특성을 고려하지 않고 건물 자체 특성이나 근린환경 접근성만을 고려하고 있다.
한편, 주택가격을 추정하기 위한 연구에서 가장 활발하게 사용되는 모형은 Rosen(1974)가 제안한 헤도닉 가격 모형(Hedonic Price Model)이다. 헤도닉 가격 모형은 단순한 선형함수 형태로 변수 간의 관계를 보여줘서 직관적으로 이해할 수 있다는 장점이 있지만, 이로 인해 설명력이 저하되는 문제점이 있다(홍정의, 2021). 또한, 주택가격은 복잡한 구조로 이루어져 단순히 선형관계로만 설명하는 데 한계가 있을 수 있다(Ko and Park, 2024). 이러한 단점 및 한계점을 보완할 수 있는 인공지능(artificial intelligence) 모형이 최근 주택가격 연구에서도 적용되고 있다(Adetunji et al., 2022). 대표적인 인공지능 방법론으로 랜덤 포레스트(random forest)가 있는데, 랜덤 포레스트는 상대적으로 다중공선성으로부터 자유롭고, 비선형적인 관계도 확인할 수 있다는 장점을 가지고 있기 때문이다. 하지만, 이러한 기존의 기계학습(machine learning) 기반의 알고리즘(algorithm)은 블랙박스(black box)의 한계로 인해 변수의 중요도나 모형의 예측력만 보여줄 뿐, 변수 간의 관계를 설명하지 못했다(Abidoye and Chan, 2018; 홍정의, 2021).
이에 본 연구는 랜덤포레스트를 활용하여 강남3구와 강북3구의 비교를 통해 주택가격을 추정하고, eXplainable Artificial Intelligence(XAI)를 활용하여 모형의 예측력과 변수의 중요도뿐만 아니라 변수 간 관계도 확인하고자 한다. 특히, 서울에서 상대적으로 아파트 가격이 높은 것으로 알려진 강남3구와 아파트 가격이 낮은 것으로 알려진 강북3구에서 아파트 가격 결정요인이 어떻게 다른지 확인하고자 한다. 이를 통해 지역별로 더 적합한 도시 및 주택정책 제언을 할 수 있을 것으로 기대한다.
Ⅱ. 선행연구 고찰
1. 서울 아파트 가격 결정요인을 확인한 연구
사람들의 주거 안정을 위해 주택가격이 중요함에 따라 주택가격이 어떤 요인에 의해 영향받는지 확인하는 연구는 다수 수행되고 있다. 대표적으로 아파트 자체의 물리적인 특성, 아파트의 입지나 근린환경 등이 아파트 가격에 미치는 영향을 확인하는 연구가 있다(최성호·성현곤, 2011; Wen et al., 2014; 이훈, 2018; Yang et al., 2019). 그중에서도 한국의 수도이며 인구밀도가 가장 높은 서울의 아파트 가격 결정요인을 확인하는 연구가 활발하게 진행되고 있다.
서울 아파트 가격 결정요인으로 아파트 자체의 물리적인 특성을 나타내는 변수가 자주 활용되고 있다. 대표적으로는 거래된 아파트 가구별로 다를 수 있는 층, 전용면적, 현관구조, 방 수, 화장실 수가 활용되고 있다. 대부분의 선행연구에서 아파트가 위치한 층이 높을수록 아파트 가격이 상승하는 경향이 있었다(엄현태 외, 2018; 김우성 외, 2019; 홍성준·이창무, 2020; 조용경·윤영호, 2022). 출산율 하락이나 1인가구 증가와 같은 인구구조의 변화로 전용면적이 작을수록 아파트 가격이 상승하는 경향이 나타남을 확인했다(조용경·윤영호, 2022; Ko and Park, 2024).
한편, 가구 특성 변수 중 거래된 아파트의 층수와 전용면적은 국토교통부 실거래가 공개시스템을 통해 공개됨에 따라 많은 연구자들이 통제변수로 활용하고 있다. 그러나, 현관구조나 방, 화장실 수와 같은 평형별 세부 정보는 실거래가 공개시스템에서 제공하는 자료에 포함되지 않아 변수 구축에 많은 시간이 소요될 수 있다. 이에 따라 현관구조나 방 개수와 같은 가구 특성 변수는 상대적으로 적게 활용되고 있는 것으로 보인다. 변수 구축의 어려움에도 몇몇 연구자들은 관심변수가 아파트 가격에 미치는 영향을 보다 정확하게 확인하고자 현관구조, 방, 화장실 등의 정보를 구축하여 변수로 활용하고 있다. 현관구조가 아파트 가격에 미치는 영향은 선행연구마다 유사하게 나타났다. 현관구조가 계단식일수록 아파트 가격이 상승하여 사람들이 계단식 아파트를 선호함을 확인했다(정수연, 2006; 황형기 외, 2008). 방 개수가 많을수록 아파트 가격이 상승했으며(강수진·서원석, 2016; 이동성·문태훈, 2016), 화장실이 많을수록 아파트 가격이 상승하는 경향이 나타났다(임준홍·홍성효, 2015; 현동우, 2021).
또한 아파트 단지별로 동일한 단지특성이 아파트 가격에 영향을 미치는 것으로 알려져 있다. 단지특성으로 자주 활용되는 변수로는 난방유형, 세대당 주차대수, 건축연한, 단지 내 총 세대수 등이 있다. 개별난방 방식을 사용하는 아파트 단지일수록 가격이 하락하는 경향이 나타났는데(최석준·채수복, 2009; 이동성·문태훈, 2016), 이에 대해 지역난방이나 중앙난방이 연료비가 적게 소비되기 때문이라고 주장했다(최석준·채수복, 2009). 또한, 대체로 세대당 주차대수가 많을수록 우수한 주거환경을 제공해 아파트 가격이 상승하는 경향이 나타났다(황형기 외, 2008; 성주한·박필, 2014). 선행연구에서 세대수가 많은 대단지 아파트일수록(김우성 외, 2019; 조용경·윤영호, 2022), 건축연한이 작을수록(이재윤·서원석, 2018) 아파트 가격이 상승하는 경향이 있었다. 한편, 전통적인 헤도닉 가격 모형을 활용하지만 건축연한과 건축연한 제곱 변수를 함께 채택하여 건축연한과 아파트 가격 간에 비선형적인 관계가 있음을 확인한 연구도 있었다(홍성준·이창무, 2020). 이는 서울 아파트 가격은 단순히 선형관계만으로 설명되기 어려운 복잡한 구조로 형성될 수 있음을 시사한다. 그러므로, 선형기반의 헤도닉 가격 모형보다 랜덤 포레스트와 같은 비선형 기반의 모형을 활용하면 서울 아파트 가격이 어떻게 형성되는지 더 면밀하게 확인할 수 있을 것이다.
이와 같은 아파트 자체의 물리적인 특성 외에 아파트의 근린환경도 아파트 가격에 영향을 미치는 것으로 알려져 있다. 서울을 대상으로 한 연구에서 가장 대표적으로 활용되는 변수로는 한강까지 거리가 있다. 대부분의 기존 연구에서는 아파트가 한강과 가까이 위치하면 한강 변에서 다양한 야외활동을 할 수 있고, 아름다운 전망을 제공할 수 있어서 한강까지 거리가 가까울수록 아파트 가격이 상승하는 경향이 나타났다(엄현태 외, 2018; Ko and Park, 2024). 또한, 대중교통 이용의 편의성으로 인해 지하철역과 가까울수록 가격이 대체로 상승하였다(임준홍·홍성효, 2015; 이재윤·서원석, 2018; 이훈, 2018).
이 외에도 대형쇼핑시설과 같은 편의시설, 교육환경을 나타낼 수 있는 초등학교 접근성, 의료 접근성을 보여주는 종합병원까지 거리와 같은 변수가 자주 활용되고 있다. 대체로 아파트에서 대형쇼핑시설까지 거리가 가까울수록 아파트 가격이 높았다(신상영 외, 2006). 안전이나 통학의 편리함으로 인해 초등학교까지 거리가 가까울수록 아파트 가격이 상승하기도 했지만(이동성·문태훈, 2016; 이재윤·서원석, 2018), 초등학교까지 거리가 멀수록 가격이 상승하는 경향이 나타나기도 하였다(한다솜·최창규, 2022). 한편, 병원 접근성과 아파트 가격 간의 관계도 확인되고 있다. 종합병원과 거리가 가까울수록 아파트 가격이 높게 나타나기도 했지만(한다솜·최창규, 2022), 혼잡성으로 인해 종합병원까지 거리가 멀수록 가격이 상승하는 경향이 나타나기도 하였다(이재윤·서원석, 2018).
이처럼 아파트의 근린환경이 아파트 가격에 미치는 영향은 연구마다 하나의 결론에 이르지 못하고 있으며, 연구의 시·공간적 범위 등에 따라 아파트 가격에 미치는 영향이 다르게 나타날 수 있음을 확인할 수 있다. 그러므로, 서울 아파트 가격 결정요인은 앞으로 계속 탐색될 필요가 있어 보인다.
2. 지역 간 아파트 가격 결정요인 비교연구
한편 부동산은 부동성을 지니고 있어 지역 간 가격 결정요인이 다를 수 있다. 이에 따라 지역별 주택가격결정요인을 비교하는 연구도 활발하게 이루어지고 있다(김광영·안정근, 2010; 이주석·조주현, 2010; 전해정, 2016; 김명연·김은정, 2019; 변세일 외, 2019; 강요명·서정렬, 2020).
변세일 외(2019)는 공간계량모형을 활용하여 광주, 대전, 대구, 부산의 아파트 매매가격 및 전세가격 결정요인을 분석했다. 분석 결과, 단지특성, 교육특성, 공간특성과 같은 변수들이 주택가격에 미치는 영향은 지역의 공간환경이나 아파트 입지에 따라 상이했다. 광주, 대구, 부산은 상위 건설사가 시공한 아파트일수록 매매가격이 상승했지만, 대전은 통계적으로 유의미한 관계가 나타나지 않았다. 한편, 4개 지역 모두 전반적으로 생활편의시설과 같은 주변 환경적 특성이 주택가격에 많은 영향을 미치는 것으로 나타났다.
Chung et al.(2018)은 헤도닉 가격 모형을 활용하여 베트남 호치민과 하노이의 아파트 가격 결정요인을 분석하였다. 분석 결과, 호치민과 하노이 모두 아파트가 도심 내 위치할수록, 도심까지 거리가 가까울수록, 평균 유닛(unit) 면적이 클수록 아파트 가격이 상승했다. 하지만, 호치민과 하노이에서 아파트 가격에 유의미한 영향을 미치는 요인이 다르게 나타나거나, 아파트 가격과의 관계가 다른 요인들도 있었다. 예를 들어 호치민은 열대 기후로 인해 수영장 유무가 아파트 가격에 중요한 요인 중 하나였지만, 하노이는 북부에 위치하여 수영장이 아파트 가격 형성에 중요한 요인으로 작용하지 않았다.
한편, 다른 도시 간 아파트 가격결정요인을 비교·분석한 연구 외에도 하나의 도시 안에서 아파트 가격 결정요인을 비교·분석한 연구도 진행되었다. 강요명·서정렬(2020)은 부산시 해운대구의 우동과 반여동을 대상으로 아파트 가격 결정요인을 분석하였으며, 브랜드가 아파트 매매가격에서 차지하는 비중을 확인하였다. 분석 결과, 우동과 반여동 모두 브랜드 아파트일수록 아파트 가격이 상승하는 것으로 나타났다. 하지만 공원 접근성과 아파트 가격 간의 관계는 우동과 반여동에서 상이하게 나타났다. 우동은 아파트 단지 20분 거리 내 공원이 있을수록 아파트 가격이 상승했지만, 반여동은 아파트 단지 20분 거리 내 공원이 있을수록 오히려 아파트 가격이 하락했다. 이는 같은 지역에서도 아파트 가격 결정요인이 서로 다르게 나타날 수 있음을 보여준다.
또한, 서울을 대상으로도 하위시장에 따라 아파트 가격 결정요인이 다를 수 있음을 확인한 연구가 진행되었다. 이주석·조주현(2010)은 헤도닉 가격 모형을 활용하여 서울시 강남3구와 강북3구 간 중형 아파트 가격 결정요인에 차이가 있음을 확인했다. 이에 주택가격 결정요인을 분석할 때 주택가격 안정화를 위해서는 지역별로 세분화하여 분석할 필요성이 있음을 주장하였다.
김광영·안정근(2010)은 서울시 대규모 아파트 단지를 대상으로 아파트 가격 결정요인을 분석했다. 이를 위해 서울시 전체, 강남 11개 구, 강북 14개 구 3개 모형으로 나누어 분석했다. 분석 결과, 강남에서는 입주경과년수가 아파트 가격에 통계적으로 유의미한 영향을 미치지 못했지만, 강북에서는 입주경과년수가 적을수록 아파트 가격이 상승했다.
전해정(2016)은 서울시 전체, 강남, 강북을 대상으로 공간계량 분석방법을 활용해 주택가격모형을 비교·분석했다. Spatial Error Model(SEM) 모형 분석 결과, 강남에서는 4차선 도로와 아파트 간의 거리가 멀어질수록 아파트 가격이 상승했지만, 강북에서는 4차선 도로와 아파트 간의 거리가 멀어질수록 아파트 가격이 하락했다. 한편, 강남과 강북 모두 지하철역까지 거리가 가까워질수록 아파트 가격이 상승했다.
김명연·김은정(2019)은 공간회귀모형을 활용해 서울시 강남3구와 강북3구를 대상으로 근린환경 접근성이 공동주택가격에 미치는 영향을 분석했다. 분석 결과, 강남3구와 강북3구 모두 2km 네트워크 반경 내 의료시설 수가 많을수록, 공동주택 단지로부터 공장까지 네트워크 최단거리가 멀어질수록 주택가격은 상승했다. 하지만 재건축정비사업구역 지정여부, 지하철역까지 거리와 같은 일부 변수가 주택가격에 미치는 영향은 강남3구와 강북3구에서 다르게 나타났다.
이처럼 지역 간 아파트 가격 결정요인을 비교한 대부분의 연구에서 지역에 따라 아파트 가격 결정요인이 다르게 나타났다. 또한 하나의 도시더라도 지역에 따라 아파트 가격 결정요인이 다르게 나타나기도 했다. 이는 아파트 가격 결정요인을 분석할 때 하나의 도시더라도 하위시장에 따라 시장을 세분화해서 아파트 가격을 보다 더 정확하게 추정할 필요가 있음을 보여준다.
3. 랜덤 포레스트를 활용한 부동산 가격 연구
기존 주택가격을 추정하는 연구에서 헤도닉 가격 모형과 같은 모수추정 방식의 방법론이 많이 활용되었는데, 인공지능의 발전으로 인공지능 방법론을 활용한 주택가격추정이 상당히 활발하게 진행되고 있다. 그중에서도 랜덤 포레스트는 기존의 의사결정나무(decision tree)에 비해 과적합(overfitting)이 발생할 우려가 적다는 장점을 가져 주택가격추정에 자주 활용되고 있으며, 주택가격을 추정하는 데 있어 다른 인공지능 모형에 비해 랜덤 포레스트가 더 우수함을 입증한 연구가 많다. 예를 들어, Antipov and Pokryshevskaya(2012)는 러시아 상트페테르부르크(Saint Petersburg)의 아파트 가격을 평가했는데, 인공신경망과 같은 대량평가모형보다 랜덤 포레스트의 성능이 더 우수했다. 이와 유사하게 Louati et al.(2022)은 의사결정나무, 랜덤 포레스트, 선형회귀를 활용하여 사우디아라비아 리야드(Riyadh)의 주거용 부동산의 토지가격을 추정하고, 모형 성능을 비교하였는데 랜덤 포레스트가 가장 우수함을 확인했다.
한편, 한국을 대상으로도 머신러닝 모형의 성능을 비교한 연구가 진행되고 있다. 김이환 외(2022)는 헤도닉 가격 모형, 인공신경망, 랜덤 포레스트를 활용해 서울시 아파트 가격을 추정했는데, 그 결과 랜덤 포레스트가 가장 우수한 모형으로 확인되었다. 또한, Kim et al.(2022)는 인공신경망과 랜덤 포레스트를 활용하여 2015년부터 2019년에 거래된 서울시 주택 매매가격을 추정했는데, 랜덤 포레스트의 성능이 더 우수했다. 이처럼 머신러닝을 활용해 주택가격을 추정한 대부분의 선행연구는 주택가격 추정에 머신러닝을 활용하면 모형의 예측력이 개선될 수 있음을 강조하고 있지만, 블랙박스의 한계로 인해 예측력 개선이나 변수의 중요도에만 초점을 맞추고 있다.
그러나 최근 설명가능한 인공지능의 개발로 머신러닝을 이용해 주택가격을 추정하더라도 개별 변수들 간 관계까지 확인할 수 있게 되었다. 이에 따라 최근 머신러닝를 활용한 주택가격 연구들도 SHapley Additive exPlanation(SHAP), Local Interpretable Model-agnostic Explanations(LIME)과 같은 XAI 기법을 활용해 주택가격 결정요인이 주택가격에 미치는 영향을 확인하고 있다. 서정석 외(2023)는 CatBoost와 XAI 기법인 SHAP을 활용하여 서울시 아파트 가격과 개발 밀도 간 비선형적인 관계를 확인했으며, Ko and Park(2024)는 랜덤 포레스트와 SHAP을 활용해 서울 아파트 매매가격과 대기오염 간의 관계를 확인했다. 또한, Uysal and Kalkan(2024)가 랜덤포레스트 모형에 SHAP과 LIME을 적용하여 이스탄불(Istanbul)의 주택 가격을 예측한 것처럼 선행연구에서 머신러닝을 활용한 주택가격 연구에서 XAI가 적용되고 있음을 알 수 있다.
4. 선행연구와의 차별성
본 연구의 목적은 서울시 강남3구와 강북3구의 아파트 가격 결정요인을 규명하고, 아파트 가격 결정요인의 중요도를 비교·분석하는 것이다. 선행연구 검토를 통해 확인한 본 연구의 차별성은 다음과 같다.
첫째, 랜덤 포레스트를 활용하여 강남3구와 강북3구의 아파트 가격 결정요인과 그 중요도를 비교·분석한다. 선행연구 고찰을 통해 확인하였듯이 같은 지역 내에서도 아파트 가격 결정요인이 다르게 나타날 수 있으며, 지역을 세분화하면 해당 지역의 특성에 기반한 분석을 통해 더 정확한 분석이 가능할 수 있다. 한편, 최근 인공지능의 발전으로 인공지능 기반의 머신러닝 모형이 다양한 연구에서도 활용되고 있다. 머신러닝은 주택연구에서 전통적으로 사용되는 헤도닉 가격 모형과 달리 비선형적인 관계를 확인할 수 있으며, 다중공선성으로부터 자유롭고, 예측력이 더 우수하다는 장점이 있다. 하지만, 주택가격에 영향을 미치는 요인의 지역적 차이를 확인한 연구에서 인공지능 모형의 적용은 상당히 부족한 실정이다. 이에 본 연구는 머신러닝 기반의 랜덤 포레스트를 활용하여 강남3구와 강북3구 간의 아파트 가격 결정요인을 비교하고자 한다.
둘째, 아파트의 물리적 요인 외에 아파트 단지의 인문적 요인을 활용한다. 선행연구 고찰 결과 지역 간 아파트 가격 결정요인을 비교한 연구가 일부 있었는데, 기존 연구들은 아파트의 물리적 환경이나 근린환경에 초점을 맞추었으며, 인문 특성 변수를 고려하지 못했다. 그러나, 지역 간의 가격 격차는 아파트 단지의 물리적 요인이나 근린환경 요인 외에 거주자의 소득과 같은 인문적 요인에 의해 크게 영향을 받을 수 있다. 따라서 본 연구는 기존 선행연구와 달리 거주자의 소득수준까지 고려해 아파트 가격 형성요인을 보다 더 면밀하게 확인하고자 한다.
셋째, 머신러닝의 한계인 블랙박스를 극복하기 위해 설명가능한 인공지능을 적용한다. 머신러닝 모형은 성능이 우수하지만, 개별 변수 간의 관계를 확인할 수 없다는 한계가 있어 기존 연구들은 대부분 모형의 예측력이나 변수의 중요도만을 제시하는 것에 그쳤다. 하지만, 주택가격을 추정하는 연구는 모형의 성능이 우수함을 확인하는 것 외에 어떤 변수와 주택가격 간의 관계를 확인하는 것이 상당히 중요할 수 있다. 변수 간 관계를 확인해야 도시 및 주택 분야에 보다 실질적인 정책적 제언이 가능할 수 있기 때문이다. 그러므로, 본 연구는 설명가능한 인공지능을 활용하여 개별 변수 간 관계까지 확인하고자 한다.
마지막으로 본 연구는 2018년부터 2022년까지 5년간 강남3구와 강북3구에서 발생한 아파트 매매 실거래가격을 전수조사해서 사용했다. 아파트 실거래가격 데이터는 국토교통부에서 매년 공개하여 쉽게 구축할 수 있지만, 방 수, 화장실 개수, 세대당 주차대수 등의 단지 및 가구특성 데이터를 제공하지 않는다는 한계가 있다. 이로 인해 서울시 강남3구와 강북3구의 아파트 가격결정요인을 비교한 기존의 연구들은 아파트 가격에 영향을 미칠 수 있는 단지 및 가구 정보를 변수에 포함하지 않거나, 포함하더라도 데이터 구축에 시간이 많이 소요되어 단기간의 자료를 분석에 활용했다. 그러나, 본 연구는 분석의 정확성을 높이기 위해 국토교통부에서 제공하지 않는 단지 및 가구특성 등의 데이터를 추가적으로 구축하여 분석에 활용해 더 정확한 분석을 구현하고자 했다. 또한, 강남3구와 강북3구의 아파트 가격 결정요인을 비교한 이전 연구과 달리 5년간의 데이터를 사용하여 일반화가 가능할 수 있다.
Ⅲ. 분석 방법
1. 변수 구성
분석을 위해 <Table 1>과 같이 변수를 설정하였다. 본 연구의 종속변수는 m2 당 아파트 매매가격으로 국토교통부 실거래가 공개시스템에서 제공하는 데이터를 사용했다. 2018년부터 2022년까지 서울시 강남3구에서 아파트 매매거래가 총 45,371건이 발생했고, 강북3구에서는 아파트 매매거래가 총 50,364건이 발생했다. 그중 가구 및 단지특성 정보가 정확하지 않거나 없는 경우는 분석에서 제외하였으며 실제 분석에는 강남3구 40,933건, 강북3구 45,927건을 활용하였다. 또한 종속변수인 m2 당 주택가격은 자연로그를 취해 활용했다.
독립변수는 선행연구고찰을 바탕으로 가구특성, 단지특성, 시간특성, 인문특성, 근린특성으로 구성했다. 가구특성 변수는 전용면적, 층, 현관구조, 방, 화장실로 구성했다. 단지특성은 건축연한, 세대수, 세대당 주차대수, 난방유형, 브랜드로 구성했다. 가구특성과 단지특성 변수는 국토교통부 실거래가 공개시스템에서 제공하는 데이터를 기본으로 하였고, 국토교통부에서 제공하지 않는 데이터는 네이버부동산과 서울부동산정보광장에서 구득하였다.
본 연구는 2018년부터 2022년까지 발생한 아파트 매매 실거래가격을 분석했는데, 코로나19와 같은 특수한 상황이 주택가격에 미친 영향을 통제하고자 계약연도를 더미처리해서 사용했다. 또한 본 연구는 강남3구와 강북3구의 주택가격 영향요인을 비교·분석하는 것을 목적으로 하는데, 주택의 물리적인 특성이나 근린환경 외에 인문 특성이 지역 간 주택가격 차이와 관련이 있을 수 있어 변수로 채택하였다. 소득은 구득할 수 있는 최소 단위인 행정동의 월평균 소득을 활용했으며, 공개된 데이터 중 가장 최신 시점인 2019년 12월 데이터를 활용하였다. 선행연구에서도 소득은 주택가격에 영향을 미칠 수 있음이 확인되고 있다(Rico-Juan and de La Paz, 2021).
근린특성은 선행연구에서 대표적으로 고려되는 한강, 공원녹지, 중심업무지구, 대중교통접근성인 버스정류소, 지하철역, 교육특성인 유치원, 초등학교, 사람들의 편의를 증진시키는 대형판매시설, 종합병원, 건강증진 및 다양한 여가활동의 기회를 제공하는 공공체육시설, 문화시설 접근성을 활용했다. 이러한 근린특성은 아파트의 주거환경을 쾌적하거나 편리하게 하여 사람들의 주택구매의사결정이나 주택가격에 영향을 미칠 수 있어 변수로 채택했다. 또한, 모든 근린특성 변수들은 GIS를 활용하여 아파트 단지 중심점으로부터 최단거리를 측정하였다.
2. 분석 방법
주택가격 결정요인을 확인하는 연구에서 가장 전통적으로 사용되는 모형 중 하나는 Rosen(1974)가 제안한 헤도닉 가격 모형으로, 재화가 가진 여러 가지 특성들로 재화의 가격을 설명하는 모형이다(성주한·박필, 2014). 본 연구는 세미로그(semi-log) 모형을 활용했으며, 식 (1)과 같다.
| (1) |
한편, 인공지능의 성능이 강화됨에 따라 기계학습 기법이 주택가격을 추정하는 연구에서도 사용되고 있는 추세다(오지훈·김정섭, 2018; 윤규섭 외, 2021; Yang et al., 2021). 그 중 대표적인 앙상블(ensemble) 기반 방법론 중 하나로 랜덤 포레스트가 있다. 랜덤 포레스트는 여러 개의 의사결정 나무를 생성하고 투표를 통해 예측하는 분석모형이다(김정희, 2021). 랜덤 포레스트는 여러 개의 의사결정 나무를 조합하는 모형으로, 과적합이 발생하지 않는 것으로 알려져 있다(Breiman, 2001). 특히, 랜덤 포레스트는 주택연구에서 전통적으로 활용되는 헤도닉 가격 모형과 달리 비모수모형이어서 예측력이 더 우수하고 다중공선성으로부터 자유로울 수 있다는 장점이 있어 주택가격연구에서도 활용되고 있다.
기존 랜덤 포레스트를 활용한 연구에서는 머신러닝의 블랙박스 한계로 인해 변수의 중요도나 예측력만 확인할 수 있었다(Antipov and Pokryshevskaya, 2012; 배성완·유정석, 2018; 홍정의, 2021; 김이환 외, 2022; Kim et al., 2022). 하지만, 최근 설명가능한 인공지능이 출현함에 따라 개별 변수들 간의 관계까지도 확인할 수 있게 되었다. 랜덤 포레스트 분석에 가장 대표적으로 사용되는 XAI 방법론 중 하나는 SHAP이다(양건필·전해정, 2022; 서정석 외, 2023; Han et al., 2023; Ko and Park, 2024). SHAP은 게임이론(game theory) 기반으로 예측을 설명해 주는 통합 프레임워크(framework)이다(Lundberg and Lee, 2017). 또한, 각 변수들이 예측에 얼마나 기여했는지를 정량화해서 변수의 중요도를 보여준다(Lundberg and Lee, 2017). SHAP의 global value와 local value를 통해 각각 종속변수에 대한 개별 독립변수들의 중요도, 독립변수와 종속변수 간의 관계를 시각적으로 확인할 수 있다.
Ⅳ. 분석 결과
1. 기초통계량
<Table 2>는 기초통계량 분석 결과이다. 2018년부터 2022년까지 강남3구에서 발생한 아파트 매매 거래의 m2당 가격은 평균 약 1,746만 원이었고, 강북3구는 평균 약 739만 원으로 강남3구가 2배 이상 비싼 것으로 나타났다. 또한 강북3구 행정동별 평균 월소득은 약 311만 원이었으며, 강남3구 행정동별 평균 월소득은 평균 약 487만 원으로 강남3구 행정동별 평균 월소득이 더 높게 나타났다. 주택가격과 소득을 통해 확인할 수 있듯이 강남3구와 강북3구 간 차이가 크게 나타나고 있다.
거래된 층수는 강남3구가 평균 약 10층, 강북3구가 평균 약 8층이었다. 현관구조는 강남3구의 76%가 계단식이었으며, 강북3구의 51%가 계단식이었다. 거래된 아파트 단지의 세대수는 강남3구가 평균 약 1,366세대, 강북3구는 평균 약 1,373세대로 비슷하게 나타났다. 브랜드의 경우 강남3구는 약 48%가 시공순위 10위 이내 건설사였지만, 강북3구는 약 18%가 시공순위 10위 이내 건설사로 그 차이가 컸다.
한강까지 거리는 강남3구가 평균 약 2,675m, 강북3구가 평균 약 10,552m로 강북3구가 더 먼 것으로 나타났다. 이는 지리적 위치상 강남3구인 강남구, 서초구, 송파구가 강북3구인 노원구, 도봉구, 강북구보다 한강과 가깝기 때문으로 보인다. 또한, 한강 변수의 표준편차는 강남3구는 약 1,737m, 강북3구는 약 1,921m로 지역 내 편차는 큰 차이가 없었다.
아파트에서 버스정류소까지 거리는 강남3구가 평균 약 157m, 강북3구가 평균 약 118m로 강북3구의 버스정류소 접근성이 상대적으로 더 우수한 것으로 나타났다. 또한, 지하철역출입구까지 거리는 강남3구가 평균 약 452m, 강북3구가 평균 약 542m로 강남3구의 지하철역 접근성이 더 우수한 것으로 나타났다. 또한 유치원은 강남3구가 평균 약 375m, 강북3구가 평균 약 240m였으며, 초등학교는 강남3구가 평균 약 360m, 강북3구가 평균 약 291m였다. 대형판매시설은 강남3구가 평균 약 1,313m, 강북3구가 평균 약 548m로 두 지역 간 차이가 큰 것으로 나타났으며, 강남3구에 비해 강북3구의 편차가 더 작아 강북3구에서 대형판매시설이 더 고르게 분포하는 것으로 판단된다. 종합병원은 강남3구가 평균 약 1,878m, 강북3구가 평균 약 1,294m였다.
아파트에서 문화시설까지 거리는 강남3구가 평균 약 423m, 강북3구가 평균 약 405m로 비슷하게 나타났지만, 아파트에서 공공체육시설까지 거리는 강남3구가 평균 약 736m, 강북3구가 평균 약 447m로 강북3구가 강남3구보다 공공체육시설 접근성이 더 우수한 것으로 보인다. 그러므로, 강남3구 내 공공체육시설의 분포를 분석하여 공공체육서비스에서 소외된 지역이 있는지 검토할 필요가 있다.
2. 헤도닉 가격 모형과 랜덤 포레스트 성능 비교
랜덤 포레스트 모형에 적용한 하이퍼파라미터(hyperparameter) 값은 <Table 3>과 같다. 최적의 모형을 구현하고자 랜덤 서치(random search) 기법을 활용해서 하이퍼파라미터를 조정하였다. 랜덤 서치 기법은 연구자가 설정한 일정한 범위 안에서 최적의 하이퍼파라미터 조합을 찾아주는 방법이다. 또한, 랜덤 포레스트의 예측 성능을 평가하기 위해 전체 데이터를 훈련 데이터(80%)와 테스트 데이터(20%)로 무작위 분할했으며, 교차검증을 5번 반복 수행했다. 이를 통해 모델의 과적합을 방지했으며, 모형의 성능을 신뢰할 수 있도록 하였다.
<Table 4>는 헤도닉 가격 모형과 랜덤 포레스트 모형의 성능을 보여준다. 본 연구에서는 R2, Mean Absolute Error(MAE), Root Mean Squared Error(RMSE) 값을 기준으로 모형 예측력을 평가하였다. R2값은 클수록 모형의 설명력이 우수하다고 평가한다. MAE과 RMSE는 값이 작을수록 오차가 적은 것을 의미하여, MAE 값과 RMSE 값이 더 작은 모형이 더 우수한 모형으로 평가된다. 헤도닉 가격 모형과 랜덤 포레스트 모형의 예측력 및 오차를 비교했을 때 랜덤 포레스트의 R2 값이 더 크며 랜덤 포레스트의 MAE 값과 RMSE 값이 더 작았다. 그러므로 본 연구에서는 성능이 더 우수한 랜덤 포레스트 모형을 최종 분석 모형으로 채택하고자 한다.
3. SHAP을 활용한 랜덤 포레스트 분석 결과
<Figure 1>과 <Figure 2>는 각각 강남3구 모형과 강북3구 모형에 관한 global value이며, <Figure 3>과 <Figure 4>는 각각 강남3구 모형과 강북3구 모형에 대한 local value이다. 먼저 global value 결과를 살펴보면, 강남3구와 강북3구에서 주택가격에 영향을 미치는 변수들의 중요도가 상이하게 나타났다. 강남3구에서는 소득, 세대수, 계약연도, 전용면적, 중심업무지구, 대형판매시설, 건축연한이 중요도가 높은 상위 7개 변수였다. 이와 달리 강북3구에서는 계약연도, 소득, 건축연한, 한강, 전용면적, 세대수, 지하철역 출입구가 상위 7개 변수였다. 즉, 강남3구는 강북3구와 비교했을 때 중심업무지구와 대형판매시설이 아파트 가격에 미치는 영향이 상대적으로 더 중요했다. 이와 달리 강북3구에서는 강남3구와 비교했을 때 한강과 지하철역 출입구가 아파트 가격에 미치는 영향이 상대적으로 더 중요하였다.
강남3구에 비해 강북3구는 한강 접근성이 아파트 가격 형성에 중요했다. 즉, 강북3구는 서울시 중심부에 가까운지가 아파트 가격 형성에 중요한 것으로 판단된다. 이와 달리 강남3구에서는 한강과의 접근성보다 강남3구에서 거주하는 것 자체에 더 의미를 두고 있는 것으로 보인다.
중심업무지구까지 거리는 강남3구에서 아파트 가격에 더 중요했다. 또한, 대중교통 접근성인 버스정류소나 지하철역은 강북3구 아파트 가격 결정에 더 중요한 역할을 하는 것으로 나타났다. 강북3구는 서울의 중심업무지구인 도심권, 강남권, 여의도권까지 거리가 멀어서 중심업무지구까지 거리보다 출퇴근을 편리하게 해주는 지하철역이나 버스정류소와 같은 대중교통이 강북3구 아파트 매수자에게 더 중요한 것으로 보인다. 또한, 기초통계 분석 결과 강남3구가 지하철역까지 거리의 평균값이 더 작아 지하철 접근성이 더 우수한 것으로 나타났다. 강남3구가 지하철 인프라가 더 잘 구축되어 있어서 강남3구에서는 주거지를 선택할 때 지하철역 접근성이 상대적으로 덜 중요할 수 있다.
대형판매시설은 강남3구의 아파트 가격 형성에 더 중요하게 작용했다. 기초통계 분석결과를 확인했을 때, 백화점과 대형마트와 같은 대형판매시설은 강남3구보다 강북3구에 더 고르게 분포해 있다. 이로 인해 대형판매시설 접근성은 강남3구의 아파트 가격 형성에 더 중요하게 나타난 것으로 보인다.
Local value 결과를 확인했을 때, 강남3구와 강북3구에서 아파트 가격에 미치는 영향이 다른 변수들이 있었다. 강북3구에서는 지하철역 출입구까지 거리가 가까울수록 아파트 가격이 상승하는 경향이 나타났다. 지하철역까지 거리가 가까울수록 통근이나 다른 지역으로의 이동이 편리해서 선호되는 것으로 보인다. 이와 달리 강남3구에서는 지하철역 출입구와 가까울수록 아파트 가격이 상승하기도 했지만, 하락하기도 했다. 기초통계 분석결과, 강남3구의 아파트에서 지하철역까지 거리는 평균 약 452m였지만, 강북3구는 평균 약 542m로 강남3구가 지하철역 접근성이 더 우수한 것으로 나타났다. 또한, 국토교통부(2025) 통계누리 자료에 따르면, 2020년 기준 강북3구에 비해 강남3구의 자가용 승용차 등록대수는 약 2배 이상 많다. 이는 강남3구가 지하철역이 주거지에 더욱 인접하고, 자동차 보유대수도 많아 매매 거래를 할 때 지하철역 접근성이 제공하는 이점과 혼잡과 같은 부의 외부효과가 동시에 영향을 미쳐서 나타난 결과로 보인다. 선행연구에서도 지하철역 주변지역은 혼잡하거나 소음이 발생해 지하철역까지 거리가 가까운 것이 오히려 주택가격에 부정적인 영향을 미칠 수 있다고 주장하였다(이세영 외, 2006). 또한, 강북3구와 달리 강남3구에서는 방이 많을수록 아파트 가격이 상승했다. 강남3구는 상대적으로 소득이 높고 세대원 간의 독립적인 개별공간을 중요시해서 나타난 결과로 판단된다.
또한, 한강 접근성이 아파트 가격에 미치는 영향이 지역별로 다르게 나타났다. 강남3구는 한강까지 거리가 가까울수록 아파트 가격이 상승하는 경향이 나타났다. 이는 선행연구와 유사한 결과로, 강남3구는 한강까지 거리가 가까울수록 경관이 우수하며 다양한 야외활동을 즐길 수 있어 선호되는 것으로 보인다(엄현태 외, 2018; Ko and Park, 2024). 그러나 강북3구는 한강까지 거리가 가까울수록 아파트 가격이 상승하기도 했지만 하락하기도 하였다. 강남3구는 한강과 인접해 있지만, 강북3구는 한강까지 거리가 멀어서 강북3구 내에서 가장 한강이 가까운 단지일지라도 한강 조망권이나 실질적 접근성이 떨어진다는 특징이 있다. 기초통계분석 결과에서도 강북3구 아파트 중에서 한강까지 거리가 가까운 아파트는 약 6.6km 거리에 위치한 것으로 나타났다. 이로 인해 아무리 강북3구 내에서 한강까지 거리가 가까운 아파트 단지일지라도 한강이 제공하는 경관이나 야외활동 증진과 같은 이점을 누리기 어렵다고 판단된다. 이와 같은 지리적 특성으로 인해 한강까지 거리가 멀수록 아파트 가격이 상승하는 경향이 나타나기도 한 것으로 보인다. 한편, 한강은 서울의 중심부를 가로지르고 있으며, 강변북로와 올림픽대로와 같은 주요 도로망이 위치한다. 이러한 한강의 지리적 이점으로 인해 강북3구에서도 한강에 가까울수록 가격이 상승한 경향이 나타나기도 한 것으로 보인다.
강남3구는 공공체육시설까지 거리가 가까울수록 아파트 가격이 상승하는 경향이 나타났다. 공공체육시설은 사람들에게 합리적인 가격으로 운동할 수 있는 공간을 제공하여 선호되는 것으로 보인다. 강북3구는 공공체육시설까지 거리가 멀수록 아파트 가격이 상승했다. 기초통계 결과에서 강북3구는 강남3구에 비해 아파트까지 공공체육시설까지 거리의 편차가 작게 나타나 강북3구가 공공체육시설이 더 고르게 설치되어있는 것으로 보인다. 이로 인해 주택을 구입할 때 사람들에게 공공체육시설이 선호요인으로 작용하지 못하였을 수 있다.
한편, 전용면적, 층, 세대당 주차대수, 소득, 건축연한, 계약연도, 공원녹지와 아파트 가격 간의 관계는 강남3구와 강북3구에서 유사하게 나타났다. 선행연구와 유사하게, 전용면적이 작을수록, 거래된 아파트의 층이 높을수록, 세대당 주차대수가 많을수록 아파트 가격이 상승하였다.
한편, 본 연구에서 인문특성으로 새롭게 추가한 소득 변수의 경우 아파트가 위치한 행정동의 월평균 소득이 높을수록 아파트 가격이 상승하는 경향이 나타났다. 소득은 사람들의 구매력에 영향을 미칠 수 있는 요인 중 하나로, 소득수준이 높은 행정동일수록 거주자의 구매력이 높아 해당 행정동에 위치한 아파트의 가격이 높은 경향이 나타난 것으로 보인다.
건축연한은 지역에 관계없이 아파트 가격과 비선형적인 관계를 보였다. 이는 아파트 건설 이후 일정 시점이 지나면 재개발 및 재건축 사업에 대한 기대감으로 인해 구축 아파트의 가격이 다시 상승하는 한국 문화의 특성이 반영된 것으로 판단된다. 또한, 지역에 상관없이 공원녹지의 접근성이 우수한 것은 아파트 가격 상승요인으로 확인되었다. 공원녹지는 쾌적한 환경을 조성해 주고, 휴식하거나 운동할 수 있는 공간을 제공하는 것처럼 사람들에게 다양한 편익을 제공하여 선호되는 것으로 보인다. 그러므로, 강남3구와 강북3구 모두 충분한 녹지공간을 제공할 필요가 있다.
계약연도는 2018년 1월 1일부터 2019년 12월 31일까지 거래된 거래보다 2020년 1월 1일부터 2022년 12월 31일에 거래된 거래일수록 매매가격이 더 높은 것으로 나타났다. 이는 코로나 팬데믹 시기에 한국은행 기준금리가 역대 최저 수준인 0.5%까지 하락한 저금리 정책과 같은 거시경제의 급격한 변화 때문으로 판단된다.
Ⅴ. 결 론
본 연구는 서울시 강남3구와 강북3구를 대상으로 랜덤 포레스트를 활용하여 아파트 가격 결정요인을 비교·분석했다. 주요 연구 결과 및 정책적 시사점은 다음과 같다.
첫째, 주택가격을 추정할 때 기계학습방법인 랜덤 포레스트를 활용하면 헤도닉 가격 모형보다 더 정확한 분석이 가능할 수 있다. 분석결과, 헤도닉 가격 모형보다 랜덤 포레스트가 설명력이 더 우수하고 오차가 더 적게 발생했다. 또한, 랜덤 포레스트 모형에 SHAP을 적용한 결과, 건축연한과 같은 일부 변수들은 아파트 가격과 비선형적인 관계가 나타났다. 이러한 결과는 헤도닉 가격 모형처럼 선형성을 기반으로 하는 모형으로 분석하면 실제 주택 시장에서 나타나는 복잡한 현상을 설명하는 데 한계가 있을 수 있음을 보여준다. 따라서, 앞으로도 성능이 더 우수하며 비모수 기반인 랜덤 포레스트 모형을 활용하면 더 정확한 분석이 가능할 수 있다.
둘째, 강남3구와 강북3구 간 아파트 가격에 영향을 미치는 변수들의 중요도가 다르게 나타났다. 그러므로 아파트 가격 결정요인을 하위시장별로 분석하여 지역 특성에 맞는 정책을 실시하면 더 실질적인 정책효과를 얻을 수 있을 것으로 보인다. 예를 들어 지하철역과 같은 대중교통 접근성은 강남3구보다 강북3구에서 아파트 가격 결정에 더 중요하였으며, 기초통계분석 결과 강남3구가 강북3구에 비해 지하철역 출입구 접근성이 더 우수한 것으로 나타났다. 또한 강북3구보다 강남3구에 지하철역이 더 많이 위치하고 있다. 그러므로, 강남3구보다는 강북3구에서 지하철역 접근성을 개선하는 것을 우선적으로 검토할 필요가 있어 보인다.
셋째, 소득은 두 지역 모두 아파트 가격 형성에 중요한 변수로 나타났다. 특히, 강남3구에서는 소득의 중요도가 가장 높았다. 그러나 기존 아파트 가격 영향요인을 확인하는 대부분의 선행연구에서는 소득과 같은 인문특성을 고려하지 못하고 있다. 그러므로 앞으로 아파트 가격 영향요인을 확인할 때 소득과 같은 인문특성 변수를 활용할 필요가 있다.
넷째, 일부 변수들이 아파트 가격에 미치는 영향은 강남3구와 강북3구에서 서로 상이한 것으로 나타났다. 예를 들어, 강북3구와 달리 강남3구는 공공체육시설까지 거리가 가까울수록 아파트 가격이 상승했으며, 기초통계 결과에서 강남3구보다 강북3구가 공공체육시설이 더 고르게 설치되어있음을 확인하였다. 이는 강남3구에서는 공공체육시설 인근에 위치한 아파트들의 가격이 높게 형성되고 있으며, 공공체육시설의 공급이 부족하다는 것을 보여줄 수 있다. 그러므로, 강남3구를 대상으로 공공체육서비스로부터 소외된 지역이 없는지 확인하고 공공체육시설을 공급하는 것을 검토할 필요가 있다. 또한, 공공체육시설 접근성과 같은 근린환경 변수가 아파트 가격에 미치는 영향이 지역별로 다른 것은 도시 내 인프라 수준, 주거환경 차이, 거주민의 특성 등 복합적인 지역 특성에 따라 상이하게 나타날 수 있음을 보여준다. 그러므로, 하위시장별로 주택가격 형성요인을 확인하면 더 정확한 분석이 가능할 수 있으며, 지역마다 특성에 맞는 도시 및 부동산 정책을 수립할 필요가 있다. 또한, 본 연구 결과는 아파트 개발업자들에게도 중요한 참고 자료가 될 수 있다. 지역의 고유한 특성을 반영해서 적절한 아파트 개발 전략을 수립해야 성공적인 개발사업이 진행될 수 있다. 이처럼 지역 특성을 반영한 성공적인 개발사업이 진행되면 추후 아파트에 입주하는 입주민들이 편리하고 쾌적한 주거환경을 누릴 수 있을 것으로 기대된다.
그러나 일부 변수는 아파트 가격에 미치는 영향이 강남3구와 강북3구에서 유사하게 나타났다. 「국토의 계획 및 이용에 관한 법률」에서 정의하고 있는 도시계획시설인 공원은 지역에 상관없이 아파트 가격 상승요인으로 나타나고 있다(법제처, 2025). 이는 주거지 선택 시 매수자에게 쾌적한 녹지환경은 선호될 수 있으며 아파트 가격 프리미엄으로도 작용할 수 있음을 의미한다. 따라서, 강남3구와 강북3구 모두 주거지에서 접근이 용이하고 충분한 공원녹지계획이 이루어질 필요가 있다.
한편, 본 연구는 강남3구와 강북3구만을 대상으로 하여 다른 지역에서는 다른 결과가 나타날 수 있다. 다른 지역을 대상으로 분석하는 것과 더 다양한 기준으로 서울시 내 하위시장을 탐색하여 하위시장별 아파트 가격 결정요인을 비교분석하는 것은 향후 연구과제로 남긴다. 그럼에도 불구하고 본 연구는 서울이라는 하나의 도시에서도 하위시장마다 아파트 가격 결정요인이 다르게 나타날 수 있음을 확인하였다. 이에 따라 하나의 시 전체에 일률적인 정책을 실시하기보다 미시적인 범위에서 도시 및 주택정책을 마련하여 지역에 더 적합한 정책이 실행할 필요가 있음을 실증분석을 통해 확인하였다는 점에서 의의가 있다.
Acknowledgments
이 논문은 2024년 대한국토·도시계획학회 추계학술대회 발표논문을 수정·보완하여 작성하였음.
References
-
강수진·서원석, 2016. “지하철 노선 및 역사특성이 아파트 매매 가격에 미치는 영향 분석”, 「국토연구」, 89: 149-162.
Kang, S. and Seo, W., 2016. “Investigating Impacts of Subway Line and Station Features on Apartment Resale Prices”, The Korea Spatial Planning Review, 89: 149-162. [https://doi.org/10.15793/kspr.2016.89..009]
-
강요명·서정렬, 2020. “아파트 가격에서 브랜드가 차지하는 가치 비중에 관한 연구 - 부산 해운대구 우동 및 반여동을 중심으로 -”, 「지역개발연구」, 52(1): 93-120.
Kang, Y. and Suh, J., 2020. “A Study on the Valuation Ratio of Brand in Real Price - A Case Study of Udong and Banyeodong in Busan Metropolitan City -”, The Studies in Regional Development, 52(1): 93-120. -
김광영·안정근, 2010. “서울시 1,000세대 이상 대규모 아파트단지의 아파트가격 결정요인에 관한 연구”, 「한국주거학회논문집」, 21(6): 81-90.
Kim, K.Y. and Ahn, J.K., 2010. “Determinant Factors for the Apartment Unit Prices of Large Scale Apartment Complexes over 1,000 Households in Seoul Metropolitan Area”, Journal of the Korean Housing Association, 21(6): 81-90. [https://doi.org/10.6107/JKHA.2010.21.6.081]
-
김명연·김은정, 2019. “근린환경 접근성은 공동주택가격에 영향을 미치는가?: 서울시 강남3구와 강북3구의 비교를 중심으로”, 「한국지역개발학회지」, 31(2): 229-250.
Kim, M.Y. and Kim, E.J., 2019. “Does the Access to Neighborhood Environment Affect Multi-family Housing Prices?: Comparison between Gangnam 3 Districts and Gangbuk 3 Districts in Seoul”, Journal of The Korean Regional Development Association, 31(2): 229-250. -
김우성·이시온·장현수·김재완·홍정의, 2019. “헤도닉 가격 모형을 통한 주거 선호의 구조 변화 분석: 2006-2017년 강남 지역 아파트를 중심으로”, 「부동산학보」, 76: 137-150.
Kim, W., Lee, S., Jang, H., Kim, J., and Hong, J., 2019. “Analysis of Structural Change of Housing Preferences using Hedonic Price Model: Case Study of Apartment Transaction Data from 2006 to 2017 in Gangnam Area”, Korea Real Estaste Academy Review, 76: 137-150. -
김이환·김형준·류두진·조훈, 2022. “기계학습 방법론을 활용한 아파트 매매가격지수 연구”, 「부동산분석」, 8(3): 1-29.
Kim, Y., Kim, H., Ryu, D., and Cho H., 2022. “A Study on Apartment Sales Price Index Using Machine Learning Methodology”, Journal of Real Estate Analysis, 8(3): 1-29. [https://doi.org/10.30902/jrea.2022.8.3.1]
-
김정희, 2021. “머신러닝을 이용한 주택가격 예측과 공간적 군집 패턴 분석”, 「경관과 지리」, 31(4): 150-165.
Kim, J.H., 2021. “Prediction of House Price and Analysis of Spatial Clustering Pattern using Machine Learning Algorithms”, Landscape and Geography, 31(4): 150-165. -
박천규·이수욱·권수연·손학기·전성제, 2012. “지역별 부동산 하위시장 유형화 및 정책방향”, 「국토정책 Brief,」 374: 1-6.
Park, C., Lee, S., Kwon, S., Son, H.,and Jeon, S., 2012. “Regional Real Estate Submarket Typology and Policy Direction”, KRIHS Policy Brief, 374: 1-6. -
배성완·유정석, 2018. “기계 학습을 이용한 공동주택 가격 추정: 서울 강남구를 사례로”, 「부동산학연구」, 24(1): 69-85.
Bae, S. and Yu, J., 2018. “Estimation of the Apartment Housing Price Using the Machine Learning Methods: The Case of Gangnam-gu, Seoul”, Journal of the Korea Real Estate Analysts Association, 24(1): 69-85. [https://doi.org/10.19172/KREAA.24.1.5]
-
변세일·고영화·최진도, 2019. “비수도권 아파트 가격 및 전세가 결정 요인 분석 -광주, 대전, 대구, 부산의 사례를 중심으로-”, 「주거환경」, 17(4): 109-126.
Byeon, S.H., Go, Y.H., and Choi, J.D., 2019. “An Analysis on Determinant Factor of Apartments Price and Jeonse Price in Gwangju, Daejeon, Daegu, Busan”, Journal of the Korea Residential Environment, 17(4): 109-126. [https://doi.org/10.22313/reik.2019.17.4.109]
-
서정석·임미화·한상욱·Sri Utami Purwaningati·김정섭, 2023. “개발밀도와 아파트 가격의 비선형적 관계 탐색: 설명 가능한 인공지능 적용을 중심으로”, 「주택연구」, 31(2): 133-160.
Seo, J., Lim, M., and Han, S., Purwaningati, S.U., and Kim, J., 2023. “Exploring the Nonlinear Relationship between Development Density and Housing Price: Focusing on eXplainable AI (XAI)”, Housing Studies Review, 31(2): 133-160. [https://doi.org/10.24957/hsr.2023.31.2.133]
-
성주한·박필, 2014. “서울 아파트 전세가격과 매매가격의 차이에 관한 연구”, 「부동산학보」, 57: 108-122.
Sung, J.H. and Park, P., 2014. “A Study on the Difference of the Chonsei Price and Sale Price of Apartment in the Seoul”, Korea Real Estate Academy Review, 57: 108-122. -
신상영·김민희·목정훈, 2006. “서울숲 조성이 주택가격에 미치는 영향”, 「서울도시연구」, 7(4): 1-17.
Shin, S.Y., Kim, M.H., and Mok, J.H., 2006. “The Effects of Seoul Forest Project on Neighborhood Housing Prices”, Seoul Studies, 7(4): 1-17. -
양건필·전해정, 2022. “기계학습과 XAI를 활용한 아파트 가격과 지역특성과의 관계 분석”, 「부동산연구」, 32(3): 7-24.
Yang, G.P. and Chun, H.J., 2022. "Analysis of the Relationship between Housing Prices and Regional Characteristics Using Machine Learning and XAI", Korea Real Estate Review, 32(3): 7-24. [https://doi.org/10.35136/krer.32.3.1]
-
엄현태·남상빈·김도형·김학열·우명제, 2018. “자연재해위험개선지구가 주변 아파트 가격에 미치는 영향”, 「한국방재학회논문집」, 18(7): 149-162.
Eom, H., Nam, S., Kim, D., Kim, H., and Woo, M., 2018. “The Impacts of Natural Disaster Risk Reduction Districts on Sales Prices of Neighboring Apartments”, Journal of the Korean Society of Hazard Mitigation, 18(7): 149-162. [https://doi.org/10.9798/KOSHAM.2018.18.7.149]
-
오지훈·김정섭, 2018. “머신러닝을 활용한 서울시 아파트 물리적 특성 변수들의 비선형 영향 분석: 다변량 적응 회귀 스플라인 모형의 적용”, 「감정평가학논집」, 17(3): 5-26.
Oh, J. and Kim, J., 2018. “Nonlinear Effects of Physical Characteristics of Apartment on Housing Prices: Focusing on Multivariate Adaptive Regression Spline”, Appraisal Studies, 17(3): 5-26. [https://doi.org/10.23843/as.17.3.1]
-
윤규섭·이주미·고선주·김희정·김주형, 2021. “머신러닝 분석을 통한 분양가 상한제의 주택시장 영향 연구”, 「대한건축학회논문집」, 37(8): 221-228.
Yoon, K.S., Lee, J.M., Ko, S.J., Kim, H,J., and Kim, J.H., 2021. “Analysing Impact of Price Ceiling System on Housing Market using Machine Learning”, Journal of the Architectural Institute of Korea, 37(8): 221-228. -
이규환·서승제, 2009. “서울시 자치구간 지역격차에 관한 연구: 강남 3구와 강북 3구의 비교”, 「한국공공관리학보」, 23(4): 357-381.
Lee, K.H. and Seo S.J., 2009. “A Study on the Regional Disparity between the Major 3 Gangnam Districts and the Major 3 Gangbuk Districts in Seoul”, Korean Public Management Review, 23(4): 357-381. [https://doi.org/10.24210/kapm.2009.23.4.015]
-
이동성·문태훈, 2016. “에너지효율등급이 아파트 가격에 미치는 영향에 관한 연구”, 「환경정책」, 24(4): 25-42.
Lee, D. and Moon, T.H., 2016. “The Effect of the Energy Efficiency Rating System on Apartment Prices”, Journal of Environmental Policy and Administration, 24(4): 25-42. [https://doi.org/10.15301/jepa.2016.24.4.25]
-
이세영·유학규·정성원·여홍구, 2006. “신도시 외부공간특성의 아파트가격에 미치는 영향에 관한 연구: 산본 신도시를 중심으로”, 「대한건축학회 논문집: 계획계」, 22(9): 3-12.
Lee, S.Y., Yoo, H.K., Jung, S.W., and Yuh, H.K., 2006. “A Study on the Influence of the Exterior Spatial Feature upon the Apartment Housing Prices: Focused on the New town ‘Sanbon’ Area in Korea”, Journal of the Architectural Institute of Korea, 22(9): 3-12. -
이재윤·서원석, 2018. “장애영역별 특수학교 입지에 따른 아파트 매매가격 영향 비교분석”, 「감정평가학논집」, 17(2): 105-126.
Lee, J.Y. and Seo, W.S., 2018. “Investigating Impact of Special Education Schools by Disability Type on Surrounding Apartment Resale Price”, Appraisal Studies, 17(2): 105-126. [https://doi.org/10.23843/as.17.2.5]
-
이주석·조주현, 2010. “강남지역과 강북지역의 아파트 가격 결정 요인 분석”, 「부동산학보」, 40: 5-13.
Lee, J.S. and Cho, J.H., 2010. “A Study on the Evaluation of Real Estate Consulting in Korea”, Korea Real Estate Academy Review, 40: 5-13. -
이훈, 2018. “경사도가 주택가격에 미치는 영향에 관한 연구 -서울지역 아파트 단지를 중심으로-”, 「국토계획」, 53(1): 153-177.
Lee, H., 2018. “A Study on the Effect of Slope on Housing Prices - Focusing on Apartment Complexes in Seoul Area -”, Journal of Korea Planning Association, 53(1): 153-177. [https://doi.org/10.17208/jkpa.2018.02.53.1.153]
-
임준홍·홍성효, 2015. “교육성취의 아파트가격에 대한 영향: 서울시 사례분석”, 「부동산학연구」, 21(1): 75-89.
Im, J. and Hong, S., 2015. “The Effect of Educational Attainments on Apartment Price: A Case Study of Seoul”, Journal of the Korea Real Estate Analysts Association, 21(1): 75-89. -
전해정, 2016. “공간계량분석기법과 GIS를 이용한 주택가격모형 비교에 관한 연구”, 「부동산학보」, 64: 46-56.
Chun, H., 2016. “The Study of Comparison of Housing Price Models by Using Spatial Econometrics and GIS”, Korea Real Estate Academy Review, 64: 46-56. -
정수연, 2006. “교육요인이 서울아파트가격에 미치는 영향에 관한 연구”, 「국토계획」, 41(2): 153-166.
Jeong, S.Y., 2006. “Impact of Educational Variable on Apartment Price in Seoul”, Journal of Korea Planning Association, 41(2): 153-166. -
조용경·윤영호, 2022. “AI 스마트 하우징 구축이 서울시 아파트 거래가격에 미치는 영향”, 「주거환경」, 20(4): 85-93.
Cho, Y. and Yoon, Y., 2022. “The Effect of AI Smart Housing Construction on Apartment Transaction Prices in Seoul”, Journal of The Residential Environment Institute of Korea, 20(4): 85-93. [https://doi.org/10.22313/reik.2022.20.4.85]
-
최석준·채수복, 2009. “주거 특성이 아파트 가격에 미치는 영향: 강남지역의 실거래 및 시세 자료 중심으로”, 「부동산학보」, 38: 296-310.
Choi, S.J. and Chae, S.B., 2009. “Impact of Residential Environment on Seoul Apartment Price: Analysis of Using Sales and Asking Price in Gangnam Gu”, Korea Real Estate Academy Review, 38: 296-310. -
최성호·성현곤, 2011. “지하철9호선 건설이 아파트 가격에 미치는 영향에 관한 연구: 사업단계별 효과를 중심으로”, 「국토계획」, 46(3): 169-177.
Choi, S.H. and Sung, H.G., 2011. “Identifying the Change of Influencing Power of the Subway Line 9 Construction Project over Housing Prices: Focusing on the Business Effects during the Entire Project Stages”, Journal of Korea Planning Association, 46(3): 169-177. -
한다솜·최창규, 2022. “우이신설 경전철이 주택 가격에 미치는 영향에 관한 연구: 우이신설 경전철 인근 아파트를 중심으로”, 「국토계획」, 57(2): 108-126.
Han, D.S. and Choi, C.G., 2022. “A Research on the Influence of the Ui-Sinseol Light Rail Transit on Housing Price: Focusing on the Apartments near the Ui-Sinseol Light Rail Transit”, Journal of Korea Planning Association, 57(2): 108-126. [https://doi.org/10.17208/jkpa.2022.04.57.2.108]
-
현동우, 2021. “명칭 변경 사례를 통해 살펴본 아파트 브랜드 프리미엄에 관한 연구”, 「부동산학연구」, 27(1): 21-35.
Hyun, D., 2021. “A Brand Premium on Apartment Prices: Evidences from Renaming Cases”, Journal of the Korea Real Estate Analysts Association, 27(1): 21-35. [https://doi.org/10.19172/KREAA.27.1.2]
-
홍성준·이창무, 2020. “Airbnb가 아파트가격에 미치는 영향에 관한 연구”, 「주택연구」, 28(1): 111-131.
Hong, S.J. and Lee, C.M., 2020. “A Study on Influence of Airbnb on Housing Price”, Housing Studies Review, 28(1): 111-131. [https://doi.org/10.24957/hsr.2020.28.1.111]
-
홍정의, 2021. “랜덤 포레스트 알고리즘을 통한 주택 대량평가모형 연구”, 「부동산분석」, 7(1): 1-28.
Hong, J., 2021. “A Mass Appraisal Model on Residential Property with Random Forest Algorithm”, Journal of Real Estate Analysis, 7(1): 1-28. [https://doi.org/10.30902/jrea.2021.7.1.1]
-
황형기·이창무·김미경, 2008. “한강조망이 주택가격에 미치는 영향”, 주택연구, 16(2): 51-72.
Hwang, H.K., Lee, C.M., and Kim, M.K., 2008. “Effect of Visibility of the Han River on the Housing Price”, Housing Studies Review, 16(2): 51-72. -
Abidoye, R.B. and Chan, A.P.C., 2018. “Improving Property Valuation Accuracy: A Comparison of Hedonic Pricing Model and Artificial Neural Network”, Pacific Rim Property Research Journal, 24(1): 71-83.
[https://doi.org/10.1080/14445921.2018.1436306]
-
Adetunji, A.B., Akande, O.N., Ajala, F.A., Oyewo, O., Akande, Y.F., and Oluwadara, G., 2022. “House Price Prediction Using Random Forest Machine Learning Technique”, Procedia Computer Science, 199: 806-813.
[https://doi.org/10.1016/j.procs.2022.01.100]
-
Antipov, E.A. and Pokryshevskaya, E.B., 2012. “Mass Appraisal of Residential Apartments: An Application of Random Forest for Valuation and a Cart-based Approach for Model Diagnostics”, Expert Systems with Applications, 39(2): 1772-1778.
[https://doi.org/10.1016/j.eswa.2011.08.077]
-
Breiman, L., 2001. “Random Forests”, Machine Learning, 45: 5-32.
[https://doi.org/10.1023/A:1010933404324]
-
Chung, Y.S., Seo, D., and Kim, J., 2018. “Price Determinants snd GIS Analysis of the Housing Market in Vietnam: The Cases of Ho Chi Minh City and Hanoi”, Sustainability, 10(12): 4720.
[https://doi.org/10.3390/su10124720]
-
Han, J., Lee, S., and Woo, A., 2023. “Effects of Neighborhood Streetscape on Single-Family Housing Prices: Focusing on Non-Linear and Interaction Effects Using Interpretable Machine Learning”, PLoS ONE, 20(5): 1-25.
[https://doi.org/10.2139/ssrn.4492576]
-
Kim, J., Lee, Y., Lee, M.H., and Hong, S.Y., 2022. “A Comparative Study of Machine Learning and Spatial Interpolation Methods for Predicting House Prices”, Sustainability, 14(15): 9056.
[https://doi.org/10.3390/su14159056]
-
Ko, D. and Park, S., 2024. “Investigating the Correlation between Air Pollution and Housing Prices in Seoul, South Korea: Application of Explainable Artificial Intelligence in Random Forest Machine Learning”, Sustainability, 16(11): 4453.
[https://doi.org/10.3390/su16114453]
- Lundberg, S. M. and Lee, S. I., 2017. “A Unified Approach to Interpreting Model Predictions”, Paper presented at the 31st International Conference on Neural Information Processing Systems, Long Beach California USA.
-
Louati, A., Lahyani, R., Aldaej, A., Aldumaykhi, A., and Otai, S., 2022. “Price Forecasting for Real Estate Using Machine Learning: A Case Study on Riyadh City”, Concurrency and Computation: Practice and Experience, 34(6): e6748.
[https://doi.org/10.1002/cpe.6748]
-
Rico-Juan, J.R. and Taltavull de La Paz, P., 2021. “Machine Learning with Explainability or Spatial Hedonic Tools? An Analysis of the Asking Prices in the Housing Market in Alicante, Spain”, Expert Systems with Applications, 171: 114590.
[https://doi.org/10.1016/j.eswa.2021.114590]
-
Rosen, S., 1974. “Hedonic Prices and Implicit Markets: Product Differentiation in Pure Competition”, Journal of political economy, 82(1): 34-55.
[https://doi.org/10.1086/260169]
- Uysal, H. and Kalkan, A., 2024. “Predicting Housing Prices in Istanbul Using Explainable Artificial Intelligence Techniques”, Journal of Multidisciplinary Developments, 9(1): 19-34.
-
Wen, H., Zhang, Y., and Zhang, L., 2014. “Do Educational Facilities Affect Housing Price? An Empirical Study in Hangzhou, China”, Habitat International, 42: 155-163.
[https://doi.org/10.1016/j.habitatint.2013.12.004]
-
Yang, L., Liang, Y., Zhu, Q., and Chu, X., 2021. “Machine Learning for Inference: Using Gradient Boosting Decision Tree to Assess Non-Linear Effects of Bus Rapid Transit on House Prices”, Annals of GIS, 27(3): 273-284.
[https://doi.org/10.1080/19475683.2021.1906746]
-
Yang, L., Zhou, J., and Shyr, O.F., 2019. “Does Bus Accessibility Affect Property Prices?”, Cities, 84: 56-65.
[https://doi.org/10.1016/j.cities.2018.07.005]
-
국세청, “근로소득 연말정산 신고현황”, 2025.4.5.읽음. KOSIS, https://kosis.kr/statHtml/statHtml.do?orgId=133&tblId=TX_13301_A035&conn_path=I2
National Tax Service, “Status of Year-End Tax Settlement for Wage Income”, Accessed April 5, 2025. KOSIS, https://kosis.kr/statHtml/statHtml.do?orgId=133&tblId=TX_13301_A035&conn_path=I2 -
국토교통부, “자동차등록현황보고”, 2025.6.30.읽음 . 통계누리, https://stat.molit.go.kr/portal/main/portalMain.do
Ministry of Land, Infrastructure and Transport., “Total Registered Motor Vehicle”, Accessed June 30, 2025. Molit Statistics System, https://stat.molit.go.kr/portal/ -
법제처, “국토의 계획 및 이용에 관한 법률”, 2025.8.18.읽음. 국가법령정보센터, https://www.law.go.kr/lsInfoP.do?lsiSeq=91698&ancYnChk=#0000
Ministry of Government Legislation, “National Land Planning and Utilization”, Accessed August 18, 2025. Korean Law Information Center, https://www.law.go.kr/lsInfoP.do?lsiSeq=91698&ancYnChk=#0000 -
한국부동산원, “(월)지역별 매매 평균가격_아파트”, 2025.8.18. 읽음. R-ONE 부동산통계정보, https://www.reb.or.kr/r-one/portal/stat/easyStatPage/A_2024_00188.do?isMobileYn=N
Korea Real Estate Board, “(Monthly) Average Sales Price of Apartments by Region”, Accessed August 18, 2025. R-ONE, https://www.reb.or.kr/r-one/portal/stat/easyStatPage/A_2024_00188.do?isMobileYn=N -
KB부동산, “주택가격동향조사”, 2025.4.7.읽음. https://data.kbland.kr/kbstats/wmh?tIdx=HT07&tsIdx=aptM2SaleAvgPrice
KB Land, “Real Estate Housing Trend Survey”, Accessed April 7, 2025. https://data.kbland.kr/kbstats/wmh?tIdx=HT07&tsIdx=aptM2SaleAvgPrice









