
한국어 임베딩 기반 리뷰 분석을 활용한 서울 아파트 주거만족도와 정주환경 영향 요인 분석
Abstract
Residential satisfaction functions as a critical subjective indicator for evaluating residential environments and serves as a foundation for formulating effective urban planning and housing policies. Despite numerous studies exploring factors that shape housing satisfaction, empirical research remains insufficient owing to the limited availability of data and methodological constraints in data acquisition. This study addresses these limitations by employing review data extracted from Zigbang, a major real-estate platform in Korea, and applying sentiment analysis techniques based on Korean language embeddings. The analysis was limited to reviews written by apartment residents in Seoul, and the findings were interpreted within the context of the apartment residential environment of Seoul. Residential satisfaction was categorized into three distinct sentiment classes—positive, neutral, and negative—and multiple regression analyses were conducted to identify the determinants influencing each sentiment category. The findings of this study provide several policy implications.
First, applying Korean language embedding-based sentiment analysis shows that the subjective perceptions of residents can be captured more accurately, allowing positive, neutral, and negative reviews to be interpreted at a micro level for evidence-based urban planning and housing policy development. Second, the determinants of neutral sentiments indicate that residents within the same apartment complex may perceive their living environment differently depending on their demographic and behavioral characteristics, emphasizing the need for demand-responsive and customized housing policies. Third, childcare facilities, schools, transit accessibility, and neighborhood amenities affect positive and negative residential satisfaction differently. This highlights the importance of spatial planning strategies that ensure a balanced provision of essential daily-life facilities in developing or redeveloping residential areas.
Keywords:
Residential Satisfaction, Neighborhood Environment, Korean Language Embedding, Review Text Analysis, Multiple Regression Analysis키워드:
주거만족도, 정주환경, 한국어 임베딩, 리뷰 분석, 다중회귀분석Ⅰ. 서 론
1. 연구의 배경 및 목적
주거지는 단순한 물리적 거주 공간을 넘어, 도시민의 삶에 다양한 기능과 사회적 의미를 부여하는 도시 내 핵심 요소이다(Preece et al., 2020). 그러나 도시 내 주거지는 한정된 자원이자 자산 증식의 수단으로 활용되고 있어, 누구나 원하는 지역에 거주하는 것은 어려운 실정이다(김기중 외, 2023). 이러한 현상은 1980년대 이후 지속적으로 제기되어 온 우리나라 주택시장의 전반적인 문제이다. 정부에서는 이를 해소하기 위해 다양한 주택정책이 시행되었는데, 양적 측면에서 주택 부족 문제를 일부 완화하였다. 그러나 질적 측면에서는 형평성 있는 정주환경을 조성하지 못했다는 한계가 지적되었다(진장익 외, 2018; 고승욱 외, 2023b).
정주환경은 주거지 주변에 대중교통 시설, 상업시설, 녹지, 교육시설 등 다양한 도시의 물리적 요소의 이용편의성과 개인의 인구·사회·경제적 특성에 따라 도시활동(통근, 통학, 업무, 여가, 쇼핑, 교육, 등)을 얼마나 효율적으로 수행할 수 있는지에 따라 평가된다(장윤정·고승욱, 2021). 즉, 정주환경은 도시민이 거주하는 지역에서의 도시활동 편의성에 따라 결정된다고 할 수 있으며(정승진 외, 2023), 현재 거주지에 대한 주거만족도를 통해 평가할 수 있다(국토교통부, 2023). 일반적으로, 주거만족도는 주거지의 공간적 특성에 의해서 결정되므로(고승욱 외, 2023b), 이를 바탕으로 도시민이 필요로 하는 기능이나 시설을 파악할 수 있다. 실제로 국내·외에서는 주거만족도를 활용한 도시계획 및 주택정책 수립이 이루어지고 있다(성진욱·이영민, 2017; 국토교통부, 2023; Mohit et al., 2010; Chen et al., 2013).
주거만족도의 중요성이 높아지면서, 주거만족도를 형성하는 요인을 규명하기 위해 다양한 연구가 수행되어 왔다(오주용 외, 2006; 신은진·남진, 2012; 강대식 외, 2024; Whang et al., 2023). 이 연구들은 국토교통부의 주거실태조사, 서울주택도시공사의 공공임대 입주자 패널 조사, 연구자들이 자체적으로 실시한 설문 조사 자료를 활용하였다. 그러나 이 자료들은 개인정보 보호법과 부정적인 응답 결과가 주택가격에 영향을 미칠 수 있다는 우려로 인해 구체적인 주거지 정보가 제공되지 않았다. 이는 주거입지에 따라 정주환경이 달라진다는 점(Kain, 1968)을 충분히 반영하지 못한다는 한계점이 존재한다. 최근에는 정보통신기술의 발전과 주거 관련 플랫폼의 등장으로 기존 주거만족도 자료의 한계를 보완할 수 있는 가능성이 제시되었다(장윤정·고승욱, 2021). 특히, 주거 플랫폼의 평점 및 리뷰 기반 데이터를 활용하여 주거만족도 자료를 구축하고, 이를 바탕으로 정주환경 분석을 수행하는 것이 가능하다(권준현·이수기, 2023).
그럼에도 불구하고, 주거 관련 플랫폼의 평점 기반 리뷰 자료는 주로 4점 또는 5점 리커트 척도(Likert Scale)로 제공되며, 평점 인플레이션 효과(Rating Inflation Effect)로 인해 신뢰도가 저하된다는 한계가 있다. 리커트 척도를 사용할 경우 중심화 경향(Central Tendency Bias)과 서열 척도(Ordinal Scale)로서의 한계가 발생할 수 있다(박현애 외, 2014). 중심화 경향이란 응답자가 극단적인 선택을 피하고 중립적 선택지를 선호하는 경향으로, 이로 인해 실제 의견 분포가 왜곡될 수 있다(Douven, 2018). 또한 리커트 척도는 응답 간의 순서는 표현하지만, 각 응답 간 간격이 동일하다고 보기 어려운 서열 척도의 특성을 지닌다(Lalla, 2017). 이처럼 리커트 척도 기반 설문조사는 본질적으로 주관성이 강한 주거만족도라는 개념을 충분히 반영하기 어렵고, 정보 손실과 편향 가능성으로 인해 데이터 신뢰도를 저하시킬 수 있다(Westland, 2022).
아울러, 평점 인플레이션 현상은 실제 만족도보다 과대 평가된 평점이 나타나는 현상으로, 실질적인 사용자 만족도를 정확히 반영하지 못하는 문제가 제기되고 있다(Filippas et al., 2019). 특히, 우리나라의 대표적 주택유형인 아파트의 경우, 단지 차원의 공간적 특성이 동일하더라도 입주자 개인 및 가구 특성에 따라 평점 인플레이션 효과가 크게 나타날 수 있다. 예를 들어, 교육환경에 대한 리뷰 항목에 대해 자녀가 있는 4인 가구는 교육환경이 우수하면 높은 점수, 미흡하면 낮은 점수를 줄 가능성이 높다. 그러나, 자녀가 없는 2인 가구의 경우는 교육환경의 질을 판단하기 어려워 보통 수준으로 응답할 가능성이 존재한다.
이러한 한계점은 한국어 임베딩 기반 정주환경 평가 기법을 통해 일정 부분 해소가 가능한데, 해당 기법은 리뷰 내용을 구성하고 있는 텍스트를 점수화함으로써, 주거만족도라는 주관적 지표에 대한 신뢰도를 높이는 데 유용하다. 구체적으로, 한국어 임베딩 기법은 문장 내 문맥을 파악하여 동음이의어나 단어 간 의미 관계를 분석하고, 이를 바탕으로 긍정, 부정, 중립의 점수를 부여할 수 있다(Park et al., 2021). 예를 들어, 평점은 높게 부여되었지만 리뷰 내용에 부정적 표현이 포함되어 있을 경우, 리뷰 내용을 바탕으로 주거만족도를 재평가 하는 것이 가능하다. 따라서 이를 통해 보다 실질적인 주거만족도를 도출하는 것이 가능하다.
한편, 정부는 수요자 중심의 안정적인 정주환경 조성을 위해 다양한 정책을 수립 및 시행하고 있다(국토교통부, 2023). 그러나 주거만족도는 개인의 주관적 경험에 따라 다르게 나타나기 때문에(장윤정·고승욱, 2021), 일괄적으로 획일화된 정책을 수립하고 시행하는 것은 비효율적인 결과를 초래할 수 있다. 따라서 도시민의 주거만족도를 면밀히 파악하고, 어떠한 정주환경 요인이 주거만족도 형성에 영향을 미치는지 확인하는 것은 효율적인 주거정책 수립을 위해 주요한 사안이다. 이러한 배경하에 이 연구의 목적은 한국어 임베딩 기반 정주환경 평가 기법을 활용하여 서울시 아파트 거주민의 주거만족도를 측정하고, 아파트가 입지한 지역의 정주환경이 주거만족도 형성에 미치는 영향을 분석하는 것이다.
2. 연구의 구성과 범위
이 연구의 구성은 다음과 같다. 전술한 제1장은 서론으로, 연구의 배경과 필요성을 바탕으로 연구의 목적을 기술하였다. 제2장에서는 ‘정주환경이 주거만족도에 미치는 영향요인’과 ‘텍스트 마이닝 기법과 한국어 임베딩 기술 기반 정주환경 평가 연구’를 중심으로 선행연구를 검토하였다. 이를 통해 이 연구의 타당성을 확보하였고 차별성을 도출하였다. 제3장은 연구방법론으로, 연구 목적을 달성하기 위한 구체적인 분석 절차와 방법을 기술하였다. 제4장에서는 제시된 방법론을 바탕으로 실증분석을 수행하였고, 결과해석을 수행하였다. 마지막으로 제5장에서는 분석결과를 바탕으로 도시계획 및 주택정책에 대한 정책적 시사점을 도출하였으며, 연구의 한계점을 명시하였다.
연구의 공간적 범위는 국내 도시 중 인구밀도가 가장 높고, 다양한 주거정책이 논의되고 있는 서울시이다. 시간적 범위는 2022년으로 설정하였는데, 이는 주거만족도 형성에 영향을 미치는 정주환경 요인을 설명할 수 있는 자료와, 주거 플랫폼 직방에 등록된 리뷰 데이터의 시점을 일치시키기 위함이다. 주거만족도와 관련된 리뷰 데이터는 2022년 1월 1일부터 12월 31일까지의 1년간 작성된 자료를 수집하였다.
서론에서 언급한 바와 같이, 동일한 아파트 단지에 거주하더라도 정주환경에 대한 개인의 주거만족도는 상이하게 나타날 수 있다는 연구 가설을 검증하기 위해서는 동일 단지 내 리뷰 데이터가 요구된다. 2022년 기준 서울시 내 리뷰 데이터가 존재하는 아파트 단지의 구체적인 공간위치 정보는 아래 <그림 1>과 같다.
Ⅱ. 선행연구 고찰
1. 아파트의 정주환경이 주거만족도 형성에 미치는 영향요인
정주환경은 개인 및 가구가 거주하는 공간을 구성하는 물리적·사회적·경제적·문화적 요소를 포괄하는 개념으로(Kaal, 2011), 도시계획 분야에서는 주거지 내 생활편의시설(상업, 문화, 교육, 교통 등)에 대한 접근성을 통해 주거지의 질적 수준을 평가해 왔다(Lee et al., 2024). 정주환경의 질적 평가는 주거만족도로 귀결되며, 주거만족도는 개인이 거주하는 주택과 주변 환경에 대해 인지하는 전반적 만족 수준을 의미한다(국토교통부, 2023). 이러한 점에서 주거만족도는 정주환경의 질을 측정하는 핵심 지표로 기능하며, 주택정책 수립과 도시계획적 의사결정 과정에서 중요한 근거자료로 활용되고 있다(진장익 외, 2018).
전통적으로 정주환경 지표는 세계보건기구(WHO)가 제시한 안정성·보건성·편리성·쾌적성의 4대 범주에 기반하여 구축·활용되어 왔다(장윤정·고승욱, 2021). 그러나 의료·과학기술의 발전과 도시민의 생활양식 변화로 인해 현대 도시에서는 보건성과 안정성보다는 편리성과 쾌적성의 중요성이 증대되고 있다(성진욱 외, 2024). 특히 서울 거주민을 대상으로 한 실증연구에서는 환경보건지표의 필요성을 낮게 평가하는 경향이 나타났으며(원종석 외, 2022), 이에 따라 생활편의 접근성과 일상활동의 용이성을 중심으로 주거만족도를 설명하려는 연구가 증가하고 있다. 그러나 설문 기반 주거만족도 조사는 조사기관 또는 연구자의 문항 구성에 따라 결과가 상이하게 나타나는 주관성 문제도 존재한다.
한편, 우리나라의 대표적인 주택유형은 공동주택인 아파트이며, 2023년 인구주택총조사 기준 전체 가구 중 53.1%가 아파트에 거주하고 있다. 아파트는 단지 내부의 물리적 특성과 더불어 주변 생활편의시설 접근성이 편리성과 쾌적성을 결정하는 핵심 요소이며(Lee et al., 2024), 동일한 환경에서도 개인·가구 특성에 따라 주거만족도가 상이하게 나타난다. 이러한 맥락에서 아파트 거주민을 대상으로 주거만족도 형성요인을 규명하는 연구들이 수행되어 왔다(신은진·남진, 2012; 한봉수·서원석, 2018; 성진욱·남진, 2019; 김성연·권성문, 2021; 강대식 외, 2024).
신은진·남진(2012)은 서울시 아파트 단지를 대상으로 안전성, 편리성, 쾌적성과 같은 공간적 특성과 거주자의 인구·사회학적 요인이 주거만족도에 미치는 영향을 다중회귀분석으로 검증하였다. 분석 결과, 지하철역(+), 경찰서·파출소(+), 의료기관(+) 등 주요 시설과의 접근성이 높을수록 주거만족도가 유의하게 상승하는 것으로 나타났다.
한봉수·서원석(2018)은 공공임대주택과 분양주택 거주자를 비교하여 주거환경 요인이 주거만족도에 미치는 영향을 분석하였다. 분석 결과, 공공임대주택의 경우 생활편의시설 접근성(+)이 높을수록 만족도가 향상되었으며, 분양주택의 경우 주택의 물리적 특성과 이웃 관계가 양호할수록 주거만족도가 높게 나타났다.
성진욱·남진(2019)은 공공임대 아파트 입주민을 대상으로 개인·가구·지역 수준을 모두 고려하여 주거만족도 영향요인을 분석하였다. 개인 수준에서는 나이(-), 교육 수준(+), 소득(+)이 영향을 미쳤으며, 가구 수준에서는 기초생활수급 여부(-), 거주기간(-). 지역 수준에서는 서울 서남권 거주 여부(-), 대중교통 접근성(+), 공공시설 접근성(+), 의료시설 접근성(+) 등이 만족도 향상에 긍정적으로 작용하였다.
김성연·권성문(2021)은 순서형 로지스틱 회귀모형을 활용하여 아파트 주거만족도 영향요인의 중요성이 시간에 따라 어떻게 변화하는지를 분석하였다. 분석 결과, 상업시설(+), 의료시설(+), 공공기관(+), 문화시설(+), 도시공원 및 녹지(+), 대중교통(+) 접근성이 높을수록 주거만족도가 향상되는 경향이 지속적으로 확인되었다.
강대식 외(2024)는 세종시 복합용도 아파트 거주자를 대상으로 주거만족도에 영향을 미치는 요인을 규명하였다. 분석 결과, 개별 주택의 쾌적성·편의성(+)이 높고, 상업·교육·문화시설의 이동성(+)이 우수할수록 주거만족도가 유의하게 상승하는 것으로 나타났다.
아파트를 대상으로 한 주거만족도 연구 외에도 도시민의 활동 특성(통근, 여가·쇼핑 등)이 주거만족도를 대변한다는 관점에서 활동특성에 영향을 미치는 요인을 분석한 연구가 수행되었다(고승욱 외, 2023b). 이 연구에서는 교통 및 생활편의시설 접근성이 정주환경에 중요한 요인임을 시사하였다. 또한 고령자·청년층·1인 가구 등 특정 계층의 이주 결정요인을 분석한 연구들에서도 생활 편의시설 접근성이 계속 거주여부를 결정짓는 중요한 요소로 도출되었다(손경민·진장익, 2020; 홍성효·임준홍, 2023; 김단야, 2024).
이상과 같이, 기존 연구는 아파트를 중심으로 정주환경이 주거 만족도 형성에 미치는 영향을 다양한 측면에서 검토해왔다. 선행 연구들은 공통적으로 생활편의시설 접근성, 교통 접근성과 같은 편리성·쾌적성 요소가 주거만족도와 밀접하게 관련되어 있다는 점을 도출하였다. 이는 도시민의 일상활동을 위한 공간적 환경이 주거만족도 형성에 직접적으로 영향을 미친다는 점을 의미한다. 특히 아파트가 우리나라 주거형태의 다수를 차지하고 있다는 점을 고려하면, 아파트 거주민을 대상으로 생활편의시설 접근성을 중심으로 주거만족도를분석하는 것은 정주환경의 질적 평가와 주택 정책 제언 측면에서도 의미가 있다. 이러한 논의는 생활편의시설을 중심으로 주거만족도에 영향을 미치는 요인을 검토할 필요가 있음을 시사한다.
2. 텍스트 마이닝 기법과 한국어 임베딩 기술 기반 정주환경 평가 연구
텍스트 마이닝(Text Mining)은 대규모 글 자료에 내재된 정보를 체계적으로 추출하기 위한 분석 방법으로 정의되며 (Feldman and Dagan, 1995), 온라인에 축적된 방대한 텍스트 기반 자료에서 사회·경제적 이슈를 도출하고 기존 정책을 평가하는 데 유용한 방법이다(고우영·홍정열, 2022). 구체적으로 키워드 추출, 동향 분석, 연관어 분석 등을 통해 문장 또는 단어가 지닌 특성을 바탕으로 긍정적·부정적 요인을 식별할 수 있어, 다양한 정성적 정보를 정량화하는 데 활용되고 있다(Hong et al., 2019).
도시계획 및 주거정책 분야에서도 텍스트 마이닝을 활용한 연구가 증가하고 있다. 특히, 대규모 부동산 플랫폼에서 웹크롤링을 수행하여 아파트 리뷰 텍스트를 수집한 뒤 주거환경 만족도의 구성요인과 영향을 분석하는 연구가 일부 수행되었다(김선재·이수기, 2020; 장윤정·고승욱, 2021; 권준현·이수기, 2023). 이들 연구는 리뷰데이터가 국토교통부 주거실태조사, 서울시 공공임대 주택 패널조사 등 기존의 설문 기반 자료와 비교하였을 때, 일정 수준의 일관성을 지니고 있다는 것을 확인하였다. 이러한 연구결과를 통해 온라인 리뷰에 기반하여 주거만족도를 분석하는 것이 가능하다는 점을 시사하였다. 또한 뉴스 기사, 블로그 등 비정형 텍스트를 활용하여 주거정책의 평가, 수요자 요구 도출 등을 수행한 연구들도 이루어졌으며(황지현, 2022; 김도연, 2023; 황윤서·이현정, 2024), 텍스트 마이닝은 정책평가에 유용한 수단이라는 점을 강조하였다.
그러나 기존 텍스트 마이닝 기반 연구들은 다음과 같은 한계점이 존재한다. 첫째, 텍스트 전처리 과정에서 연구자의 주관적 판단이 개입될 가능성이 높고, 특정 단어를 선택하거나제거하는 기준이 연구자의 경험에 의해 결정될 수 있다는 점이 지적된다 (Weber, 1990). 둘째, 키워드 분류를 위해 구축하는 어휘 사전 역시 연구자의 선입견이 반영될 위험이 있다(Lazer et al., 2014). 셋째, 플랫폼 리뷰 평점이 실제 만족도보다 높게 나타나는 ‘평점 인플레 현상’을 충분히 반영하지 못한다는 한계가 존재한다.
더불어, 텍스트 마이닝 기법의 한계와 별개로 온라인 리뷰데이터가 지닌 구조적 특성에서 발생하는 문제 또한 고려해야 한다. 우선, 온라인 리뷰는 자발적 참여에 의해 작성되기 때문에 특정 플랫폼 이용자에 편중되며, 실제 거주민 전체를 대변하기 어려운 자기선택 편향(Self-selection Bias) 문제가 발생할 수 있다(Li and Hitt, 2008; Brandes et al., 2022). 리뷰 수가 적거나 특정 유형의 단지에 편중될 경우 표본 대표성의 왜곡은 커질 수 있다. 또한 온라인 리뷰에는 실제 경험과 무관한 허위 리뷰(Fake Review)가 포함될 가능성이 있으며, 이는 감성 분석이나 키워드 분석 결과를 왜곡하는 요인으로 작용할 수 있다(Paul and Nikolaev, 2021).
이러한 한계를 보완하기 위한 방안으로 임베딩 기술 기반텍스트 마이닝 기법이 효율적으로 평가받고 있다(Mikolov et al., 2013). 임베딩 기법은 대규모 말뭉치를 사전 학습하여 단어 간 의미적 유사성을 벡터 형태로 표현함으로써 연구자의 주관적 사전 구축 의존도를 낮추고, 텍스트의 맥락적 의미를 보다 정교하게 반영할 수 있다는 장점이 존재하여(Bojanowski et al., 2017), 평점 인플레 현상을 해소하기 적합하다. 반면, 자기선택 편향과 허위 리뷰는 텍스트 마이닝 기법이 아닌 데이터 생성 과정에서 발생하는 구조적 문제이기 때문에, 임베딩 기술로 해결하기 어렵다. 이러한 한계는 분석 단위를 개별 리뷰가 아닌 단지 수준의 집계 지표로 설정하는 것과 리뷰 수가 적은 단지를 제외하고, 비정상적 패턴을 보이는 리뷰를 필터링하는 등 분석 설계 단계에서 보완을 통해 완화될 수 있다. 이 연구는 이러한 한계를 인지하고 자료구축 단계에서 관련 조치를 반영하였다.
3. 연구의 차별성
선행연구 고찰을 통해 아파트 정주환경이 주거만족도 형성에 미치는 주요 영향요인을 파악하였으며, 기존 연구가 지닌 한계점을 확인하였다. 특히 텍스트 마이닝 기법과 한국어 임베딩 기술을 활용한 정주환경 평가 관련 연구들을 검토한 결과, 기존 방법론이 갖는 기술적 제약과 분석상의 한계가 존재함을 확인할 수 있었다. 이 연구는 이러한 한계점을 보완할 수 있는 분석 틀을 제시하였으며, 연구 목적을 달성하기 위해 필요한 데이터 구성 방식과 분석 관점, 그리고 아파트 정주환경 요소의 선정 기준에 대한 이론적 근거를 확보하였다. 이 연구의 차별성은 다음과 같다.
첫째, 한국어 임베딩 기반 텍스트 마이닝 기법을 적용하기 위해 기존 감성어 사전에 공간 감성어를 추가하였다. 이는 감성어 사전의 감성 점수를 재구성한 것이 아니라, 임베딩 모델이 처리할 수 있는 어휘 범위를 확장하는 방식으로 공간 관련 어휘를 입력한 것이다. 기존 연구들은 대부분 기본 감성어 중심의 감성 사전을 구축하면서 연구자의 주관이 개입될 여지가 컸으나, 이 연구는 감성 점수를 임의로 부여하는 절차를 수행하지 않았다. 주거만족도 리뷰에서 반복적으로 등장하는 장소·공간 관련 POI(Point of Interest) 단어를 임베딩 입력 어휘에 추가하여, 해당 단어들이 임베딩 모델이 학습한 의미공간에서 자연스럽게 반영되도록 하였다. 이와 같은 방법은 연구자의 주관적 판단을 최소화하면서 한국어 텍스트의 공간적 맥락 정보를 보다 정확하게 파악할 수 있어, 주거 만족도 측정의 정밀도를 높일 수 있다.
둘째, 주거만족도 평가를 ‘긍정’, ‘중립’, ‘부정’의 세 범주로 세분화하여 분류하였다. 기존 연구 대부분은 평점 중심 접근이나 ‘긍정’ 과 ‘부정’의 이진 분류(Binary Classification)로 처리하여 중립적 의견을 충분히 반영하지 못했다. 반면 이 연구는 리뷰의 중립적 의미까지 도출할 수 있게 하여 중립적 주거만족도를 도출하였다. 특히, 우리나라의 대표 주거유형인 아파트는 동일한 단지에 거주하더라도 개인 및 가구의 사회·경제적 특성에 따라 인식이 다르게 나타날 수 있다. 이러한 점을 고려할 수 있는 분석 틀을 제시했다는 점에서 이 연구의 차별성이 존재한다.
셋째, 실제 도시민의 활동 특성과 이동가능 범위를 고려하여 접근성 지표를 구성하였다. 기존 연구들은 생활편의시설 접근성이 주거만족도에 중요한 요인이라 강조해왔으나, 접근성 산출 과정에서 행정구역 단위 정보에 의존하거나 실제 보행 가능 범위를 반영하지 못하였다. 이 연구는 Mapbox 플랫폼과 OSM 보행네트워크를 활용한 서비스 에어리어 분석과 네트워크 분석을 적용함으로써, 보다 실질적인 이동범위를 고려하여 접근성 변수를 구축하였다.
넷째, 온라인 리뷰 데이터가 지닌 구조적 한계인 자기선택 편향, 허위 리뷰 등 문제를 보완하기 위해 분석 설계 단계에서 정제 절차를 적용하였다. 기존 연구들도 리뷰 데이터의 편향성과 신뢰성 문제를 인식하고 있었으나, 이를 실증적으로 보완하기 위한 절차를 수행하지 않았다. 이 연구에서는 리뷰 수가 일정 기준 이하인 단지를 분석에서 제외하고, 분석 단위를 개별 리뷰가 아닌 단지 단위의 집계 지표로 설정하였다. 이를 통해 자기선택 편향과 허위 리뷰 문제에 대하여 왜곡 가능성을 일부 완화하였다. 이러한 접근은 온라인 리뷰 데이터의 구조적 한계를 부분적으로 보완하고, 분석의신뢰도를 높일 수 있다.
Ⅲ. 연구방법론
1. 분석의 틀
이 연구의 목적을 달성하기 위한 분석의 틀은 <그림 2>와 같으며, 전체 과정은 총 4단계로 구성된다. 첫 번째 단계는 주거만족도 분석에 활용할 리뷰 데이터를 수집하는 과정으로, 부동산 플랫폼인 ‘직방’에서 웹 크롤링(Web-Crawling) 기법을 활용하여 주거 관련 리뷰 데이터를 수집하였다.
두 번째 단계는 수집한 데이터를 연구 목적에 부합하게 정제하고 가공하는 전처리 과정이다. 한국어 텍스트의 언어적·구조적 특성을 반영하기 위해 데이터 전처리 절차를 수행하였다. 구체적으로는 ‘띄어쓰기 및 맞춤법 교정’, ‘불용어 제거’, ‘형태소 분석’, ‘어근 복원’ 과정을 단계별로 적용하였다.
세 번째 단계는 이 연구의 주요 차별성을 입증하고 연구 목적을 실현하기 위한 핵심 단계이다. 앞서 전처리된 텍스트 데이터(리뷰 정보)를 대상으로 감성어 사전을 활용하여 감성 점수를 산정하는 것이다. 이후 문장 단위로 감성 점수를 합산하고, 이를 기반으로 아파트 거주민의 주거만족도를 ‘긍정’, ‘중립’, ‘부정’의 세 가지 범주로 분류하였다. 또한 리뷰 데이터의 기본적 편향 가능성을 고려하여, 단지 단위의 지표 구득과 단지의 리뷰 수가 적은 표본은 제외하였다.
마지막 단계는 실증분석 단계이다. 도출된 주거만족도 범주(긍정, 중립, 부정)를 종속변수로 설정하였고, 독립변수는 선행연구를 바탕으로 도출된 아파트 주거만족도에 영향을 미치는 요인을 ‘보육 및 교육’, ‘교통’, ‘여가’, ‘의료’, ‘일상생활편의시설’로 구분하였다. 이후에는 각 범주별 주거만족도에 미치는 영향요인을 도출하기 위해 다중회귀분석을 수행하였다. 이를 통해 설정한 독립변수들이 ‘긍정 주거만족도’, ‘중립 주거만족도’, ‘부정 주거만족도’에 미치는 영향을 정량적으로 분석하였다. 각 단계에 대한 구체적인 방법론은 다음 절에 상세히 기술하였다.
2. 주거만족도 자료 수집과 정제 및 가공
도시계획 및 주거정책 분야에서는 설문조사 기반의 주거만족도 자료를 활용하여 다영한 연구가 수행되었다. 그러나, 이 자료들은 설문기관 및 설문자가 설계한 내용을 바탕으로 조사가 이루어진다는 점과 개인정보보호법에 의거하여 세부적인 위치정보가 제공되지 않는다.
한편, 부동산 플랫폼 직방에서 제공하는 리뷰 자료는 단지명, 위치, 평점, 내용, 작성 날짜 등 다양한 정보를 포함하고 있기 때문에(<그림 3> 참조), 주거만족도를 분석하는 데 유용하다. 이를 위한 데이터 수집 방법으로는 웹 크롤링 기법을 활용하여 정보를 자동으로 추출하는 접근 방식을 채택하였다. 웹 크롤링은 웹 페이지로부터 대규모의 데이터를 효율적으로 수집하는 데에 있어 핵심적인 기술로, 이를 통해 방대한 양의 정보를 신속하게 처리할 수 있다(권준현·이수기, 2023). 데이터 수집 범위는 연구의 시간적 범위를 고려하여 2022년 1월 1일부터 2022년 12월 31일까지 직방 플랫폼에 게시된 내용을 포함한다.
수집한 리뷰 데이터를 바탕으로, 한국어 텍스트의 언어적·구조적 특성을 반영하기 위해 Python의 다양한 자연어 처리 라이브러리를 활용하였다. 구체적인 데이터 전처리 과정은 다음과 같다(<표 1> 참조).
첫째, 텍스트의 일관성을 확보하기 위해 띄어쓰기 교정을 수행하였다. 이를 위해 기존 텍스트에서 띄어쓰기를 일괄적으로 제거한 후, Python 내 PyKoSpacing 패키지를 활용하여 문맥 기반의 띄어쓰기 보정을 수행하였다.
둘째, 맞춤법 교정을 수행하였다. 일반적으로 문법적 오류가 존재하면 왜곡된 텍스트 분석 결과가 나타날 수 있다. 이를 방지하고자 Python 내 hanspell 라이브러리를 사용하였다. 이 기법은 네이버 맞춤법 검사기를 기반으로 맞춤법, 띄어쓰기, 문법 등의 오류를 자동으로 탐지하고 수정하는 과정이다. 이를 통해 데이터의 정확성을 확보하는 것이 가능하다.
셋째, 의미적 노이즈(Semantic Noise)를 줄이기 위해 불용어 제거를 수행하였다. 불용어는 문장 구성에는 필수적일 수 있으나, 감성 분석에는 기여도가 낮은 단어들이다. 이를 제거함으로써 보다 정확도 높은 감성 분석 결과를 기대할 수 있다.
넷째, 형태소 분석 기법을 적용하였다. 형태소 분석은 문장을 의미 단위로 분해하여 품사 구조를 파악하는 과정이다. 특히, 한국어와 같이 복합적인 어절 구조를 갖는 언어에서는 이 과정을 수행하는 것이 요구된다(Kim et al., 1994). Python 내 KoNLPy 패키지의 Okt 형태소 분석기를 활용하여 명사, 동사, 형용사 등의 품사를 구분하고 추출하였다.
마지막 단계는 어근 복원 과정으로, 동사나 형용사와 같은 용언을 기본형으로 변환하는 과정이다. 즉, 동일한 의미를 갖고 있는 단어가 다양한 형태로 표현되는 문제를 해결하여 분석의 일관성을 높일 수 있다(Park et al, 2021). 이 연구에서는 형태소 분석 결과를 기반으로, 모든 용언을 해당 기본형으로 변환하였다.
3. 주거만족도 리뷰데이터 감성점수 산정
주거만족도 자료 수집과 정제 및 가공 과정을 거친 후, 오피니언 마이닝 기법(Opinion Mining Techniques)을 적용하였다. 오피니언 마이닝 기법은 문장 내 단어의 감성적 가치를 정량적으로 평가하는 것이 가능하며(Barbaglia et al., 2024), 이를 위해서는 한국어 특성을 고려한 정확한 감성어 사전을 활용하는 것이 중요하다. 이 연구에서는 ‘KNU 한국어 감성어 사전’을 활용하였는데, 해당 사전은 한국어 기반의 보편적 감정 표현을 도출하여 각 단어에 대해 긍정, 중립, 부정의 감성 점수를 제공하는 것이 가능하다.
특히 KNU 사전은 필요한 경우 사전에 존재하지 않는 단어를 ‘어휘 차원’에서 추가할 수 있는 확장 기능을 제공한다(박상민 외, 2018). 이 연구에서 추가한 공간·장소 관련 단어들은 감성 점수를 연구자가 임의로 지정한 것이 아니라, 임베딩 기반 텍스트 분석 과정에서 사전의 입력 어휘를 확장하는목적으로만 사용되었다. 즉, 단어 목록은 보완하되, 감성 방향성은 KNU 사전의 기존 점수 체계에 따라 자동적으로 적용되며, 연구자의 주관이 개입되지 않는다.
아파트 거주민의 주거만족도는 공간적 환경요소의 영향을 크게 받는다는 점(장윤정·고승욱, 2021)을 고려하여, 리뷰 텍스트에 등장하는 장소 정보를 기반으로 물리적 요소를 도출하고 이를 통계청 분류체계(대분류-중분류-소분류)에 따라 교통시설, 교육시설, 유동시설, 체육·운동시설, 문화시설, 공원, 공공시설 등 7개 생활편의시설 유형으로 재분류하였다. 이후 각 분류에 해당하는 공간·시설 단어를 KNU 감성어 사전의 입력 어휘에 추가함으로써, 리뷰 텍스트 내 공간 관련 표현이 감성 분석 과정에서 누락되지 않도록 사전을 보완하였다(<그림 4> 참조).
이후에는 각 문장에 포함된 단어에 감성 점수를 부여하고, 이를 합산하는 방식으로 긍정적, 중립적, 부정적 주거만족도를 산출하였다. 구체적으로, 감성어 사전을 기반으로 각 단어의 감성적 방향성과 강도를 수치화하고, 문장 내 모든 단어의 감성 점수를 합산하여 문장 단위의 총 감성 점수를 산정하였다(<표 2> 참조). 점수 총합이 양수일 경우 해당 문장은 긍정적 감성(긍정적 주거만족도), 음수일 경우 부정적 감성(부정적 주거만족도)으로 정의하였다. 감성 점수가 0에 해당하는 경우는 중립적인 감성(중립적 주거만족도)으로 분류하였다.
이러한 방식은 단어 수준의 감성 정보를 활용하여 문장 전체의 감성 방향성을 도출하는 감성 분석 분야의 표준적 방법론이며(Liu, 2020), 리뷰 텍스트의 감성 반응을 정량적으로 구분하는 데 효과적이다.
4. 변수설정 및 실증분석모형
공동주택의 대표적 유형인 아파트는 동일한 공간에 위치하더라도 거주자 개인이 체감하는 주관적 특성에 따라 주거만족도의 수준이 다르게 나타날 수 있다. 이에 이 연구에서는 리뷰 데이터를 기반으로 도출한 유형별 주거만족도(긍정, 중립, 부정)에 영향을 미치는 요인을 분석하기 위해 다중회귀분석을 수행하였다.
종속변수는 ‘긍정적 주거만족도 빈도’, ‘중립적 주거만족도 빈도’, ‘부정적 주거만족도 빈도’이다. 독립변수는 선행연구검토를 통하여 확인한 아파트 주거만족도에 영향을 미치는 도시민의 생활과 관련된 시설이며, 이를 ‘보육 및 교육’, ‘교통’, ‘여가’, ‘생활시설’로 분류하였다. 생활시설은 국토교통부·행정안전부에서 제시한 생활SOC 분류체계(관계부처합동, 2019)를 참고하여 시설의 기능적 위계와 이용 범위에 따라 두 가지로 다시 구분하였다. 첫번째는 도보 생활권에서 일상적으로 이용되는 생활밀착형 편의시설(Neighborhood Daily Amenities)이며, 두 번째는 지역거점 기능시설(Regional Urban Function Centers)로 정의하였다(<표 3> 참조). 이 범주들은 도시민의 일상생활 접근성 관점에서 주거만족도에 영향을 미친다는 선행연구 결과를 고려한 것이다(권준현·이수기, 2023; 장윤정·고승욱, 2021).
또한, 이 연구의 주요 차별성으로 기술한 바와 같이 도시민의 실질적인 접근성(이동 범위)을 측정하는 것이 중요한 변수들에 대하여 서비스 에어리어 분석(Service Area Analysis)을 수행하였다. 서비스 에어리어 분석은 보행네트워크망을 기반으로 시간이나 거리 기준으로 도달 가능한 이동 범위를 도출할 수 있다. 이는 기존의 직선거리 기반 분석에 비해 보다 현실적인 분석으로 평가된다(Church and Marston, 2003). 이때, 도시민의 실제 보행속도를 반영하는 것이 중요한데, 보행속도에 따라 이동 범위가 상이하게 나타나기 때문이다. 따라서, 이 연구에서는 한음 외(2020)의 연구에서 65세 미만 1,629명을 대상으로 조사한 평균 보행속도 결과인 1.29m/s를 적용하였다. 서비스 에어리어 분석을 위해 보행네트워크 정보가 필요하다. 이를 위해 OSM 기반 보행네트워크 정보를 활용하였고, Mapbox 플랫폼과 Python 3.12을 사용하였다. 최종적으로 도출된 결과물은 보행속도, 이동시간, 네트워크망에 따라 10분 내 이동할 수 있는 공간 범위 형상(Spatial Extent)으로 나타난다.
한편, 아파트 주거만족도에 영향을 미치는 시설 중 공공시설은 도시계획 관련 법·제도에 따라 입지하는 반면, 민간시설은 사회·경제적 특성과 수요에 기반해 입지한다는 차이가 있다. 예를 들어, 초등학교는 2,000~3,000세대당 보행거리 1,000m 이내 배치가 권장되어 대체로 양호한 접근성을 보이는 반면, 생활편의시설은 공공 규제보다는 거주민 수요와 영리적 판단에 따라 입지하는 경향이 있다. 또한 생활권공원, 버스정류장, 공공자전거 대여소와 같은 변수들은 공공에서 제공하는 시설이며, 주거지역에서 일상적으로 이용되는 점을 고려하여 전반적으로 공급되지만 주거지역에 따라 규모(시설 수)는 상이하다. 이와 같은 특성을 반영하여 OSM 보행네트워크를 기반으로 서비스 에어리어 분석을 수행하여 10분 보행권을 구득하였고, 앞서 언급한 생활밀착형 편의시설과 생활권공원, 버스정류장, 공공자전거 대여소가 10분 보행권 내 얼마나 포함되어 있는지 산출하였다.
이외의 변수들은 네트워크 분석(Network Analysis) 기법을 활용하여 구축하였다. 네트워크 분석은 실제 보행망이나 도로망을 고려하여 접근성을 분석하는 기법이다. 유클리디안 거리(Euclidean Distance) 기반 분석과 달리, 공간 네트워크의 구조적 특성을 반영함으로써 보다 현실적인 이동거리를 분석할 수 있다(Church and Marston, 2003). 이를 위해 OSM 보행네트워크를 활용하였고, 일부 변수는 ‘서울시 도로 네트워크 공간정보’를 사용하였다. 이는 설정한 변수 중 보행으로 접근이 가능하지만, 현실적으로는 차량 이용이 필요한 경우가 존재하기 때문이다. 예컨대 고속도로 IC/JC 입구까지의 거리는 물리적으로 보행 접근이 가능하더라도, 실제로는 차량을 이용하기 때문이다. 반면 지하철역은 출발지로부터 보행으로 접근하는 것이 일반적이다.
다중회귀분석은 R 4.40을 활용하여 수행하였으며, 사용된 다중회귀분석 모형은 식 (1)과 같다.
| (1) |
여기서 Yj(k)는 j번째 아파트 단지의 감성 유형 k에 해당하는 주거만족도 빈도이며, 감성유형은 긍정, 부정, 중립으로 구분된다. 독립변수로는 다섯 가지 범주의 물리적특성 요인을 포함한다. β0는 상수항, β1~β3는 각 설명변수에 대한 회귀계수이며, εj는 오차항을 의미한다.
Ⅳ. 실증분석
1. 감성점수에 따른 리뷰데이터 주거만족도 분류
웹 크롤링 기법을 활용하여 2022년 1월 1일부터 2022년 12월 31일까지 부동산 플랫폼 직방에서 총 1,474개의 리뷰 데이터를 수집하였다. 웹 크롤링 과정에서는 주관적 평가가 포함되지 않은 데이터(평점만 존재하고 텍스트 리뷰가 없는 경우)는 자동으로 제외되도록 설정하였다. 수집된 자료를 대상으로 ‘띄어쓰기 교정’, ‘맞춤법 교정’, ‘불용어 제거’, ‘형태소 분석’ 등의 절차를 거쳐 정제·가공하였으며, 장소 관련 어휘가 포함된 KNU 감성어 사전을 활용해 감성 점수를 산정하였다.
이후 리뷰데이터가 지닌 구조적 한계인 자가선택 편향과 허위·비정상 리뷰 가능성을 완화하기 위해 분석 단위를 개별리뷰가 아닌 단지 단위 집계 지표로 구성하였다. 또한, 단일 리뷰가 과도한 영향을 미치거나, 비정상적인 리뷰가 단지 점수를 왜곡하는 문제를 줄이기 위해, 리뷰 수가 적은 단지는 분석에서 제외하였다. 구체적으로, 리뷰 수가 5개 미만인 단지는 단일 리뷰가 전체 감성 점수에 미치는 비중이 크게 나타나, 실제 거주민의 전반적 인식을 반영하기 어렵다고 판단하여 표본에서 제외하였다. 이는 온라인 리뷰 데이터의 자기선택 편향과 허위 리뷰 개입 가능성을 최소화하기 위한 과정이다.
분석 결과, 리뷰 데이터가 존재하는 서울시 아파트 단지는 총 684개로 나타났다. 이 중 긍정적 주거만족도가 확인된 단지는 681개, 중립적 주거만족도 단지는 360개, 부정적 주거만족도 단지는 403개로 집계되었다. 전반적으로 리뷰데이터 기반 주거만족도는 긍정적 경향을 보였으며, 동일한 아파트 단지라 하더라도 거주자가 체감하는 주거만족도에는 차이가 존재함을 확인하였다.
이러한 차이를 공간적 관점에서 파악하고자 공간 분포 분석을 수행하였다. 분석 결과는 <그림 5~7>과 같으며, 만족도 수준별 분포의 빈도 차이는 존재하나 서울시 전역에서는 유사한 공간적 패턴을 보였다. 그러나 기존 연구에서도 리뷰데이터, 민원자료 등 개인의 주관적 관점에서 수집된 자료는 데이터의 수에 따라 공간적 분포가 나타난다는 점이 지적되어 왔다(배준열 외, 2024).
이 연구 또한 이와 유사한 결과가 나타났는데, 아파트 단지별 리뷰데이터를 자치구 단위로 집계한 결과, 리뷰데이터 수가 많은 단지가 포함된 자치구일수록 긍정적, 중립적, 부정적 주거만족도가 모두 높게 나타났다. 이에 단순히 자치구별 만족도 빈도를 비교하기보다는, 자치구 단위로 각 만족도 범주의 비율을 산출해 분석하는 것이 중요하다고 판단하였으며, 이를 <표 4>에 제시하였다.
긍정적 주거만족도 비율이 높은 광진구, 강동구, 서대문구는 「서울서베이 도시정책지표조사」에서 주거환경, 생활편의시설, 교통 접근성 등에서 상대적으로 높은 만족도를 보이는 지역으로 확인되었다(서울특별시, 2022). 특히 광진구와 강동구는 한강변의 쾌적성, 교통 인프라 개선, 생활편의시설 확충 등의 영향으로 주거 선호도가 상승하고 있다. 또한 중구와 강남구는 고용중심지와 밀접하여 직주근접이 우수한 지역임에 따라 이와 같은 결과가 나타난 것으로 확인된다.
반면, 부정적 주거만족도 비율이 높은 금천구, 은평구, 성동구, 용산구, 마포구는 일부 지역에서 노후 주거지, 교통 혼잡, 급격한 개발에 따른 주택가격 상승 등으로 인해 주거만족도에 부정적 영향을 미칠 가능성이 있다. 특히 마포구의 경우, 대규모 개발사업으로 인한 주택가격 급등과 젠트리피케이션 현상이 주민들의 주거 안정성과 만족도에 영향을 미치는 것으로 확인되었다(이민주, 2020). 한편, 중립적 주거만족도 비율이 높은 강북구, 종로구, 구로구, 양천구, 성북구는 서울서베이 조사에서도 주거만족도의 편차가 작고 평균에 근접한 것으로 나타났다(서울특별시, 2022).
이러한 결과는 리뷰데이터를 기반으로 구축한 주거만족도가 단순히 거주자의 주관적 평가에 의존하는 것이 아니라, 물리적 환경, 사회경제적 요인, 도시정책 등 다양한 요소가 복합적으로 작용한 결과임을 보여준다(Marans, 2012; 장윤정·고승욱, 2021). 특히, 장윤정·고승욱(2021)은 서울시 거주민들의 주거만족도가 물리적 환경, 공공서비스 등 다양한 요인에 따라 결정되며, 이는 공간적 분포 차이에 영향을 받는다고 시사하였다.
2. 기술통계분석
다중회귀분석을 수행하기에 앞서 선정된 변수들을 바탕으로 기술통계분석을 실시하였다(<표 5> 참조). 종속변수는 공간정보가 결합된 리뷰데이터의 범주별 빈도이며, 독립변수는 아파트 단지의 입지 기반 공간정보를 활용하여 구축하였다. 기술통계분석을 통해 각 변수의 통계적 분포와 지역 간 차이를 종합적으로 확인하였다.
종속변수인 아파트 단지별 주거만족도의 표본 수는 긍정적 681개, 중립적 360개, 부정적 403개로 나타났으며, 각 평균은 4.62, 0.83, 0.95로 전반적으로 서울시 아파트 단지 거주민의 주거만족도가 긍정적인 경향인 것으로 나타났다. 그러나 표준편차는 긍정적 2.48, 중립적 1.02, 부정적 1.09로 나타나, 중립 및 부정적 만족도에서 상대적으로 높은 분산이 확인되었다. 이는 아파트 단지별로 거주민이 체감하는 만족도 수준이 고르게 나타나지 않는다는 점을 의미한다.
독립변수의 경우에도 전반적으로 평균 대비 표준편차가 높아 지역 간 접근성 및 시설 분포의 편차가 큰 것으로 확인되었다. 교통 관련 변수 중, 지하철역까지의 거리는 평균 739.51m이나 표준편차가 532.89m로 나타나 단지 간 접근성 격차가 존재한다. 고속도로 진출입(IC/JC) 거리도 평균 2,611.60m, 표준편차 1,333.49m로 큰 차이를 보였다.
보육 및 교육시설 중 어린이집(평균 2.77개)과 유치원(평균 0.37개)은 단지별 접근성이 제한적인 수준임을 시사하며, 최솟값이 0인 단지가 존재한다는 점은 일부 지역에서 보행생활권 내 보육시설이 확보되지 않았음을 의미한다. 초등학교는 평균 585.39m로 비교적 접근성이 양호한 것으로 보이지만. 최대거리 999.09m인 단지도 존재하여 지역 간 격차가 있다는 것을 확인하였다
생활밀착형 편의시설 중 약국, 동네병원, 편의점의 최솟값은 모두 0으로 나타나, 684개 아파트 단지 중에는 해당 시설이 보행생활권 10분 내 존재하지 않는 경우도 존재한다는 것을 확인할 수 있었다. 또한, 생활밀착형 편의시설의 다양성 지수 최솟값이 0.23으로 확인된 점도 일부 아파트 단지에서 일상생활에 필요한 다양한 시설이 충분하지 않다는 점을 뒷받침한다.
지역거점 기능시설의 경우, 경찰서와 소방서는 각각 평균 608.67m, 840.01m로 비교적 양호한 접근성으로 확인되었다. 반면 3차 종합병원과 고용중심지는 최댓값이 각각 11948.90m, 17028.70m로 나타나 단지별 접근성 차이가 매우 큰 것으로 확인되었다. 이는 공공서비스가 아닌 민간 또는 도시공간구조에 따라 입지가 결정되는 특성 때문이며, 개인이 선택한 주거입지에 따라 의료 및 고용 접근성이 크게 달라질 수 있음을 시사한다.
종합적으로, 다수의 변수에서 변동 폭이 크게 나타나 특정 지역에 시설이 집중되는 양상을 확인할 수 있었다. 이러한 결과는 이후 수행할 다중회귀분석에서 변수 간 영향 관계를 해석하는 데 중요한 기초 자료로 활용 가능하다.
3. 다중회귀분석 결과
주거만족도 리뷰데이터를 수집한 후 일련의 정제·가공 과정을 수행하였고, KNU 감성어 사전을 활용해 각 리뷰의 감성점수를 산정하여 ‘긍정적 주거만족도’, ‘중립적 주거만족도’, ‘부정적 주거만족도’로 분류하였다. 이후, 선행연구를 통해 도출한 아파트 주거만족도 영향요인을 독립변수로 설정하여 유형별 다중회귀분석을 수행하였다. 분석 결과는 <표 6>에 제시하였다.
모형 설명력은 긍정적 주거만족도 0.357, 중립적 주거만족도 0.277, 부정적 주거만족도 0.312로 나타났다. 각 모형의 다중공선성(VIF)는 모두 10 미만으로 나타나, 변수 간 유의한 상관관계로 인한 문제는 없는 것으로 확인하였다. 이를 통해 세 모형 모두 일정 수준의 설명력을 확보하였으며, 긍정적 주거만족도 모형이 가장 높은 설명력을 보였다. 이는 전체 리뷰에서 긍정 비중이 크다는 점과 주거만족도가 전반적으로 긍정에 편향된다는 기존 논의(장윤정·고승욱, 2021)에 부합한다. 또한 세 모형의 종속변수는 동일한 리뷰 데이터를 기반으로 분류된 만큼 서로 독립적이라고 할 수 없다. 이는 긍정·중립·부정 간 상대적 비중 변화가 상호적으로 영향을 줄 수 있으며, 기존 텍스트 기반 감성분석 연구에서도 지적된 바 있다(Egami et al., 2022). 이러한 점을 고려하여, 이 연구에서는 긍정적 주거만족도를 중심으로 주요 결과를 해석하되, 필요한 부분에서는 중립과 부정 모형의 결과를 함께 비교하는 방식으로 해석을 진행하고자 한다.
먼저, 긍정적 주거만족도 빈도에 영향을 미치는 변수로 교육·보육 시설 중 초등학교까지의 최단거리는 90% 신뢰수준에서 음(-)의 영향요인으로 나타났다. 이는 아파트 단지에서 초등학교까지의 거리가 짧을수록 긍정적 주거만족도가 형성된다는 의미로, 초등학교 접근성이 주거환경 만족도와 관련된다는 기존 연구결과(이은경 외, 2024)와도 일치한다. 또한 아파트 가격이 높을수록 주거만족도가 상승한다는 연구(김단야, 2021)결과와 단지 내 초등학교 입지나 우수한 보행 접근성이 주택가격을 높이는 이른바 ‘초품아’ 현상을 고려한다면, 초등학교 접근성이 긍정적 만족도 빈도를 높이는 요인임을 시사한다.
한편, 부정적 주거만족도 빈도 모형에서는 초등학교까지의 거리가 90% 신뢰수준에서 양(+)의 영향요인으로 나타났으며, 10분 보행권 내 유치원 수는 95% 신뢰수준에서 음(-)의 영향요인으로 확인되었다. 즉, 초등학교까지의 거리가 멀고, 보행권 내 유치원 이 적을수록 부정적 평가가 형성되는 것으로, 보육·교육 환경이 주거만족도에 직접적인 영향을 미친다는 점을 뒷받침한다. 이는 보육·교육환경의 양호도가 주거만족도 를 결정한다는 기존 연구(성진욱 외, 2024)와 일관된다. 또한, 신혼부부·영유아 가구가 양호한 보육환경을 선호한다는 사회적 경향, 그리고 주거만족도 분석에서 유치원 관련 키워드가 긍정 요인으로 나타났다는 권준현·이수기(2023)의 연구결과와도 동일한 맥락이다.
교통시설 중 지하철역까지의 최단거리 변수는 95% 신뢰수준에서 유의하며, 음(-)의 영향관계를 갖고 있는 것으로 확인되었다. 이는 아파트 단지로부터 대중교통 수단을 대표하는 지하철 접근성이 높을수록 주거만족도는 긍정적으로 나타난다는 것을 의미한다. 김선재·이수기(2020) 연구에서 양호한 주거만족도를 형성하는 요인으로 대중교통 접근성의 영향력 이 높다는 결과와 일치된다. 이는 부정적 주거만족도 빈도 모형에서 10분 보행권 내 버스정류장 수가 90% 신뢰수준에서 음(-)의 영향을 미치는 것으로도 설명이 가능하다. 지하철과 함께 대중교통을 대표하는 버스정류장의 수가 적다는 것은 아파트단지 인근에서 버스를 이용할 기회가 낮다는 것을 의미한다. 따라서, 대중교통 이용 접근성이 저하되어 부정적 주거만족도 빈도를 형성하는 것과 관련성이 있는 것으로 확인된다.
일반적으로 도시민의 일상생활은 통근이나 통학을 시작으로 이루어지며, 서울서베이 도시정책지표조사에 따르면, 서울에 거주하는 도시민이 통근·통학 시 주로 이용하는 교통수단은 지하철과 버스 등 대중교통이 가장 큰 비중을 차지하는 것으로 나타났다(서울특별시, 2024). 따라서 이러한 점들이 종합적으로 고려될 때, 긍정적 주거만족도 빈도와 부정적 주거만족도 빈도와 일정한 연관성이 있음을 시사한다. 또한, 최근 서울시 공공 자전거(따릉이) 보급 확대와 함께 자전거를 활용한 도시활동이 증가하고 있다(서울특별시, 2024). 이러한 점을 고려하였을 때, 공공자전거 대여소 수가 90% 신뢰수준에서 음(-)의 영향 을 보이며 부정적 주거만족도 빈도와 유의한 관계로 나타난 결과를 뒷받침해줄 수 있다. 이는 자전거 이용 편의성이 주거만족도 향상에 중요한 요소로 작용한다는 강대식 외(2024)의 연구 결과와도 일치한다.
여가시설 중 수변공간까지의 최단거리와 공연시설까지의 최단거리는 각각 95%와 90% 신뢰수준에서 음(-), 양(+)의 영향관계로 유의미한 변수로 확인되었다. 수변공간은 공원과 여가시설의 기능을 함께 수행하면서 경관적 요소까지 복합적으로 갖추고 있어, 해당 공간에 대한 접근성은 도시민의 삶의 질에 직접적인 영향을 미친다(홍경구·안건혁, 2003). 특히 서울시 내 한강과 다양한 하천(양재천, 중랑천 등)까지의 접근성에 따라 여가공간 활용이 가능해지고, 이로 인해 주거환경에 대한 긍정적 인식이 나타난다는 연구결과(Kwon et al., 2019)를 고려했을 때, 이 연구에서 도출된 결과는 타당한 것으로 판단된다.
여가시설과 동일한 맥락에서 아파트 단지에서 공연시설까지의 짧아질수록 긍정적 주거만족도가 형성되는 것으로 나타났다. 이는 아파트 단지가 단순한 주거공간을 넘어, 도시민의 다양한 일상활동이 출발하는 기점이라는 점과도 귀결된다(고승욱 외, 2023b). 실제로 도시 환경에서 여가 기반시설의 접근성은 도시민의 주관적 웰빙과 삶의 만족에 영향을 미치는 요인으로 확인된 바 있으며(Huang et al., 2023), 이러한 맥락을 고려하면 공연시설과의 거리가 짧을수록 여가활동 접근성이 높아지고, 결과적으로 긍정적 주거만족도 형성에 기여했을 가능성이 존재한다.
종합적으로, 여가시설 접근성은 긍정적 주거만족도 빈도 형성에 영향을 미치는 요인임을 확인하였다. 이는 부정적 주거만족도 빈도 모형에서 생활권공원 접근성이 90% 신뢰수준에서 양(+)의 영향요인으로 나타난 점과도 해석의 일관성을 갖는다. 아파트 단지로부터 생활권공원까지의 거리가 증가할수록 부정적 주거만족도 빈도가 증가하는 것으로 나타났는데, 이는 선행연구에서 생활권공원과 같이 일상적으로 이용 가능한 시설이 가까울수록 주거만족도가 향상된다는 결과(김성연·권성문, 2021; Whang et al., 2023)와 상반되는 측면으로도 해석할 수 있다.
생활시설 중 생활밀착형 편의시설 변수로 설정한 10분 보행권 내 약국, 동네병원, 편의점의 수는 각각 신뢰수준 95%, 90%, 99%에서 유의하게 나타났으며 모두 양(+)의 영향요인을 갖는 것으로 확인되었다. 해당 시설들은 일상생활에서 도시민의 편의성과 관련된 시설로 정의되며, 기존 여러 연구에서도 생활편의시설의 접근성이 양호하거나 규모가 클수록 주거만족도가 향상되고 양호한 정주환경을 갖추고 있는 것으로 확인되었다(한봉수·서원석, 2018; 손경민·진장익, 2020; 홍성효·임준홍, 2023). 이와 동일한 맥락에서 유의하게 나타난 생활밀착형 편의시설 변수들이 보행권에 많이 입지할수록 긍정적 주거만족도 빈도가 형성되는 것으로 판단된다. 또한 부정적 주거만족도 빈도 모형에서도 나타난 상반된 결과로도 주장을 뒷받침 할 수 있다. 약국, 동네병원, 편의점 변수는 모두 신뢰수준 90%에서 음(-)의 영향요인으로 나타났으며, 이는 생활편의시설의 수가 적을수록 부정적 주거만족도 빈도 형성에 영향을 미친다고 해석할 수 있다.
또한, 부정적 주거만족도 빈도 모형에서 생활밀착형 편의시설 다양성지수는 신뢰수준 90%에서 음(-)의 영향요인을 갖고 있는 것을 통해 생활밀착형 편의시설과 주거만족도 간의 관계를 규명하는 것이 가능하다. 이 결과는 단순히 개별 시설의 접근성뿐 아니라 주거지 주변에 다양한 생활밀착형 편의시설이 분포하고 있는지 여부도 주거만족도 형성에 기여한다는 점을 시사한다. 실제로 주거지 내 생활편의시설의 구성 (다양성)은 주거환경의 중요한 만족요인으로 도출되었다(최정민·박동찬, 2020).
한편, 중립적 주거만족도 빈도 형성 요인을 도출한 모형에서는 생활밀착형 편의시설이 90% 신뢰수준에서 유의하며 양(+)의 영향관계를 보였다. 서울시의 공간구조 특성상 다양한 생활편의시설이 밀집한 지역은 대체로 업무·상업시설과 인접한 주거지역으로 분류되는 경향이 있다(고승욱 외, 2023b). 다만 이러한 지역에서의 주거만족도는 거주하고 있는 개인 및 가구의 인구·사회·경제적 특성에 따라 상이하게 나타난다 (성진욱·남진, 2019). 이는 주거만족도가 개인이 체감하는 주관적 인식이라는 점에 기인하는데(장윤정·고승욱, 2021), 자녀가 있거나 향후 출산·양육을 계획하는 가구는 보육 및 교육환경을 중시하는 반면 자녀가 없는 가구, 1인 가구, 고령가구는 교통접근성이나 생활시설 접근성이 우수할수록 해당 지역에 대한 만족도와 계속거주 의향이 높아지는 경향이 있다(장윤정·이창효, 2016; 김단야, 2024). 이러한 맥락을 고려할 때, 중립적 주거만족도 모형에서 생활밀착형 편의시설 다양성지수가 양(+)의 영향요인으로 나타난 것은 타당한 결과로 판단된다. 이는 보육 및 교육시설, 교통시설 변수가 각각 유의하게 도출된 결과와도 일괄되게 설명할 수 있다.
먼저, 보육 및 교육시설 중 10분 보행권 내 어린이집 수와 유치원 수는 각각 90%, 95% 신뢰수준에서 유의하며 모두 양(+)의 영향요인으로 나타났다. 교통시설의 경우, 지하철역까지의 최단거리는 90% 신뢰수준에서 음(-)의 영향요인, 10분 보행권 내 버스정류장 수와 공공자전거 대여소 수는 모두 양(+)의 영향요인으로 나타났다. 이러한 결과는 선행연구의 맥락에서 해석이 가능한데, 권준현·이수기(2023)는 자녀를 보유하거나 출산을 계획하는 가구(신혼부부 가구)는 어린이집· 유치원 접근성이 주거만족도 결정에 주요 요인으로 작용된다고 주장하였다. 반면 자녀가 없는 가구, 1인 가구, 고령가구 등은 보육·교육환경이 주거만족도에 큰 영향을 미치지 않지만, 통근·여가·쇼핑 등 일상활동의 편의성을 좌우하는 대중교 통 접근성 및 근린시설 접근성을 중요하게 고려한다(성진욱 외, 2024).
특히 서울시 주거지의 공간구조 특성을 고려하면 이러한 해석을 뒷받침해줄 수 있다. 일반적으로 역세권이거나 도심·업무시설 인근에 위치한 아파트 단지는 대중교통 접근성과 생활밀착형 편의시설의 다양성은 우수하지만, 상대적으로 보 육·교육환경이 열악한 경우가 많다(Lee et al, 2024). 즉, 교 통 접근성과 생활시설 접근성에서 높은 만족을 느끼는 가구 도 존재하지만, 동시에 보육·교육환경을 중시하는 가구는 이 점을 부정적 요인으로 인식할 수 있다. 이러한 상반된 평가 가 동시에 존재할 수 있기 때문에, 중립적 주거만족도의 빈도에서는 두 영향이 서로 상쇄되며 결과적으로 ‘중립’에 가까운 반응이 형성될 가능성이 있다. 다시 말해, 감성분석 수행 시 대중교통 접근성에서의 긍정적 영향과 보육·교육환경에서의 상대적 부정성이 함께 작용하면서 전체적으로 0에 수렴하는 중립적 만족도가 도출된 것으로 판단된다.
마지막으로 긍정적 주거만족도 빈도 모형에서는 지역거점 기능시설 중 경찰서와의 거리, 그리고 가장 가까운 고용중심지까지의 거리가 각각 90%, 95% 신뢰수준에서 유의하며 모두 음(-)의 영향관계를 갖고 있는 것으로 도출되었다. 이는 경찰서·파출소 등 공공안전 관련 관공서가 인접한 지역일수록 공공서비스 이용 여건이 우수하다는 신은진·남진(2012)의 연구결과와도 일치한다. 또한 서울시 고용중심지와 가까운 아파트 단지는 통근 접근성이 뛰어날 뿐만 아니라, 고용중심지가 업무 기능과 함께 상업·문화·여가 기능을 복합적으로 보유하고 있다(고승욱 외, 2023a). 고용중심지와 가까이 입지한 아파트 단지일수록 복합적 도시활동 접근성이 우수하여, 긍정적 주거만족도 형성에 기여한 것으로 해석된다. 나아가 지역거점 기능시설은 공간적으로 한정된 자원이라는 점(Lee et al., 2024)에서, 해당 시설에 더 쉽게 도달할 수 있는 입지는 상대적으로 높은 편익을 제공한다. 따라서 이러한 시설 접근성의 우수성은 거주자의 생활 안정성·이용 편의성·활동 다양성을 높이며, 결과적으로 긍정적 주거만족도에 양(+)의 영향을 미치는 요인으로 작용한 것으로 판단된다.
한편, 중립적 주거만족도 빈도 모형에서도 긍정적 주거만족도 모형과 동일하게 가장 가까운 고용중심지까지의 거리가 90% 신뢰수준에서 유의하며, 음(-)의 영향요인으로 나타났다. 이는 앞서 언급한 도시공간구조적 특성과 주거만족도가 개인의 주관적 인식이라는 점을 함께 고려할 때 복합적으로 해석이 가능하다. 일반적으로 고용중심지까지의 거리가 가까울수록 도시활동을 위한 이동 접근성과 생활편의시설 접근성이 양호하다. 그러나 고용중심지와 인접한 주거지역은 고용밀도가 높아 쾌적성이 저하되기 쉬우며, 이는 주거만족도 형성에서 쾌적성이 중요한 요인임을 밝힌 강대식 외(2024)의 연구결과와도 귀결된다.
이는 개인 민원자료를 활용해 주관적 주거만족도를 분석한 배준열 외(2024)의 연구와도 유사한데, 동일한 주거환경에 거주하더라도 일부 거주자는 만족을 느끼지 않거나 중립적으로 평가하는 경향이 확인되었다. 또한 장윤정·고승욱(2021)은 주거만족도를 단일 기준으로 정량화하는 것은 어렵다고 지적한다. 이러한 논의는 이 연구의 계수값을 통해서도 확인이 가능하다. 고용중심지까지의 거리에 대한 회귀계수는 긍정적 주거만족도 모형에서 -2.428로 나타났으며, 이는 중립적 주거만족도 모형의 -0.110보다 높게 나타났다. 동일한 변수임에도 긍정적 만족도 빈도 형성에는 더 큰 영향을 미치고, 중립적 만족도에서는 상대적으로 작다는 점을 확인할 수 있다.
종합적으로, 중립적 주거만족도 모형에서 유의하게 나타난 변수들은 개인에 따라 동일한 환경을 평가하는 기준이 다르 기 때문이다. 즉, 하나의 공간적 조건이 서로 다른 주거만족 도를 결정하며, 이러한 상반된 평가가 중립적 만족도 빈도를 형성하는 것으로 판단된다.
Ⅳ. 결론 및 시사점
주거만족도는 도시민이 정주환경을 어떻게 체감하는지를 평가할 수 있는 유용한 지표이며, 이를 기반으로 한 도시계 획 및 주거정책은 보다 효과적인 정책 수립을 가능하게 한 다. 이러한 중요성에도 불구하고, 주거만족도 자료의 부족과 수집 방식의 한계로 인해 실증적 논의는 충분히 축적되지 못 한 실정이다. 이 연구에서는 이러한 한계를 보완하기 위해 부동산 플랫폼 ‘직방’의 리뷰 자료를 활용하였다. 이 중 서울시 아파트 단지에서 작성된 리뷰를 수집하여 정제·가공하고, 감성분석을 통해 주거만족도 데이터를 구축하였다. 이후 선행연구에서 도출한 주거만족도 형성 요인이 리뷰 기반 주거만족도 빈도에 어떠한 영향을 미치는지 실증분석하였다. 분석결과를 기반으로 한 연구결과에 대한 요약은 다음과 같다.
첫째, 주거만족도 평가를 위해 감성분석을 적용함으로써 기존 연구의 한계를 보완하였고, 이를 활용하여 도시계획·주 거정책 수립을 위한 근거자료를 구축할 수 있음을 확인하였 다. 한국어 임베딩 기반 감성분석을 활용하여 긍정·중립·부정 주거만족도를 도출하였으며, 부동산플랫폼 리뷰에서 빈번하게 나타나는 공간적 표현을 문장 단위에서 자연스럽게 해석하도록 함으로써 감성점수 산정의 정확성을 높였다. 이는 특 정 단어에 가중치를 부여하는 방식이 아닌, 실제 주거환경을 서술하는 문맥 정보를 반영함으로써 기존 분석 방식에서 나 타났던 해석상의 한계를 개선한 결과라 할 수 있다. 또한 주 거만족도는 개인의 주관적 관점과 리뷰 자료의 특성에 따라 중립적 표현이 나타날 수 있다는 점을 고려하여, 주거만족도 를 긍정·중립·부정 범주로 세분화하였다. 이러한 분석체계는 국토교통부와 서울시가 활용하는 주거환경 만족도 지표를 보완함으로써, 단지별 주거환경의 문제요인과 개선 필요성을 보다 미시적으로 파악하는 데 활용될 수 있음을 시사한다.
구체적으로, 국토교통부에서 수행하는 주거실태조사와 서울시에서 실시하는 주거만족도 조사는 현재의 주거환경 수준을 평가하고 그 결과를 바탕으로 주거정책을 수립하는데 활용되고 있다. 그러나 객관식 중심의 조사 문항만으로는 개인의 주관적 관점이 주거만족도에 미치는 영향을 반영하기 어려운 실정이다. 향후 주거실태조사 및 주거만족도 조사에서 주관적 의견을 기술할 수 있는 문항을 포함하고, 감성분석을 통해 해당 의견을 반영할 경우, 도시계획·주거정책 수립 과정에서 활용 가능성과 관련성을 갖는 것으로 해석될 수 있다.
둘째, 중립적 주거만족도에 영향을 미치는 요인을 고려할 때, 실질적인 수요자 맞춤형 주택공급 정책의 중요성이 확인된다. 실증분석 결과, 중립적 주거만족도 빈도 형성에는 어린이집 수(-), 유치원 수(-), 지하철역까지의 최단거리(-), 버스정류장 수(+), 공공자전거 대여소 수(+), 생활밀착형 편의시설 다양성지수(+), 가장 가까운 고용중심지까지의 거리(-)가 유의하게 도출되었다. 이러한 결과는 동일한 아파트 단지에 거주하더라도 개인 및 가구의 인구·사회·경제적 특성에 따라 필요로 하는 생활환경이 각기 다르기 때문에 나타난 것으로 해석할 수 있다.
현재 서울시는 주거취약계층으로 정의되는 청년층(대학생, 1인 가구, 신혼부부 등)의 주거안정을 지원하기 위해 ‘청년안심주택’ 정책을 시행 중이다. 그러나 동일한 청년계층 내에서도 선호하는 주거환경은 상이하게 나타나고 있으며, 개인이 체감하는 주거만족도 역시 일괄적으로 판단하기 어렵다. 따라서 수요자의 주관적 요구와 생활특성을 반영한 주거지원 정책이 필요하며, 리뷰 기반 주거만족도와 같은 정성적 자료를 활용하면 정책수요자의 실질적인 수요를 파악할 수 있다. 이와 같은 관점은 청년안심주택뿐 아니라 향후 고령자 안심주택, 공공임대주택 등 다양한 주거지원정책 분야에 대한 논의로 확장될 수 있으며, 주거정책을 보다 세분화하여 검토하는 데 참고가 될 수 있음을 시사한다.
셋째, 주거만족도 향상을 위해서는 도시계획 차원에서 생활시설을 공급할 때 주거지역의 특성을 종합적으로 고려하는 접근이 필요하다. 도시계획차원에서 현실적으로 직접적인 공급이 어려운 자연환경 요소와 지역거점 기능시설을 제외하고 실증분석 결과를 살펴보면, 긍정적 주거만족도 빈도 형성 모형에서는 초등학교까지의 최단거리(-), 지하철역까지의 최단거리(-), 약국의 수(+), 동네병원 수(+), 편의점 수(+)가 유의하게 나타났다. 반면, 부정적 주거만족도 빈도 형성 모형에서는 어린이집의 수(+), 초등학교까지의 최단거리(+), 버스정류장 수(-), 공공자전거 대여소 수(-), 약국의 수(-), 동네병원 수(-), 편의점 수(-), 생활밀착형 편의시설 다양성지수(-)가 유의한 변수로 도출되었다. 이러한 결과를 통해 주거만족도 형성에 어떤 물리적 생활시설이 영향을 미치는지 구체적으로 파악할 수 있으며, 일부 결과는 기존 연구와도 부합해 타당성을 뒷받침한다.
한편, 서울시는 수요자 맞춤형 주거정책을 추진하고 있으며, 이를 지원하기 위해 재정비 지역, 역세권, 생활편의시설이 양호한 입지 등을 중심으로 주거지를 발굴하고 있다. 그러나 서울시 내 토지는 한정적이고, 양호한 입지를 갖고 있는 지역일수록 토지가격이 높아 신규 주거지 확보에는 한계가 존재한다. 이와 동시에 수도권 지역에서 3기 신도시 조성, 저층 노후주거지 정비 등 국가·지자체 차원의 주거안정 정책이 시행되고 있으나, 생활시설의 격차로 인해 거주민의 주거만족도는 지역별로 상이하게 나타나고 있다.
이러한 점을 고려하면, 단순히 주거입지를 발굴하여 주택을 공급하는 방식만으로는 주거만족도 형성을 충분히 설명하는 데에는 일정한 한계가 존재하는 것으로 해석된다. 이에 따라 향후 도시계획 차원에서 새롭게 형성되는 주거지역에 대해 보육 및 교육시설, 근린생활시설, 대중교통 접근성 등 생활기반시설의 확보수준을 함께 검토할 필요성이 제기된다. 이러한 접근은 토지의 한정성으로 인해 발생하는 제약을 완화하는 데 참고가 될 수 있으며, 주거정책과 도시계획 간 연계의 중요성을 재확인하는 데 의미를 갖는다.
이 연구는 기존의 주관적 주거만족도 연구가 갖는 한계점을 보완하기 위해 한국어 임베딩 기반 리뷰 분석을 통해 주관적 주거만족도를 긍정·중립·부정 범주로 정량화하였고, 이를 바탕으로 주거만족도에 영향을 미치는 요인을 실증적으로 분석하였다. 그러나, 다음과 같은 한계점이 존재한다.
첫째, 이 연구는 부동산 플랫폼 직방의 리뷰 데이터를 활용하였다는 점에서 대표성의 한계를 지닌다. 온라인 리뷰의 특성상 리뷰 작성자는 상대적으로 연령대가 낮고 디지털 활용도가 높은 집단에 편중될 가능성이 있으며, 이러한 특성은 분석 결과의 일반화에 제약으로 작용할 수 있다. 또한 활용한 리뷰 데이터 모두 서울시 아파트 거주자로 한정되어 타 주거유형까지 일반화하지 못하였다. 국내의 다양한 부동산 플랫폼 중 체계적인 리뷰 데이터 구축이 가능한 곳은 직방이 유일하며, 단독주택·다가구·다세대주택과 같은 저층 주거유형의 경우 일부 리뷰가 존재하나 그 수가 매우 적어 실증분석에 포함하기 어려웠다. 또한 공공임대주택의 경우 SH·LH 등 공공기관이 거주지 평가 자료를 보유하고 있음에도 불구하고, 개인정보 보호 등의 사유로 연구 활용이 불가능하다는 점을 한계로 명시한다.
둘째, 한국어 임베딩 기반 감성분석은 대규모 온라인 리뷰 자료를 활용하여 주거만족도를 정량화할 수 있다는 장점이 있으나, 분석 대상이 되는 텍스트의 특성상 풍자적 표현, 복합적인 감정, 또는 중립적 서술이 긍정이나 부정으로 오인될 가능성이 구조적으로 존재한다. 특히, 이 연구에서는 문장 단위의 임베딩을 활용하여 개별 단어 중심의 분석에서 발생할 수 있는 해석상의 한계를 완화하고자 하였으나, 감성분석 결과 자체에 대한 외부 타당도 검증을 수행하지 못하였음을 명시한다.
셋째, 감성분석 수행 과정에서 ‘초품아’, ‘슬세권’과 같은 신조어나 줄임말을 충분히 반영하지 못하였다는 한계가 존재한다. 이를 보완하기 위해서는 KNU 한국어 사전 등을 활용하여 감성분석에 필요한 워드 스코어를 추가적으로 구성할 필요가 있으나, 해당 워드 스코어를 산정하는 일관된 기준이 정립되어 있지 않아 연구자의 주관적 판단이 개입될 가능성이 크다고 판단하였다. 이에 이 연구에서는 연구자 개입을 최소화하고 분석 과정의 일관성을 유지하기 위해 해당 절차를 수행하지 않았음을 명시한다.
넷째, 주거만족도에 미치는 영향요인 중 개인 및 가구 특 성이 반영되지 못하였다. 리뷰데이터는 작성자의 연령대와 성별 정보를 구득할 수 있으나, 이가 누락되어 있는 자료가 존재한다. 누락된 자료를 제외한다면 자료의 표본 수 부족이라는 문제가 발생되어 연령대와 성별 정보를 고려하지 못하였다. 또한 연령대와 성별만으로 개인 및 가구 특성을 대변하기에는 해석의 왜곡 가능성이 존재한다. 이는 개인 및 가구 특성 중 주거만족도 형성에 영향력이 높은 소득, 가구원 수, 직업, 학력 등의 정보를 구득할 수 없기 때문이다.
향후 연구에서는 이러한 한계를 보완하기 위해, 신조어와 줄임말을 반영할 수 있는 일관된 기준을 정의하고, 개인 및 가구 특성 정보를 포함할 수 있는 방법을 도출하여 반영하고 자 한다. 또한, 실증분석 방법론 측면에서는 개인 및 가구 특성과 지역적 특성을 복합적으로 반영할 수 있는 구조방정식모형이나 다층모형을 사용하여 분석을 수행한다면 보다 개선된 연구 결과를 도출할 수 있을 것으로 사료된다.
연구의 결과는 도시계획 및 주거정책 수립을 위한 기초자료로 활용되기를 기대하며, 주거만족도와 같은 정성적 자료를 정량화하여 분석하는 방법론으로도 활용될 수 있기를 기대한다.
Acknowledgments
이 논문은 한국연구재단 공동연구사업(NRF-2023S1A5A2A0308586611)의 지원을 받아 수행된 연구임
References
-
강대식·김민규·이수기, 2024. “신도시 주상복합 아파트 거주자의 만족도 영향요인 분석: 세종 행정중심복합도시를 중심으로”, 「국토계획」, 59(4): 141-158.
Kang, D.S., Kim, M.K., and Lee, S,G., 2024. “Analysis of Factors Influencing Residential Satisfaction of Mixed-use Apartment Residents in New Town: Focused on Sejong Multifunctional Administrative City”, Journal of Korea Planning Association, 59(4): 141-158. [https://doi.org/10.17208/jkpa.2024.08.59.4.141]
-
고승욱·신한철·이승일, 2023a. “API 기반 통근통행자료를 활용한 서울시 행정동별 승용차 탄소배출량 추정: 네트워크 특성을 공간구조정책 특성을 중심으로”, 「국토계획」, 58(1): 91-103.
Go, S.W., Shin, H.C., and Lee, S.I., 2023a. “Estimation of Passenger Private Car Carbon Emissions by Administrative District Using API-based Commuter Data: Focusing on Network and Spatial Structure Policy Characteristics”, Journal of Korea Planning Association, 58(1): 91-103. [https://doi.org/10.17208/jkpa.2023.02.58.1.91]
-
고승욱·정승진·이승일, 2023b. “서울시 공공임대주택 입주자의 개인 및 가구특성과 주거지의 공간적 특성이 장시간 통근 여부에 미치는 영향 연구: 다수준 이항 로지스틱 회귀모형을 활용하여”, 「국토계획」, 58(2): 52-66.
Go, S.W., Jung, S.J., and Lee, S.I., 2023b. “A Study on the Effect of Individual and Household Characteristics with Regional Residential Characteristics in Public Rental Housing in Seoul on Long Time Commuting: A Multilevel Binomial Logistic Regression Model Study”, Journal of Korea Planning Association, 58(2): 52-66. [https://doi.org/10.17208/jkpa.2023.04.58.2.52]
-
고우영·홍정열, 2022. “텍스트마이닝 기법을 활용한 스마트시티 교통부문 Use Case 평가지표 선정 방법론: 대구광역시 스마트시티 사례를 중심으로”, 「대한교통학회지」, 40(4): 449-461.
Go, W.Y. and Hong, J.Y., 2022. “Framework for Key Performance Index of Use Cases in Smart Transportation Using Text Mining: Focusing on Daegu Metropolitan City”, Journal of Korean Society of Transportation, 40(4): 449-461. [https://doi.org/10.7470/jkst.2022.40.4.449]
-
관계부처합동, 2019. 「생활SOC 3개년 계획 발표」, 국무조정실.
Joint Ministries, 2019. Announcement of the Three-Year Plan for Living SOC, Office for Government Policy Coordination. -
국토교통부, 2023. “2022년도 주거실태조사”, 세종.
Ministry of Land, Infrastructure and Transport, 2023. “2022 Korea Housing Survey”, Sejong. -
권준현·이수기, 2023. “주거환경에 대한 거주민의 만족도와 영향요인 분석 – 직방 아파트 리뷰 빅데이터와 딥러닝 기반 BERT 모형을 활용하여 –”, 「지역연구」, 39(2): 47-61.
Kweon, J.H. and Lee, S., 2023. “Analysis of Resident's Satisfaction and Its Determining Factors on Residential Environment: Using Zigbang’s Apartment Review Bigdata and Deeplearning-based BERT Model”, Journal of the Korean Regional Science Association, 39(2): 47-61. -
김기중·강현도·고승욱, 2023. “주택의 물리적 특성과 근린환경 특성이 고위험 전세가율에 영향을 미치는가?: 깡통전세 여부를 중심으로”, 「주택도시금융연구」, 8(2): 55-75.
Kim, K.J., Kang, H.D., and Go, S.W., 2023. “Do Physical Characteristis of Housing and Neighborhood Environment Impact High Jeonse Price Ratio?: Focusing on Whether Jeonse Is a High Risk”, Journal of Housing and Urban Finance, 8(2): 55-75. [https://doi.org/10.38100/jhuf.2023.8.2.55]
-
김단야, 2021. “주택자산가치의 변화는 주거만족을 설명할 수 있는가? 순서형 프라빗 모형을 활용한 실증분석”, 「부동산분석」, 7(3): 21-38.
Kim, D., 2021. “Do Changes in Housing Values Explain Housing Satisfaction? Empirical Evidence from the Ordered-Probit Models”, Journal of Real Estate Analysis, 7(3): 21-38. [https://doi.org/10.30902/jrea.2021.7.3.21]
-
김단야, 2024. “노인의 계속거주(AIP: Aging in Place) 영향요인 규명에 관한 연구: 지역별 소득별 영향요인 비교를 중심으로”, 「국토계획」, 59(4): 69-84.
Kim, D.Y., 2024. “An Empirical Study on the Determinants of AIP in Korea: Comparison of Determinants for Region and Income Level”, Journal of Korea Planning Association, 59(4): 69-84. [https://doi.org/10.17208/jkpa.2024.08.59.4.69]
-
김도연, 2023. “텍스트 마이닝 기법을 활용한 공유주택 관련 뉴스기사 분석”, 「한국주거학회논문집」, 34(1): 159-169.
Kim, D.Y., 2023. “Analysis of News Regarding on Shared Housing Using Text Mining Techniques”, Journal of the Korean Housing Association, 34(1): 159-169. [https://doi.org/10.6107/JKHA.2023.34.1.159]
-
김선재·이수기, 2020. “수도권 2기 신도시 주거환경만족도 요인분석: 웹크롤링과 텍스트 마이닝을 활용하여”, 「국토계획」, 55(7): 5-20.
Kim, S.J. and Lee, S., 2020. “Determinants of Residential Environment Satisfaction in the Second-Generation New Towns of the Seoul Metropolitan Area Using Web Crawling and Text Mining”, Journal of Korea Planning Association, 55(7): 5-20. [https://doi.org/10.17208/jkpa.2020.12.55.7.5]
-
김성연·권성문, 2021. “아파트 주거만족도 영향요인과 변화 추이: 국토교통부 주거실태조사 중 주택 및 주거환경 만족도 조사 결과를 중심으로”, 「주택도시연구」, 11(1): 61-80.
Kim, S.Y. and Kwon, S.M., 2021. “The Determinents and Changes of Residential Satisfaction with Apartments: Analyzing Housing and Residential Environment Satisfaction Using the Korea Housing Survey in the Ministry of Land, Infrastructure and Transport”, SH Urban Research & Insight, 11(1): 61-80. [https://doi.org/10.26700/shuri.2021.4.11.1.61]
-
박상민·나철원·최민성·이다희·온병원, 2018. “Bi-LSTM 기반의 한국어 감성사전 구축 방안”, 「지능정보연구」, 24(4): 219-240.
Park, S.M., Na, C.W., Choi, M.S., Lee, D.H., and On, B.W., 2018. “KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon”, Journal of Intelligence and Information Systems, 24(4): 219-240. -
박현애·배성우·박종석, 2014. “과학교육의 태도와 흥미 연구에서 리커트 척도 활용의 유의점”, 「한국과학교육학회지」, 34(4): 385-391.
Park, H.A., Bea, S.W., and Park, J.S., 2014. “The Likert Scale Attention Points Applied to Research on Attitude and Interests on Science Education”, Journal of the Korean Association for Science Education, 34(4): 385-391. [https://doi.org/10.14697/jkase.2014.34.4.0385]
-
배준열·강현도·고승욱·이승일, 2024. “민원자료를 기반으로 한 주관적 주거환경 요인과 객관적 주거환경 요인을 고려한 주택가격 분석: LDA 토픽 모델링을 활용하여”, 「국토계획」, 59(1): 1-19.
Bea, J.Y., Kang, H.D., Go, S.W., and Lee, S.I., 2024. “The Effects of Subjective Residential Environment Based on Civil Complaints Data and Objective Residential Environment Factors on Housing Price: Using LDA Topic Modeling”, Journal of Korea Planning Association, 59(1): 1-19. [https://doi.org/10.17208/jkpa.2024.02.59.1.121]
-
서울특별시, 2022. 「2022년 도시정책지표 조사: 결과보고서」, 서울.
Seoul Metropolitan Government, 2022. Urban Policy Indicators Survey: Final Report, Seoul. -
성진욱·김기중·이영민, 2024. 「청년안심주택 특성 분석 및 활성화 방안」, SH도시연구원.
Sung, J.U., Kim, K.J., and Lee, Y.M., 2024. Analysis of Characteristics and Activation Strategies of Youth Public Housing, SH Urban Research Institute. -
성진욱·남진, 2019. “다층모형을 활용한 개인, 가구, 지역차원에서의 주거만족도에 관한 연구 – 서울시 공공임대주택 사례를 중심으로 –”, 「국토계획」, 54(4): 26-37.
Sung, J.U. and Nam, J., 2019. “Analysis on the Residential Satisfaction of Individual, Household and Area-Level Characteristics using Multi-Level Models – Focusing on Public Housing in Seoul –”, Journal of Korea Planning Association, 54(4): 26-37. [https://doi.org/10.17208/jkpa.2019.08.54.4.26]
-
성진욱·이영민, 2017. “공공임대주택 입주의사에 영향을 미치는 요인에 관한 연구 – 서울시민의 공공임대주택에 대한 인식을 중심으로 –”, 「서울도시연구」, 18(3): 39-55.
Sung, J.U. and Lee, Y.M., 2017. “Analysis on Factors Affecting of Moving into Public Rental Housing – Focused on Seoul Citizen’s Perception of Public Rental Housing –”, Seoul Studies, 18(3): 39-55. -
손경민·진장익, 2020. “지역특성이 노인층·청년층 주거만족도에 미치는 영향 분석: 구조방정식 경로분석모형을 활용하여”, 「국토계획」, 55(4): 19-34.
Son, K.M. and Jin, J.I., 2020. “An Analysis of the Effect of Regional Characteristics on the Residential Satisfaction of the Elderly and the Young: Using Path Analysis of the Structural Equation Model”, Journal of Korea Planning Association, 55(4): 19-34. [https://doi.org/10.17208/jkpa.2020.08.55.4.19]
-
신은진·남진, 2012. “서울시 아파트 단지의 주거환경 유형별 주거만족도 결정요인에 관한 연구”, 「국토계획」, 47(5): 139-154.
Shin, E.J. and Nam, J., 2012. “Determinants of Residential Satisfaction by Residential Environment of Apartment Complexes in Seoul”, Journal of Korea Planning Association, 47(5): 139-154. -
오주용·김덕례·박환용, 2006. “개발밀도에 따른 주거만족도 변화에 관한 연구”, 「국토계획」, 41(2): 25-42.
Oh, J.Y., Kim, D.R., and Park, H.Y., 2006. “A Study on the Variation of Residential Satisfaction by Development Density”, Journal of Korea Planning Association, 41(2): 25-42. -
원종석·김효미·김상균·김세라, 2022. 「서울시 환경보건지표 개발과 운용방안」, 서울연구원.
Won, J.S., Kim, H.M., Kim, S.G., and Kim, S.R., 2022. A Study on the Development of Environmental Health Indicators in Seoul, The Seoul Institute. [https://doi.org/10.3390/ijerph192416611]
-
이민주, 2020. “젠트리피케이션에 의한 주거지역의 변화 –서울 연남동 사례–”, 「한국사진지리학회지」, 30(2): 106-117.
Lee, M.J., 2020. “The Impact of Gentrification on the Changes in Residential Areas –A Case Study of Yeonnam-dong, Seoul–”, Journal of the Association Of Korean Photo-Geographers, 30(2): 106-117. -
이은경·고동원·박승훈, 2024. “아파트의 주거환경 및 근린환경 특성이 주거만족도에 미치는 영향분석: 서울시 아파트 단지를 중심으로”, 「한국주거학회논문집」, 35(3): 63-72.
Lee, E.K., Ko, D.W., and Park, S.H., 2024. “Analysis ofthe Impact of Apartment Living Environment and Neighborhood Environment Characteristics on Housing Satisfaction: Focusing on Apartment Complexes in Seoul”, Journal of the Korean Housing Association, 35(3): 63-72. [https://doi.org/10.6107/JKHA.2024.35.3.063]
-
장윤정·고승욱, 2021. “주거만족과 물리적 주거환경 간 불일치 결정요인: 서울시 20~40대 아파트 거주자를 중심으로”, 「국토계획」, 56(6): 1-17.
Jang, Y.J. and Go, S.W., 2021. “Factors Affecting on Inconsistency between Subjective Residential Satisfaction and Objective Residential Environment: Focused on Apartment Residents in Their 20s-40s in Seoul”, Journal of Korea Planning Association, 56(6): 1-17. [https://doi.org/10.17208/jkpa.2021.11.56.6.53]
-
장윤정·이창효, 2016. “20~30대 1인 가구의 여가통행 목적지 공간 선택과 선호에 관한 행태특성 연구”, 「서울도시연구」, 17(2): 77-96.
Jang, Y. and Yi, C.H., 2016. “A Study of Behavioural Characteristics of 20–30’s Single Households on Destination Choices and Preferences for Leisure Travel”, Seoul Studies, 17(2): 77-96. -
정승진·고승욱·이승일, 2023. “주거지 근린환경을 고려한 고령자의 통행발생 결정요인 분석: 부산광역시를 사례로”, 「국토계획」, 58(7): 141-155.
Jung, S.J., Go, S.W., and Lee, S.I., 2023. “An Analysis of the Determinants of the Senior Citizens’ Trip Generation Considering the Neighborhood Environment of the Residential Area: For Busan Metropolitan City”, Journal of Korea Planning Association, 58(7): 141-155. [https://doi.org/10.17208/jkpa.2023.12.58.7.141]
-
진장익·이슬기·김재승·김정우, 2018. “공공임대주택의 지역적 특성이 거주자의 주거만족도에 미치는 영향 – 다층모형(Multi-level Model)을 활용하여 –”, 「부동산분석」, 4(1): 15-32.
Jin, J.I., Lee, S.G., Kim, J.S., and Kim, J.W., 2018. “The Effects of Spatial Environments of Public Rental Housing on Residents’ Satisfaction – Based on Multi-level Model –”, Journal of Real Estate Analysis, 4(1): 15-32. [https://doi.org/10.30902/jrea.2018.4.1.15]
-
최정민·박동찬, 2020. “주거환경 생활편의시설의 접근성 및 중요도에 관한 연구”, 「주거환경」, 18(1):1-20.
Choi, J.M. and Park, D.C., 2020. “A Study on Accessibility and Importance of Living Facilities in Residential Areas”, Journal of The Residential Environment Institute of Korea, 18(1):1-20. [https://doi.org/10.22313/reik.2020.18.1.1]
-
한봉수·서원석, 2018. “사회적 혼합단지 거주민의 주거환경 만족도 결정요인 비교연구”, 「주택도시연구」, 8(3): 1-16.
Han, B.S. and Seo, W.S., 2018. “Comparing the Factors of Residential Satisfaction among Social Mixed Housing Residents”, SH Urban Research & Insigh, 8(3): 1-16. [https://doi.org/10.26700/shuri.2018.12.8.3.1]
-
한음·조혜림·문성철·윤성범·박순용, 2020. “노인보호구역 보행자녹색시간 산정을 위한 보행속도 기준 개선”, 「한국 ITS학회 논문지」, 19(4): 45-54.
Han, E., Cho, H.R., Mun, S.C., Yun, S.B., and P, S.Y., 2022. “Improvement of Pedestrian Speed Criteria for the Pedestrian Green Interval at Silver Zone”, Journal of Korean Society of Intelligent Transport Systems, 19(4): 45-54. [https://doi.org/10.12815/kits.2020.19.4.45]
-
홍경구·안건혁, 2003. “하천변 주거지경관에 대한 인지유형 별 시각적 영향 요인 분석”, 「국토계획」, 38(4): 159-170.
Hong, G.K. and Ahn, K.H., 2003. “The Analysis of Visual Preference Factors of Scenic Types of Residential area of the Skirts of River”, Journal of Korea Planning Association, 38(4): 159-170. -
홍성효·임준홍, 2023. “주거환경만족도가 이주의향에 미치는 영향”, 「주택금융연구」, 7(2): 133-153.
Hong, S.H. and Im, J.H., 2023. “The Impact of Residential Environmental Satisfaction on Intention to Move”, Housing Finance Research, 7(2): 133-153. [https://doi.org/10.52344/hfr.2023.7.2.133]
-
황윤서·이현정, 2024. “텍스트 마이닝 기법을 활용한 온라인 뉴스 기사의 중장년 주거 토픽 분석”, 「Human Ecology Research」, 62(4): 645-655.
Hwang, Y.S. and Lee, H.J., 2024. “Analysis of Housing Topics for Middle-Aged Adults in Online News Articles Using Text-Mining Techniques”, Human Ecology Research, 62(4): 645-655. [https://doi.org/10.6115/her.2024.045]
-
황지현, 2022. “블로그 마이닝을 활용한 행복주택의 인식 분석”, 「한국콘텐츠학회논문지」, 22(2): 211-223.
Hwang, J.H., 2022. “Analysis of Perception on Happy Housing Using Blog Mining Technique”, Journal of the Korea Contents Association, 22(2): 211-223. -
Barbaglia, L., Consoli, S., Manzan, S., Tiozzo Pezzoli, L., and Tosetti, E., 2024. “Sentiment Analysis of Economic Text: A Lexicon-Based Approach”, arXiv:2411.13958, .
[https://doi.org/10.1111/ecin.13264]
-
Bojanowski, P., Grave, E., Joulim, A., and Mikolov, T., 2017. “Enriching Word Vectors with Subword Information”, Transactions of the Association for Computational Linguistics, 5(1): 135-146.
[https://doi.org/10.1162/tacl_a_00051]
-
Brandes, L., Godes, D., and Mayzlin, D., 2022. “Extremity Bias in Online Reviews: The Role of Attrition”, Journal of Marketing Research, 59(4): 675-695.
[https://doi.org/10.1177/00222437211073579]
-
Chen, L., Zhang, W., Yang, Y., and Yu, J., 2013. “Disparities in Residential Environment and Satisfaction among Urban Residents in Dalian, China”, Habitat International, 40: 100-108.
[https://doi.org/10.1016/j.habitatint.2013.03.002]
-
Church, R.L. and Marston, J.R., 2003. “Measuring Accessibility for People with a Disability”, Geographical Analysis, 35(1): 83-96.
[https://doi.org/10.1353/geo.2002.0029]
-
Douven, I., 2018. “A Bayesian Perspective on Likert Scales and Central Tendency”, Psychon Bull Rev, 25(3): 1203-1211.
[https://doi.org/10.3758/s13423-017-1344-2]
-
Egami, N., Fong, C.J., Grimmer, J., Roberts, M.E., and Stewart, B.M., 2022. “How to Make Causal Inferences Using Texts”, Science Advances, 8(42): eabo4616.
[https://doi.org/10.1126/sciadv.abg2652]
- Feldman, R. and Dagan, I., 1995. “Knowledge Discovery in Textual Databases (KDT),” Paper presented at the First International Conference on Knowledge Discovery and Data Mining (KDD-95), Montreal: Quebec, Canada.
-
Filippas, A., Horton, J.J., and Golden, J.M., 2019. Reputation Inflation, National Bureau of Economic Research.
[https://doi.org/10.3386/w25857]
-
Hong, J.Y., Tamakloe, R., Lee, G.W., and Park, D.J., 2019. “Insight from Scientific Study in Logistics using Text Mining”, Transportation Research Record: Journal of the Transportation Research Board, 2673(4): 97-107.
[https://doi.org/10.1177/0361198119834905]
-
Huang, X., Kang, C., Yin, C., and Li, Y., 2023. “Urban and Individual Correlates of Subjective Well-Being in China: An Application of Gradient Boosting Decision Trees”, Frontiers in Public Health, 11: 1090832.
[https://doi.org/10.3389/fpubh.2023.1090832]
-
Kaal, H., 2011. “A Conceptual History of Livability: Dutch Scientists, Politicians, Policy Makers and Citizens and the Quest for a Livable City”, City, 15(5): 532-547.
[https://doi.org/10.1080/13604813.2011.595094]
-
Kain, J.F., 1968. “Housing Segregation, Negro Employment, and Metropolitan Decentralization”, The Quarterly Journal of Economics, 82(2): 175-197.
[https://doi.org/10.2307/1885893]
-
Kim, D.B., Lee, S.J., Choi, K.S., and Kim, G.C., 1994. “A Two-level Morphological Analysis of Korean”, in Proceedings of the 15th Conference on Computational Linguistics, 535-539.
[https://doi.org/10.3115/991886.991979]
-
Kwon, Y., Seo, Y., and Hwang, J., 2019. “Is the High-Density Housing Layout Affected by River Direction? Lessons from Seoul, South Korea”, Sustainability, 11(11): 3013.
[https://doi.org/10.3390/su11113013]
-
Lalla, M., 2017. “Fundamental Characteristics and Statistical Analysis of Ordinal Variables: A Review”, Quality & Quantity, 51(1): 435-458.
[https://doi.org/10.1007/s11135-016-0314-5]
-
Lazer, D., Kennedy, R., King, G., and Vespignani, A., 2014. “The Parable of Google Flu: Traps in Big Data Analysis”, Science, 343(6176): 1203-1205.
[https://doi.org/10.1126/science.1248506]
-
Lee, G.J., Jeong, B.S., and Go, S.W., 2024. “Exploring Urban Amenity Accessibility within Residential Segregation: Evidence form Seoul’s Apartment Housing”, Land, 13(6): 824.
[https://doi.org/10.3390/land13060824]
-
Li, X. and Hitt, L.M., 2008. “Self-Selection and Information Role of Online Product Reviews”, Information Systems Research, 19(4): 456-474.
[https://doi.org/10.1287/isre.1070.0154]
-
Liu, B., 2020. Sentiment Analysis: Mining Opinions, Sentiments, and Emotions (2nd ed), Cambridge: Cambridge University Press.
[https://doi.org/10.1017/9781108639286]
-
Marans, R.W., 2012. “Quality of Urban Life Studies: An Overview and Implications for Environment-behaviour Research”, Procedia -Social and Behavioral Sciences, 35: 9-22.
[https://doi.org/10.1016/j.sbspro.2012.02.058]
- Mikolov, T., Chen, K., Corrado, G., and Dean, J., 2013. “Efficient Estimation of Word Representations in Vector Space”, arXiv preprint, arXiv:1301.3781, .
-
Mohit, M.A., Ibrahim, M., and Rashid, Y.R., 2010. “Assessment of Residential Satisfaction in Newly Designed Public Low-cost Housing in Kuala Lumpur, Malaysia”, Habitat International, 34(1): 18-27.
[https://doi.org/10.1016/j.habitatint.2009.04.002]
- Park, S.J., Moon, J.H., Kim, S.D., Cho, W.I., Han, J.Y., Park, J.W., Song, C.S., Kim, J.S., Song, Y.S., Oh, T.H., Lee, J.H., Oh, J.H., Lyu, S.W., Jeong, Y.H., Lee, I.K., Seo, S.W., Lee, D.J., Kim, H.W., Lee, M.H., Jang, S.B., Do, S.W., Kim, S.K., Lim, K.T., Lee, J.W., Park, K.M., Shin, J.M., Kim, S.H., Park, L.C., Oh, A.C., Ha, J.W., and Cho, K.H., 2021. “KLUE: Korean Language Understanding Evaluation”, arXiv:2105.09680, .
-
Paul, H. and Nikolaev, A., 2021. “Fake Review Detection on Online E-Commerce Platforms: A Systematic Literature Review”, Data Mining and Knowledge Discovery, 35: 1830-1881.
[https://doi.org/10.1007/s10618-021-00772-6]
-
Preece, J., Crawford, J., McKee, K., Flint, J., and Robinson, D., 2020. “Understanding Changing Housing Aspirations: A Review of the Evidence”, Housing Studies, 35(1): 87-106.
[https://doi.org/10.1080/02673037.2019.1584665]
-
Weber, R.P., 1990. Basic Content Analysis, London: Sage Publications.
[https://doi.org/10.4135/9781412983488]
-
Westland, J.C., 2022. “Information Loss and Bias in Likert Survey Responses”, PLoS ONE, 17(7): e0271949.
[https://doi.org/10.1371/journal.pone.0271949]
-
Whang, S.W., Park, K.S., and Kwon, C.W., 2023. “Influence of Aesthetic Design Elements on Residential Satisfaction in Apartment Based on Seoul Apartment Complex”, Journal of Asian Architecture and Building Engineering, 23(4): 1381-1392.
[https://doi.org/10.1080/13467581.2023.2270006]
-
서울특별시, 2024. “서울서베이 도시정책지표조사”, 서울열린데이터광장, https://data.seoul.go.kr/dataList/OA-15564/F/1/datasetView.do
Seoul Metropolitan Government, 2024. “Seoul Survey: Urban Policy Indicators”, Seoul Open Data Plaza, https://data.seoul.go.kr/dataList/OA-15564/F/1/datasetView.do














