Аннотация
В данной статье [1] рассматривается новейшая литература, посвященная прогнозированию цен на жилье на национальном и региональном уровнях. После обсуждения существующей литературы, в статье кратко рассматриваются пакеты и моделирование в R. В статье также освещаются будущие направления исследований и возможные инновации в области прогнозирования цен на жилье.
1 Введение
Статьи Case and Shiller [1989, 1990] вызвали значительный интерес к ценам на жилье в Соединенных Штатах и прогнозированию этих цен. Их работа показала, что рынок недвижимости неэффективен, то есть изменения цен, как правило, движутся в одном направлении на протяжении нескольких лет. Прогнозирование цен на недвижимость по-прежнему представляет большой интерес для экономистов в целом, а также для исследователей и практиков в сфере недвижимости, поскольку инвестиции в жилую недвижимость являются ключевым компонентом экономики.
Leamer [2007] в своей влиятельной статье указывает на то, что рынок жилья оказывает сильное влияние на показатели экономики в целом.
Таким образом, возможность прогнозировать цены на жилье (или, по крайней мере, поворотные точки на рынке) имеет жизненно важное значение для политиков и практиков. В частном секторе цены являются одним из наиболее часто задаваемых клиентами вопросов. Это логично, поскольку компании и покупатели жилья могут существенно выиграть или проиграть в зависимости от состояния рынка и сроков продаж или покупок. Кроме того, хотя большая часть исследований сосредоточена на ценообразовании на национальном или международном уровне, значительно меньше внимания уделяется прогнозированию на субнациональном уровне (штат, мегаполис, округ). Более локализованное прогнозирование — это область, которая имеет потенциал для развития в будущем, поскольку рынок жилья функционирует скорее на местном, чем на национальном уровне.
Однако, как отметили Hendershott and Weicher [2002] в обзоре литературы по прогнозированию на тот момент, многие прогнозы были существенно неверными. Прогнозирование — очень сложная задача, но эта область постоянно развивается.
Остальная часть этой статьи будет посвящена прошлым исследованиям, связанным с прогнозированием цен на жилье.
Я буду в основном фокусироваться на исследованиях, касающихся Соединенных Штатов, и буду рассматривать достижения в моделировании в зависимости от масштаба моделей, будь то национальные или региональные.
Затем я кратко затрону методы в R, которые оказались полезными, и прокомментирую возможные расширения этих программ, которые были бы полезны пользователям.
В заключительных двух разделах будут представлены соображения о достижениях, после чего последует заключение. Моя цель — дать читателям (краткий) обзор данной области, а также идеи и ресурсы для будущей работы.
2. Литература по прогнозированию
2.1 Моделирование временных рядов
2.1.1 Национальный уровень
Классическая работа Case and Shiller вызвала большой интерес к прогнозированию цен на жилье.
В более ранней работе Sklarz et al. [1987] использовали авторегрессионные методы для прогнозирования начала строительства жилья.
Cho [1996] обобщил различные исследования, проведенные к тому времени, и прокомментировал эффективность рынка жилья. Аналогично Case and Shiller, он обнаружил свидетельства положительной последовательной корреляции цен на жилье, по крайней мере, в краткосрочной перспективе.
Учитывая это, методы анализа временных рядов стали основным направлением исследований, изучающих прогнозирование цен на жилье.
Hoffman and Rasche [1997], хотя и не фокусировались непосредственно на рынке жилья, использовали векторные модели коррекции ошибок (VECM) для прогнозирования ключевых компонентов экономики США. Поскольку многие макроэкономические переменные демонстрируют признаки коинтеграции, VECM могут быть очень полезны для целей прогнозирования.
Larson [2010] также использовал векторные модели коррекции ошибок для прогнозирования цен на жилье. В частности, следует отметить, что его оценка цен на жилье с использованием векторной модели коррекции ошибок с учетом дохода дала хорошие многошаговые прогнозы (стр. 26).
Leung [2014] также представил доказательства того, что доходы и цены на жилье имеют коинтеграционную связь.
Совсем недавно [24 октября 2019 г.] Kiefer создал структуру для проведения вневыборочных прогнозов на основе одной входной переменной в рамках векторной модели коррекции ошибок.
Например, если у нас есть очень надежный истинный вневыборочный прогноз уровня дохода, его можно использовать для генерации вневыборочных оценок цен на жилье на основе коинтеграционной связи. Векторные модели коррекции ошибок, содержащие не слишком много переменных, представляют собой метод моделирования, который может быть полезен для вневыборочного прогнозирования, как показал Kiefer [24 октября 2019 г.].
Этот подход, безусловно, может быть расширен и обобщен для других задач прогнозирования.
Недавно Milunovich [2020] сравнил широкий спектр моделей прогнозирования реальных цен на жилье в Австралии. Он обнаружил, что в целом одномерные модели показали лучшие результаты на коротких горизонтах прогнозирования. Он также обнаружил, что многомерные прогнозы могут иметь некоторые преимущества на более длительных горизонтах, хотя общая эффективность прогнозов снижается по мере увеличения горизонта прогнозирования (стр. 28).
McGurk [2020] включил информацию о потоках капитала в свою модель прогнозирования и обнаружил, что это добавило некоторую объяснительную силу прогнозам цен на жилье в США. Это было интересное исследование, поскольку прогноз включал некоторую информацию о международных финансовых потоках, которая может быть полезна, поскольку Bernanke [10 марта 2005 г.] выдвинул гипотезу о том, что глобальный избыток сбережений определял макроэкономическое поведение в США до Великой рецессии.
Наконец, Gravatt et al. [2022] разработали простой метод определения возможности завышения цен на рынке жилья в мегаполисах. Этот простой метод является отличным дополнением к вышеупомянутым методам моделирования, поскольку он интуитивно понятен и легко усваивается как специалистами, так и широкой публикой. Иногда простота использования и доступность приносят больше пользы, чем более сложные и ресурсоемкие анализы.
2.1.2 Региональный уровень
Переходя к региональным моделям, Miller et al. [2005] использовали авторегрессионную модель для оценки цен на жилье. Интересно, что это был один из первых примеров прогнозирования на уровне мегаполиса. Авторы запустили свою модель на 316 мегаполисах, чтобы прогнозы учитывали локальные эффекты. Это полезный подход, поскольку прогнозы на уровне мегаполиса представляют большой интерес для практиков.
Rapach and Strauss [2007] продемонстрировали, что комбинации различных авторегрессионных моделей с распределенными лагами (ARDL) помогли точно прогнозировать цены на жилье в различных штатах.
В другом исследовании Miller and Sklarz [2012] отметили, что учет краткосрочных и среднесрочных рыночных условий улучшил точность и своевременность прогнозов.
В другом региональном исследовании Gupta and Miller [2012] спрогнозировали цены на жилье в Лос-Анджелесе, Лас-Вегасе и Финиксе, используя различные модели. Они обнаружили, что рекурсивные прогнозы (обновляемые ежеквартально) достаточно точно отражают поворотные моменты на рассматриваемых ими рынках жилья в мегаполисах.
Balcilar et al. [2015] изучили широкий спектр линейных и нелинейных моделей прогнозирования цен на жилье в США на национальном уровне и по регионам переписи населения США. В целом они обнаружили, что дополнительные затраты с точки зрения сложности и вычислительных ресурсов для нелинейных моделей не перевешивают преимущества использования линейных моделей для краткосрочного прогнозирования.
Bork and Møller [2015] использовали методы динамического усреднения моделей для создания прогнозов, которые меняются со временем и по всем 50 штатам США. Они обнаружили, что использование этого метода повышает точность их прогнозов.
Kholodilin and Siliverstovs [2017] провели прогнозирование цен на недвижимость в 71 немецком городе. Они обнаружили, что ни один отдельный индикатор не предсказывает все рынки, но комбинации прогнозов помогают повысить точность прогнозов.
В заключение этого раздела компания Moody’s Analytics разработала метод прогнозирования цен на жилье на уровне мегаполисов.
Chen et al. [2013] описали модель и входные переменные. Это включало создание и оценку модели, которая генерировала равновесную цену для каждой интересующей единицы (в данном случае, мегаполисов), и уравнения корректировки, которое оценивало, как быстро цены, отклонившиеся от равновесия, возвращаются к этим уровням. Все эти методы могут быть полезны для моделирования цен на региональном или столичном уровне.
2.2 Другие подходы к моделированию
Auterson [2014] разработал теоретически обоснованную модель, основанную на спросе и полезности домохозяйств, для моделирования цен на жилье в Соединенном Королевстве.
Saunders and Tulip [2019] создали структурную макроэкономическую модель для моделирования цен на жилье в Австралии. Модели, построенные аналогичным образом, имели бы преимущество в том, что они учитывали бы взаимосвязи между различными макроэкономическими переменными (процентные ставки, уровень вакантных площадей и т. д.) и то, как они влияют на цены на жилье.
Agnello and Schuknecht [2009] исследовали факторы, влияющие на циклы цен на жилье в развитых странах, используя панельную модель. Их модель показала определенные перспективы в выявлении периодов ценового бума.
Аналогично, Geng [2018] использовал межрегиональную панельную модель для исследования фундаментальных факторов, влияющих на цены на жилье в развитых странах. Панельные модели (включая США) могут быть полезны для повышения статистической мощности исследований. Такие модели, безусловно, могут быть более широко адаптированы на уровне штатов или мегаполисов в Соединенных Штатах.
В заключение этого подраздела я бы порекомендовал всем заинтересованным читателям обратиться к работе Petropoulos et al. [2022], содержащей обширный обзор современной литературы по всем аспектам прогнозирования, а также к работе Ghysels et al. [2013], в которой подробно рассматривается моделирование, связанное с прогнозированием цен на недвижимость.
3. Вопросы моделирования
В R существует несколько пакетов, полезных для тестирования и моделирования временных рядов. Более старый, но все еще широко используемый пакет — forecast [Hyndman et al., 2008].
Он является основным инструментом для многих специалистов. Он содержит множество методов прогнозирования, включая полезную команду (auto.arima) для автоматического выбора оптимальной модели для заданного ряда.
Недавно Hyndman and Athanasopoulos [2021] опубликовали свободно доступный учебник по прогнозированию. Текст доступен в цифровом виде онлайн бесплатно (можно также приобрести бумажную копию). В книге подробно описан пакет fable в R, который содержит множество встроенных методов прогнозирования.
Krispin [2019] также выпустил недорогую книгу, в которой подробно описаны методы и практика прогнозирования в R, включающую его пакет TSstudio. В ней много примеров с приложениями.
Несколько других пакетов предлагают дополнительные методы для работы с временными рядами.
urca [Pfaff et al.] — полезный пакет, который можно использовать для тестирования коинтеграции и единичного корня.
Пакет vars [Pfaff and Stigler] — ещё один пакет R, позволяющий пользователю моделировать с использованием VECM.
Кроме того, Weiss et al. [2018] предлагают полезный пакет ForecastComb, позволяющий комбинировать прогнозы, что, как было показано, помогает повысить точность прогнозов.
Пакет modeltime [Dancho] — более новый пакет, позволяющий оптимизировать прогнозирование по многим различным сегментам (например, по мегаполисам). modeltime также специально разработан для прогнозирования в больших масштабах, то есть он может создавать автоматические прогнозы для многих различных единиц (округов, мегаполисов, штатов).
Кроме того, я обнаружил, что R Journal и Journal of Statistical Software очень информативны для отслеживания последних пакетов прогнозирования с открытым исходным кодом в R. Многие из этих статей содержат примеры и приложения для тех, кто заинтересован.
4 Направления будущих исследований
Много литературы посвящено прогнозированию уровня цен на жилье в масштабах всей страны как в США, так и в других развитых странах. Как правило, в этих работах использовались модели VECM и другие методы, возможно, с панельной структурой.
Относительно меньше литературы посвящено прогнозированию на уровне мегаполисов.
Это не обязательно связано с тем, что исследователи не задумывались об этом (см., например, сноску 5 в работе Miller et al. [2005]), но существуют постоянные проблемы с доступностью и объемом данных на уровне мегаполисов. Поэтому одним из направлений дальнейшего развития было бы увеличение объема данных на уровне мегаполисов за более длительные периоды времени с месячным или квартальным интервалом (предпочтительно общедоступных через Бюро переписи населения США или аналогичный общедоступный источник).
Другая область, которой несколько уделяется недостаточно внимания, — это моделирование для нескольких регионов. Что касается практиков, многие частные компании и частные лица заинтересованы в прогнозах не столько на национальном уровне, сколько для конкретных мегаполисов (как правило, чем больше охваченных мегаполисов, тем лучше). Насколько мне известно, существует относительно ограниченное количество информации и доступных пакетов для прогнозирования в больших масштабах
(Fable обладает некоторыми возможностями для прогнозирования по нескольким подразделениям, ModelTime специально настроен для этого, но информация об этом пакете несколько менее доступна).
Регулярное прогнозирование для многих подразделений является ключевым направлением развития в сфере недвижимости (и для всех специалистов по прогнозированию в целом). Я думаю, что это станет важным направлением развития в будущем для многих компаний в сфере недвижимости, а также в других отраслях.
Кроме того, многие организации заинтересованы в истинном прогнозировании вне выборки. Это означает не контрольную выборку из модели временных рядов, а истинное прогнозирование будущих значений (например, июль 2024 года).
Проблема многих методов заключается в необходимости прогнозирования входных данных для дат вне выборки.
Одна из немногих статей, посвященных этой проблеме, — это работа Kiefer [24 октября 2019 г.]. Его метод, который можно было бы дополнительно обобщить, использует модель VECM и, используя наблюдаемые входные данные, прогнозируемые на основе известного ряда, может делать истинные прогнозы вне выборки. В сочетании с довольно хорошим опытом использования моделей VECM в прогнозировании цен, это может стать ключевой областью для дальнейшего развития прогнозирования.
Наконец, исследование Gravatt et al. [2022] было очень интересным. Метод, использованный авторами, был простым, но легким для понимания и использования. Авторы также свободно представили свой метод и сделали результаты общедоступными. Этот тип исследований очень полезен для неакадемической аудитории, поскольку практики и неакадемические исследователи могут легко получить доступ к модели и статье и использовать их. Более тесное сотрудничество между академическими и неакадемическими исследователями представляется простой областью для дальнейшего улучшения понимания рынков жилья.
5. Заключение
Начиная с работ Case and Shiller [1989, 1990], прогнозирование цен на жилье вызвало большой интерес в области экономики и прогнозирования.
Жилье является одним из важнейших компонентов экономических показателей США [Leamer, 2007], поэтому неудивительно, что этой теме посвящено много исследований.
Многие исследователи сосредоточились на проблеме на национальном уровне, используя подход временных рядов.
Некоторые исследования (хотя и не столь масштабные) рассматривали проблему прогнозирования на уровне мегаполисов или штатов.
Для исследователей и практиков доступно бесплатное программное обеспечение, такое как R.
Разработаны различные пакеты R, которые могут быть полезны именно для прогнозирования. Больше внимания следует уделить разработке пакетов, которые можно использовать для прогнозирования в больших масштабах (во многих мегаполисах). Это область, представляющая большой интерес, особенно для неакадемической аудитории. Кроме того, сосредоточение внимания на истинном прогнозировании вне выборки может принести значительную пользу как академическим кругам, так и частному сектору.
Наконец, более тесное сотрудничество между академическими и неакадемическими исследователями могло бы принести пользу данной области. Неакадемические исследователи обладают сильными сторонами в выявлении потребностей/желаний практиков, в то время как академические исследователи могут вносить передовые исследования и разработку программного обеспечения. Поощрение взаимодействия и диалога между двумя типами исследователей может принести большую пользу.
6 Глоссарий
Авторегрессионная модель (АР) – модель временных рядов, зависящая от собственных априорных значений, а также от случайной составляющей, которая будет вызывать изменения.
Авторегрессионная модель с распределенными лагами (ARDL) – модель временных рядов, похожая на АР, но включающая объясняющую переменную и ее лаги, которые будут влиять на поведение зависимой переменной.
Пакет Fable – пакет в R. Это обновление пакета forecast, которое включает больше возможностей для прогнозирования.
Пакет Forecast – пакет в R, который содержит множество полезных встроенных методов прогнозирования. Подходит для «готового» прогнозирования.
Пакет ForecastComb – пакет в R, который позволяет пользователю объединять различные прогнозы для создания единого взвешенного прогноза.
Journal of Statistical Software – бесплатный онлайн-журнал, публикующий статьи об инновациях в программном обеспечении в R, а также в других программах. Также полезен для получения общих знаний в области статистического моделирования.
Пакет Modeltime – пакет в R, позволяющий пользователю создавать прогнозы в больших масштабах, то есть вы можете создавать автоматические прогнозы для интересующей вас единицы (различные города, продукты и т. д.) одновременно.
Панельная модель – эконометрическая модель, которая генерирует оценку, используя входные данные из различных интересующих единиц (штаты, страны и т. д.) во времени.
R Journal – бесплатный онлайн-журнал по моделированию/эконометрике, посвященный пакетам и инновациям в программировании в R.
Пакет TSstudio – пакет в R для прогнозирования временных рядов. Это еще один пакет R, который можно использовать для прогнозирования.
Пакет Urca – пакет в R, который можно использовать для тестирования коинтеграции, а также для различных других тестов моделирования временных рядов.
Пакет Vars – пакет в R, который можно использовать для создания векторных моделей коррекции ошибок и других моделей временных рядов.
Векторная модель коррекции ошибок (VECM) – модель временных рядов, которая учитывает коинтеграционную связь между переменными. Коинтеграция — это взаимосвязь, при которой две переменные движутся синхронно (это можно проверить статистически).
Ссылки
Luca Agnello and Ludger Schuknecht. Booms and busts in housing markets: De- terminants and implications. European Central Bank Working Paper Series, (1071), 2009.
Toby Auterson. Forecasting house prices. U.K. Office for Budget Responsibility Working Paper, (6), 2014.
Mehmet Balcilar, Rangan Gupta, and Stephen M. Miller. The out-of-sample forecasting performance of nonlinear models of regional housing prices in the us. Applied Economics, 47(22):2259–2277, 2015.
Ben S. Bernanke. Remarks by governor ben s. bernanke. In Sandridge Lecture Virginia Association of Economists, 10 March 2005.
Lasse Bork and Stig Vinther Møller. Forecasting house prices in the 50 states using dynamic model averaging and dynamic model selection. International Journal of Forecasting, 31(1):63–78, 2015.
Karl E. Case and Robert J. Shiller. The efficiency of the market for single-family homes. The American Economic Review, 79(1):125–137, 1989.
Karl E. Case and Robert J. Shiller. Forecasting prices and excess returns in the housing market. AREUEA Journal, 18(3):253–273, 1990.
Cella Chen, Andres Carbacho-Burges, Sunayana Mehra, and Mike Zoller. The moody’s analytics case-shiller home price index forecast methodology. Tech- nical report, Moody’s Analytics, 2013.
Man Cho. House price dynamics: A survey of theoretical and empirical issues.
Journal of Housing Research, 7(2):145–172, 1996.
Matt Dancho. modeltime: The Tidymodels Extension for Time Series Modeling.
Nan Geng. Fundamental drivers of house prices in advanced economies. Inter- national Monetary Fund Working Paper, (WP/18/164):1–24, 2018.
Eric Ghysels, Alberto Plazzi, Rossen Valkanov, and Walter Torous. Chapter 9 – forecasting real estate prices. In Graham Elliott and Allan Timmermann, editors, Handbook of Economic Forecasting Volume 2 Part A. Elsevier, 2013.
Denise Gravatt, Eli Baracha, and Ken H. Johnson. A note on the estimation of the degree of over or under-pricing of housing markets relative to their long-term pricing trend. Journal of Housing Research, 31(1):1–3, 2022.
Rangan Gupta and Stephen M. Miller. ’ripple effects’ and forecasting home prices in los angeles, las vegas, and phoenix. The Annals of Regional Science, 48:763–782, 2012.
Patric H. Hendershott and John C. Weicher. Forecasting housing markets: Lessons learned. Real Estate Economics, 30(1):1–11, 2002.
Dennis L. Hoffman and Robert H. Rasche. Stls/us-vecm6.1: A vector error- correction forecasting model of the u.s. economy. Federal Reserve Bank of St. Louis Working Paper, (1997-008A), 1997.
Rob Hyndman et al. forecast: Forecasting Functions for Time Series and Linear Models, 2008.
Rob J. Hyndman and George Athanasopoulos. Forecasting: Principles and Practice, 3rd Edition. Otexts, 2021.
Konstantin A. Kholodilin and Boriss Siliverstovs. Think national, forecast local: A case study of 71 german urban housing markets. Applied Economics, 49 (42):4271–4297, 2017.
Len Kiefer. Forecasts from a bivariate vecm conditional on one of the variables, 24 October 2019. This article can be found on Kiefer’s blog: lenkiefer.com.
Rami Krispin. Hands-On Time Series Analysis with R. Packt Publishing, 2019.
William D. Larson. Evaluating alternative methods of forecasting house prices: A post-crisis reassessment. George Washington University Research Program on Forecasting Working Paper, (2010-004), 2010.
Edward E. Leamer. Housing is the business cycle. NBER Working Paper Series, (13428), 2007.
Charles Ka Yui Leung. Error correction dynamics of house prices: An equilib- rium benchmark. Federal Reserve Bank of Dallas Globalization and Monetary Policy Institute Working Paper, (177), 2014.
Zachary McGurk. Us real estate inflation prediction: Exchange rates and net foreign assets. The Quarterly Review of Economics and Finance, 75:53–66, 2020.
Norman G. Miller and Michael Sklarz. Integrating real estate market conditions into home price forecasting systems. Journal of Housing Research, 21(2):183– 214, 2012.
Norman G. Miller, Michael Sklarz, and Thomas G. Thibodeau. The impact of interest rates and employment on nominal housing prices. International Real Estate Review, 8(1):26–42, 2005.
George Milunovich. Forecasting australia’s real house price index: A comparison of time series and machine learning methods. Journal of Forecasting, 39(7): 1098–1118, 2020.
Fotios Petropoulos et al. Forecasting: Theory and practice. International Jour- nal of Forecasting, 38(3):705–871, 2022.
Bernhard Pfaff and Matthieu Stigler. vars: VAR Modelling.
Bernhard Pfaff, Eric Zivot, and Matthieu Stigler. urca: Unit Root and Cointe- gration Test for Time Series Data.
David E. Rapach and Jack K. Strauss. Forecasting real housing price growth in the eighth district states. Regional Economic Development, 31(2):33–42, 2007.
Trent Saunders and Peter Tulip. A model of the australian housing market.
Reserve Bank of Australia Research Discussion Paper, (RDP 2019-01), 2019.
Michael A. Sklarz, Norman G. Miller, and Will Gersch. Forecasting using long- order autoregressive processes: An example using housing starts. AREUEA Journal, 15(4):375–388, 1987.
Christoph E. Weiss, Eran Raviv, and Gernot Roetzer. Forecast
combinations in r using the forecastcomb package. R Journal,
10(2):262–281, 2018.
[1] Meszaros J. (2024), A Brief Review of House Price Forecasting Methods, Real Estate Issues, Vol. 48, Num. 4, Febr. 7, https://cre.org/real-estate-issues/a-brief-review-of-house-price-forecasting-methods/. Джон Месарош (John Meszaros) — старший аналитик-исследователь в компании Zonda. Он получил докторскую степень в Университете Западной Вирджинии по специальности «Финансовая экономика». Оговорка: Мнения, изложенные в статье, принадлежат автору и не обязательно отражают точку зрения компании Zonda или ее сотрудников.