Проектирование исследований, проверка гипотез и отбор выборок в оценке

Статистические методы являются важным элементом набора инструментов практикующего оценщика. Степень использования статистических данных в практике оценки зависит от ряда обстоятельств, таких как объем работы, статистическая компетентность аналитика и наличие данных. Далее обсуждается теория, необходимая для компетентности в статистическом выводе, то есть выводе о неизвестной характеристике генеральной совокупности на основе выборочных данных. Объясняется, как подготавливать и реализовывать статистические исследования с выводами, а также рассматриваются темы построения гипотез, надежности и обоснованности исследований, формирования выборки, установления уровней значимости и размера выборки.

 

Дизайн исследования и проверка гипотез. В чем вопрос?

 

На самом элементарном уровне применение логической статистики сводится к ответам на вопросы. Например, мы могли бы спросить: «Справедлива ли теория снижающейся предельной полезности для данного типа недвижимости в данной рыночной области?» Или: «Как этот конкретный рынок аренды реагирует на близость к общественному транспорту?» Или: «Каково, если таковое имеется, влияние уличного шума на цены на жилье в данном квартале?»

В конечном счете вопрос может быть таким же фундаментальным, как: «Каково мое мнение о рыночной стоимости этой недвижимости и может ли доверие к моему мнению быть подкреплено применением методов вывода?»

Вопросы исследования, подобные этим, могут представлять весь объем задания на оказание оценочных услуг, или они могут быть небольшими, но важными аспектами более всестороннего исследования. В любом случае эффективное применение методов вывода требует четкого понимания соответствующих вопросов, явной или неявной формулировки проверяемых гипотез, соответствующих данных, достоверного анализа и достоверной интерпретации результатов анализа.

Поскольку процесс оценки служит систематическим и организованным способом разработки плана работы в соответствии с объемом конкретного задания, дизайн исследования посредством статистического анализа во многом обеспечивает дорожную карту для перехода от исследовательского вопроса к пониманию.

 

От исследовательского вопроса к проверяемым гипотезам

 

Проверка гипотез опирается на принцип, часто называемый «попперовской фальсификацией», философ начала двадцатого века Карл Поппер утверждал, что статистические умозаключения не могут ничего доказать с абсолютной уверенностью.

Однако методы вывода могут поставить под сомнение достоверность утверждения «истина.» Когда может возникнуть достаточное сомнение, утверждение истины может быть «фальсифицировано», по крайней мере, до некоторой степени.

Степень определенности, связанная с обозначением утверждения как ложного, связана со «статистической значимостью» или просто «значимостью» на языке статистики.

Процесс формирования и проверки гипотезы (т.е. теории) заключается в следующем:

  1. Определить соответствующий ожидаемый результат на основе теории и опыта. Это обычно упоминается в выводной статистике как «исследовательская гипотеза»
  2. Сформулировать пару проверяемых гипотез, связанных с исследовательской гипотезой: (1) «нулевую гипотезу» и (2) «альтернативную (исследовательскую) гипотезу».» Обе проверяемые гипотезы должны быть взаимоисключающими и коллективно исчерпывающими. Цель проверки гипотезы состоит в том, чтобы фальсифицировать или отвергнуть утверждение истины, подразумеваемое нулевой гипотезой, оставляя исследовательскую гипотезу в качестве единственной разумной альтернативы.
  3. Сформулировать вывод, который опровергает (или не опровергает) нулевую гипотезу.

 

Проверка гипотез в реальном мире

 

Хотя трехэтапный процесс формирования и проверки гипотезы легко описать, его, как правило, гораздо сложнее применить. Давайте рассмотрим простой пример и подумаем о возможных осложнениях.

Рассмотрим влияние уличного шума на цены на жилье. Этот простой вопрос оценки стоимости жилья иллюстрирует сложности, возникающие при формулировании и проверке гипотез реального мира.

Подходящей исследовательской гипотезой может быть общее утверждение типа «Воздействие уличного шума влияет на цену дома», или, если аналитик делает более конкретное предположение относительно направления эффекта, исследовательская гипотеза может быть такой: «Воздействие уличного шума снижает цену дома»

В зависимости от объема задания, соответствующий исследовательский вопрос может быть гораздо более конкретным, чем этот.

Возможно, потребуется дополнительная доработка, в результате чего могут возникнуть исследовательские гипотезы, такие как «Воздействие уличного шума, превышающего» X децибел «над обычным уровнем шума, снижает цену на жилье» или «Воздействие уличного шума снижает цену на жилье, но размер снижения уменьшается с расстоянием от улицы и становится незначительным на расстоянии «X футов» от улицы».

Для простоты предположим, что подходящая исследовательская гипотеза заключается в том, что «Воздействие уличного шума снижает цену на жилье в районе объекта недвижимости».

Это утверждение становится альтернативной гипотезой — гипотезой, которую, по вашему мнению, будут поддерживать данные.

Помните, что нулевая гипотеза и альтернативная гипотеза являются взаимоисключающими и в совокупности исчерпывающими.

Таким образом, нулевая гипотеза (утверждение истины, которое вы пытаетесь фальсифицировать) будет заключаться в том, что «Воздействие уличного шума либо увеличивает цену дома, либо не влияет на цену дома в рыночной зоне объекта недвижимости».

Эти два утверждения являются взаимоисключающими (только одно из них может быть истинным), и они в совокупности являются исчерпывающими (цена дома должна расти, падать или оставаться неизменной).

Таким образом, соответствующие гипотезы для этого примера

  • Гипотеза исследования: воздействие уличного шума снижает цену на жилье в районе рынка объекта недвижимости.
  • Проверяемые гипотезы:
    • нулевая гипотеза (Hо): эффект цены уличного шума >
    • альтернативная гипотеза (Hа): эффект цены уличного шума < 0.

Как только эти гипотезы будут сформулированы, должен быть разработан план исследования, который позволит аналитику достоверно проверить достоверность нулевой гипотезы.

Если нулевая гипотеза может быть фальсифицирована с достаточной уверенностью, то аналитик может сделать вывод, что альтернативная гипотеза, скорее всего, верна.

Однако важно признать, что статистические методы вывода не предназначены для поддержки нелогичных, необоснованных или атеистических предположений. Утверждения исследований и альтернативных гипотез должны быть хорошо аргументированными и логичными, имея в виду, что методы вывода предназначены для поддержки обоснованных исследовательских гипотез.

 

Действительность и надежность

 

Тесты на достоверность нулевой гипотезы бесполезны, если они не являются достоверными (т.е. достойными веры).

Две концепции — валидность и надежность — имеют первостепенное значение для проверки достоверных гипотез. (1)

Эти концепции глубоко укоренились в дизайне исследований и научных исследованиях.

Понятия надежности и валидности поначалу могут сбивать с толку, но на самом деле они довольно просты.

Например, есть представление о том, что надежность аналогична кластеризации выстрелов по цели. При этом

  • выстрелы, которые разбросаны по всей мишени, ненадежны.
  • выстрелы, которые плотно сгруппированы, но смещены от центра, надежны, но недействительны.
  • и только выстрелы, которые плотно сгруппированы и сосредоточены на цели, являются надежными (последовательными) и действительными (точными).

Поскольку угрозы надежности и обоснованности подрывают доверие, достоверные исследования и мнения, связанные с оценкой, с большей вероятностью возникнут тогда, когда аналитики поймут и оценят, в какой степени используемые методы были надежными и обоснованными.

Уделение внимания нескольким простым критериям может иметь большое значение для обеспечения достоверных результатов.

Например, логические схемы исследований, контроль погрешности измерений, стандартизация протоколов интервью, использование репрезентативных данных и применение соответствующих аналитических инструментов являются основными и существенными элементами использования статистических методов для поддержки достоверных оценок.

 

Допустимость

 

Строго говоря, достоверность — это степень, в которой статистическая мера отражает реальное значение того, что измеряется.

Рассмотрим шкалу, которая последовательно указывает веса, которые составляют 95% от истинного веса. Очевидно, что результат недействителен, когда цель состоит в том, чтобы измерить истинный вес. Хотя такого рода погрешность измерения исправима, если она согласована и известна, во многих ситуациях погрешность измерения обычно не является ни согласованной, ни известной.

Отсутствие обоснованности исследований проистекает из многих источников, и оценка обоснованности исследований включает в себя множество соображений, таких как

  • Логическая обоснованность
  • Валидность конструкции
  • Внутренняя действительность
  • Внешняя действительность
  • Достоверность статистических заключений
  • Предвзятость

 

Логическая обоснованность

Проект исследования состоит из нескольких частей, таких как постановка проблемы, гипотеза исследования, выбор и определение переменных, реализация проекта и процедур, выводы и заключения.

Логическая обоснованность удовлетворяется тогда, когда каждая последующая часть общего проекта логически вытекает из предыдущего шага. Если общий дизайн не логичен, то результаты вряд ли будут действительными. Оценщики уже должны быть знакомы с элементами и логическим потоком проектирования исследований, поскольку процесс оценки представляет собой аналогичный алгоритм.

 

Валидность конструкции

Валидность конструкции связана с тем, насколько хорошо измеряются фактические атрибуты, характеристики и характеристики. Например, хотя высокие люди обычно весят больше, чем низкорослые, использование весовой шкалы не является допустимой конструкцией для измерения роста. Как показывает этот пример, валидность конструкции — это простая концепция, но на практике она может быть довольно нюансированной.

Опасения по поводу валидности конструкции особенно применимы к использованию интервью и вопросников. Точные определения переменных и устранение двусмысленности важны для обеспечения того, чтобы вопросы не были неправильно истолкованы респондентами или исследователями. Значения, присвоенные респондентами, должны соответствовать значениям, намеченным исследователем. Кроме того, значение должно быть последовательным от респондента к респонденту.

Валидность конструкции особенно проблематична, когда респонденты должны интерпретировать технический или научный язык, как это имеет место во многих интервью, связанных со сделками с недвижимостью (например, подтверждение продажи). Не предполагайте, что опрашиваемые лица полностью понимают значения технических терминов, таких как ставка капитализации, внутренняя норма прибыли, чистый операционный доход, эффективный валовой доход, устаревание и тому подобное.

 

Внутренняя действительность

Внутренняя валидность требует, чтобы все альтернативные объяснения причинности были исключены. Исключение угроз внутренней валидности является трудоемкой задачей, поскольку она требует явного определения каждого альтернативного объяснения причинности наряду с обоснованием его отклонения. Если все разумные альтернативные причины не могут быть исключены, исследование может быть неубедительным и недействительным.

 

Внешняя действительность

Внешняя валидность существует, когда выводы и заключения могут быть обобщены из репрезентативной выборки на большую или иную совокупность. Случайный отбор из целевой популяции является лучшим средством получения репрезентативной выборки, подверженной причудам ошибки выборки, которая встречается повсеместно. Поэтому, когда была получена случайная выборка, аналитик должен оценить, в какой степени характеристики выборки соответствуют характеристикам целевой совокупности.

 

Достоверность Статистического Заключения

Статистические выводы не будут действительными, если применяемые статистические тесты не подходят для анализируемых данных. Исследователь должен быть осведомлен о предположениях, лежащих в основе каждого статистического теста, и о том, насколько надежен тест, если эти предположения будут нарушены.

 

Предвзятость

Предвзятость возникает, когда в результатах исследований присутствует систематическая ошибка. Смещение может исходить из нескольких источников, и его можно разделить на две категории: не выборочная ошибка (nonsampling error) и ошибка выборки (sampling error). (2)

Не выборочная ошибка включает в себя смещение без ответа, смещение отбора выборки и систематическую ошибку измерения.

Предвзятость при отборе выборки может наблюдаться в исследованиях недвижимости, которые часто опираются на наблюдательные выборки (например, нельзя считать, что сопоставимая продажа была случайным событием).

Ошибка выборки проистекает из того факта, что случайная выборка может отличаться от генеральной совокупности просто случайно.

 

Надежность

 

Надежность — это степень, в которой «одни и те же данные собирались бы каждый раз при повторных наблюдениях [измерениях] одного и того же явления.» (3)

Надежная модель даст результаты, которые можно считать последовательными, надежными и предсказуемыми.

В качестве примера предположим, что шести оценщикам предлагается измерить один и тот же дом площадью 1 400 кв. футов и рассчитать его улучшенную жилую площадь.

Набор оценок, состоящий из 1 360 квадратных метров, 1 420 квадратных футов, 1 400 квадратных метров, 1 450 квадратных метров, 1 350 квадратных метров и 1 340 квадратных футов, не будет надежным, даже если они охватывают истинную площадь пола.

Однако для сравнения набор оценок, состоящий из 1 440 квадратных футов, 1 435 квадратных футов, 1 445 квадратных футов, 1 445 квадратных футов, 1 440 квадратных футов и 1 435 квадратных футов, был бы более надежным, несмотря на то что он не заключает в скобки истинную площадь пола.

Хотя второй набор оценок жилой площади является более надежным (т.е. предсказуемым и последовательным), расчеты площади пола демонстрируют систематический уклон вверх, что делает этот набор оценок недействительным.

Идеальный набор оценок был бы очень последовательным (надежным) и точным (действительным), например, 1 398 квадратных футов, 1 402 квадратных футов, 1 400 квадратных футов, 1 395 квадратных футов, 1 405 квадратных футов и 1 400 квадратных футов.

Надежность может быть трудно достичь, особенно когда данные поступают из источников, находящихся вне контроля аналитика.

Например, субъективные оценки состояния, качества строительства и привлекательности, предоставляемые третьими лицами, могут быть ненадежными, особенно если мнения высказывают более одного человека. То, что кажется «отличным» для одного человека, может рассматриваться как «выше среднего» или просто «среднее» для другого.

Поскольку надежность может быть трудно оценить и контролировать, рекомендуется подумать о возможных угрозах надежности, которые могут возникнуть.

Если данные поступают из внешнего источника

  • спросите, использовался ли стандартизированный протокол измерения или классификации;
  • выясните, участвовало ли в оценке качества или состояния более одного человека;
  • подумайте о том, как могут возникать ошибки в подсчете очков или измерениях, и произвольно проверяйте погрешность измерения;
  • обратите внимание на использование двусмысленных вопросов, двусмысленных инструкций или своеобразного (технического) языка, который может быть труден для понимания респондентами.

 

Отбор выборки (sampling)

 

Выборка — это подмножество более крупной совокупности, отобранной для исследования. Когда цель исследования состоит в том, чтобы лучше понять большую совокупность, выборка должна быть как можно более похожа на большую совокупность.

Статистики используют термин «репрезентативный» для обозначения сходства выборки с более крупной совокупностью. Когда выборка не является репрезентативной, трудно утверждать, что характеристики выборки указывают на характеристики большей целевой совокупности.

Хотя выборка — это простая концепция, её применение может быть сложным процессом.

Первая задача заключается в получении списка элементов или членов совокупности, которую вы хотите изучить.

Иногда существуют полные или частичные списки. Часто они вообще не существуют, или составители списков не желают предоставлять к ним доступ.

Например, если бы вам было интересно узнать, какой процент домов на озере в вашем штате имеют центральные канализационные системы и сколько из них имеют собственные септические системы, вы могли бы разработать репрезентативную выборку объектов на берегу озера, чтобы получить оценки долей совокупности. Однако получение полного списка объектов на берега озера для того, чтобы сформировать выборку, может быть затруднено. Составление списка владельцев самостоятельно из книги записей округа — один из вариантов, но это займет много времени.

Вероятностные выборки характеризуются знанием вероятности того, что каждый элемент в совокупности будет отобран (включён в выборку).

В не вероятностной выборке вероятность того, что каждый элемент будет отобран (включён в выборку) неизвестна.

Статистические выводы, полученные в результате анализа вероятностных выборок, являются предпочтительными, поскольку выводы, сделанные из не вероятностных выборок могут быть ненадежными и неточными.

 

Вероятностные выборки

 

Существует множество методов формирования вероятностных выборок, и наиболее распространенными из них являются

  • простые случайные выборки
  • стратифицированные случайные выборки
  • систематические случайные выборки
  • кластерные выборки

 

Простые Случайные Выборки

В простой случайной выборке каждый элемент совокупности имеет одинаковую вероятность отбора.

Простая случайная выборка может быть выбрана как с заменой, так и без замены.

При выборке с заменой вероятность отбора для каждого члена совокупности равна 1/N каждый раз, когда производится отбор, где N представляет общую численность популяции.

При выборке без замены вероятность выбора увеличивается по мере выбора элементов.

Вероятность выбора для первого выбранного элемента равна 1/N и уменьшается до 1/(N — 1) для второго выбранного элемента, 1/(N — 2) для третьего выбранного элемента и т. д., поскольку размер неотобранной совокупности уменьшается в процессе отбора выборки.

Формирование выборки с заменой можно рассмотреть, как последовательный выбор карты из полной колоды, замену карты, перетасовку колоды и выбор другой карты.

Напротив, формирование выборки без замены можно рассмотреть, как раздачу карт в покере, когда каждая новая карта в вашей руке сдается из все меньшей и меньшей колоды.

Поскольку каждый элемент в совокупности имеет равную вероятность выбора при данном розыгрыше, простые случайные выборки считаются очень репрезентативными. Тем не менее, все же возможно случайным образом просто случайно выбрать непредставительную выборку. Эта возможность называется ошибкой выборки. Хотя ошибка выборки не может быть полностью устранена, ее можно свести к минимуму за счет формирования более крупных выборок.

 

Стратифицированная Случайная Выборка

Создание стратифицированной случайной выборки начинается с разделения совокупности на подгруппы (известные как страты) на основе одной или нескольких существенных характеристик. Как только это будет сделано, вы можете формировать случайные выборки из каждой страты. Стратифицированные выборки гарантируют, что доля выборки для стратифицирующей характеристики идентична доле совокупности, уменьшая ошибку выборки и повышая точность выводов.

В качестве простого примера значения стратифицированной случайной выборки предположим, что вы хотите использовать выборку, чтобы сделать вывод о средней арендной плате за квартиру в некотором районе рынка. Предположим также, что совокупность квартир содержит квартиры многих видов планировок с разным количеством спален и ванных комнат. Если бы использовалась простая случайная выборка, у вас не было бы уверенности (из-за ошибки выборки), что состав планировок выборки будет идентичен составу планировок совокупности. Хотя смесь в среднем будет одинаковой при повторных случайных выборках, она может отличаться от совокупности в любой отдельной выборке.

Использование стратифицированной выборки позволяет контролировать долю выборки, отбираемой из каждого типа квартир, тем самым контролируя погрешность выборки смеси квартир. Если это сделано, выборочная средняя арендная плата будет являться более точной оценкой средней арендной платы населения.

Когда известен параметр доли в совокупности, стратифицированная случайная выборка, отражающая долю совокупности, обычно дает наиболее точные выводы.

Вы можете задаться вопросом: «Если стратифицированная случайная выборка повышает точность выводов, почему это не делается часто?» Основная причина заключается в недостаточном понимании доли в совокупности по одной или нескольким важным характеристикам. Например, простая стратификация, описанная в предыдущем абзаце, не может быть выполнена, если пропорции смешения единиц в совокупности неизвестны.

 

Систематическая Случайная Выборка

Систематическая выборка — это именно то, что подразумевает ее название, — система, используемая для отбора выборки.

Систематическая выборка обычно включает в себя отсортированные данные, такие как бухгалтерские записи, поданные по дате, или медицинские записи, поданные в алфавитном порядке.

Например, если вы хотите отобрать 1 000 файлов из совокупности 30 000 файлов, вы можете выбрать каждый 30-й файл.

Затем вы можете случайным образом выбрать файл из первых 30 файлов в качестве отправной точки, а затем выбрать каждый 30-й файл после начальной точки.

Если вы случайно выбрали начиная с файла 14, ваша выборка будет состоять из файлов 14, 44, 74, 104 и так далее.

Хотя систематическая выборка может показаться удобной, она может создать проблемы, когда существует систематическая закономерность, связанная с тем, как были отсортированы данные. Если это так, то выборка может быть предвзятой.

Скажем, например, вы проводите аудит своей компании и случайным образом просматриваете бухгалтерские записи с 4-го по 23-е число каждого месяца. Вы бы не обрадовались, узнав, что сотрудник, работающий неполный рабочий день, который помогал 14 и 15 числа каждого месяца, растрачивал деньги. Поскольку вы случайно выбрали не те дни для проверки, кража осталась бы нераскрытой. Если бы случайная выборка была взята из каждого месяца года, вероятность выбора 14-го или 15-го дня по крайней мере одного месяца составляла бы 800%. (4)

Структура данных, наряду с неудачной отправной точкой систематической выборки, привела к искажению выборки, непреднамеренно исключив все даты, когда произошла преступная деятельность.

Использование систематической выборки требует оценки вероятности существования паттерна в данных в кадре выборки, который может привести к смещению выборки. Если вы сомневаетесь, используйте другой метод формирования выборок.

 

Кластерная выборка

Кластерная выборка часто используется в географическом разрезе, когда кластеры встречаются естественным образом. Городские кварталы, участки переписи и почтовые индексы являются примерами естественных географических кластеров.

Случайный выбор кластеров и элементов внутри каждого выбранного кластера представляет собой случайную выборку.

Рассмотрим выборку квартир, упомянутую в предыдущем обсуждении стратифицированных случайных выборок. Если не было доступной выборки, вы могли бы сформировать выборку, случайным образом выбрав географические кластеры (например, участки переписи) в пределах исследуемой области, идентифицировав все квартиры в каждом выбранном кластере и случайным образом сформировав выборку из идентифицированных квартир в каждом кластере. Полученная выборка была бы репрезентативной для совокупности, если бы выбранные кластеры были репрезентативными для рынка, а объекты, выбранные из каждого кластера, были репрезентативными для их кластера.

Проблема с этим методом заключается в том, что оценщики знакомы с другими контекстами, а именно с ошибкой компаундирования.

Достижение состояния «репрезентативности» становится многоуровневой конструкцией при использовании кластерной выборки. Если более грубый слой выделения – кластеры — не является репрезентативным, то выборка не будет репрезентативной независимо от того, насколько хорошо выбранные объекты представляют свои кластеры. Если более грубый кластерный слой является репрезентативным, то более сфокусированный слой выделения — объекты внутри каждого кластера — все еще может быть не полностью репрезентативным, если некоторые или все выбранные объекты не представляют их кластер. Из-за этих проблем размер выборки с точки зрения количества кластеров и элементов, выбранных из каждого кластера, должен быть больше, чем размер выборки, необходимый для простой случайной выборки или стратифицированной выборки.

Когда кадр выборки недоступен, кластерная выборка может быть единственной альтернативой. Однако следует позаботиться о том, чтобы кластеры были как можно более репрезентативными для совокупности.

Использование географических данных часто влечет за собой выбор кластеров, которые включают в себя все важные географические переменные рыночной области. В зависимости от ситуации важные географические переменные могут включать

  • Школьные округа
  • Муниципалитеты
  • Округа
  • Возраст районов
  • Относительные доходы домашних хозяйств
  • Продолжительность поездок на работу

 

Самостоятельный выбор и затруднительное положение оценщика

 

Напомним из предыдущего обсуждения обоснованности, что предвзятость отбора выборки может возникнуть в исследованиях недвижимости, которые часто опираются на наблюдательные выборки, поскольку процесс самоотбора отделяет объекты, предлагаемые для продажи, от тех, которые не предлагаются для продажи.

Владельцы недвижимости не выбираются случайным образом, как продающие свои дома каждый месяц. Таким образом, выборка домов «для продажи» или «продано» не может быть репрезентативной для совокупности всех аналогичных объектов на рынке.

Самостоятельный выбор может быть или не быть проблемой, в зависимости от того, если и как проданная недвижимость отличается от непроданной или не предназначенной для продажи.

Вообще говоря, на более широких и активных рынках самостоятельный выбор, скорее всего, не будет иметь значения.

Например, рынок жилья более активен, чем рынок торговых центров, и с меньшей вероятностью будет демонстрировать систематические различия между объектами, предлагаемыми для продажи, и объектами, не предназначенными для продажи.

Тем не менее, некоторые жилые районы могут пострадать от локализованных внешних факторов, таких как экологическая опасность, закрытие завода или изменение доступа. (5)

В таких случаях данные из затронутого местоположения могут не отражать объекты в незатронутых местоположениях.

Сектор объектов для розничной торговли является хорошим примером того, как самостоятельный выбор может повлиять на данные о сделках с недвижимостью.

Предположим, известный и распространенный якорный арендатор прекращает свою деятельность или реорганизуется в результате банкротства, и несколько торговых центров с площадями, занятыми этим якорным арендатором, выставляются на продажу. Если и когда эти объекты будут проданы, они, вероятно, не будут представлять остальные торговые центры на рынке, которые не были связаны с этим арендатором.

Статистический анализ данных о рыночных сделках, искаженных включением этих продаж, может привести к искажению сегмента объектов для розничной торговли, не затронутого закрытием магазинов. Та же логика применима и к сопоставимой арендной плате, связанной с торговыми центрами, имеющими магазины dark anchor stores.

Поскольку недвижимость, предлагаемая для продажи или аренды, представляет собой самоотобранную выборку, а не случайную выборку, оценщики должны позаботиться о том, чтобы анализируемые данные о сделках действительно представляли конкурентный рынок объекта недвижимости.

Опытные оценщики должны быть в состоянии определить влияние, если таковое имеется, самоотбора на рынке, которое может препятствовать включению некоторых данных в данный анализ или исследование.

Кроме того, компетентные оценщики знают, что незнание рынка и неспособность оценить наличие предвзятости в самоотборе на нем требуют помощи кого-то, кто понимает рынок, чтобы достоверно оценить данные о сделках.

 

Не вероятностные выборки

 

Выборки, не поддающиеся проверке, менее полезны для вывода, чем вероятностные выборки, о которых мы говорили до сих пор, потому что выводы, к которым мы можем прийти с помощью статистического анализа не вероятностной выборки, зависят от конкретной выборки.

Информация, полученная из выборочных данных, может быть неприменима к большей совокупности, поскольку нет никакой гарантии, что выборочные данные являются репрезентативными для совокупности.

Например, интернет — опросы, в которых пользователей сайта спрашивают их мнение по таким различным вопросам, как результаты выборов, результаты спортивных соревнований или надвигается ли экономический спад, являются образцами не вероятностности. Результаты такого опроса говорят нам только о том, как доля пользователей веб-сайта, ответивших на этот вопрос, относится к этой проблеме. Но мы не знаем, являются ли респонденты опроса репрезентативными для всех пользователей сайта. Мы также не знаем, отражают ли мнения респондентов мнения населения в целом. Результаты обследования могут быть применимы к населению в целом, но при этом не представлено никаких статистических показателей взаимосвязи такой выборки с населением в целом.

Именно поэтому экспертное, профессиональное оценочное суждение необходимо при применении статистического анализа сопоставимых данных о продажах или аренде к объекту недвижимости или конкретному рынку.

Поскольку генерация сопоставимых данных в значительной степени является процессом самостоятельного отбора, для оценки того, являются ли сопоставимые элементы данных репрезентативными для предмета исследования, требуется экспертная оценка.

При выявлении непредставительных элементов данных эти элементы могут быть либо удалены из анализа, либо помечены для последующей обработки (т.е. попытки статистического контроля и корректировки аспектов транзакций, которые приводят к тому, что они не являются репрезентативными для предметного рынка).

Решение об исключении данных или применении той или иной формы статистического контроля зависит от объема имеющихся данных и причины проведения исследования.

Если сокращенный набор данных, исключающий непредставительные данные, достаточно велик для достоверного исследования, непредставительные данные могут быть исключены.

Например, в жилищном контексте обычно предпочтительнее исключить продажи роскошных домов и продажи домов начального уровня из исследования стоимости домов по средним ценам. Хотя можно статистически контролировать различия между роскошными домами, домами начального уровня и домами средней стоимости, выяснить, какие элементы контроля использовать, может быть непростой задачей.

Однако, если бы нам нужно было знать влияние внешних факторов, таких как уличный шум или близость линий электропередач, на весь рынок жилья, то мы, скорее всего, захотели бы понять влияние внешних факторов во всех ценовых категориях — начального уровня, средней категории и роскошной. Исследование всего рынка жилой недвижимости может также включать в выборку квартиры, кондоминиумы и таунхаусы, в зависимости от объема работ, применимых к заданию.

 

Ошибка выборки

 

Ошибка выборки возникает, когда выборка отличается от совокупности.

При проверке гипотез ошибка выборки может привести к отклонению нулевой гипотезы, которая на самом деле верна, или к отказу отклонить нулевую гипотезу, которая на самом деле ложна.

Любой из этих результатов приведет к неправильному выводу.

В первом случае гипотеза исследования ошибочна, но данные показывают, что это не так.

Во втором случае гипотеза исследования верна, но анализ ее не подтверждает.

 

Результаты проверки гипотез можно свести к четырем возможностям:

 

Но верна не отклонять Но правильный результат
Но ложна отклонить Но правильный результат
Но верна отклонить Но ошибочный результат
Но ложна не отклонять Но ошибочный результат

 

Отклонение истинной нулевой гипотезы называется ошибкой I типа.

При ошибке типа I исследование поддерживает гипотезу исследования, даже если она основана на ложном предположении. Вероятность отклонения истинной нулевой гипотезы символизируется строчной греческой буквой альфа, которая называется уровнем значимости. Вероятность того, что вы не сделаете ошибку типа I (1 — альфа), называется уровнем доверия. Вероятность ошибки типа I можно контролировать, выбрав уровень значимости (альфа) до выполнения статистической проверки нулевой гипотезы. Исследователь принимает решение о приемлемой вероятности отклонения истинной нулевой гипотезы и отклоняет нулевую гипотезу, если статистические результаты находятся на уровне или лучше заданного порога (альфа). Например, если (альфа) установлена на уровне 5%, а статистический результат составляет [альфа] = 3%, результат считается значимым, и нулевая гипотеза отклоняется.

Если это кажется запутанным, посмотрите на это с точки зрения уровня доверия. Установка (альфа) на уровне 5% — это то же самое, что сказать: «Если данные позволяют мне быть на 95% уверенным в правильности моего исследовательского предположения, то я собираюсь отвергнуть нулевую гипотезу и принять исследовательскую гипотезу».

Например, если анализ приводит к альфа = 3%, соответствующий уровень уверенности составляет 97%. В этом случае мы превысили порог 95% — ного уровня достоверности, что подтверждает обоснованность нашей исследовательской гипотезы.

Один из способов защититься от ошибочного отклонения нулевой гипотезы, которая на самом деле верна, — это позаботиться о построении исследовательской гипотезы.

Обратите внимание, что нулевая гипотеза верна только в том случае, если исследовательская гипотеза ложна. Лучшие рассуждения, логика и понимание лежащих в основе явлений помогут защититься от ошибочных исследовательских проектов, которые пытаются поддержать ложные предположения.

Ошибочная неспособность отклонить нулевую гипотезу, которая на самом деле является ложной, известна как ошибка типа II.

В этом случае исследование не подтверждает гипотезу исследования, даже если она основана на истинном предположении.

Вероятность ошибки второго типа обозначается строчной греческой буквой (бета). К сожалению, (бета) не может быть известна с уверенностью, если вы не знаете истинный параметр совокупности, который вы пытаетесь вывести (если вы знаете (бета), почему вы пытаетесь сделать вывод об этом?)

Рассмотрим пример влияния шума дорожного движения на цену жилья.

  • если влияние шума существенно, то вероятность того, что гипотеза исследования не подтвердится, невелика.
  • если эффект действительно существует, но не является существенным, то нам будет труднее продемонстрировать эффект статистически, а это означает, что (бета) будет относительно большой.
  • если эффект транспортного шума невелик, статистический анализ должен быть более «мощным», увеличивая вероятность демонстрации эффекта.

Мощность статистического теста символизируется 1 – (бета).

Статистическая мощность может быть увеличена тремя способами:

  1. Увеличение (альфа). Этот выбор может быть не очень удовлетворительным, если первоначальная логика, лежащая в основе первоначального решения по (альфа), не изменилась. (6)
  2. Увеличение размера выборки. Небольшие эффекты гораздо легче обнаружить с большим количеством данных.
  3. Устранение сбивающих с толку эффектов. В примере с уличным шумом эффект уличного шума может быть замаскирован, если участки, примыкающие к проезжей части, обычно больше, чем участки внутри того же квартала. Контроль размера области исследования в анализе должен улучшить способность модели обнаруживать влияние уличного шума.

 

Соотнесение выбора уровня значимости (альфа) со Стандартным нормальным распределением

 

Выбор (альфа) — это способ указать, насколько далеко — на статистическом расстоянии — среднее значение выборки должно быть от того, каким было бы среднее значение совокупности, если бы нулевая гипотеза была истинной, чтобы отвергнуть нулевую гипотезу.

Рассмотрим простую пару гипотез статистического теста:

 

Но : mu [равно]  0

 

Но : mu [не равно] 0

 

Если мы выберем (альфа) = 0,05 и совокупность будет нормально распределена, то мы скажем: «Если среднее значение выборки составляет 1,96 стандартных отклонений или больше от 0, я отклоню нулевую гипотезу о том, что среднее значение популяции равно 0.»

Почему 1,96 стандартных отклонений? Если мы посмотрим Z = 1,96 в стандартной нормальной таблице, мы найдем вероятность Z [меньше или равна] 1,96 = 0,975. Кроме того, когда мы ищем — 1,96 в стандартной нормальной таблице, мы найдем вероятность Z [меньше или равна] — 1,96 = 0,025. Следовательно,

 

P(-1,96 [меньше или равно] Z [меньше или равно] 1.96) = 0.975 — 0.025 = 0.95.

 

Уровень достоверности 95% связан с (альфа) = 0,05 (5%).

Чтобы быть на 95% уверенным в том, что нулевая гипотеза [mu] = 0 ложна, выборочное среднее [bar.x] должно быть не менее 1,96 стандартных отклонений от 0.

Стандартная нормальная кривая имеет вместе с местоположениями 0 стандартных отклонений (середина кривой) и [+ или -] 1,96 стандартных отклонений. Напомним, что площадь под кривой равна 1 (100%), а площадь под частью кривой равна вероятности нахождения выборочного среднего ([bar.x]) в этом месте, когда истинное среднее значение популяции равно 0.

Посмотрев вверх -1,96 в стандартной нормальной таблице, мы обнаружим, что площадь под кривой слева от -1,96 равна 0,025 (или 2,5% вероятности нахождения в этом месте, если [mu] = 0).

Посмотрев вверх на + 1,96 в стандартной нормальной таблице, мы обнаружим, что площадь под кривой слева от 1,96 составляет 0,975 (97,5%), оставляя 0,025 справа от 1,96 (2,5% вероятности того, что [bar.x] находится в этом месте, если [mu] = 0).

Таким образом, при [alpha] = 0,05 мы можем отвергнуть нулевую гипотезу о том, что [mu] = 0, если [bar.x] [меньше или равно] -1,96 стандартных отклонений от 0 или если [bar.x] [больше или равно] 1,96 стандартных отклонений от 0.

Проверка гипотез — это навык, который развивается на практике.

Итак, давайте рассмотрим примерную проблему.

Предположим, мы взяли интервью у представителя франшизы быстрого питания, и нам сказали, что средняя площадь ресторана сети составляет 2 400 квадратных футов.

Другие источники указывают на то, что средняя площадь помещений для этой конкретной концепции быстрого питания со временем выросла по мере расширения меню и адаптации к новым моделям потребления.

Эта концепция быстрого питания довольно нова для вашего штата, и мы подозреваем, что средняя площадь здесь превышает 2 400 квадратных футов. Мы решаем использовать случайную выборку площадей, чтобы проверить нашу гипотезу, а также решить, что, если мы сможем быть уверены на 90%, мы придем к выводу, что средняя площадь этажей в этом штате превышает 2 400 квадратных футов.

Сначала мы излагаем исследовательскую, нулевую и альтернативную гипотезы, а также уровень значимости, необходимый для отклонения нулевой гипотезы с уверенностью 90%.

Гипотеза исследования: Средняя площадь этажа превышает 2 400 квадратных футов.

 

Но : mu [меньше или равно] 2 400 квадратных футов

 

Но : mu > 2 400 квадратных футов

 

(альфа) = 0,10

 

Обратите внимание, что нулевая гипотеза в этом примере содержит символ «[меньше или равно]», а не символ «=», поскольку исследовательская гипотеза сформулирована как «превышает». Помните, что нулевая и альтернативные гипотезы должны быть взаимоисключающими и коллективно исчерпывающими, поэтому Но должна охватывать все возможности, которые отличаются от На.

Затем мы вычисляем среднее значение выборки и предполагаем, что на данный момент мы знаем стандартное отклонение совокупности (сигма).

 

[bar.x] = 2 560 квадратных футов

 

(сигма) = 114 квадратных футов

 

Z = [bar.x] — [mu] / [sigma] = 2,560 — 2,400 / 114 = 1,40

 

Является ли среднее значение выборки в 2 560 достаточно далеким от 2 400 в статистических терминах, чтобы отвергнуть гипотезу о том, что средняя площадь пола составляет 2 400 квадратных футов или меньше? Мы можем решить этот вопрос одним из двух способов:

  1. Выберите значение Z, связанное с (альфа) = 0,10, и сравните 1,40 с этим порогом уровня значимости.
  2. Оцените вероятность того, что [bar.x] составит 1,40 стандартных отклонений или более от гипотетического среднего значения, и сравните этот результат с требуемым уровнем [альфа] в 10%.

Давайте сделаем это в обоих направлениях.

Значение Z, связанное с (alpha) = 0.10, является значением-назовем его «B» — где P(Z [меньше или равно] B) = 0.90.

Таблица стандартных норм указывает, что это происходит со значением приблизительно 1,28 стандартных отклонений. Значение 1.28 называется критическим значением Z, поскольку для отклонения нулевой гипотезы требуется результат [bar.x] этой величины или более. (7)

Поскольку 1,40 больше критического значения 1,28, вы можете отклонить нулевую гипотезу.

С другой стороны, стандартная нормальная таблица показывает, что вероятность того, что Z будет меньше или равно 1,40, равна 0,919. Таким образом, уровень значимости (альфа), указанный в выборке, составляет 0,081, что меньше 0,10, поэтому мы можем отвергнуть нулевую гипотезу и заявить с уверенностью не менее 90% (или, точнее, 91,9%), что средняя площадь пола в этом состоянии превышает 2 400 квадратных футов.

В статистике вероятность значения Z, равная 0,081, называется p-значением, которое представляет собой вероятность того, что результат [bar.x] составит 1,40 стандартных отклонения от 2 400, при условии, что нулевая гипотеза верна.

В этом примере мы отвергли нулевую гипотезу, основанную на так называемом тесте с одним хвостом. Нулевая гипотеза содержит утверждение [меньше или равно], поэтому нам нужно беспокоиться только о правом хвосте распределения Z, чтобы проверить правильность нулевой гипотезы.

Аналогично, если нулевая гипотеза содержит утверждение [больше или равно], то мы будем заниматься только левым хвостом распределения Z (также однохвостый тест). Когда нулевая гипотеза содержит оператор=, она может быть отклонена в любом хвосте распределения Z, что называется двухвостым тестом.

С практической точки зрения это упражнение, хотя и довольно простое в статистическом плане, может быть полезно для оценки того, значительно ли старая площадь меньше, чем новые требования к магазинам, в поддержку оценки функционального устаревания.

Или он может поддерживать анализ наиболее эффективного использования площади, корректируя соотношение площади в соответствии с текущей тенденцией в размере магазина.

 

Размер выборки

 

Как только вы решите собрать выборочные данные для статистического исследования, вы сразу же столкнетесь с вопросом о том, сколько данных вам нужно.

Решение этого вопроса может быть простым или сложным, в зависимости от ситуации.

Если вы намерены изучить средние значения выборки или пропорции выборки, расчет размера выборки может быть простым результатом выбора точности, которую вы ожидаете достичь, и включения этой информации в простое уравнение.

Если исследование включает сбор данных путем опроса, размер выборки должен быть скорректирован для не отвечающих и неподходящих респондентов. Конечно, вы можете не знать, со сколькими из них вы столкнетесь, пока не завершите опрос. (8)

Однако имейте в виду, что если вы планируете использовать регрессионную модель, выборка должна быть достаточно большой, чтобы вместить все переменные, которые вам, возможно, потребуется включить в модель.

К сожалению, вы можете заранее не знать, сколько переменных необходимо в модели, что является запутанной проблемой.

 

Размер выборки для оценки средних значений

Предположим, вы хотите оценить среднюю арендную плату за однокомнатные квартиры из выборки, репрезентативной для всех односпальных квартир в вашем городе.

Необходимый размер выборки можно рассчитать, как только вы примете три решения:

  1. Уровень уверенности, который вам необходим
  2. Степень точности, которую вы ожидаете достичь
  3. Оценка стандартного отклонения арендной платы за односпальную квартиру в городе

Уровень доверия, который вам нужен, равен 1 – (альфа). Поэтому это решение определяет (альфа), который необходим для оценки размера выборки.

Степень точности, которую вы ожидаете достичь, указывается в единицах измерения.

Например, если вы оцениваете среднюю арендную плату, степень точности указывается в долларах. Степень точности называется ошибкой выборки, которая обозначается как e.

Стандартное отклонение (сигма) оцениваемой переменной будет неизвестно и должно быть оценено. Методы оценки (сигма) включают ссылки на предыдущие исследования, проведение небольшого пилотного исследования или исследование диапазона интересующей переменной (диапазон часто будет примерно в 6(сигма) для нормального распределения).

Уравнение для оценки размера выборки, необходимого для оценки среднего значения популяции, выглядит следующим образом

 

n = [Z. sup.2][[sigma].sup.2]/[e.sup.2]

 

Снова взяв пример аренды квартиры с одной спальней, предположим, что вы определились с уровнем достоверности 95%, ожидаете точности в пределах [+ или -] 10,00 долларов и оцениваете диапазон ежемесячной арендной платы за квартиры с одной спальней в районе рынка в 120 долларов (от 650 до 770 долларов).

Основываясь на этих факторах, вы выбираете Z = 1,96 на основе (альфа) = 0,05 и стандартного нормального распределения, e = 10 и (сигма) = $20 = $120 / 6. Необходимый размер выборки

 

n = [Z. sup.2][[sigma].sup.2]/[e.sup.2] = [1.96.sup.2] x [20.sup.2]/[10.sup.2] = 15.36

 

Расчеты размера выборки, как правило, округляются, поэтому вы хотели бы получить случайную выборку по крайней мере из 16 арендуемых квартир с одной спальней.

Предположим, вам требуется большая точность, чем [+ или -]$10. Например, вам может потребоваться больше статистических данных для сравнения средней арендной платы за два типа квартир с одной спальней (например, с отдельным балконом и без него). Предположим, вам нужно уменьшить ошибку выборки с 10 до 5 долларов, чтобы иметь достаточную статистическую мощность для обнаружения эффекта частных балконов. Как это требование влияет на размер выборки?

 

n = [Z. sup.2][[sigma].sup.2]/[e.sup.2] = [1,96.sup.2] x [20.sup.2]/[5.sup.2] = 61,47

 

Объем выборки, по существу, увеличивается в четыре раза до 62. Это подчеркивает важный момент: увеличение статистической мощности является «дорогостоящим», когда стоимость указана с точки зрения размера выборки.

Сокращение ошибки выборки вдвое увеличивает размер выборки в четыре раза, а уменьшение ошибки выборки до одной четверти от суммы, показанной в этом примере (2,50 доллара США), увеличит размер выборки в 16 раз. Связь между размером выборки и ошибкой выборки экспоненциальна из-за члена [e.sup.2] в знаменателе уравнения размера выборки.

 

Размер выборки для оценки пропорций

Как американцы, мы привыкли читать об оценках пропорций во время выборов. Следующее было сообщено агентством Reuters накануне первичных президентских выборов в Нью-Гэмпшире 8 января 2008 года:

Опрос Reuters/CSPAN/Zogby показал, что Обама с перевесом в 10 пунктов опережает Клинтон в штате с 39% до 29%, поскольку он набрал волну импульса после своей победы в Айове.

Погрешность (e) для приведенного выше утверждения, как сообщалось в другом месте, составила [+ или -] 4,4%.

Предполагая уровень значимости 0,05, опрошенный был на 95% уверен, что доля голосов Обамы составляла от 54,6% до 45,4%, а доля Клинтон — от 24,6% до 55,4%. Основываясь на этой информации, мы можем сделать вывод, что, как мы вскоре увидим, было опрошено примерно 496 респондентов.

Уравнение для размера выборки, необходимого для оценки доли населения, выглядит следующим образом:

 

n = [Z. sup.2] p (p — 1) / [e.sup.2]

 

где Z-стандартное нормальное значение, связанное с уровнем достоверности, e-погрешность, а p-оценка доли населения.

Для большинства оценок доли p устанавливается равным 0,50, поскольку эта доля максимизирует значение p(1 — p), гарантируя, что выборка достаточно велика независимо от истинной доли населения.

Возвращаясь к первичному президентскому опросу в Нью-Гэмпшире, мы можем применить уравнение для размера выборки, чтобы вывести количество респондентов:

 

n = [Z. sup.2](1 — p)/[e.sup.2] = [1.96.sup.2] x 0.50(1 — 0.50)/[0.44.sup.2] = 496

 

Теперь давайте рассмотрим более практическую проблему для оценщика. Предположим, вы хотите оценить долю недавних мигрантов в городе, которые выбирают арендное жилье, а не домовладение в течение первого года проживания. Предполагая, что вы можете получить список недавних мигрантов, из которых можно сделать выборку (например, из записей электрической компании), вы можете определить количество респондентов, которые вам понадобятся, определив уровень доверия и допустимую погрешность. Если вы установите [alpha] = 0,05 и e = 2%, количество случайно выбранных ответов, которые вам понадобятся, будет равно:

 

n = [1,96.sup.2] x .50(1 — 0,50)/[0,02.sup.2] = 2,401

 

Сравнивая президентский опрос с выборкой выбора жилья, приведенной выше, мы видим, что снижение погрешности (от 4,4% до 2%) резко увеличивает размер выборки и связанные с этим затраты. Поэтому мы должны тщательно рассмотреть вопрос о том, какова достаточная погрешность и связанное с этим количество времени и денег, чтобы посвятить сбору данных.

 

Источник: Wolverton M. L. (2009), Research design, hypothesis testing, and sampling, Appraisal Journal, September 22, 2009, https://www.thefreelibrary.com/Research+design%2c+hypothesis+testing%2c+and+sampling.-a0214455078

Материал этой статьи первоначально был опубликован как глава 6 в книге Marvin L. Wolverton, An Introduction to Statistics for Appraisers (Chicago: Appraisal Institute, 2009).

 

Сноски

(1.) Рекомендуемым источником для обсуждения обоснованности и надежности при разработке и осуществлении исследований является Mary L. Smith and Gene V. Glass, Research and Evaluation in Education and the Social Sciences (Boston: Allyn and Bacon, 1987).

David M. Levine, Timothy C. Krehbiel, and Mark L. Berenson, Business Statistics:A First Course, 3rd ed. (Upper Saddle River, N.J.: Prentice Hall, 2003), 23-25.

(3.) Earl Babble, The Practice of Social Research, 6th ed. (Belmont, Calif.: Wadsworth, 1992).

(4.) Предполагая 30-дневный месяц, вероятность случайного выбора 14-го или 15-го числа каждого месяца составляет 2 + 30 или 1/5. За 12 месяцев это составляет 12/15, или 80%.

(5.) Локализованные внешние факторы отличаются от общерыночных внешних факторов, влияющих на все объекты недвижимости. Например, волна ликвидационных выкупов жилья в 2008/2009 годах определяла рынок во многих регионах, и можно было бы законно ожидать, что репрезентативная выборка будет включать выкупленные объекты недвижимости и влияние цены выкупа, если таковые имеются.

(6.) Поскольку выбор высокого уровня значимости уменьшает [бета], влияние на [бета] должно было учитываться при первоначальном выборе [альфа].

(7.) Попробуйте вычислить критическое значение, связанное с 0,90, используя макрос «=NORMINV» в Excel, чтобы получить более точное критическое значение 1,2816.

(8.) Возможно, лучшим справочником для разработки выборочных обследований и максимизации частоты ответов является Don Dillman, который написал серию книг по этой теме и является признанным экспертом. Его последняя книга — » Mail and Internet Surveys: The Tailored Design Method (Hoboken, N.J.: John Wiley & Sons, 2007). Если вы не собираетесь проводить веб-опрос, то одной из его старых книг будет достаточно.