Содержание
В справочной системе SPSS не указана явно принадлежность ANOVARM к одной или другой группе статистических методов. По сути расчетов ANOVARM близок к многомерному дисперсионному анализу, поскольку в качестве зависимой переменной выступают сразу несколько переменных, кодирующих ряд временных периодов. Зависимые переменные в ANOVARM по смыслу (с точки зрения исследователя) представляют собой фактически одну и ту же переменную, только измеренную многократно.
В этой трактовке следует скорее говорить о специфической форме одномерного дисперсионного анализа, в котором зависимая переменная представлена набором подпеременных (точно так же, как при кодировании многовариантных вопросов; см. раздел 1.4.2). Таким образом, мы придерживаемся точки зрения тех авторов, которые считают ANOVARM видом одномерного дисперсионного анализа . Завершают вывод результатов двухфакторного анализа таблицы с расчетами апостериорных тестов. В нашем случае они практически такие же, как в предыдущем примере, поскольку переменная Возраст сохранила свою значимость (см. рис. 3.14 и 3.15). Однако при интерпретации таблицы Multiple Comparisons следует помнить о неравенстве дисперсий. Поэтому значимость различий между отдельными возрастными группами надо устанавливать на основании второй части таблицы Tamhane.
Вторая таблица Independent Samples Test позволяет установить статистическое различие между данными значениями. В случае t-тестов для независимых выборок под независимыми выборками понимаются бинарные категории (то есть варианты ответа) какой-либо переменной. Например, мужчины и женщины (вопрос Пол респондента), покупатели и не покупатели какого-либо продукта (вопрос Покупаете ли Вы данный продукт?) и т. То есть когда есть два уровня группирующей (зависимой) переменной и несколько независимых переменных, на основании которых и будет выполняться различие между группами зависимой переменной. 3.35 представлены результирующие таблицы Homogenous Subsets, по которым можно сделать выводы относительно различий между отдельными категориями независимых переменных на основании обеих рассматриваемых зависимых переменных.
Все статистические процедуры, относящиеся к группе процедур, которые позволяют выявить такие различия (t-тесты и дисперсионный анализ), сравнивают респондентов на основании средних значений переменных. Иными словами, провести различие можно на основании двух или более числовыхпеременных. Таблица Multivariate Tests позволяет сделать выводы относительно влияния независимых переменных в отдельности, а также их взаимодействий на зависимые переменные в целом. Поскольку с практической точки зрения влияние не несет никакой смысловой нагрузки, данная таблица обычно не рассматривается. В результате мы выясняем, какой из трех факторов — пол, возраст или время (кварталы) — определяет различия в оценках одежды марки Х.
Затем из раскрывающегося списка Build Term выберите тот или иной тип взаимодействия между переменными. И наконец, щелкните на соответствующей кнопке, чтобы перенести сформированную пользовательскую модель в правый список Model. Поэтому при ограничениях, налагаемых аппаратным обеспечением компьютера, следует отказаться от использования полнофакторных моделей в пользу определяемых пользователем . Если ограничения жесткие, можно выполнить только исследования влияния независимых переменных на зависимую по отдельности (в терминологии SPSS, Main effects)1.
Однако визуального различия между категориями недостаточно для того, чтобы с уверенностью констатировать наличие статистически значимого различия. На установление статистической значимости различий между целевыми группами респондентов и направлены процедуры, объединенные под названием «Анализ различий». По оси ординат здесь (вертикальная ось) располагаются средние значения кратности покупок глазированных сырков каждой из рассматриваемых половозрастных групп. Так, мужчины младше 18 лет характеризуются существенно меньшей кратностью покупок сырков, чем женщины младше 18 лет.
Обратите внимание, что одновременно можно сформировать в правом списке Model сколько угодно различных моделей, подбирая только основные, необходимые вам взаимодействия факторов.
Если дихотомических переменных нет, следует выбрать переменную с наименьшим четным количеством категорий и перекодировать данные категории в дихотомию. Для горизонтальной оси следует выбирать именно данную (уже дихотомическую) переменную. Данный способ работает далеко не всегда, ведь часто различия между взаимодействиями факторов находятся именно в тех категориях, которые будут перекодированы (сокращены). 3.2 приведены основные характеристики переменных, участвующих в различных видах дисперсионного анализа.
Мужчины в возрасте до 18 лет имеют наименьшую кратность покупок и по сравнению со всеми другими половозрастными группами. Мужчины в возрасте 19–35 лет характеризуются наивысшей кратностью покупок сырков среди всех возрастных групп мужчин. Можно заметить, что ситуация с женщинами в двух рассматриваемых возрастных группах диаметрально противоположная. Мужчины младше 18 лет имеют наименьшую кратность покупок; женщины младше 18 лет — наивысшую.
Теперь щелкните на кнопке Add, чтобы подтвердить построение графика с заданными параметрами. Так, если предположить, что влияние переменной Пол статистически значимо, из рис. 3.18 можно было бы заключить, что женщины покупают глазированные сырки в больших объемах по сравнению с мужчинами. Случается, что по результатам таблицы Tests of Between-Subjects Effects некая переменная оказывается незначимой, однако в таблице Multiple Comparisons отдельные уровни этой переменной значимо отличаются друг от друга.
Если линии на отрезке между двумя категориями данной переменной не пересекаются — различий нет; если пересекаются — различия есть. 3.22 представлен пример максимальных различий https://deveducation.com/ (линии пересекаются под прямым углом); на рис. Итак, в данной главе мы рассмотрели статистические методы, применяемые для анализа различий между целевыми группами респондентов.
При помощи кнопок Post Hoc и Options необходимо выбрать те же параметры, которые мы выбирали для одно- и двухфакторного анализа. В результате останется не рассмотренной одна важная кнопка в главном диалоговом окне Plots, позволяющая указать параметры для построения графиков. Эту кнопку следует использовать в тех ситуациях, когда обнаружено статистически значимое взаимодействие между факторами.
Итак, вы задали все переменные для исследования и можете использовать кнопки, расположенные в нижней части этого диалогового окна, — так же, как вы делали это при одномерном дисперсионном анализе (см. раздел 3.2.1). В окне Post Hoc задайте апостериорные тесты Scheffe (для равных дисперсий) и Tumhale (для неравных дисперсий) для переменных, имеющих более двух категорий (в нашем случае это только q74 — Возраст). В окне Options выберите параметр Homogeneity Tests и в соответствующее поле поместите переменные с двумя категориями, для которых следует рассчитать средние значения (q80 — Пол и все взаимодействия, в которых она участвует). Остальные диалоговые окна аналогичны рассмотренным для одномерного дисперсионного анализа, поэтому мы не приводим их второй раз. В диалоговом окне Model можно задать и другие значения, но для большинства задач маркетинговых исследований достаточно оставлять все эти значения по умолчанию. То же самое касается и кнопки Contrasts (исследование взаимодействий между уровнями независимых переменных), а также кнопки Save, позволяющей сохранять некоторые значения.
В первой таблице, One-Sample Statistics, отражены расчеты среднего значения исследуемой переменной (столбец Mean). В нашем случае данное значение отражает среднюю оценку питания пассажиров первого класса (4,1 балла). Вторая таблица, One-Sample Test, позволяет сделать вывод о статистической значимости/незначимости тестируемого различия. (2-tailed), различие в оценках пассажиров первого класса и всей выборочной совокупности респондентов является статистически незначимым . Разница между реальным и тестируемым значениями (в нашем случае — 0,1 балла) отражается в столбце Mean Difference. Линейное распределение может показывать, что данные группы респондентов действительно различаются (например, мужчин в выборке в два раза больше, чем женщин).
Также в этих таблицах вы видите однородные кластеры респондентов, различающиеся частотой и кратностью покупок глазированных сырков. Многомерный дисперсионный анализ является дальнейшим расширением одномерного дисперсионного анализа (после рассмотренного в разделе Мультивариантное тестирование 3.2.2 ANOVARM), предназначенным для одновременного анализа сразу нескольких зависимых и независимых переменных. Дело в том, что некоторые источники иногда относят анализ с повторными измерениями к одномерному, а иногда — к многомерному дисперсионному анализу.
Несмотря на то что данные методы (особенно обобщенная линейная модель) достаточно сложны для изучения, их применение позволяет поднять аналитическую работу на существенно более высокий уровень. Для иллюстрации процесса построения графиков предположим, что по результатам трехфакторного дисперсионного анализа была установлена статистическая значимость взаимодействия между переменными q3 (Пол) и q4 (Возраст). В окне Profile Plots мы поместили переменную с наименьшим числом категорий q3 в поле Horizontal Axis, а переменную q4 — в поле Separate Lines.
Выше мы упомянули о специальном тесте, позволяющем установить равенство/неравенство дисперсий. На необходимость проведения данного теста (так же как и многих других) можно указать в диалоговом окне Options, вызываемом одноименной кнопкой в главном диалоговом окне Univariate (рис. 3.11). Для однофакторного дисперсионного анализа можно ограничиться только одним тестом Levene на равенство дисперсий (параметр Homogeneity tests). Как было сказано выше, одномерный дисперсионный анализ исследует влияние одной или нескольких независимых переменных на одну зависимую. Одномерный дисперсионный анализ может быть однофакторным (one-way ANOVA) или многофакторным (n-way ANOVA). В первом случае есть только одна независимая переменная; во втором — несколько.