Столбец 7 книги Покупок

Картинка

Добавил: admin
Формат файла: RAR
Оценка пользователей: Рейтинг (4,2 из 5)
Дата добавления: 18.04.2018
Скачиваний: 5988 раз(а)
Проверен Dr.Web: Вирусов нет

Скачать

Одним из первых шагов анализа является табуляция данных. Табуляция данных может быть очень изощренной, например, как в показанной выше таблице, где на самом деле объединено несколько таблиц. Столбец 7 книги Покупок начнем с самых простых таблиц.

В этой таблице табулирована переменная цвета рубашки у 27 встреченных мужчин. Таблица называется одномерной, так как в ней табулирована только одна переменная — цвет рубашки.

Вы можете видеть, насколько удобно табличное представление. Табулируя, например, доход, можно проанализировать различные группы населения по уровню дохода. Таким образом, возникают категоризованные переменные. Часто категоризованную переменную можно рассматривать как некоторую классификацию исходной числовой переменной.

Например, количество посетителей сайта в течение дня можно отнести к определенным временным отрезкам, например, к часам. Вы легко можете построить соответствующую группировку. Однако имеется много ситуаций, когда категоризованная переменная не выражается в терминах какой-либо исходной числовой переменной, а определяется самой природой данных.

Internet, книги, посвященные языкам программирования, научным программам и т. В свою очередь, пользователи могут быть разбиты на классы: начинающие пользователи, продвинутые пользователи, профессионалы и т. Рассмотрим файл данных о продажах. Эти данные измерены в количественной шкале.

Предположим, что нас интересует только факт покупки данного товара. Тогда количественная шкала явно избыточна. Покажем, как это сделать в системе STATISTICA. Дважды щелкнем на имени переменной КОЛБАСЫ.

Авторская рецензия на «Столбец 7 книги Покупок»

Подробное описание

1-я переменная в файле данных. Такие переменные называют также индикаторными, т. Подобную категоризацию можно выполнить для всего списка товаров.

В итоге получим файл данных, состоящий из столбец 7 книги Покупок 0 и 1. Заметим, что подобного рода таблицы, содержащие индикаторные переменные, весьма часто появляются в медицинских исследованиях. В них строка — пациент, переменные — симптомы болезни. Единица отмечает, что у данного пациента присутствует данный симптом, 0 — симптом отсутствует.

Такого типа таблицы будут подробно рассмотрены также в главе Анализ соответствий. Теперь ещё раз напомним идею категоризации, потому что эта идея является ключевой. Итак, идея состоит в том, чтобы разбить множество разнородных наблюдений на однородные группы с помощью определенных признаков, отражающих существо задачи, и провести дальнейшее исследование в каждой группе отдельно. Такие группы гораздо проще анализировать, чем исходную корзину с разнородными данными.

Выводы

Например, множество всех покупателей можно поделить на две группы — купивших и не купивших мороженое, или на четыре группы — купивших мороженое и купивших сыр, купивших мороженое и не купивших сыр, не купивших мороженое и купивших сыр, не купивших мороженое и не купивших сыр и т. В STATISTICA таблицы строятся в модуле Основные статистики и таблицы. Конкретный способ построения таблиц зависит от целей исследования.

Скачать

Врач может табулировать частоты различных симптомов заболевания в зависимости от возраста и пола пациентов, социолог имеет возможность построить сводную таблицу результатов опроса и оценить связи между ответами мужчин и женщин отдельно. В области образования можно табулировать число учащихся, покинувших среднюю школу, в зависимости от возраста, пола и этнического происхождения. Экономисту может понадобиться свести в таблицу количество банкротств в зависимости от вида промышленности, региона и начального капитала, а исследователю спроса классифицировать потребителей в зависимости от доходов.

Менеджеры, размещающие рекламу в Internet, могут интересоваться частотой посещения различных сайтов в отдельные дни недели. Более серьезной задачей является установление цен на продукцию с целью эффективного способа организации продаж: имеются разные категории пользователей, например, учебные заведения, государственные организации, коммерческие структуры и т. Покупательские возможности разных категорий различны, поэтому разбиение на группы, когда вы имеете дело не со средним покупателем, а с покупателем из определенной группы, выглядит совершенно естественно. Далее в одной таблице можно табулировать значения двух переменных, тогда возникают таблицы сопряженности.

В крайнем правом столбце с литером ВСЕГО даются суммы значений по строкам таблицы. В последней строке показаны суммы значений, подсчитанные по столбцам.

Это так называемые маргинальные частоты. Метрдотелю достаточно взглянуть на таблицу, чтобы представить, сколько было посетителей разного пола в различные дни недели.