<<
>>

Некоторые виды статистических графиков

Возможности пакета STATISTICA позволяют построить несколько сотен различных графиков. Я лишь приведу краткое описание и примеры построения тех из них, которые, на мой взгляд, позволяют дать наиболее полную визуальную картину данных.

В разделе Stats 2D Graphs приведены различные виды двухмерных графиков. Из них наиболее удобными являются Histograms (Гистограммы), Scatterplots (Диаграммы двумерного рассеяния), Normal Probability Plots (Графики на нормальной вероятностной бумаге) и Box Plots (Графики "коробка-усы").

? Двумерные гистограммы. Если диапазон значений анализируемой выборки разбить на несколько равных по протяженности частей и указать количество вариантов, входящих в каждый из этих интервалов, то получится график, называемый гистограммой. Чтобы построить двумерные диаграммы, из раздела Stats 2D Graphs меню Graphs (Графики) необходимо выбрать подраздел Histograms. Это приведет к появлению диалогового окна 2D Histograms, где надо нажать кнопку Variables, после чего во втором открывшемся окне щелкнуть по имени нужного столбца и нажать кнопку ОК. Таким образом, под кнопкой Variables в окне 2D Histograms появится имя того столбца, на основании данных которого будет построена гистограмма. В других частях этого диалогового окна можно задать тип графика в разделе Graph Туре и подобрать функцию распределения в разделе Fit Туре. Устанавливая флажок Categories и изменяя числовые значения в расположенной рядом строке, можно выбрать определенное число интервалов, на которое надо разбить весь диапазон значений (рис. III.64).

Рис. III.64. Двумерная гистограмма

? Диаграммы двумерного рассеяния. На диаграммах двумерного рассеяния отображается зависимость между двумя типами переменных. При этом по оси X приведены значения независимых переменных из одного столбца, а по оси Y — соответствующие им значения из другого.

Таким образом, если таблица ввода состоит из 2 столбцов, то в каждой из строк содержатся числовые данные, на пересечении которых на плоскости диаграммы будут формироваться соответствующие точки.

Чтобы построить этот тип графиков, сначала нужно нажать кнопку Graphs на панели инструментов, а затем в разделе Stats 2D Graphs выбрать подраздел Scatterplots. Выполнение этого действия открывает окно Scatterplots, где для построения диаграммы следует задать переменные, указать тип графика и, если необходимо, наложить на график кривую любой из указанных функций. Последовательность выполняемых действий при вводе переменных в общих деталях является такой же, как и в случае построения гистограмм. Единственное отличие состоит лишь в том, что необходимо задать не один, а два вида переменных. При этом номера столбцов, переменные которых надо расположить по осям X и Y, следует указать в нижних строках второго диалогового окна под соответствующими надписями X и Y. Тип графика задается в разделе Graph Туре, выбор функции — в окне Fit. Следует отметить, что в разделе Ellipse вы можете задать границы доверительного интервала. Для этого нужно установить флажок Conf. и ввести в расположенную рядом строку, ширину интервала (в долях единицы). Завершается настройка нажатием кнопки ОК. Примером этого типа графиков является диаграмма корреляции веса и роста в определенной группе пациентов (рис. III.65).

Рис. III.65. Диаграмма двумерного рассеяния

? Распределение по нормальному закону. Указанный тип графиков позволяет определить, подчиняется ли распределение случайных величин в полученной выборке нормальному закону распределения. Как и в предыдущих случаях, для построения указанного типа графиков нужно в меню Graph выбрать раздел Stats 2D Graphs, а в появившемся подменю — подраздел Normal Probability Plots. Открывается диалоговое окно, в котором аналогичным образом нужно задать имя столбца, содержащего анализируемые переменные.

Завершается настройка нажатием кнопки ОК (рис. III.66).

Рис. III.66. График функции, подчиняющейся нормальному закону

? Графики "коробка-усы”. Для построения этого типа графиков необходимо выполнить такую же последовательность действий, как и в предыдущих случаях, с тем только отличием, что в подменю нужно выбрать подраздел Box Plots. После этого в разделе Graph Туре диалогового окна Box Plots указать тип графика (Box-Whiskers — "коробка с усами", Boxes — только "коробка", Whiskers — только "усы", Columns — графики в виде колонок) и задать переменные. Особенность ввода переменных состоит в том, что во втором диалоговом окне Select Variables for Box Plot требуется указать как переменные, так и значения категорий. В том случае, когда графики типа "коробка-усы" строятся для отображения структуры изучаемой статистической выборки, задавать значения в строке Box Categories не требуется. Напротив, в строке Variables вы можете указать несколько переменных. Для этого в указанную строку надо ввести номера тех столбцов, на основании данных которых вам необходимо построить данный тип графиков. Номера вводимых столбцов следует отделять друг от друга пробелом. В случае выбора нескольких переменных в расположенной рядом строке нужно выбрать надпись Multiple, чтобы все построенные графики располагались в одной координатной сетке.

Другие настройки этого типа графиков включают изменения параметров "коробки", "усов" и срединной точки. В тех случаях, когда распределение переменных анализируемой выборки описывается нормальным законом, в качестве разделительной срединной точки лучше выбрать среднее арифметическое. Для этого в строке Value раздела Middle Point нужно выбрать опцию Mean. Если же распределение переменных не подчиняется нормальному закону, более точно характеризуют структуру опытной выборки не средние арифметические величины, а значения медианы.

Поэтому в этих случаях для построения графика следует щелкнуть в строке Value по надписи Median. Выбирая в строке Style значение Line (Линия) или же Point (Точка), вы установите форму разделительной срединной точки.

Помимо медианы и средних арифметических величин структуру выборки характеризуют значения перцентилей, минимальных и максимальных значений. Для установки минимальных и максимальных значений в строке Value раздела Whisker установить надпись Міп-Мах. Установка верхней границы первого перцентиля и нижней — последнего осуществляется в разделе Box. В строке Value следует выбрать надпись Percentiles, а в строке Coefficient указать ширину отдельного перцентиля. После этого в строке Outliers нужно выбрать вариант Off. Как и в предыдущих случаях, после установки всех интересующих вас параметров нажать кнопку ОК (рис. III.67).

Рис. III.67. График "коробка-усы"

В разделе Stats 3D Sequential Graphs (Трехмерные последовательные графики) приведены графики, построенные в трехмерной системе координат. Однако следует отметить, что при построении графиков из указанного раздела не наблюдается связи между значениями трех различных независимых переменных. Из этого семейства графиков наиболее удобными являются Raw Data Plots (Большой выбор объемных диаграмм) и Bivariate Histograms (Бивариантные гистограммы).

? Raw Data Plots (Большой выбор объемных диаграмм). При помощи графиков этого типа можно изобразить в одной координатной сетке одновременно структуру нескольких анализируемых выборок. Например, госпитализация в течение года пациентов с диагнозом "инфаркт миокарда", обратившихся в различные сроки после начала болевого приступа (рис. III.68). В данном случае независимые выборки — это сроки поступления после начала болевого приступа.

Рис. III.68. Обьемная диаграмма

Характерной особенностью указанного типа графиков является отсутствие зависимости между значениями различных типов независимых переменных.

Причем, лишь маркировка оси Z формируется на основании значений независимой переменной, которые располагаются в ячейках одного и того же столбца, тогда как за основу маркировки оси X принимается число наблюдений (то есть строк), а за основу маркировки оси Y — количество независимых переменных (то есть столбцов).

Чтобы построить график этого типа, следует в меню Graphs выбрать команду Stats 3D Sequential Graphs, а затем из подменю — команду Raw Data Plots. Открывается диалоговое окно, где вы должны задать переменные и тип графика, после чего нажать кнопку ОК.

? Bivariate Histograms (Бивариантные (перекрестные) гистограммы). Этот тип графиков напоминает двухмерные диаграммы рассеяния, т. к. в нем отражается зависимость одного типа переменных от другого. Однако в указанных графиках также отображается и то, в каком количестве наблюдений были получены идентичные данные. Например, если представить описанную ранее корреляцию веса и роста в группе больных в виде бивариантной гистограммы, то график примет вид, приведенный на рис. III.69. Из графика видно, что только у двух пациентов совпали параметры роста и веса. Маркировка оси X определяется числовыми значениями одного типа переменных (расположены в ячейках какого-то одного столбца), а маркировка оси Y — числовыми значениями другого типа переменных (расположены в ячейках какого-то другого столбца). За основу маркировки оси Z принимается количество наблюдений (то есть строк). Формирование указанного типа графиков происходит путем выбора из меню Graphs команды Stats 3D Sequential Graphs, а затем команды Bivariate Histograms. В открывшемся окне вам нужно указать, значения какой переменной расположить по оси X, а какой — по оси Y. После ввода данных нажать кнопку ОК.

Рис. III.69. Бивариантная (перекрестная) гистограмма

В разделе Stats 3D XYZ Graphs можно построить трехмерные графики, в которых отражена зависимость между значениями всех трех типов переменных. Из этого семейства графиков я хочу остановиться на описании трехмерных диаграмм рассеяния.

В указанном типе диаграмм отображена зависимость между значениями трех независимых переменных, полученных в каждом отдельном случае наблюдения. Например, если в описанной ранее группе пациентов в таблицу ввода, содержащую параметры роста и веса, добавить данные о пульсе и построить трехмерную диаграмму рассеяния, то она примет следующий вид (рис. III.70). Построение этих графиков осуществляется выбором из меню Graphs команды Stats 3D XYZ Graphs, а затем команды Scatterplots. Далее в появившемся диалоговом окне нужно указать переменные, выбрать тип графика и нажать кнопку ОК.

Рис. III.70. Трехмерная диаграмма рассеяния

<< | >>
Источник: Герасевич В. А.. Самоучитель. Компьютер для врача. — СПб.: БХВ-Петербург,2002. — 640 с.. 2002

Еще по теме Некоторые виды статистических графиков: