12.2.1. Гистограммы



Гистограммой называется график, аппроксимирующий по случайным данным плотность их распределения. При построении гистограммы область значений случайной величины (а,b) разбивается на некоторое количество bin сегментов, а затем подсчитывается процент попадания данных в каждый сегмент. Для построения гистограмм в Mathcad имеется несколько встроенных функций. Рассмотрим их, начиная с самой сложной по применению, чтобы лучше разобраться в возможностях каждой из функций.

Гистограммы с произвольными интервалами

  •  hist (intvls,x) — вектор частоты попадания данных в интервалы гистограммы:

  •  intvls — вектор, элементы которого задают сегменты построения гистограммы в порядке возрастания a<intvlsi<b;
  •  х — вектор случайных данных.


Если вектор intvls имеет bin элементов, то и результат hist имеет столько же элементов. Построение гистограммы иллюстрируется листингом 12.8 и рис. 12.6.

Листинг 12.8. Построение гистограммы

Для анализа взято N=1000 данных с нормальным законом распределения, созданных генератором случайных чисел (третья строка листинга). Далее определяются границы интервала (upper, lower), содержащего внутри себя все случайные значения, и осуществляется его разбиение на количество (bin) одинаковых сегментов, начальные точки которых записываются в вектор int (предпоследняя строка листинга).

ПРИМЕЧАНИЕ

В векторе int можно задать произвольные границы сегментов разбиения так, чтобы они имели разную ширину.




Рис. 12.6. Построение гистограммы (продолжение листинга 12.8)


Обратите внимание, что в последней строке листинга осуществлена нормировка значений гистограммы, с тем чтобы она правильно аппроксимировала плотность вероятности, также показанную на графике.

Гистограммы с равными интервалами

Если нет необходимости задавать сегменты гистограммы разной ширины, то удобнее воспользоваться упрощенным вариантом функции hist:

  •  hist (bin, х) — вектор частоты попадания данных в интервалы гистограммы:

  •  bin — количество сегментов построения гистограммы;
  •  х — вектор случайных данных.


Для того чтобы использовать этот вариант функции hist вместо предыдущего, достаточно заменить первый из ее аргументов в листинге 12.8 следующим образом:

Недостаток упрощенной формы функции hist в том, что по-прежнему необходимо дополнительно определять вектор сегментов построения гистограммы.

От этого недостатка свободна функция histogram:

  •  histogram (bin, х) — матрица гистограммы размера binx2, состоящая из столбца сегментов разбиения и столбца частоты попадания в них данных:

  •  bin — количество сегментов построения гистограммы;
  •  х — вектор случайных данных.


Примеры использования функции histogram приведены в листинге 12.9 и на рис. 12.7. Сравнение с предыдущим листингом подчеркивает простоту построения гистограммы этим способом (стоит отметить, что в листинге 12.9, в отличие от предыдущего, мы не нормировали гистограмму).

Листинг 12.9. Упрощенный вариант построения гистограммы



Рис. 12.7. График и матрица гистограммы (продолжение листинга 12.9)


ПРИМЕЧАНИЕ

Для того чтобы назначить двумерному графику тип гистограммы, в диалоговом окне Formatting Currently Selected Graph (Форматирование) установите на вкладке Traces (Графики) тип списка bar (Столбцы) или solidbar (Гистограмма). На рис. 12.6 и 12.7 применены установки второго типа: закрашенными столбиками (solidbar).