Теория проблем, связанных с пересечениями рассмотрена, например, в книге Крамера Г. и Лидбеттера М. [ 5 ].
Можно определить как ?(t) некоторую случайную величину, определяемую процессом Х(t):
(2.16.)
и
(2.17.)
Тогда Z
(t) – та часть времени 0 ? t ? T , которую процесс Х(t) проводит над уровнем ПДК. (см. рис. 1.1).
Из теоремы Фубини следует, что среднее значение величины Z
(T) задается соотношениями:
(2.18.)
Ясно, что при соотношении эта величина может быть близка к нулю.
Таким образом, следуя требованиям стандарта, значения функции Х(t) могут сколько угодно раз касаться уровня ПДК, но не должны пересекать его на всем интервале 0 ? t ? T. Однако, нужно иметь ввиду, что если приведенные на рис. 2.2. превышения , определенны за время , то эти превышения не правомерно рассматривать как нарушения стандарта качества воздуха.
Таким образом, четко определяется задача оценки санитарно-гигиенической обстановки. Это – оценка возможных экстремальных значений концентрации за отчетный период 0 ? t ? T, отнесенных к определенным временам осреднения и сопоставление их с соответствующими границами допуска, отнесенными к тем же самым временам осреднения.
Оценки экстремальных значений могут быть сделаны разными способами, в том числе и простым и естественным перебором всех (n) экспериментальных значений, что обычно и делается в производственной практике. На самом деле, это может привести к учету заведомо ошибочных данных, кроме того не дает возможности объективно оценить частоты и вероятности.
Кроме того, метод перебора не дает гарантии «хорошей» оценки экстремума концентрации, так как на практике приходится иметь дело с выборками ограниченного объема, то есть с ситуациями, когда действительное число измерений концентрации за контрольный период времени Т = 1 год, гораздо меньше соответствующего объема генеральной совокупности n N. Если же промежуток времени между отдельными измерениями ?t = 0, то метод перебора оправдан, но не позволяет, все-таки, исключить ошибочные и «выскакивающие», то есть не принадлежащие данной статистической совокупности значения. Кроме того, в этом случае, возможно наличие корреляционной связи между членами временного ряда, что ведет к необходимости обработки лишней информации.
Таким образом, во всех случаях целесообразно находить экстремальные значения при помощи какого-либо алгоритма.
У одномерной выборки, состоящей из (n) значений, всегда имеются, по крайней мере, два конечных и однозначно определяемых экстремальных значения и также конечная широта, являющаяся разностью между этими значениями. На первый взгляд кажется, что нахождение экстремума совсем простая задача, достаточно лишь расположить (n) выборочных значений в порядке возрастания их величины и рассмотреть значения, стоящие на i – ом месте от начала или конца ( в дальнейшем нас будет интересовать i – е верхнее значение), тогда при i=n получаются экстремальные значения. На самом деле экстремальные значения, как и любая порядковая статистика, обладают выборочной неустойчивостью и определяются свойствами генеральной совокупности, поэтому правильнее их находить по выборке при помощи каких-либо специальных алгоритмов.
Как известно [40], порядковые статистики представляют собой зависимые случайные величины (даже если исходная совокупность независимая) и поэтому описывается некоторым совместным распределением. Если функция распределения случайной переменной в генеральной совокупности и функции плотности f(x) непрерывны, то в выборке объемом (n) функция плотности распределения i-й порядковой статистики выражаются формулой:
(2.19.)
Математическое ожидание i – й порядковой статистики дается выражением:
(2.20.)
Где – переменная интегрирования.
Дисперсия i – й порядковой статистики определяется из выражения:
Где
(2.21.)
Ковариация между i-й и j-й порядковыми статистиками (I < j) вычисляется по формуле:
(2.22.)
Где
Нормированный коэффициент корреляции:
(2.23.)
Очевидно, что эти формулы очень сложны и малопригодны для аналитического исследования. Что касается распределения наибольшего значения Х
, то событие
X
? X эквивалентно пересечению событий
Следовательно,
(2.24.)
Тогда, (2.25.)
(2.26.)
Последнее выражение позволяет оценить X
если есть информация о распределении генеральной совокупности. Для нормальной или логнормальной функции распределения, оценки математических ожиданий i – х порядковых статистик могут быть выполнены только численным интегрированием на ЭВМ.
Если известны распределение и плотность генеральной совокупности F(X) и f(X), то можно находить любой контрольный уровень (X
) с любой вероятностью его не превышения (превышения) из уравнения:
(2.27.)
Например, для стандартного нормального распределения :
(2.28.)
Из последнего выражения видно, что оценки вида X
=?+3? является хорошей оценкой экстремального значения по выборке. Аналогичные оценки можно получить и для логнормального распределения. Какую же величину вероятности следует задавать для оценки экстремального значения? Однозначных рекомендаций нет. Используют уровень 2?, то есть 95% и 3?, то есть 99,7%. Задают и более жесткие границы, например, для частоты экстремального значения в работе [35] рекомендуется уровень 0,01%.
Конечно, одни нормы более «мягкие», другие более «жесткие», но на практике можно было бы ограничиться любыми уровнями, обеспечивающими вероятность не превышения 95%, главным является понимание того, что любая граница допуска может быть задана с определенной вероятностью ее не превышения. В данной работе предполагается детально исследовать этот вопрос и выдать конкретные рекомендации для практического использования.
Существует еще один аспект проблемы оценки санитарно-гигиенической обстановки, который связан со стационарностью рассматриваемых случайных функций (случайных процессов).
Этот вопрос имеет принципиальное значение, прежде всего для возможности применения эргодической гипотезы (общей эргодической теоремы – предельной теоремы для среднего значения случайных функций) [42]. В общем случае математическое ожидание и дисперсия случайной функции сами являются функциями времени. Если эти функции представляют собой долгопериодные регулярные колебания (как в случае метеорологических рядов), то они могут быть выявлены методами гармонического анализа и использованы для прогноза. В случае же нерегулярных колебаний, как возможность диагностики, так и прогноза становится проблематичной.