Математика случая

Сжато, но строго рассмотрены вероятностно-статистические основы современных статистических методов. Изложение доведено до переднего края научных исследований и практических разработок. Рассмотрены все основные понятия, используемые при применении современных статистических методов. Особое внимание уделено непараметрическим подходам, статистике нечисловых данных и другим перспективным элементам высоких статистических технологий. Учебное пособие рекомендовано Всероссийской ассоциацией статистических методов.
Для инженеров, менеджеров, экономистов, специалистов различных отраслей народного хозяйства, научных работников, студентов, слушателей, аспирантов и преподавателей, для всех, кому нужно в сжатые сроки овладеть понятийной базой статистических методов.

Аннотация к исходному варианту книги

Введение

Статистика есть наука об обработке данных. Статистические методы основаны на вероятностных моделях. С обработкой результатов наблюдений, измерений, испытаний, опытов, анализов имеют дело специалисты почти во всех областях научных исследований. Шесть нобелевских премий получены эконометриками, — специалистами по статистическим методам в экономике.

Современная теория вероятностей основана на аксиоматике Андрея Николаевича Колмогорова. Однако в России специалисты и научные работники, студенты и преподаватели пока недостаточно знакомы с последними достижениями в области вероятностно-статистических методов, хотя ссылки на них постоянно встречаются в научно-технической, деловой и учебной литературе.

Эта книга кратко, но на современном уровне расскажет об основных вероятностно-статистических понятиях и фактах. Кто ещё не знаком с этой ведущей областью современной науки, смогут быстро дойти до фронта исследований, а те, кто уже́ изучал основы теории вероятностей и математической статистики, быстро восстановят и повысят свои знания и смогут умело применять их в своей работе. В частности, применять профессиональные статистическое программное обеспечение, нормативно-техническую и инструктивно-методическую документацию.

Специалисту

Инженеру, менеджеру, экономисту, научному работнику… — практически любому специалисту приходится применять методы исследования, основанные на теории вероятностей и статистике. Но многим их трудно освоить.

Студенту

В специальных дисциплинах часто используются вероятностно-статистические методы и модели. Значит, надо уметь в них разобраться. То, что было сдано годы назад, уже́ забыто, да и недостаточно для решения новых задач.

Не стоит искать старые конспекты и заново читать толстые учебники. Надо быстро освежить свои знания или снова, на этот раз ускоренно, познакомиться с основными фактами теории вероятностей и статистики. Эта книга — для вас!

Профессионалу

Вы постоянно обрабатываете данные. Но вероятностно-статистические методы и модели развиваются. Отслеживаете ли вы изменения? Вы знаете, что критерий Стьюдента устарел и что следует использовать вместо него? Хорошо ли знаете статистику нечисловых данных? Если да, то эта книга для вас слишком проста. Если же нет — приглашаем ознакомиться с современным взглядом на теорию вероятностей и статистику.

Сравнение с аналогами

Как познакомиться с терминологией незнакомой области? Первая мысль — из энциклопедии, такой как «Вероятность и математическая статистика» ^[1]. Однако толщина энциклопедии обескураживает, а большинство статей в ней доступны лишь математикам-профессионалам.

Делались попытки составлять более или менее полные сводки терминов, определений и обозначений. Например, в учебник ^[2] по эконометрике нами включена такая сводка. Однако получить целостное представление о необходимой для освоения учебника базовой области знания таким образом невозможно.

Аналогами являются многочисленные учебники и учебные пособия по теории вероятностей и математической статистике, как части типового курса высшей математики, и по общей теории статистики как части экономического образования. У всех этих изданий два изъяна: во-первых, содержат много сведений, не используемых впоследствии в практической работе, хотя и полезных при первоначальном изучении предмета; во-вторых, не дают достаточно сведений о современных статистических методах. Они не освещают многие методы, входящие в программные средства по обработке данных и статистическим вычислениям, такие как SPSS, Stata, Statistica, или MATLAB.

Замысел книги

Поныне существует разрыв между типовыми курсами по математической статистике и государственными стандартами по статистическим методам управления качеством промышленной продукции (http://www.centerprioritet.ru/tc125/index.htm). Первоначальный вариант этой книги стремился заполнить его.

Похожие проблемы имеются и в других направлениях: в социально-экономической области (в экономике, менеджменте, социологии), в научных медицинских исследованиях.

Стала очевидной необходимость создания нового рода книг, предназначенных для информационной поддержки современных разработок с использованием статистических методов. Такие книги должны давать краткое, но законченное введение в используемые ныне статистические методы.

Структура книги

Краткое, но законченное введение в используемые ныне статистические методы даёт эта книга. По ходу изложения постоянно отмечаются возможности применения рассматриваемых концепций при решении практических задач. Конкретные методы обработки данных здесь почти не разбираются, но даётся вся необходимая база для восприятия описаний таких методов. Это и есть основная задача книги.

О содержании книги исчерпывающее представление даёт оглавление. Доказательства теорем не приводятся. Лишь во главе, посвящённой опытам с конечным числом исходов, приводятся элементарные доказательства. Автор неоднократно проводил занятия для школьников и студентов по материалам этой главы.

Замечание для математиков-профессионалов. В изложении удалось обойти ряд математических сложностей. Хотя математические основы теории вероятностей предполагают использование σ-алгебр событий (измеримых множеств) и интеграла Лебега, прикладникам эти понятия едва нужны, и в книге им внимания не уделяется. Поэтому же не акцентируется внимание на условиях справедливости центральной предельной теоремы, и так далее.

Даны контрольные вопросы и задачи, а также примерные темы докладов, рефератов и исследовательских работ. В приложении дан краткий перечень основных тем задач прикладной статистики, широко используемых в практической деятельности и в научных исследованиях. Обширность этого перечня показывает, что конкретным статистическим методам должны быть посвящены отдельные издания достаточно большого объёма.

Содержимое книги прошло многолетнюю и всестороннюю проверку. Оно использовалось во многих других отечественных и зарубежных образовательных и иных организациях. Автор благодарен своим многочисленным коллегам, слушателям и студентам, прежде всего различных образовательных структур Московского государственного технического университета имени Н. Э. Баумана, за полезные обсуждения.

С текущей научной информацией по статистическим методам можно познакомиться на сайте автора «Высокие статистические технологии» http://orlovs.pp.ru, его форуме http://forum.orlovs.pp.ru, а также на ранее разработанных сайтах, http://antorlov.chat.ru, http://antorlov.euro.ru.

Достаточно большой объём информации содержит еженедельная рассылка «Эконометрика», выпускаемая с июля 2000 года (о ней рассказано на указанных выше сайтах). Автор искренне благодарен редактору этого электронного издания А. А. Орлову за многолетний энтузиазм по выпуску еженедельника.

В книге раскрыто представление о случае, вероятности и статистике, соответствующее общепринятому в мире. Возможны различные точки зрения по частным вопросам; Автор с радостью примет вопросы и замечания.

Нужность математической статистики

Теория вероятностей и математическая статистика суть основы вероятностно-статистических методов обработки данных. Данные мы обрабатываем и анализируем прежде всего для принятия решений. Чтобы воспользоваться современным математическим аппаратом, необходимо рассматриваемые задачи выразить в терминах вероятностно-статистических моделей.

Применение конкретного вероятностно-статистического метода состоит из трёх этапов:

Переход от экономической, управленческой, технологической реальности к абстрактной математико-статистической схеме, то есть построение вероятностной модели системы управления, технологического процесса, процедуры принятия решений, в частности по результатам статистического контроля, и тому подобного.
Проведение расчётов и получение выводов чисто математическими средствами в рамках вероятностной модели.
Толкование математико-статистических выводов применительно к реальной ситуации и принятие соответствующего решения (например, о соответствии или несоответствии качества продукции установленным требованиям, необходимости наладки технологического процесса), в частности, заключения (о доле дефектных единиц продукции в партии, о конкретном виде законов распределения контролируемых параметров технологического процесса и подобном).

Математическая статистика применяет понятия, методы и результаты теории вероятностей. Далее рассматриваем основные вопросы построения вероятностных моделей в разнообразных случаях. Подчеркнём, что для активного и правильного использования нормативно-технических и инструктивно-методических документов по вероятностно-статистическим методам нужны предварительные знания. Так, необходимо знать, при каких условиях следует применять тот или иной документ, какие исходные данные нужны для его выбора и применения, какие решения должны быть приняты по результатам обработки данных, и так далее.

Примеры применения теории вероятностей и математической статистики

Рассмотрим несколько примеров, когда вероятностно-статистические модели являются хорошим средством решения задач.

В романе Алексея Николаевича Толстого «Хождение по мукам» (том 1) говорится: «мастерская даёт двадцать три процента брака, этой цифры вы и держи́тесь, — сказал Струков Ивану Ильичу». Как понимать эти слова в разговоре руководителей завода? Eдиница продукции не может быть дефектна на 23 %. Она может быть либо годной, либо дефектной. Наверноe, Струков мыслил, что в партии большого объёма содержится примерно 23 % дефектных единиц продукции. Тогда возникает вопрос: а что значит «примерно»? Пусть из 100 проверенных единиц продукции 30 окажутся дефектными, или из 1000 — 300, или из 100 000 — 30 000… Надо ли обвинять Струкова во лжи?

Монетка, используемая как жребий, должна быть «симметричной»: в среднем в половине случаев подбрасывания должен выпадать орёл, а в половине случаев — решка. Но что означает «в среднем»? Если провести много серий по 10 бросаний в каждой серии, то часто будут встречаться серии, в которых монетка 4 раза выпадает орлом. Для симметричной монеты это будет происходить в 20,5 % серий. А если на 100 000 бросаний окажется 40 000 орлов, то можно ли считать монету симметричной? Процедура принятия решений строится на основе теории вероятностей и математической статистики.

Пример может показаться несерьёзным. Это не так. Жеребьёвка широко используется при организации промышленных технико-экономических экспериментов. Например, при обработке результатов измерения показателя качества (момента трения) подшипников в зависимости от различных технологических факторов (влияния консервационной среды, методов подготовки подшипников перед измерением, влияния нагрузки подшипников в процессе измерения и тому подобных). Допустим, нужно сравнить качество подшипников в зависимости от результатов хранения их в разных консервационных маслах. При планировании такого эксперимента возникает вопрос, какие подшипники следует поместить в масло одного состава, а какие — в другое, но так, чтобы избежать субъективизма и обеспечить объективность принимаемого решения. Ответ может быть получен с помощью жребия.

Аналогичный пример можно привести и с контролем качества любой продукции. Чтобы решить, соответствует или не соответствует контролируемая партия продукции установленным требованиям, из неё выбирается представительная часть: по этой выборке судят о всей партии. Поэтому желательно, чтобы каждая единица в контролируемой партии имела одинаковую вероятность быть выбранной. В производственных условиях выбор единиц продукции обычно делают не жребием, а по специальным таблицам случайных чисел или с помощью компьютерных датчиков случайных чисел.

Похожие проблемы обеспечения объективности сравнения возникают при сопоставлении различных схем организации производства, оплаты труда, при проведении тендеров и конкурсов, подбора кандидатов на вакантные должности. Всюду нужна жеребьёвка или подобные ей меры.

Пусть надо выявить наиболее сильную и вторую по силе команду при организации турнира по олимпийской системе (проигравший выбывает). Допустим, что более сильная команда всегда побеждает более слабую. Ясно, что самая сильная команда однозначно станет чемпионом. Вторая по силе команда выйдет в финал только когда до финала у неё не будет игр с будущим чемпионом. Если такая игра запланирована, то вторая по силе команда в финал не попадёт. Тот, кто планирует турнир, может либо досрочно «выбить» вторую по силе команду из турнира, сведя её в первой же встрече с лидером, либо обеспечить ей второе место, обеспечив встречи с более слабыми командами вплоть до финала. Чтобы избежать субъективизма, проводят жеребьёвку. Для турнира из 8 команд вероятность того, что в финале встретятся две самые сильные команды, равна 4 из 7. Соответственно с вероятностью 3 из 7 вторая по силе команда покинет турнир досрочно.

При любом измерении единиц продукции (с помощью штангенциркуля, микрометра, амперметра…) имеются погрешности. Чтобы выяснить, есть ли систематические погрешности, необходимо многократно измерить единицы продукции, характеристики которой известны (например, стандартного образца). При этом следует помнить, что кроме систематической погрешности присутствует и случайная погрешность.

Встаёт вопрос, как по измерениям выявить систематическую погрешность. Если отмечать только, является ли полученная при очередном измерении погрешность положительной или отрицательной, то эту задачу можно свести к уже́ рассмотренной. Действительно, сопоставим измерение с бросанием монеты: положительную погрешность — с выпадением орла, отрицательную — решки (нулевая погрешность при достаточном числе делений шкалы практически никогда не встречается). Тогда проверка отсутствия систематической погрешности эквивалентна проверке симметричности монеты.

Итак, задача проверки на систематическую погрешность сведена к задаче проверки симметричности монеты. Проведённые рассуждения приводят к так называемому «критерию знаков» в математической статистике.

При статистическом регулировании технологических процессов на основе методов математической статистики разрабатываются правила и планы статистического контроля процессов, направленные на своевременное обнаружение разладки технологических процессов и принятия мер к их наладке и предотвращению выпуска продукции, не соответствующей установленным требованиям. Эти меры нацелены на сокращение издержек производства и потерь от поставки некачественных единиц продукции. При статистическом приёмочном контроле на основе методов математической статистики разрабатываются планы контроля качества путем анализа выборок из партий продукции. Сложность заключается в том, чтобы уметь правильно строить вероятностно-статистические модели принятия решений. В математической статистике для этого разработаны вероятностные модели и методы проверки гипотез, в частности, гипотез о том, что доля дефектных единиц продукции равна определённому числу $p_{0}$ , например, $p_{0}=0{,}23$ .

Задачи оценивания

В ряде ситуаций возникают задачи оценки характеристик и параметров распределений вероятностей.

Рассмотрим пример. Пусть на контроль поступила партия из $N$ электроламп. Из этой партии случайным образом выбрано $n$ электроламп. Возникает ряд естественных вопросов. Как по результатам испытаний элементов выборки определить средний срок службы электроламп, с какой точностью можно оценить эту характеристику? Как изменится точность, если взять выборку большего объёма? При каком числе часов $T$ можно уверять, что не менее 90 % электроламп прослужат $T$ и более часов?

Предположим, что при испытании выборки дефектными оказались $X$ электроламп. Какие границы можно указать для числа $D$ дефектных электроламп в партии, для уровня дефектности ${\frac {D}{N}}$ и тому подобного?

Или при статистическом анализе точности и стабильности технологических процессов надлежит оценить такие показатели качества, как среднее значение контролируемого параметра и степень его разброса в рассматриваемом процессе. Согласно теории вероятностей в качестве среднего значения случайной величины целесообразно использовать её математическое ожидание, а в качестве статистической характеристики разброса — дисперсию, среднеквадратичное отклонение или коэффициент вариации. Возникают вопросы: как оценить эти статистические характеристики по выборочным данным и с какой точностью это удаcтся сделать?

Аналогичных примеров можно привести много. Здесь важно показать, как теория вероятностей и математическая статистика могут быть использованы в инженерных и управленческих задачах.

Вероятностно-статистические методы и оптимизация

Идея оптимизации пронизывает прикладную математическую статистику и иные статистические методы. А именно, методы планирования экспериментов, статистического приёмочного контроля, статистического регулирования технологических процессов и другие. С другой стороны, оптимизационные постановки в теории принятия решений, например, прикладная теория оптимизации качества продукции и требований стандартов, предусматривают широкое использование вероятностно-статистических методов, прежде всего прикладной математической статистики.

В производственном управлении, в частности, при оптимизации качества продукции и требований стандартов особенно важно применять статистические методы на начальном этапе жизненного цикла продукции, этапе научно-исследовательской подготовки опытно-конструкторских разработок (разработка перспективных требований к продукции, аванпроекта, технического задания на опытно-конструкторскую разработку). Это объясняется ограниченностью информации, доступной на начальном этапе жизненного цикла продукции, и необходимостью прогнозирования технических возможностей и экономической ситуации на будущее. Статистические методы должны применяться на всех этапах решения задачи оптимизации: при шкалировании переменных, разработке математических моделей функционирования изделий и систем, проведении технических и экономических экспериментов и тому подобном.

В задачах оптимизации, в том числе оптимизации качества продукции и требований стандартов, используют все области статистики. А именно, статистику случайных величин, многомерный статистический анализ, статистику случайных процессов и временны́х рядов, статистику объектов нечисловой природы. Разработаны рекомендации по выбору статистического метода для анализа конкретных данных ^[3].

Коротко об истории

Математическая статистика как наука начинается с работ Карла Фридриха Гаусса, на основе теории вероятностей исследовавшего и обосновавшего метод наименьших квадратов, созданный им в 1795 году и применённый для обработки астрономических данных (с целью уточнения орбиты карликовой планеты Церера). Его именем часто называют одно из наиболее популярных распределений вероятностей — нормальное, а в теории случайных процессов основной объект изучения — гауссовские процессы.

В конце XIX — начале ХХ века крупный вклад в математическую статистику внесли английские исследователи, прежде всего Карл Пирсон (1857—1936) и Роналд Фишер (1890—1962). В частности, Пирсон разработал критерий «хи-квадрат» проверки статистических гипотез, а Фишер — дисперсионный анализ, теорию планирования эксперимента, метод максимального правдоподобия оценки параметров.

В 30-е годы ХХ века поляк Ежи Нейман (1894—1977) и англичанин Эгон Пирсон развили общую теорию проверки статистических гипотез, а советские математики Андрей Николаевич Колмогоров (1903—1987) и Николай Васильевич Смирнов (1900—1966) заложили основы непараметрической статистики. В 40-е годы ХХ века румын Авраам Вальд (1902—1950) построил теорию последовательного статистического анализа.

Математическая статистика бурно развивается и ныне. За последние 40 лет можно выделить четыре принципиально новых направления исследований:

Разработка и внедрение математических методов планирования экспериментов;
Развитие статистики объектов нечисловой природы как самостоятельного направления в прикладной математической статистике;
Развитие статистических методов, устойчивых по отношению к малым отклонениям от используемой вероятностной модели;
Широкое развёртывание работ по созданию компьютерных пакетов программ, предназначенных для проведения статистического анализа данных.

Современное представление о математической статистике

Под математической статистикой понимают «раздел математики, посвящённый математическим методам сбора, систематизации, обработки и интерпретации статистических данных, а также использованию их для научных или практических выводов. Правила и процедуры математической статистики опираются на теорию вероятностей, позволяющую оценить точность и надёжность выводов, получаемых в каждой задаче на основании имеющегося статистического материала» ^[1] с. 326. При этом статистическими данными называются сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками.

По типу решаемых задач математическая статистика обычно делится на три раздела: описание данных, оценка и проверка гипотез.

По виду обрабатываемых статистических данных математическая статистика делится на четыре направления:

Одномерная статистика (статистика случайных величин), в которой результат наблюдения описывается действительным числом.
Многомерный статистический анализ, где результат наблюдения над объектом описывается несколькими числами (вектором).
Статистика случайных процессов и временны́х рядов, где результат наблюдения — функция.
Статистика объектов нечисловой природы, в которой результат наблюдения имеет нечисловую природу, например, является множеством (геометрической фигурой), упорядочением или получен в результате измерения по качественному признаку.

Исторически первыми появились некоторые области статистики объектов нечисловой природы (в частности, задачи оценивания доли брака и проверки гипотез о ней) и одномерная статистика. Математический аппарат для них проще, поэтому на их примере обычно демонстрируют основные идеи математической статистики.

Лишь те методы обработки данных, то есть математической статистики, являются доказательными, которые опираются на вероятностные модели соответствующих реальных явлений и процессов. Речь идёт о моделях поведения потребителей, возникновения рисков, функционирования технологического оборудования, получения результатов эксперимента, течения заболевания и тому подобного. Вероятностную модель реального явления следует считать построенной, если рассматриваемые величины и связи между ними выражены в терминах теории вероятностей. Соответствие вероятностной модели реальности, то есть её адекватность, обосновывают, в частности, с помощью статистических методов проверки гипотез.

Невероятностные методы обработки данных являются поисковыми, их можно использовать лишь при предварительном анализе данных, так как они не дают возможности оценить точность и надёжность выводов, полученных на основании ограниченного статистического материала.

Вероятностные и статистические методы применимы всюду, где удаётся построить и обосновать вероятностную модель явления или процесса. Их применение обязательно, когда сделанные на основе выборочных данных выводы переносятся на всю совокупность (например, с выборки на всю партию продукции).

В конкретных областях применений используются как вероятностно-статистические методы широкого применения, так и специфические. Например, в разделе производственного менеджмента, посвящённого статистическим методам управления качеством продукции, используют прикладную математическую статистику (включая планирование экспериментов). С помощью её методов проводится статистический анализ точности и стабильности технологических процессов и статистическая оценка качества. К специфическим методам относятся методы статистического приёмочного контроля качества продукции, статистического регулирования технологических процессов, оценки и контроля надёжности и другие.

Широко применяются такие прикладные вероятностно-статистические дисциплины, как теория надёжности и теория массового обслуживания. Содержание первой из них ясно из названия, вторая занимается изучением систем типа телефонной станции, на которую в случайные моменты времени поступают вызовы — требования абонентов, набирающих номера на своих телефонных аппаратах. Длительность обслуживания этих требований, то есть длительность разговоров, также моделируется случайными величинами. Большой вклад в развитие этих дисциплин внесли Александр Яковлевич Хинчин (1894—1959), Борис Владимирович Гнеденко (1912—1995) и другие отечественные учёные.

Основы теории вероятностей

Этот раздел содержит полные доказательства всех рассматриваемых утверждений.

События и множества

Исходное понятие при построении вероятностных моделей в задачах принятия решений — опыт, или испытание. Примеры опытов: проверка качества единицы продукции, бросание игральных костей, исход спортивного матча.

Первый шаг при построении вероятностной модели реального явления или процесса — выделение возможных исходов опыта. Их называют элементарными событиями. Обычно считают, что в первом опыте возможны два исхода — «единица продукции годна» и «единица продукции дефектна». Естественно принять, что при бросании монеты осуществляется одно из двух элементарных событий: «выпала решка» и «выпал орёл». При этом случаи «монета встала на ребро» или «монету не удалось найти» считаем невозможными.

При бросании трёх монет элементарных событий значительно больше. Вот одно из них: «первая монета выпала орлом, вторая — решкой, третья — снова орлом». Перечислим все элементарные события в этом опыте. Для этого обозначим выпадение орла буквой $\mathrm {O}$ , а решки — буквой $\mathrm {P}$ . Имеется $2^{3}=8$ элементарных событий: $\mathrm {OOO}$ , $\mathrm {OOP}$ , $\mathrm {OPO}$ , $\mathrm {OPP}$ , $\mathrm {POO}$ , $\mathrm {POP}$ , $\mathrm {PPO}$ , $\mathrm {PPP}$ . В каждой тройке символов первый показывает результат бросания первой монеты, второй — второй монеты, третий — третьей монеты.

Совокупность всех возможных исходов опыта, всех элементарных событий, называется пространством элементарных событий. Вначале мы ограничимся пространством элементарных событий, состоящим из конечного числа элементов.

С математической точки зрения пространство (совокупность) всех элементарных событий, возможных в опыте, — это некоторое множество, а элементарные события — его элементы. Однако в теории вероятностей для обозначения используемых понятий по традиции применяются свои термины, отличающиеся от терминов теории множеств.

Таблица 1. Соответствие терминов
Теория вероятностей	Теория множеств
Пространство элементарных событий	Множество
Элементарное событие	Элемент множества
Событие	Подмножество
Достоверное событие	Подмножество, совпадающее с множеством
Невозможное событие	Пустое подмножество $\varnothing$
Сумма $A+B$ событий $A$ и $B$	Объединение $A\cup B$
Произведение $AB$ событий $A$ и $B$	Пересечение $A\cap B$
Событие, противоположное $A$	Дополнение $A$
События $A$ и $B$ несовместны	$A\cap B$ пусто
События $A$ и $B$ совместны	$A\cap B$ не пусто

Как сложились два параллельных терминологических ряда? Основные понятия теории вероятностей и её терминология сформировались в XVII—XVIII веках. Теория множеств возникла в конце XIX века независимо от теории вероятностей и получила распространение в ХХ веке.

Принятый ныне аксиоматический подход к теории вероятностей, разработанный Колмогоровым, дал возможность развивать эту дисциплину на базе теории множеств и теории меры. Этот подход позволил рассматривать теорию вероятностей и математическую статистику как часть математики, проводить рассуждения на математическом уровне строгости. В частности, было введено чёткое различие между частотой и вероятностью, случайная величина стала рассматриваться как функция от элементарного исхода, и так далее. За основу методов статистического анализа данных стало возможным брать вероятностно-статистические модели, сформулированные в математических терминах. В результате удалось чётко отделить строгие утверждения от обсуждения философских вопросов случайности, преодолеть подход на основе понятия равновозможности, имеющий ограниченное практическое значение. Наиболее существенно, что после работ Колмогорова нет необходимости связывать вероятности тех или иных событий с пределами частот. Так называемые «субъективные вероятности» получили смысл экспертных оценок вероятностей.

После выхода в 1933 году (на немецком языке, и в 1936 — на русском) основополагающей монографии ^[4] аксиоматический подход к теории вероятностей стал общепринятым в исследованиях в этой области. Во многом перестроилось преподавание. Повысился научный уровень многих прикладных работ. Но всё ещё распространены устаревшие и во многом неверные представления о теории вероятностей и математической статистике. Поэтому в настоящей главе рассматриваем основные понятия, подходы, идеи, методы и результаты в этих областях, необходимые для их квалифицированного применения в задачах различных областей знаний и практической деятельности.

В послевоенные годы Колмогоров формализовал понятие случайности на основе теории информации ^[5]. Грубо говоря, числовая последовательность является случайной, если её нельзя заметно сжать без потери информации. Однако этот подход не был предназначен для использования в прикладных работах и преподавании. Он представляет собой важное методологическое и теоретическое продвижение.

Вероятность события

Перейдём к основному понятию теории вероятностей — вероятности события. В методологических терминах можно сказать, что вероятность события является мерой возможности осуществления события. В ряде случаев естественно считать, что вероятность события $A$ — это число, к которому приближается отношение количества осуществлений события $A$ к общему числу всех опытов (то есть частота осуществления события $A$ ) — при увеличении числа опытов, проводящихся независимо друг от друга. Иногда можно предсказать это число из соображений равновозможности. Так, при бросании симметричной монеты и орёл, и решка имеют одинаковые шансы оказаться сверху, а именно, 1 шанс из 2, а потому вероятности выпадения орла и решки равны $\ {\tfrac {1}{2}}$ .

Однако этих соображений недостаточно для развития теории. Методологическое определение не даёт численных значений. Не все вероятности можно оценивать как пределы частот, и неясно, сколько опытов надо брать. На основе идеи равновозможности можно решить ряд задач, но в большинстве практических ситуаций применить её нельзя. Например, для оценки вероятности дефектности единицы продукции. Поэтому перейдём к определениям в рамках аксиоматического подхода на базе математической модели, предложенной Колмогоровым.

Определение 1. Пусть конечное множество $\Omega =\{\omega \}$ является пространством элементарных событий, соответствующим некоторому опыту. Пусть каждому $\omega \in \Omega$ поставлено в соответствие неотрицательное число $P(\omega )$ , называемое вероятностью элементарного события $\omega$ , причём сумма вероятностей всех элементарных событий равна 1, то есть

\sum _{\omega \in \Omega }P(\omega )=1

. (1)

Тогда пара $\{\Omega ,P\}$ , состоящая из конечного множества $\Omega$ и неотрицательной функции $P$ , определённой на $\Omega$ и удовлетворяющей условию (1), называется вероятностным пространством. Вероятность события $A$ равна сумме вероятностей элементарных событий, входящих в $A$ , то есть определяется равенством

P(A)=\sum _{\omega \in A}P(\omega )

. (2)

Сконструирован математический объект, основной при построении вероятностных моделей. Рассмотрим примеры.

Пример 1. Бросанию монеты соответствует вероятностное пространство с $\Omega =\{\mathrm {O} ,\mathrm {P} \}$ и $P(\mathrm {O} )=P(\mathrm {P} )={\tfrac {1}{2}}$ . Здесь $\mathrm {O}$ означает, что выпал орёл, $\mathrm {P}$ — выпала решка.

Пример 2. Проверке качества одной единицы продукции (в ситуации, описанной в романе А. Н. Толстого «Хождение по мукам», см. выше) соответствует вероятностное пространство с $\Omega =\{N,G\}$ и $P(N)=0,23$ , $P(G)=0,77$ . Здесь $N$ означает негодную единицу продукции, $G$ — годную.

Отметим, что приведённое выше определение вероятности $P(A)$ согласуется с интуитивным представлением о связи вероятностей события и входящих в него элементарных событий, и с распространённым мнением, согласно которому вероятность события $A$ — число от 0 до 1, представляющее предел частоты реализации события $A$ при неограниченном числе повторений одного и того же комплекса условий.

Из определения вероятности события, свойств символа суммирования и равенства (1) вытекает, что

P(\Omega )=1

, (3a)

P(\varnothing )=0

, (3б)

P(A+B)=P(A)+P(B)-P(AB)

. (3в)

Для несовместных событий $A$ и $B$ согласно формуле (3в) $P(A+B)=P(A)+P(B)$ . Последнее утверждение называют также теоремой сложения вероятностей.

Независимые события

При применении вероятностно-статистических методов принятия решений постоянно используется понятие независимости. Например, при применении статистических методов управления качеством продукции говорят о независимых измерениях значений контролируемых параметров у включенных в выборку единиц продукции, о независимости появления дефектов одного вида от появления дефектов другого вида. Независимость случайных событий понимается в вероятностных моделях в следующем смысле.

Определение 2. События $A$ и $B$ называются независимыми, если $P(AB)=P(A)\cdot P(B)$ .

Это определение соответствует интуитивному представлению о независимости: осуществление или неосуществление одного события не должно влиять на осуществление или неосуществление другого.

Иногда соотношение $P(AB)=P(A)\cdot P(B|A)=P(B)\cdot P(A|B)$ , справедливое при $P(A)\cdot P(B)>0$ , называют также теоремой умножения вероятностей. (Если $P(A)\cdot P(B)=0$ , то хотя бы одна из условных вероятностей не определена.)

Утверждение 1. Пусть события $A$ и $B$ независимы. Тогда события ${\overline {A}}$ и ${\overline {B}}$ независимы, события ${\overline {A}}$ и $B$ независимы, события $A$ и ${\overline {B}}$ независимы (здесь надчёркивание означает действие, противоположное данному; другими словами, ${\overline {A}}$ — событие, противоположное $A$ , или в терминах теории множеств: множество ${\overline {A}}$ — дополнение множества $A$ ).

Действительно, из формулы (3в) следует, что для событий $C$ и $D$ , произведение которых пусто, $P(C+D)=P(C)+P(D)$ . Поскольку пересечение $AB$ и ${\overline {A}}B$ пусто, а объединение есть $B$ , то

P(AB)+P({\overline {A}}B)=P(B)

.

$A$ и $B$ независимы, поэтому

P({\overline {A}}B)=P(B)-P(AB)=P(B)-P(A)\cdot P(B)=P(B){\Big (}1-P(A){\Big )}

.

Заметим теперь, что из соотношений (1) и (2) следует, что $P({\overline {A}})=1-P(A)$ . Значит,

P({\overline {A}}B)=P({\overline {A}})\cdot P(B)

.

Вывод равенства $P(A{\overline {B}})=P(A)P({\overline {B}})$ отличается от предыдущего лишь переменой мест $A$ и $B$ всюду.

Для доказательства независимости ${\overline {A}}$ и ${\overline {B}}$ вспомним, что события $AB$ , ${\overline {A}}B$ , $A{\overline {B}}$ и ${\overline {A}}\,{\overline {B}}$ не имеют попарно общих элементов, а в сумме составляют всё пространство элементарных событий. Следовательно,

P(AB)+P({\overline {A}}B)+P(A{\overline {B}})+P({\overline {A}}\,{\overline {B}})=1

.

Воспользовавшись ранее доказанными соотношениями, получаем, что

P({\overline {A}}\,{\overline {B}})=1-P(AB)-P(B){\Big (}1-P(A){\Big )}-P(A){\Big (}1-P(B){\Big )}={\Big (}1-P(A){\Big )}{\Big (}1-P(B){\Big )}=P({\overline {A}})P({\overline {B}})

,

что и требовалось доказать.

Пример 3. Рассмотрим опыт бросания игрального кубика. Считаем, что все грани имеют одинаковые шансы выпасть. Построим соответствующее вероятностное пространство. Покажем, что события «наверху — грань с чётным числом» и «наверху — грань с числом, кратным 3» независимы.

Пространство элементарных исходов состоит из шести элементов: «наверху — грань с 〈целые числа от 1 до 6〉». Событие «наверху — грань с чётным числом» состоит из трёх элементарных событий: когда наверху оказывается 2, 4 или 6. Событие «наверху — грань с числом, кратным 3» состоит из двух элементарных событий — когда наверху оказывается 3 или 6. Поскольку все грани имеют одинаковые шансы оказаться наверху, то все элементарные события должны иметь одинаковую вероятность. Поскольку всего имеется 6 элементарных событий, то каждое из них имеет вероятность ${\tfrac {1}{6}}$ . По определению событие «наверху — грань с чётным числом» имеет вероятность ${\tfrac {1}{2}}$ , а событие «наверху — грань с числом, кратным 3» — вероятность ${\tfrac {1}{3}}$ . Произведение этих событий состоит из одного элементарного события «наверху — грань с 6», а потому имеет вероятность ${\tfrac {1}{6}}$ . Поскольку ${\tfrac {1}{6}}={\tfrac {1}{2}}\cdot {\tfrac {1}{3}}$ , то рассматриваемые события являются независимыми в соответствии с определением независимости.

Независимые испытания

В вероятностных моделях процедур принятия решений с помощью понятия независимости событий можно придать точный смысл понятию «независимые испытания». Для этого рассмотрим сложный опыт, состоящий в проведении двух испытаний. Эти испытания называются независимыми, если любые два события $A$ и $B$ , из которых $A$ определяется по исходу первого испытания, а $B$ — по исходу второго, являются независимыми.

Пример 4. Опишем вероятностное пространство, соответствующее бросанию двух монет независимо друг от друга.

Разбор примера. Пространство элементарных событий состоит из четырёх элементов: $\{\mathrm {OO} ,\mathrm {OP} ,\mathrm {PO} ,\mathrm {PP} \}$ (запись $\mathrm {OO}$ означает, что первая монета выпала орлом и вторая — тоже орлом; запись $\mathrm {PO}$ — первая — решкой, а вторая — орлом, и так далее). Поскольку события «первая монета выпала решкой» и «вторая монета выпала орлом» являются независимыми по определению независимых испытаний и вероятность каждого из них равна ${\tfrac {1}{2}}$ , то вероятность $\mathrm {PO}$ равна ${\tfrac {1}{4}}$ . Аналогично, вероятность каждого из остальных элементарных событий также равна ${\tfrac {1}{4}}$ .

Пример 5. Опишем вероятностное пространство, соответствующее проверке качества двух единиц продукции независимо друг от друга, если вероятность дефектности равна х.

Разбор примера. Пространство элементарных событий состоит из четырёх элементов:

$\omega _{1}$ — обе единицы продукции годны;
$\omega _{2}$ — первая единица продукции годна, а вторая — дефектна;
$\omega _{3}$ — первая единица продукции дефектна, а вторая — годна;
$\omega _{4}$ — обе единицы продукции являются дефектными.

Вероятность того, что единица продукции дефектна, есть $x$ , а потому вероятность того, что имеет место противоположное событие, то есть единица продукции годна, есть $1-x$ . Поскольку результат проверки первой единицы продукции не зависит от такового для второй, то

P(\omega _{1})=(1-x)^{2}

,

P(\omega _{2})=P(\omega _{3})=x(1-x)

,

P(\omega _{4})=x^{2}

.

Условные вероятности

В некоторых задачах прикладной статистики оказывается полезным такое понятие, как условная вероятность $P(B|A)$ — вероятность осуществления $B$ при условии, что $A$ произошло. При $P(A)>0$ по определению

P(B|A)={\frac {P(AB)}{P(A)}}

.

Для независимых событий $A$ и $B$ , очевидно, $P(B|A)=P(B)$ . Это равенство эквивалентно определению независимости. Понятия условной вероятности и независимости введены Абрахамом де Муавром в 1718 году.

Недостаточно попарной независимости событий для их независимости в совокупности. Рассмотрим классический пример ^[6], с. 46. Пусть одна грань тетраэдра окрашена в красный цвет, вторая — в зелёный, третья грань окрашена в синий цвет и четвёртая — во все эти три цве́та. Пусть событие $A$ состоит в том, что грань, на которую упал тетраэдр при бросании, окрашена красным (полностью или частично), событие $B$ — зелёным, событие $C$ — синим. Пусть при бросании все четыре грани тетраэдра имеют одинаковые шансы оказаться внизу. Поскольку граней четыре и две из них имеют в окраске красный цвет, то $P(A)={\frac {1}{2}}$ . Легко подсчитать, что

P(B)=P(C)=P(A|B)=P(B|C)=P(C|A)=P(B|A)=P(C|B)=P(A|C)={\frac {1}{2}}

.

События $A$ , $B$ и $C$ , таким образом, попарно независимы. Но если известно, что осуществились одновременно события $B$ и $C$ , то это значит, что тетраэдр встал на грань, содержащую все три цвета, то есть осуществилось и событие $A$ . Следовательно, $P(ABC)={\frac {1}{4}}$ , в то время как для независимых событий должно быть $P(A)\cdot P(B)\cdot P(C)={\frac {1}{8}}$ . Следовательно, события $A$ , $B$ и $C$ в совокупности зависимы, хотя попарно независимы.

Формула полной вероятности

Предположим, что событие $B$ может осуществиться с одним и только с одним из $k$ попарно несовместных событий $A_{1},A_{2},\dots ,A_{k}$ . Тогда

B=\sum _{j=1}^{k}BA_{j}

,

где события $BA_{i}$ и $BA_{j}$ с разными индексами $i$ и $j$ несовместны. По теореме сложения вероятностей

P(B)=\sum _{j=1}^{k}P(BA_{j})

.

Воспользовавшись теоремой умножения, находим, что

P(B)=\sum _{j=1}^{k}{\Big (}P(A_{j})\cdot P(B|A_{j}){\Big )}

.

Получена так называемая формула полной вероятности. Она широко использовалась математиками при конкретных расчётах ещё в начале XVIII века, но впервые была сформулирована как одно из основных утверждений теории вероятностей Пьером-Симоном Лапласом лишь в конце того века. Она применяется, в частности, при нахождении среднего выходного уровня дефектности в задачах статистического обеспечения качества продукции.

Формулы Байеса

Применим формулу полной вероятности для вывода так называемых формул Байеса, которые иногда используют при проверке статистических гипотез. Требуется найти вероятность события $A_{i}$ , если известно, что событие $B$ произошло. Согласно теореме умножения,

P(A_{i}B)=P(B)\cdot P(A_{i}|B)=P(A_{i})\cdot P(B|A_{i})

.

Следовательно

P(A_{i}|B)={\frac {P(A_{i})\cdot P(B|A_{i})}{P(B)}}

.

Используя формулу полной вероятности для знаменателя, находим, что

P(A_{i}|B)={\frac {P(A_{i})\cdot P(B|A_{i})}{\sum _{j=1}^{k}{\Big (}P(A_{j})\cdot P(B|A_{j}){\Big )}}}

.

Две последние формулы и называют обычно формулами Байеса. Общая схема их использования такова. Пусть событие $B$ может протекать в различных условиях, относительно которых может быть сделано $k$ гипотез $A_{1},A_{2},\dots ,A_{k}$ . Априорные вероятности этих гипотез суть $P(A_{1}),P(A_{2}),\dots ,P(A_{k})$ . Известно также, что при справедливости гипотезы $A_{i}$ вероятность $B$ равна $P(B|A_{i})$ . Произведён опыт, в которым произошло $B$ . Естественно после этого уточнить оценки вероятностей гипотез. Апостериорные оценки вероятностей гипотез $P(A_{1}|B),P(A_{2}|B),\dots ,P(A_{k}|B)$ даются формулами Байеса. В прикладной статистике существует направление байесовская статистика, в которой, в частности, на основе априорного распределения параметров после проведения измерений, наблюдений, испытаний, опытов анализов вычисляют уточнённые оценки параметров.

Случайные величины

Случайная величина — это величина, значение которой зависит от случая, то есть от элементарного события $\omega$ . Таким образом, случайная величина — это функция, определённая на пространстве элементарных событий $\Omega$ . Примеры случайных величин: количество орлов, выпавших при независимом бросании двух монет; число, выпавшее на верхней грани игрального кубика; число дефектных единиц продукции среди проверенных.

Определение случайной величины $X$ как функции от элементарного события $\omega$ , то есть функции $X{:}\;\Omega \to H$ , отображающей пространство элементарных событий $\Omega$ в некоторое множество $H$ , казалось бы, содержит в себе противоречие. О чём идёт речь: о величине или о функции? Дело в том, что наблюдается всегда лишь реализация случайной величины: её значение, соответствующее именно тому элементарному исходу опыта (элементарному событию), которое осуществилось в конкретной реальной ситуации. Наблюдается именно величина. А функция от элементарного события — это теоретическое понятие, основа вероятностной модели реального явления или процесса.

Отметим, что элементы $H$ — это не обязательно числа. Ими могут быть и последовательности чисел (вектора), и функции, и математические объекты иной природы, в частности, нечисловой (упорядочения и другие бинарные отношения, множества, нечёткие множества и другие) ^[2]. Однако наиболее часто рассматриваются вероятностные модели, в которых элементы $H$ — числа, то есть $H=\mathbb {R} ^{1}$ . В иных случаях обычно используют термины «случайный вектор», «случайное множество», «случайное упорядочение», «случайный элемент» и другие.

Математическое ожидание

Рассмотрим случайную величину с числовыми значениями. Часто оказывается полезным связать с этой функцией число — её «среднее значение» или, как говорят, «среднюю величину», «показатель центральной тенденции». По ряду причин, некоторые из которых будут ясны из дальнейшего, в качестве «среднего значения» обычно используют математическое ожидание.

Определение 3. Математическим ожиданием случайной величины $X$ называется число (4)

M(X)=\sum _{\omega \in \Omega }X(\omega )P(\omega )

,

то есть математическое ожидание случайной величины — это взвешенная сумма значений случайной величины с весами, равными вероятностям соответствующих элементарных событий.

Пример 6. Вычислим математическое ожидание числа, выпавшего на верхней грани игрального кубика. Непосредственно из определения 3 следует, что

M(X)=1\cdot {\frac {1}{6}}+2\cdot {\frac {1}{6}}+3\cdot {\frac {1}{6}}+4\cdot {\frac {1}{6}}+5\cdot {\frac {1}{6}}+6\cdot {\frac {1}{6}}={\frac {1+2+3+4+5+6}{6}}={\frac {21}{6}}=3{,}5

.

Утверждение 2. Пусть случайная величина $X$ принимает значения $x_{1},x_{2},\dots ,x_{m}$ . Тогда справедливо равенство (5)

M(X)=\sum _{i=1}^{m}x_{i}P(X=x_{i})

,

то есть математическое ожидание случайной величины — это взвешенная сумма значений случайной величины с весами, равными вероятностям того, что случайная величина принимает определённые значения.

В отличие от (4), где суммирование проводится непосредственно по элементарным событиям, случайное событие $\{X=x_{i}\}=\{\omega {:}\;X(\omega )=x_{i}\}$ может состоять из нескольких элементарных событий.

Иногда соотношение (5) принимают как определение математического ожидания. Однако с помощью определения 3, как показано далее, более легко установить свойства математического ожидания, нужные для построения вероятностных моделей реальных явлений, чем с помощью соотношения (5).

Для доказательства соотношения (5) сгруппируем в (4) члены с одинаковыми значениями случайной величины $X(\omega )$ :

M(X)=\sum _{i=1}^{m}\left(\sum _{\omega {:}\;X(\omega )=x_{i}}X(\omega )\cdot P(\omega )\right)

.

Поскольку постоянный множитель можно вынести за знак суммы, то

\sum _{\omega {:}\;X(\omega )=x_{i}}X(\omega )\cdot P(\omega )=\sum _{\omega {:}\;X(\omega )=x_{i}}x_{i}\cdot P(\omega )=x_{i}\cdot \sum _{\omega {:}\;X(\omega )=x_{i}}P(\omega )

.

По определению вероятности события

\sum _{\omega {:}\;X(\omega )=x_{i}}P(\omega )=P(X=x_{i})

.

Из двух последних соотношений получаем требуемое:

M(X)=\sum _{i=1}^{m}\left(x_{i}\cdot \sum _{\omega {:}\;X(\omega )=x_{i}}P(\omega )\right)=\sum _{\omega {:}\;X(\omega )=x_{i}}{\Big (}x_{i}\cdot P(X=x_{i}){\Big )}

.

Понятие математического ожидания в вероятностно-статистической теории соответствует понятию центра масс в механике. Поместим в точки $x_{1},x_{2},\dots ,x_{m}$ на числовой оси массы $P(X=x_{1}),\;P(X=x_{2}),\;\dots ,\;P(X=x_{m})$ соответственно. Тогда равенство (5) показывает, что центр масс этой системы материальных точек совпадает с математическим ожиданием, что показывает естественность определения 3.

Утверждение 3. Пусть $X$ — случайная величина, $M(X)$ — её математическое ожидание, $a$ — некоторое число. Тогда

$M(a)=a$ ;
$M{\Big (}X-M(X){\Big )}=0$ ;
$M\left((X-a)^{2}\right)=M\left({\Big (}(X-M(X){\Big )}^{2}\right)+{\Big (}a-M(X){\Big )}^{2}$ .

Для доказательства рассмотрим сначала случайную величину, являющуюся постоянной, $X(\omega )=a$ , то есть функция $X(\omega )$ отображает пространство элементарных событий $\Omega$ в единственную точку $a$ . Поскольку постоянный множитель можно выносить за знак суммы, то

M(X)=\sum _{\omega \in \Omega }a\cdot P(\omega )=a\cdot \sum _{\omega \in \Omega }P(\omega )=a

.

Если каждый член суммы разбивается на два слагаемых, то и вся сумма разбивается на две суммы, из которых первая составлена из первых слагаемых, а вторая — из вторых. Следовательно, математическое ожидание суммы двух случайных величин $X+Y$ , определённых на одном и том же пространстве элементарных событий, равно сумме математических ожиданий $M(X)$ и $M(Y)$ этих случайных величин:

M(X+Y)=M(X)+M(Y)

.

А потому

M{\Big (}X-M(X){\Big )}=M(X)-M{\Big (}M(X){\Big )}

.

Как показано выше, $M{\Big (}M(X){\Big )}=M(X)$ . Следовательно,

M{\Big (}X-M(X){\Big )}=M(X)-M(X)=0

.

Поскольку

(X-a)^{2}={\biggr (}{\Big (}X-M(X){\Big )}+{\Big (}M(X)-a{\Big )}{\biggr )}^{2}=

$={\Big (}X-M(X){\Big )}^{2}+2{\Big (}X-M(X){\Big )}{\Big (}M(X)-a{\Big )}+{\Big (}M(X)-a{\Big )}^{2}$ ,

то

M{\Big (}(X-a)^{2}{\Big )}=M{\biggr (}{\Big (}X-M(X){\Big )}^{2}{\biggr )}+M{\biggr (}2{\Big (}X-M(X){\Big )}{\Big (}M(X)-a{\Big )}{\biggr )}+M{\biggr (}{\Big (}M(X)-a{\Big )}^{2}{\biggr )}

.

Упростим последнее равенство. Как показано в начале доказательства утверждения 3, математическое ожидание константы есть сама эта константа, а потому

M{\biggr (}{\Big (}M(X)-a{\Big )}^{2}{\biggr )}={\Big (}M(X)-a{\Big )}^{2}

.

Поскольку постоянный множитель можно выносить за знак суммы, то

M{\biggr (}2{\Big (}X-M(X){\Big )}{\Big (}M(X)-a{\Big )}{\biggr )}=2{\Big (}M(X)-a{\Big )}\cdot M{\Big (}X-M(X){\Big )}

.

Правая часть последнего равенства равна нулю, поскольку, как показано выше, $M{\Big (}X-M(X){\Big )}=0$ . Следовательно,

M{\Big (}(X-a)^{2}{\Big )}=M{\biggr (}{\Big (}X-M(X){\Big )}^{2}{\biggr )}+{\Big (}a-M(X){\Big )}^{2}

,

что и требовалось доказать.

Из сказанного вытекает, что $M{\Big (}(X-a)^{2}{\Big )}$ достигает минимума по $a$ , равного $M{\biggr (}{\Big (}X-M(X){\Big )}^{2}{\biggr )}$ , при $a=M(X)$ , поскольку второе слагаемое в равенстве (3) всегда неотрицательно и равно нулю только при указанном значении $a$ .

Утверждение 4. Пусть случайная величина $X$ принимает значения $x_{1},x_{2},\dots ,x_{m}$ а $f$ есть некоторая функция числового аргумента. Тогда

M{\Big (}f(X){\Big )}=\sum _{i=1}^{m}f(x_{i})\cdot P(X=x_{i})

.

Для доказательства сгруппируем в правой части равенства (4), определяющего математическое ожидание, члены с одинаковыми значениями $X(\omega )$ :

M{\Big (}f(X){\Big )}=\sum _{i=1}^{m}\left(\sum _{\omega {:}\;X(\omega )=x_{i}}f{\Big (}X(\omega ){\Big )}\cdot P(\omega )\right)

.

Пользуясь тем, что постоянный множитель можно выносить за знак суммы, и определением вероятности случайного события (2), получаем

M{\Big (}f(X){\Big )}=\sum _{i=1}^{m}\left(f(x_{i})\cdot \sum _{\omega {:}\;X(\omega )=x_{i}}P(\omega )\right)=\sum _{i=1}^{m}f(x_{i})\cdot P(X=x_{i})

,

что и требовалось доказать.

Утверждение 5. Пусть $X$ и $Y$ — случайные величины, определённые на одном и том же пространстве элементарных событий, а $a$ и $b$ — некоторые числа. Тогда

M(aX+bY)=aM(X)+bM(Y)

.

С помощью определения математического ожидания и свойств символа суммирования получаем цепочку равенств:

aM(X)+bM(Y)=a\sum _{\omega \in \Omega }X(\omega )P(\omega )+b\sum _{\omega \in \Omega }Y(\omega )P(\omega )=

$=\sum _{\omega \in \Omega }{\Big (}aX(\omega )+bY(\omega ){\Big )}P(\omega )=M(aX+bY)$ .

Требуемое доказано.

Выше показано, как зависит математическое ожидание от перехода к другому началу отсчёта и к другой единице измерения (переход $Y=aX+b$ ), а также к функциям от случайных величин. Полученные результаты постоянно используются в технико-экономическом анализе, при оценке финансово-хозяйственной деятельности предприятия, при переходе от одной валюты к другой во внешнеэкономических расчётах, в нормативно-технической документации и другом. Рассматриваемые результаты позволяют применять одни и те же расчётные формулы при различных параметрах масштаба и сдвига.

Независимость случайных величин — одно из базовых понятий теории вероятностей, лежащее в основе практических всех вероятностно-статистических методов принятия решений.

Определение 4. Случайные величины $X$ и $Y$ , определённые на одном и том же пространстве элементарных событий, называются независимыми, если для любых чисел $a$ и $b$ независимы события $\{X=a\}$ и $\{Y=b\}$ .

Утверждение 6. Если случайные величины $X$ и $Y$ независимы, $a$ и $b$ — некоторые числа, то случайные величины $X+a$ и $Y+b$ также независимы.

Действительно, события $\{X+a=c\}$ и $\{Y+b=d\}$ совпадают с событиями $\{X=c-a\}$ и $\{Y=d-b\}$ соответственно, а потому независимы.

Пример 7. Случайные величины, определённые по результатам различных испытаний в схеме независимых испытаний, сами независимы. Это вытекает из того, что события, с помощью которых определяется независимость случайных величин, определяются по результатам различных испытаний, а потому независимы по определению независимых испытаний.

В вероятностно-статистических методах принятия решений постоянно используется следующий факт: если $X$ и $Y$ — независимые случайные величины, $f(X)$ и $g(Y)$ — случайные величины, полученные из $X$ и $Y$ с помощью некоторых функций $f$ и $g$ , то $f(X)$ и $g(Y)$ — также независимые случайные величины. Например, если $X$ и $Y$ независимы, то $X^{2}$ и $2Y+3$ независимы, $\lg X$ и $\lg Y$ независимы. Доказательство рассматриваемого факта — тема одной из контрольных задач.

Подавляющее большинство вероятностно-статистических моделей, используемых на практике, основывается на понятии независимых случайных величин. Так, результаты наблюдений, измерений, испытаний, анализов, опытов обычно моделируются независимыми случайными величинами. Часто считают, что наблюдения проводятся согласно схеме независимых испытаний. Например, результаты финансово-хозяйственной деятельности предприятий, выработка рабочих, результаты (данные) измерений контролируемого параметра у изделий, отобранных в выборку при статистическом регулировании технологического процесса, ответы потребителей при маркетинговом опросе и другие типы данных, используемых при принятии решений, обычно рассматриваются как независимые случайные величины, вектора́ или элементы. Причина такой популярности понятия независимости случайных величин состоит в том, что к настоящему времени теория продвинута существенно дальше для независимых случайных величин, чем для зависимых.

Часто используется следующее свойство независимых случайных величин.

Утверждение 7. Если случайные величины $X$ и $Y$ независимы, то математическое ожидание произведения $XY$ равно произведению математических ожиданий $X$ и $Y$ , то есть

M(XY)=M(X)M(Y)

.

Доказательство. Пусть $X$ принимает значения $x_{1},x_{2},\dots ,x_{m}$ , в то время как $Y$ принимает значения $y_{1},y_{2},\dots ,y_{k}$ . Сгруппируем в задающей $M(XY)$ сумме члены, в которых $X$ и $Y$ принимают фиксированные значения:(6)

M(XY)=\sum _{1\leqslant i\leqslant m,\;1\leqslant j\leqslant k}\left(\sum _{\omega {:}\;X(\omega )=x_{i},\;Y(\omega )=y_{j}}X(\omega )Y(\omega )P(\omega )\right)

.

Поскольку постоянный множитель можно вынести за знак суммы, то

\sum _{\omega {:}\;X(\omega )=x_{i},\;Y(\omega )=y_{j}}X(\omega )Y(\omega )P(\omega )=x_{i}y_{j}\sum _{\omega {:}\;X(\omega )=x_{i},\;Y(\omega )=y_{j}}P(\omega )

.

Из последнего равенства и определения вероятности события заключаем, что равенство (6) можно преобразовать к виду

M(XY)=\sum _{1\leqslant i\leqslant m,\;1\leqslant j\leqslant k}x_{i}y_{j}\cdot P(X=x_{i},\;Y=y_{j})

.

$X$ и $Y$ независимы, поэтому

P(X=x_{i},\,Y=y_{j})=P(X=x_{i})\cdot P(Y=y_{j})

.

Воспользовавшись этим равенством и свойством символа суммирования

\sum _{1\leqslant i\leqslant m,\;1\leqslant j\leqslant k}c_{i}d_{j}=\left(\sum _{i=1}^{m}c_{i}\right)\left(\sum _{j=1}^{k}d_{j}\right)

,

заключаем, что (7)

M(XY)=\left(\sum _{i=1}^{m}x_{i}\cdot P(X=x_{i})\right)\left(\sum _{j=1}^{k}y_{j}\cdot P(Y=y_{j})\right)

.

Из равенства (5) следует, что первый сомножитель в правой части (7) есть $M(X)$ , а второй — $M(Y)$ , что и требовалось доказать.

Пример 8. Построим пример, показывающий, что из равенства $M(XY)=M(X)\cdot M(Y)$ не следует независимость случайных величин $X$ и $Y$ . Пусть вероятностное пространство состоит из трёх равновероятных элементов $\omega _{1}$ , $\omega _{2}$ , $\omega _{3}$ . Пусть

X(\omega _{1})=1

,

X(\omega _{2})=0

,

X(\omega _{3})=-1

,

Y(\omega _{1})=Y(\omega _{3})=1

,

Y(\omega _{2})=0

.

Тогда $XY=X$ , $M(X)=M(XY)=0$ , следовательно, $M(XY)=M(X)\cdot M(Y)$ . Однако при этом

P(X=0)=P(Y=0)=P(X=0,\;Y=0)=P(\omega _{2})={\frac {1}{3}}

,

в то время как вероятность события $\{X=0,\;Y=0\}$ в случае независимых $X$ и $Y$ должна была равняться ${\frac {1}{3}}\cdot {\frac {1}{3}}={\frac {1}{9}}$ .

Независимость нескольких случайных величин $X,Y,Z,\dots$ означает по определению, что для любых чисел $x,y,z,\dots$ справедливо равенство

P(X=x,\;Y=y,\;Z=z,\dots )=P(X=x)\cdot P(Y=y)\cdot P(Z=z)\cdot \dots

.

Например, если случайные величины определяются по результатам различных испытаний в схеме независимых испытаний, то они независимы.

Дисперсия случайной величины

Математическое ожидание показывает, вокруг какой точки группируются значения случайной величины. Необходимо также уметь измерить изменчивость случайной величины относительно математического ожидания. Выше показано, что $M\left((X-a)^{2}\right)$ достигает минимума по $a$ при $a=M(X)$ . Поэтому за показатель изменчивости случайной величины естественно взять именно $M\left({\Big (}X-M(X){\Big )}^{2}\right)$ .

Определение 5. Дисперсией случайной величины $X$ называется число

\sigma ^{2}=D(X)=M\left({\Big (}X-M(X){\Big )}^{2}\right)

.

Установим ряд свойств дисперсии случайной величины, постоянно используемых в вероятностно-статистических методах принятия решений.

Утверждение 8. Пусть $X$ — случайная величина, $a$ и $b$ — некоторые числа, $Y=aX+b$ . Тогда

D(Y)=a^{2}D(X)

.

Как следует из утверждений 3 и 5, $M(Y)=aM(X)+b$ . Следовательно,

D(Y)=M\left({\Big (}Y-M(Y){\Big )}^{2}\right)=M\left({\Big (}aX+b-aM(X)-b{\Big )}^{2}\right)=M\left(a^{2}{\Big (}X-M(X){\Big )}^{2}\right)

.

Поскольку постоянный множитель можно выносить за знак суммы, то

M\left(a^{2}{\Big (}X-M(X){\Big )}^{2}\right)=a^{2}M\left({\Big (}X-M(X){\Big )}^{2}\right)=a^{2}D(X)

.

Утверждение 8 показывает, в частности, как меняется дисперсия результата наблюдений при изменении начала отсчёта и единицы измерения. Оно даёт правило преобразования расчётных формул при переходе к другим значениям параметров сдвига и масштаба.

Утверждение 9. Если случайные величины $X$ и $Y$ независимы, то дисперсия их суммы $X+Y$ равна сумме дисперсий:

D(X+Y)=D(X)+D(Y)

.

Для доказательства воспользуемся тождеством

{\biggr (}{\Big (}X+Y{\Big )}-{\Big (}M(X)+M(Y){\Big )}{\biggr )}^{2}={\Big (}X-M(X){\Big )}^{2}+2{\Big (}X-M(X){\Big )}{\Big (}Y-M(Y){\Big )}+{\Big (}Y-M(Y){\Big )}^{2}

,

которое вытекает из известной формулы элементарной алгебры $(a+b)^{2}=a^{2}+2ab+b^{2}$ при подстановке $a=X-M(X)$ и $b=Y-M(Y)$ . Из утверждений 3 и 5 и определения дисперсии следует, что

D(X+Y)=D(X)+D(Y)+2M\{{\Big (}X-M(X){\Big )}{\Big (}Y-M(Y){\Big )}\}

.

Согласно утверждению 6 из независимости $X$ и $Y$ вытекает независимость $X-M(X)$ и $Y-M(Y)$ . Из утверждения 7 следует, что

M{\biggr (}{\Big (}X-M(X){\Big )}{\Big (}Y-M(Y){\Big )}{\biggr )}=M{\Big (}X-M(X){\Big )}M{\Big (}Y-M(Y){\Big )}

.

Поскольку $M{\Big (}X-M(X){\Big )}=0$ (см. утверждение 3), то правая часть последнего равенства равна 0, откуда с учетом двух предыдущих равенств и следует заключение утверждения 9.

Утверждение 10. Пусть $X_{1},X_{2},\dots ,X_{k}$ — попарно независимые случайные величины (то есть $X_{i}$ и $X_{j}$ независимы, если $i\neq j$ ). Пусть $Y_{k}$ — их сумма, $Y_{k}=X_{1}+X_{2}+\dots +X_{k}$ , тогда дисперсия суммы равна сумме дисперсий слагаемых,

D(Y_{k})=D(X_{1})+D(X_{2})+\dots +D(X_{k})

.

Для любых случайкых величин математическое ожидание суммы равно сумме математических ожиданий слагаемых,

M(Y_{k})=M(X_{1})+M(X_{2})+\dots +M(X_{k})

.

Соотношения, сформулированные в утверждении 10, являются основными при изучении выборочных характеристик, поскольку результаты наблюдений или измерений, включенные в выборку, обычно рассматриваются в математической статистике, теории принятия решений и эконометрике как реализации независимых случайных величин.

Для любого набора числовых случайных величин (не только независимых) математическое ожидание их суммы равно сумме их математических ожиданий. Это утверждение является обобщением утверждения 5. Строгое доказательство легко проводится методом математической индукции.

При выводе формулы для дисперсии $D(Y_{k})$ воспользуемся следующим свойством символа суммирования:

\left(\sum _{1\leqslant i\leqslant k}a_{i}\right)^{2}=\left(\sum _{1\leqslant i\leqslant k}a_{i}\right)\left(\sum _{j=1}^{k}a_{j}\right)=\sum _{1\leqslant i\leqslant k,\;1\leqslant j\leqslant k}a_{i}a_{j}

.

Положим $a_{i}=X_{i}-M(X_{i})$ , получим

{\Big (}X_{1}+X_{2}+\dots +X_{k}-M(X_{1})-M(X_{2})-\dots -M(X_{k}){\Big )}^{2}=\sum {\Big (}X_{i}-M(X_{i}){\Big )}{\Big (}X_{j}-M(X_{j}){\Big )}

.

Воспользуемся теперь тем, что математическое ожидание суммы равно сумме математических ожиданий: (8)

D(Y_{k})=\sum _{1\leqslant i\leqslant k,\;1\leqslant j\leqslant k}M{\biggr (}{\Big (}X_{i}-M(X_{i}){\Big )}{\Big (}X_{j}-M(X_{j}){\Big )}{\biggr )}

.

Как показано при доказательстве утверждения 9, из попарной независимости рассматриваемых случайных величин следует, что $M{\biggr (}{\Big (}X_{i}-M(X_{i}){\Big )}{\Big (}X_{j}-M(X_{j}){\Big )}{\biggr )}=0$ при $i\neq j$ . Следовательно, в сумме (8) остаются только члены с $i=j$ , а они равны как раз $D(X_{i})$ .

Полученные в утверждениях 8—10 фундаментальные свойства таких характеристик случайных величин, как математическое ожидание и дисперсия, постоянно используются практически во всех вероятностно-статистических моделях реальных явлений и процессов.

Пример 9. Рассмотрим событие $A$ и случайную величину $X$ такую, что $X(\omega )=1$ , если $\omega \in A$ , и $X(\omega )=0$ в противном случае, то есть если $\omega \in \Omega \backslash A$ . Покажем, что $M(X)=P(A)$ , $D(X)=P(A){\Big (}1-P(A){\Big )}$ .

Воспользуемся формулой (5) для математического ожидания. Случайная величина $X$ принимает значения: 1 — с вероятностью $P(A)$ и 0 — с вероятностью $1-P(A)$ , а потому

M(X)=1\cdot P(A)+0\cdot {\Big (}1-P(A){\Big )}=P(A)

.

Аналогично ${\Big (}X-M(X){\Big )}^{2}={\Big (}1-P(A){\Big )}^{2}$ с вероятностью $P(A)$ и ${\Big (}X-M(X){\Big )}^{2}={\Big (}0-P(A){\Big )}^{2}$ с вероятностью $1-P(A)$ , а потому

D(A)={\Big (}1-P(A){\Big )}^{2}P(A)+{\Big (}P(A){\Big )}^{2}{\Big (}1-P(A){\Big )}

.

Вынося общий множитель, получаем, что $D(A)=P(A){\Big (}1-P(A){\Big )}$ .

Пример 10. Рассмотрим $k$ независимых испытаний, в каждом из которых некоторое событие $A$ может наступить, а может и не наступить. Введём случайные величины $X_{1},X_{2},\dots ,X_{k}$ следующим образом: $X_{i}(\omega )=1$ , если в $i$ -ом испытании $A$ наступило, и $X_{i}(\omega )=0$ в противном случае. Тогда $X_{1},X_{2},\dots ,X_{k}$ попарно независимы (см. пример 7). Как показано в примере 9, $M(X_{i})=p$ , $D(X_{i})=p(1-p)$ , где $p=P(A)$ . Иногда $p$ называют «вероятностью успеха» — в случае, если наступление события $A$ рассматривается как «успех».

Биномиальное распределение

Случайная величина $B=X_{1}+X_{2}+\dots +X_{k}$ называется биномиальной. Ясно, что $0\leqslant B\leqslant k$ при всех возможных исходах опытов. Чтобы найти распределение $B$ , то есть вероятности $P(B=a)$ при $a=0,1,\dots ,k$ , достаточно знать $p$ — вероятность наступления рассматриваемого события в каждом из опытов. Действительно, случайное событие $B=a$ осуществляется только когда событие $A$ наступает ровно при $a$ испытаниях. Если известны номера всех этих испытаний (то есть номера в последовательности испытаний), то вероятность одновременного осуществления в а опытах события $A$ и в $k-a$ опытах противоположного ему — это вероятность произведения $k$ независимых событий. Вероятность произведения равна произведению вероятностей: $p^{a}(1-p)^{k-a}$ . Сколькими способами можно задать номера $a$ испытаний из $k$ ? Это $k \choose a$ — число сочетаний из $k$ элементов по $a$ , рассматриваемое в комбинаторике. Как известно, ${k \choose a}={\frac {k!}{a!(k-a)!}}$ , где символом $k!$ обозначено произведение всех натуральных чисел от 1 до $k$ , то есть $k!=1\cdot 2\cdot \dots \cdot k$ (дополнительно принимают, что $0!=1$ ). Из сказанного следует, что биномиальное распределение, то есть распределение биномиальной случайной величины, имеет вид

P(B=a)={k \choose a}p^{a}(1-p)^{k-a}

.

Название «биномиальное распределение» основано на том, что $P(B=a)$ является членом с номером $(a+1)$ в разложении по биному Ньютона

(A+C)^{k}=\sum _{0\leqslant j\leqslant k}{k \choose j}A^{k-j}C^{j}

,

если положить $A=1-p$ , $C=p$ . При $j=a$ получим

{k \choose j}A^{k-j}C^{j}=P(B=a)

.

Для числа сочетаний из $k$ элементов по $a$ , кроме ${k \choose a}$ , используют более распространённое в отечественной литературе обозначение $C_{k}^{a}$ .

Из утверждения 10 и расчётов примера 9 следует, что для случайной величины $B$ , имеющей биномиальное распределение, математическое ожидание и дисперсия выражаются формулами $M(B)=kp$ , $D(B)=kp(1-p)$ , поскольку $B$ является суммой $k$ независимых случайных величин с одинаковыми математическими ожиданиями и дисперсиями, найденными в примере 9.

Неравенства Чебышёва

Во введении обсуждалась задача проверки равенства определённому числу доли дефектной продукции в партии. Для демонстрации вероятностно-статистического подхода к проверке подобных утверждений полезны неравенства, впервые применённые в теории вероятностей русским математиком Пафнутием Львовичем Чебышёвым и носящие его имя. Эти неравенства широко применяются в теории математической статистики, и в ряде практических задач принятия решений. Например, в задачах статистического анализа технологических процессов и качества продукции в случаях, когда явный вид функции распределения результатов наблюдений неизвестен. Они применяются также в задаче исключения резко отклоняющихся результатов наблюдений.

Первое неравенство Чебышёва

Пусть $X$ — неотрицательная случайная величина (то есть $X(\omega )\geqslant 0$ для любого $\omega \in \Omega$ ). Тогда для любого положительного числа $a$ справедливо неравенство

P(X\geqslant a)\leqslant {\frac {M(X)}{a}}

.

Доказательство. Все слагаемые в правой части формулы (4), определяющей математическое ожидание, в рассматриваемом случае неотрицательны. Поэтому при отбрасывании некоторых слагаемых сумма не увеличивается. Оставим в сумме только те члены, для которых $X(\omega )\geqslant a$ . Получим, что (9)

M(X)\geqslant \sum _{\omega {:}\;X(\omega )\geqslant a}X(\omega )P(\omega )

.

Для всех слагаемых в правой части $X(\omega )\geqslant a$ , поэтому (10)

\sum _{\omega {:}\;X(\omega )\geqslant a}X(\omega )P(\omega )\geqslant a\sum _{\omega {:}\;X(\omega )\geqslant a}P(\omega )=aP(X\geqslant a)

.

Из (9) и (10) следует требуемое.

Второе неравенство Чебышёва

Пусть $X$ — случайная величина. Для любого положительного числа $a$ справедливо неравенство

P{\Big (}|X-M(X)|\geqslant a{\Big )}\leqslant {\frac {D(X)}{a^{2}}}

.

Это неравенство содержалось в работе П. Л. Чебышёва «О средних величинах», доложенной Российской академии наук 17 декабря 1866 года и опубликованной в последовавшем году.

Для доказательства второго неравенства Чебышёва рассмотрим случайную величину $Y={\Big (}X-M(X){\Big )}^{2}$ . Она неотрицательна, и потому для любого положительного числа $b$ , как следует из первого неравенства Чебышёва, справедливо неравенство

P(Y\geqslant b)\leqslant {\frac {M(Y)}{b}}={\frac {D(X)}{b}}

.

Положим $b=a^{2}$ . Событие $\{Y\geqslant b\}$ совпадает с событием $\{|X-M(X)|\geqslant a\}$ , а потому

P{\Big (}|X-M(X)|\geqslant a{\Big )}=P(Y\geqslant a^{2})\leqslant {\frac {D(X)}{a^{2}}}

,

что и требовалось доказать.

Пример 11. Можно указать неотрицательную случайную величину $X$ и положительное число $a$ такие, что первое неравенство Чебышёва обращается в равенство.

Достаточно рассмотреть $X(\omega )=a$ . Тогда $M(X)=a$ , ${\frac {M(X)}{a}}=1$ и $P(a\geqslant a)=1$ , то есть $P(X\geqslant a)={\frac {M(X)}{a}}=1$ .

Следовательно, первое неравенство Чебышёва в его общей формулировке не может быть усилено. Однако для подавляющего большинства случайных величин, используемых при вероятностно-статистическом моделировании реальных явлений и процессов, левые части неравенств Чебышёва много меньше соответствующих правых частей.

Пример 12. Может ли первое неравенство Чебышёва обращаться в равенство при всех $a$ ? Оказывается, нет. Покажем, что для любой неотрицательной случайной величины с ненулевым математическим ожиданием можно найти такое положительное число $a$ , что первое неравенство Чебышёва является строгим.

Действительно, математическое ожидание неотрицательной случайной величины либо положительно, либо равно нулю. В первом случае возьмем положительное $a$ , меньшее положительного числа $M(X)$ , например, положим $a={\frac {M(X)}{2}}$ . Тогда ${\frac {M(X)}{a}}$ больше 1, в то время как вероятность события не может превышать 1, а потому первое неравенство Чебышева является для этого а строгим. Второй случай исключается условиями примера 11.

Отметим, что во втором случае равенство 0 математического ожидания влечет тождественное равенство 0 случайной величины. Для такой случайной величины левая и правая части первого неравенства Чебышёва равны 0 при любом положительном $a$ .

Можно ли в формулировке первого неравенства Чебышева отбросить требование неотрицательности случайной величины $X$ ? A требование положительности $a$ ? Легко видеть, что ни одно из двух требований не может быть отброшено, ибо иначе правая часть первого неравенства Чебышева может стать отрицательной.

Закон больши́х чисел

Неравенство Чебышёва позволяет доказать замечательный результат, лежащий в основе математической статистики — закон больши́х чисел. Из него вытекает, что выборочные характеристики при возрастании числа опытов приближаются к теоретическим, а это даёт возможность оценивать параметры вероятностных моделей по опытным данным. Без закона больши́х чисел не было бы большей части прикладной математической статистики.

Теорема Чебышёва. Пусть случайные величины $X_{1},X_{2},\dots ,X_{k}$ попарно независимы и существует число $C$ такое, что $D(X_{i})\leqslant C$ при всех $i=1,2,\dots ,k$ . Тогда для любого положительного $\varepsilon$ выполнено неравенство (11)

P\left\{\left|{\frac {X_{1}+X_{2}+\dots +X_{k}}{k}}-{\frac {M(X_{1})+M(X_{2})+\dots +M(X_{k})}{k}}\right|\geqslant \varepsilon \right\}\leqslant {\frac {C}{k\varepsilon ^{2}}}

.

Доказательство. Рассмотрим случайные величины $Y_{k}=X_{1}+X_{2}+\dots +X_{k}$ и $Z_{k}={\frac {Y_{k}}{k}}$ . Тогда согласно утверждению 10 $M(Y_{k})=M(X_{1})+M(X_{2})+\dots +M(X_{k})$ , $D(Y_{k})=D(X_{1})+D(X_{2})+\dots +D(X_{k})$ .

Из свойств математического ожидания следует, что $M(Z_{k})={\frac {M(Y_{k})}{k}}$ , а из свойств дисперсии — что $D(Z_{k})={\frac {D(Y_{k})}{k^{2}}}$ . Таким образом,

M(Z_{k})={\frac {\{M(X_{1})+M(X_{2})+\dots +M(X_{k})\}}{k}}

,

$D(Z_{k})={\frac {\{D(X_{1})+D(X_{2})+\dots +D(X_{k})\}}{k^{2}}}$ .

Из условия теоремы Чебышёва следует, что

D(Z_{k})\leqslant {\frac {Ck}{k^{2}}}={\frac {C}{k}}

.

Применим к $Z_{k}$ второе неравенство Чебышёва. Получим для стоящей в левой части неравенства (11) вероятности оценку

P\{|Z_{k}-M(Z_{k})|\geqslant \varepsilon \}\leqslant {\frac {D(Z_{k})}{e^{2}}}\leqslant {\frac {C}{k\varepsilon ^{2}}}

,

что и требовалось доказать.

Эта теорема была получена П. Л. Чебышёвым в той же работе 1867 года «О средних величинах», что и неравенства Чебышёва.

Пример 13. Пусть $C=1$ , $\varepsilon =0{,}1$ . При каких $k$ правая часть неравенства (11) не превосходит $0{,}1$ ? $0{,}05$ ? $0{,}00001$ ?

В рассматриваемом случае правая часть неравенства (11) равна ${\frac {100}{k}}$ . Она не превосходит $0{,}1$ , если $k\geqslant 1000$ , не превосходит $0{,}05$ , если $k\geqslant 2000$ , не превосходит $0{,}00001$ , если $k\geqslant 10\,000\,000$ .

Правая часть неравенства (11), а вместе с ней и левая, при возрастании $k$ и фиксированных $C$ и $\varepsilon$ убывает, приближаясь к 0. Следовательно, вероятность того, что среднее арифметическое независимых случайных величин отличается от своего математического ожидания менее чем на $\varepsilon$ , приближается к 1 при возрастании числа случайных величин, причём при любом $\varepsilon$ . Это утверждение называют законом больши́х чисел.

Наиболее важен для вероятностно-статистических методов принятия решений (и для математической статистики в целом) случай, когда все $X_{i}$ , $i=1,2,\dots$ имеют одно и то же математическое ожидание $M(X_{1})$ и одну и ту же дисперсию $\sigma ^{2}=D(X_{1})$ . В качестве замены (оценки) неизвестного исследователю математического ожидания используют выборочное среднее арифметическое

{\overline {X}}={\frac {X_{1}+X_{2}+\dots +X_{k}}{k}}

.

Из закона больши́х чисел следует, что ${\overline {X}}$ при увеличении числа опытов (испытаний, измерений) сколь угодно близко приближается к $M(X_{1})$ , что записывают так:

{\overline {X}}{\stackrel {P}{\to }}M(X_{1})

.

Здесь знак ${\stackrel {P}{\to }}$ означает «сходимость по вероятности». Это понятие отличается от «перехода к пределу» в математическом анализе. Последовательность $b_{n}$ имеет предел $b$ при $n\to \infty$ , если для любого сколь угодно малого $\delta >0$ существует число $n(\delta )$ такое, что при любом $n>n(\delta )$ справедливо утверждение: $b_{n}\in (b-\delta ;b+\delta )$ . При использовании понятия «сходимость по вероятности» элементы последовательности предполагаются случайными, вводится ещё одно сколь угодно малое число $\varepsilon >0$ и утверждение $b_{n}\in (b-\delta ;b+\delta )$ предполагается выполненным не наверняка, а с вероятностью не менее $1-\varepsilon$ .

Сходимость частот к вероятностям

Уже́ отмечалось, что с точки зрения ряда естествоиспытателей вероятность события $A$ — это число, к которому приближается отношение количества осуществлений события $A$ к количеству всех опытов при безграничном увеличении числа опытов. Известный математик Якоб Бернулли (1654—1705) в самом конце XVII века доказал это утверждение в рамках математической модели (опубликовано доказательство было лишь после его смерти, в 1713 году).

Теорема Бернулли

Пусть $m$ — число наступлений события $A$ в $k$ независимых (попарно) испытаниях, и $p$ есть вероятность наступления события $A$ в каждом из испытаний. Тогда при любом $\varepsilon >0$ справедливо неравенство (12)

P\left\{\left|{\frac {m}{k}}-p\right|\geqslant \varepsilon \right\}\leqslant {\frac {p(1-p)}{k\varepsilon ^{2}}}

.

Доказательство. Как показано в примере 10, случайная величина $m$ имеет биномиальное распределение с вероятностью успеха $p$ и является суммой $k$ независимых случайных величин $X_{i}$ , $i=1,2,\dots ,k$ , каждое из которых равно 1 с вероятностью $p$ и 0 с вероятностью $1-p$ , то есть $m=X_{1}+X_{2}+\dots +X_{k}$ . Применим к $X_{1},X_{2},\dots ,X_{k}$ теорему Чебышёва с $C=p(1-p)$ и получим требуемое неравенство (12).

Теорема Бернулли даёт возможность связать математическое определение вероятности (по Колмогорову) с определением ряда естествоиспытателей (по Рихарду Мизесу (1883—1953)), согласно которому вероятность есть предел частоты в бесконечной последовательности испытаний. Для показания этой связи сначала отметим, что $p(1-p)\leqslant {\frac {1}{4}}$ при всех $p$ . Действительно, ${\frac {1}{4}}-p(1-p)=\left(p-{\frac {1}{2}}\right)^{2}\geqslant 0$ .

Следовательно, в теореме Чебышёва можно использовать $C={\frac {1}{4}}$ . Тогда при любом $p$ и фиксированном $\varepsilon$ правая часть неравенства (12) при возрастании $k$ приближается к 0, что и доказывает согласие математического определения в рамках вероятностной модели с мнением естествоиспытателей.

Есть и прямые экспериментальные подтверждения того, что частота осуществления определённых событий близка к вероятности, определённой из теоретических соображений. Рассмотрим бросания монеты. Поскольку и орёл, и решка имеют равные шансы оказаться сверху, то вероятность выпадения орла равна ${\frac {1}{2}}$ из соображений равновозможности. Французский естествоиспытатель XVIII века Жорж Бюффон бросил монету 4040 раз, орёл выпал при этом 2048 раз. Частота появления орлов опыте Бюффона равна 0,507. Английский статистик Карл Пирсон бросил монету 12 000 раз и при этом наблюдал 6019 выпадений орлов — частота 0,5016. В другой раз он бросил монету 24 000 раз, орёл выпал 12 012 раз — частота 0,5005. Как видим, во всех этих случаях частоты лишь незначительно отличаются от теоретической вероятности 0,5 ^[7], с. 148.

О проверке статистических гипотез

С помощью неравенства (12) можно кое-что сказать о проверке соответствия качества продукции заданным требованиям.

Пусть из 100 000 единиц продукции 30 000 оказались дефектными. Согласуется ли это с гипотезой о том, что вероятность дефектности равна 0,23? Прежде всего, какую вероятностную модель целесообразно использовать? Принимаем, что проводится сложный опыт, состоящий из 100 000 испытаний 100 000 единиц продукции на годность. Считаем, что испытания (попарно) независимы и что в каждом испытании вероятность того, что единица продукции является дефектной, равна $p$ . В реальном опыте получено, что событие «единица продукции не является годной» осуществилось 30 000 раз при 100 000 испытаниях. Согласуется ли это с гипотезой о том, что вероятность дефектности $p=0{,}23$ ?

Для проверки гипотезы воспользуемся неравенством (12). В рассматриваемом случае $k=100\,000$ , $m=30\,000$ , ${\frac {m}{k}}=0{,}3$ , $p=0{,}23$ , ${\frac {m}{k}}-p=0{,}07$ . Для проверки гипотезы поступают так. Оценим вероятность того, что ${\frac {m}{k}}$ отличается от $p$ так же, как в рассматриваемом случае, или больше, то есть оценим вероятность выполнения неравенства $\left|{\frac {m}{k}}-0{,}23\right|>0{,}07$ . Положим в неравенстве (12) $p=0{,}23$ , $\varepsilon =0{,}07$ . Тогда (13)

P\left\{\left|{\frac {m}{k}}-0{,}23\right|\geqslant 0{,}07\right\}\leqslant {\frac {0{,}23\cdot 0{,}77}{0{,}0049k}}\approx {\frac {36{,}11}{k}}

.

При $k=100\,000$ правая часть (13) меньше ${\frac {1}{2500}}$ . Значит, вероятность того, что отклонение будет не меньше наблюдаемого, весьма мала. Следовательно, если исходная гипотеза верна, то в рассматриваемом опыте осуществилось событие, вероятность которого меньше ${\frac {1}{2500}}$ , и поскольку это очень малое число, то исходную гипотезу надо отвергнуть.

Подробнее методы проверки статистических гипотез будут рассмотрены ниже. Здесь отметим, что одна из основных характеристик метода проверки гипотезы — уровень значимости, то есть вероятность отвергнуть проверяемую гипотезу (её в математической статистике называют нулевой и обозначают $H_{0}$ ), когда она верна. Для проверки статистической гипотезы часто поступают так. Выбирают уровень значимости — малое число $\alpha$ . Если описанная в предыдущем абзаце вероятность меньше $\alpha$ , то гипотезу отвергают, как говорят, на уровне значимости $\alpha$ . Если эта вероятность больше или равна $\alpha$ , то гипотезу принимают. Обычно в вероятностно-статистических методах принятия решений выбирают $\alpha =0{,}05$ , значительно реже $\alpha =0{,}01$ или $\alpha =0{,}1$ , в зависимости от конкретной практической ситуации. В рассматриваемом случае $\alpha$ , напомним, — это та доля опытов (то есть проверок партий по 100 000 единиц продукции), в которой мы отвергаем гипотезу $H_{0}{:}\;p=0{,}23$ , хотя она верна.

Насколько результат проверки гипотезы $H_{0}$ зависит от числа испытаний $k$ ? Пусть при $k=100$ , $k=1000$ , $k=10\,000$ оказалось, что $m=30$ , $m=300$ , $m=3000$ соответственно, так что во всех случаях ${\frac {m}{k}}=0{,}3$ . Какие значения принимает вероятность

P_{k}=P\left\{\left|{\frac {m}{k}}-0{,}23\right|\geqslant 0{,}07\right\}

и её оценка — правая часть формулы (13)?

При $k=100$ правая часть (13) равна приблизительно 0,36, что не даёт оснований отвергнуть гипотезу. При $k=1000$ правая часть (13) равна примерно 0,036. Гипотеза отвергается на уровне значимости $\alpha =0{,}05$ (и $\alpha =0{,}1$ ), но на основе оценки вероятности с помощью правой части формулы (13) не удаётся отвергнуть гипотезу на уровне значимости $\alpha =0{,}01$ . При $k=10\,000$ правая часть (13) меньше ${\frac {1}{250}}$ , и гипотеза отвергается на всех обычно используемых уровнях значимости.

Более точные расчёты, основанные на применении центральной предельной теоремы теории вероятностей (см. ниже), дают $P_{100}=0{,}095$ , $P_{1000}=0{,}0000005$ , так что оценка (13) является в рассматриваемом случае весьма завышенной. Причина в том, что получена она из наиболее общих соображений, применительно ко всем возможным случайным величинам улучшить её нельзя (см. пример 11), но применительно к конкретному биномиальному распределению — можно.

Ясно, что без введения уровня значимости не обойтись, ибо даже очень большие отклонения ${\frac {m}{k}}$ от $p$ имеют положительную вероятность осуществления. Так, при справедливости гипотезы $H_{0}$ событие «все 100 000 единиц продукции являются дефектными» отнюдь не является невозможным с математической точки зрения, оно имеет положительную вероятность осуществления, равную $0{,}23^{100000}$ , хотя эта вероятность и невообразимо мала.

Аналогично разберём проверку гипотезы о симметричности монеты.

Пример 14. Если монета симметрична, то $p={\frac {1}{2}}$ , где $p$ — вероятность выпадения орлов. Согласуется ли с этой гипотезой результат эксперимента, в котором при 10 000 бросаниях выпало 4000 орлов?

В рассматриваемом случае ${\frac {m}{k}}=0{,}4$ . Положим в неравенстве (12) $p=0{,}5$ , $\varepsilon =0{,}1$ :

P\left\{\left|{\frac {m}{k}}-0{,}5\right|\geqslant 0{,}1\right\}\leqslant {\frac {0{,}5\cdot 0{,}5}{0{,}01k}}={\frac {25}{k}}

.

При $k=10\,000$ правая часть последнего неравенства равна ${\frac {1}{400}}$ . Значит, если исходная гипотеза верна, то в нашем единственном эксперименте осуществилось событие, вероятность которого весьма мала — меньше ${\frac {1}{400}}$ . Поэтому исходную гипотезу следует отвергнуть.

Если из 1000 бросаний монеты орлы выпали в 400 случаях, то правая часть выписанного выше неравенства равна ${\frac {1}{40}}$ . Гипотеза симметричности отклоняется на уровне значимости 0,05 (и 0,1), но рассматриваемые методы не дают возможности отвергнуть её на уровне значимости 0,01.

Если $k=100$ , а $m=40$ , то правая часть неравенства равна $0{,}25$ . Оснований для отклонения гипотезы нет. С помощью более тонких методов, основанных на центральной предельной теореме теории вероятностей, можно показать, что левая часть неравенства равна приблизительно 0,05. Это показывает, как важно правильно выбрать метод проверки гипотезы или оценивания параметров. Следовательно, целесообразна стандартизация подобных методов, позволяющая сэкономить усилия, необходимые для сравнения и выбора наилучшего метода, а также избежать устаревших, неверных или неэффективных методов.

Ясно, что даже по нескольким сотням опытов нельзя достоверно отличить абсолютно симметричную монету ( $p={\frac {1}{2}}$ ) от несколько несимметричной монеты (для которой, скажем, $p=0{,}49$ ). Более того, любая реальная монета несколько несимметрична, так что монета с $p=0{,}5$ есть математическая абстракция. Между тем, в ряде управленческих и производственных ситуаций требуется осуществить справедливую жеребьёвку, а для этого требуется абсолютно симметричная монета. Например, речь может идти об очередности рассмотрения инвестиционных проектов комиссией экспертов, о порядке вызова для собеседования кандидатов на должность, об отборе единиц продукции из партии в выборку для контроля и тому подобном.

Пример 15. Можно ли с помощью несимметричной монеты получить последовательность испытаний с двумя исходами, каждый из которых имеет вероятность ${\frac {1}{2}}$ ?

Ответ: да, можно. Приведём способ, предложенный видным польским математиком Гуго Штейнгаузом (1887—1972).

Будем бросать монету два раза подряд и записывать исходы бросаний так (Г — орёл, Р — решка, на первом месте стоит результат первого бросания, на втором — второго): ГР запишем как Г, в то время РГ запишем как Р, а ГГ и PP вообще не станем записывать. Например, если исходы бросаний окажутся такими:

ГР,	РГ,	ГР,	PP,	ГР,	РГ,	ГГ,	РГ,	PP,	РГ,
то запишем их в виде:
Г,	Р,	Г,		Г,	Р,		Р,		Р.

Сконструированная таким образом последовательность обладает теми же свойствами, что и полученная при бросании идеально симметричной монеты, поскольку даже у несимметричной монеты последовательность ГР встречается столь же часто, как и последовательность РГ.

Применим теорему Бернулли и неравенство (12) к обработке реальных данных.

Пример 16. С 1871 по 1900 год в Швейцарии родился 1 359 671 мальчик и 1 285 086 девочек. Совместимы ли эти данные с предположением, что вероятность рождения мальчика равна 0,5? A с предположением, что она равна 0,515? Другими словами, требуется проверить нулевые гипотезы $H_{0}{:}\;p=0{,}5$ и $H_{0}{:}\;p=0{,}515$ с помощью неравенства (12).

Число испытаний равно общему числу рождений, то есть $1\,359\,671+1\,285\,086=2\,644\,757$ . Есть все основания считать испытания независимыми. Число рождений мальчиков составляет приблизительно 0,514 всех рождений. В случае $p=0{,}5$ имеем $\varepsilon =0{,}014$ , и правая часть неравенства (12) имеет вид

{\frac {0{,}5\cdot 0{,}5}{0{,}014\cdot 0{,}014\cdot 2\,644\,757}}\approx 0{,}00001

.

Таким образом, гипотезу $p=0{,}5$ следует считать несовместимой с приведёнными в условии данными. В случае $p=0{,}515$ имеем $\varepsilon =0{,}001$ , и правая часть (12) равна приблизительно 0,1, так что с помощью неравенства (12) отклонить гипотезу $H_{0}{:}\;p=0{,}515$ нельзя.

Итак, здесь на основе элементарной теории вероятностей (с конечным пространством элементарных событий) мы сумели построить вероятностные модели для описания проверки качества деталей (единиц продукции) и бросания монет и предложить методы проверки гипотез, относящихся к этим явлениям. В математической статистике есть более тонкие и сложные методы проверки описанных выше гипотез, которыми и пользуются в практических расчётах.

Можно спросить: в рассмотренных выше моделях вероятности были известны заранее — со слов Струкова или же из-за того, что мы предположили симметричность монеты. A как строить модели, если вероятности неизвестны? Как оценить неизвестные вероятности? Теорема Бернулли — результат, с помощью которого даётся ответ на этот вопрос. Именно, оценкой неизвестной вероятности $p$ является число ${\frac {m}{k}}$ , поскольку доказано, что при возрастании $k$ вероятность того, что ${\frac {m}{k}}$ отличается от $p$ более чем на какое-либо фиксированное число, приближается к нулю. Оценка будет тем точнее, чем больше $k$ . Более того, можно доказать, что с некоторой точки зрения (см. далее) оценка ${\frac {m}{k}}$ для вероятности $p$ является наилучшей из возможных (в терминах математической статистики — состоятельной, несмещённой и эффективной).

Суть вероятностно-статистических методов

Как подходы, идеи и результаты теории вероятностей и математической статистики используются при обработке данных — результатов наблюдений, измерений, испытаний, анализов, опытов с целью принятия практически важных решений?

Базой является вероятностная модель реального явления или процесса, то есть математическая модель, в которой объективные соотношения выражены в терминах теории вероятностей. Вероятности используются прежде всего для описания неопределённостей, которые надо учитывать при принятии решений. Имеются в виду как нежелательные возможности (риски), так и привлекательные («счастливый случай»). Иногда случайность вносится в ситуацию сознательно, например, при жеребьёвке, случайном отборе единиц для контроля, проведении лотерей или опросов потребителей.

Теория вероятностей позволяет по одним вероятностям рассчитать другие, интересующие исследователя. Например, по вероятности выпадения орла можно рассчитать вероятность того, что при 10 бросаниях монет выпадет не менее 3 орлов. Подобный расчёт опирается на вероятностную модель, согласно которой бросания монет описываются схемой независимых испытаний, кроме того, выпадения орла и решки равновозможны, а потому вероятность каждого из этих событий равна ${\frac {1}{2}}$ . Более сложна модель, в которой вместо бросания монеты рассматривается проверка качества единицы продукции. Соответствующая вероятностная модель опирается на предположение о том, что контроль качества различных единиц продукции описывается схемой независимых испытаний. В отличие от модели с бросанием монет необходимо ввести новый параметр — вероятность $p$ того, что единица продукции является дефектной. Модель будет полностью описана, если принять, что все единицы продукции имеют одинаковую вероятность оказаться дефектными. Если последнее предположение неверно, то число параметров модели возрастает. Например, можно принять, что каждая единица продукции имеет свою вероятность оказаться дефектной.

Обсудим модель контроля качества с общей для всех единиц продукции вероятностью дефектности $p$ . Чтобы при анализе модели «дойти до числа», необходимо заменить $p$ на некоторое конкретное значение. Для этого необходимо выйти из рамок вероятностной модели и обратиться к данным, полученным при контроле качества. Математическая статистика решает обратную задачу по отношению к теории вероятностей. Её цель — на основе результатов наблюдений (измерений, анализов, испытаний, опытов) получить выводы о вероятностях, лежащих в основе вероятностной модели. Например, на основе частоты появления дефектных изделий при контроле можно сделать выводы о вероятности дефектности (см. обсуждение выше с использованием теоремы Бернулли). На основе неравенства Чебышева делались выводы о соответствии частоты появления дефектных изделий гипотезе о том, что вероятность дефектности принимает определённое значение.

Таким образом, применение математической статистики опирается на вероятностную модель явления или процесса. Используются два параллельных ряда понятий: относящиеся к теории (вероятностной модели) и относящиеся к практике (выборке результатов наблюдений). Например, теоретической вероятности соответствует частота, найденная по выборке. Математическому ожиданию (теоретический ряд) соответствует выборочное среднее арифметическое (практический ряд). Как правило, выборочные характеристики суть оценки теоретических. При этом величины, относящиеся к теоретическому ряду, «находятся в головах исследователей», относятся к миру идей (по древнегреческому философу Платону), недоступны для непосредственного измерения. Исследователи располагают лишь выборочными данными, из которых они стараются установить интересующие их свойства теоретической вероятностной модели.

Зачем же нужна вероятностная модель? Дело в том, что только с её помощью можно перенести свойства, установленные по результатам анализа конкретной выборки, на другие выборки, а также на всю так называемую генеральную совокупность. Термин «генеральная совокупность» используется, когда речь идёт о большой, но конечной совокупности изучаемых единиц. Например, о совокупности всех жителей России или совокупности всех потребителей растворимого кофе в Москве. Цель маркетинговых или социологических опросов в том, чтобы утверждения, полученные по выборке из сотен или тысяч человек, перенести на генеральные совокупности в несколько миллионов человек. При контроле качества в роли генеральной совокупности выступает партия продукции.

Чтобы перенести выводы с выборки на более обширную совокупность, необходимы те или иные предположения о связи выборочных характеристик с характеристиками этой более обширной совокупности. Эти предположения основаны на соответствующей вероятностной модели.

Конечно, можно обрабатывать выборочные данные, не используя ту или иную вероятностную модель. Например, можно рассчитывать выборочное среднее арифметическое, подсчитывать частоту выполнения тех или иных условий. Однако результаты расчётов будут относиться только к конкретной выборке, перенос полученных с их помощью выводов на какую-либо иную совокупность некорректен. Иногда подобную деятельность называют «анализ данных». По сравнению с вероятностно-статистическими методами анализ данных имеет ограниченную познавательную ценность.

Итак, использование вероятностных моделей на основе оценивания и проверки гипотез с помощью выборочных характеристик — вот суть вероятностно-статистических методов принятия решений.

Подчеркнём, что логика использования выборочных характеристик для принятия решений на основе теоретических моделей предполагает одновременное использование двух параллельных рядов понятий, один из которых соответствует вероятностным моделям, а второй — выборочным данным. К сожалению, в ряде литературных источников, устаревших либо написанных в рецептурном духе, не делается различия между выборочными и теоретическими характеристиками, что приводит читателей к недоумениям и ошибкам при практическом использовании статистических методов.

Случайные величины и их распределения

Распределения случайных величин и функции распределения

Распределение числовой случайной величины — это функция, однозначно определяющая вероятность того, что случайная величина принимает заданное значение или принадлежит к некоторому заданному интервалу.

Первое — если случайная величина принимает конечное число значений. Тогда распределение задаётся функцией $P(X=x)$ , ставящей каждому возможному значению $x$ случайной величины $X$ вероятность того, что $X=x$ .

Второе — если случайная величина принимает бесконечно много значений. Это возможно лишь тогда, когда вероятностное пространство, на котором определена случайная величина, состоит из бесконечного числа элементарных событий. Тогда распределение задаётся набором вероятностей $P(a\leqslant X<b)$ для всех пар чисел $a,b$ таких, что $a<b$ . Распределение может быть задано с помощью так называемой функции распределения $F(x)=P(X<x)$ , определяющей для всех действительных $x$ вероятность того, что случайная величина $X$ принимает значения, меньшие $x$ . Ясно, что

$P(a\leqslant X<b)=F(b)-F(a)$

Это соотношение показывает, что как распределение может быть рассчитано по функции распределения, так и, наоборот, функция распределения — по распределению.

Используемые в прикладных исследованиях функции распределения бывают либо дискретными, либо непрерывными, либо их комбинациями.

Дискретные функции распределения соответствуют дискретным случайным величинам, принимающим конечное число значений или же значения из множества, элементы которого можно перенумеровать натуральными числами (такие множества в математике называют счётными). Их график имеет вид ступенчатой лестницы (рисунок 1).

Пример 17. Число $X$ дефектных изделий в партии принимает значение 0 с вероятностью 0,3, значение 1 с вероятностью 0,4, значение 2 с вероятностью 0,2 и значение 3 с вероятностью 0,1. График функции распределения случайной величины X изображен на рисунке 1.

Рисунок 1. График функции распределения числа дефектных изделий.

F(x)  ^
      |
   1,0|                 <-----
   0,9|           <-----
      |
   0,7|     <-----
      |
      |
      |
   0,3|<----
      |
      |
   ---+---------------------->
    0 |     1     2     3
                            х

Непрерывные функции распределения не имеют скачков. Они монотонно возрастают при увеличении аргумента, — от 0 при $x\to -\infty$ до 1 при $x\to +\infty$ . Случайные величины, имеющие непрерывные функции распределения, называют непрерывными.

Практически используемые непрерывные функции распределения, как правило, имеют производные. Первая производная $f(x)$ функции распределения $F(x)$ называется плотностью вероятности:

f(x)={\frac {dF(x)}{dx}}

.

По плотности вероятности можно определить функцию распределения:

F(x)=\int \limits _{-\infty }^{x}f(y)\,dy

.

Для любой функции распределения

\lim _{x\to -\infty }F(x)=0

,

\lim _{x\to +\infty }F(x)=1

,

а потому

\int \limits _{-\infty }^{+\infty }f(x)\,dx=1

.

Перечисленные свойства функций распределения постоянно используются в вероятностно-статистических методах принятия решений. В частности, из последнего равенства вытекает конкретный вид констант в формулах для плотностей вероятностей, рассматриваемых ниже.

Пример 18. Часто используется следующая функция распределения:(14)

F(x)={\begin{cases}0,\ x<a\\{\frac {x-a}{b-a}},\ a\leqslant x\leqslant b\\1,\ x>b\end{cases}}

,

где $a$ и $b$ суть некоторые числа, $a<b$ . Найдём плотность вероятности этой функции распределения:

f(x)={\begin{cases}0,\ x<a\\{\frac {1}{b-a}},\ a<x<b\\0,\ x>b\end{cases}}

,

(в точках $x=a$ и $x=b$ производная функции $F(x)$ не существует).

Случайная величина с функцией распределения (14) называется «равномерно распределённой на отрезке $[a;b]$ ».

Смешанные функции распределения встречаются, в частности, тогда, когда наблюдения в какой-то момент прекращаются. Например, при анализе статистических данных, полученных при использовании планов испытаний на надёжность, предусматривающих прекращение испытаний по истечении некоторого срока. Или при анализе данных о технических изделиях, потребовавших гарантийного ремонта.

Пример 19. Пусть, например, срок службы электрической лампочки — случайная величина с функцией распределения $F(t)$ , а испытание проводится до выхода лампочки из строя, если это произойдет менее чем за 100 часов от начала испытаний, или до момента $t_{0}=100$ часов. Пусть $G(t)$ — функция распределения времени эксплуатации лампочки в исправном состоянии при этом испытании. Тогда

G(t)={\begin{cases}F(t),\ t\leqslant 100\\1,\ t>100\end{cases}}

.

Функция $G(t)$ имеет скачок в точке $t_{0}$ , поскольку соответствующая случайная величина принимает значение $t_{0}$ с вероятностью $1-F(t_{0})>0$ .

Характеристики случайных величин

В вероятностно-статистических методах используется ряд характеристик случайных величин, выражающихся через функции распределения и плотности вероятностей.

Квантили

При описании дифференциации доходов, при нахождении доверительных границ для параметров распределений случайных величин и во многих иных случаях применяется такое понятие, как «квантиль порядка $p$ », где $0<p<1$ (иатробозначается $x_{p}$ ). Квантиль порядка $p$ — значение случайной величины, для которого функция распределения принимает значение $p$ или имеет место «скачок» со значения меньше $p$ до значения больше $p$ (рисунок 2). Может случиться, что это условие выполняется для всех значений $x$ , принадлежащих этому интервалу (то есть функция распределения постоянна на этом интервале и равна $p$ ). Тогда каждое такое значение называется «квантилем порядка $p$ ». Для непрерывных функций распределения, как правило, существует единственный квантиль $x_{p}$ порядка $p$ (рисунок 2), причём(15)

F(x_{p})=p

.

Пример 20. Найдём квантиль $x_{p}$ порядка $p$ для функции распределения $F(x)$ из (13).

При $0<p<1$ квантиль $x_{p}$ находится из уравнения

{\frac {x-a}{b-a}}=p

,

то есть $x_{p}=a+p(b-a)=a(1-p)+bp$ . При $p=0$ любое $x\leqslant a$ является квантилем порядка $p=0$ . Квантилем порядка $p=1$ является любое число $x\geqslant b$ .

Для дискретных распределений, как правило, не существует $x_{p}$ , удовлетворяющих уравнению (14). Точнее, если распределение случайной величины даётся таблицей 2, где $x_{1}<x_{2}<\dots <x_{k}$ , то равенство (14), рассматриваемое как уравнение относительно $x_{p}$ , имеет решения только для $k$ значений $p$ , а именно

$p=p_{1}$ ,

$p=p_{1}+p_{2}$ ,

$p=p_{1}+p_{2}+p_{3}$ ,

…

$p=p_{1}+p_{2}+\dots +p_{m}$ , $3<m<k$ ,

…

$p=p_{1}+p_{2}+\dots +p_{k}$ .

Таблица 2. Распределение дискретной случайной величины
Значения $x$ случайной величины $X$	$x_{1}$	$x_{2}$	…	$x_{k}$
Вероятности $P(X=x)$	$p_{1}$	$p_{2}$	…	$p_{k}$

Для перечисленных $k$ значений вероятности $p$ решение $x_{p}$ уравнения (14) неединственно, а именно

F(x)=p_{1}+p_{2}+\dots +p_{m}

для всех $x$ таких, что $x_{m}<x\leqslant x_{m+1}$ . То есть $x_{p}$ — любое число из интервала $(x_{m};x_{m+1}]$ . Для всех остальных $p$ из промежутка $(0;1)$ , не входящих в перечень (15), имеет место «скачок» со значения меньше $p$ до значения больше $p$ . A именно, если

p_{1}+p_{2}+\dots +p_{m}<p<p_{1}+p_{2}+p_{2}+\dots +p_{m}+p_{m+1}

,

то

x_{p}=x_{m+1}

.

Рассмотренное свойство дискретных распределений создаёт значительные трудности при табулировании и использовании подобных распределений, поскольку невозможным оказывается точно выдержать типовые численные значения характеристик распределения. В частности, это так для критических значений и уровней значимости непараметрических статистических критериев (см. ниже), поскольку распределения статистик этих критериев дискретны.

Характеристики положения указывают на «центр» распределения. Большое значение в статистике имеет квантиль порядка $p={\frac {1}{2}}$ . Он называется медианой (случайной величины $X$ или её функции распределения $F(x)$ ) и обозначается $Me(X)$ . В геометрии есть понятие «медиана» — прямая, проходящая через вершину треугольника и делящая противоположную его сторону пополам. В математической статистике медиана делит пополам не сторону треугольника, а распределение случайной величины: равенство $F(x_{0{,}5})=0{,}5$ означает, что вероятность попасть левее $x_{0,5}$ и вероятность попасть правее $x_{0{,}5}$ (или непосредственно в $x_{0{,}5}$ ) равны между собой и равны ${\frac {1}{2}}$ , то есть $P(X<x_{0{,}5})=P(X\geqslant x_{0{,}5})={\frac {1}{2}}$ .

Медиана указывает «центр» распределения. С точки зрения одной из современных концепций — теории устойчивых статистических процедур — медиана является лу́чшей характеристикой случайной величины, чем математическое ожидание. При обработке результатов измерений в порядковой шкале медианой можно пользоваться, а математическим ожиданием — нельзя.

Ясный смысл имеет такая характеристика случайной величины, как мода — значение (или значения) случайной величины, соответствующее локальному максимуму плотности вероятности для непрерывной случайной величины или локальному максимуму вероятности для дискретной случайной величины.

Если $x_{0}$ есть мода случайной величины с плотностью $f(x)$ , то, как известно из дифференциального исчисления, ${\frac {df(x_{0})}{dx}}=0$ .

У случайной величины может быть много мод. Так, для равномерного распределения (14) каждая точка $x$ такая, что $a<x<b$ , является модой. Однако это исключение. Большинство случайных величин, используемых в вероятностно-статистических методах принятия решений и других прикладных исследованиях, имеют одну моду. Случайные величины, плотности, распределения, имеющие одну моду, называются унимодальными.

Математическое ожидание для дискретных случайных величин с конечным числом значений рассмотрено в главе «События и множества». Для непрерывной случайной величины $X$ математическое ожидание $M(X)$ удовлетворяет равенству

M(X)=\int \limits _{-\infty }^{+\infty }xf(x)\,dx

,

являющемуся аналогом формулы (5).

Пример 21. Математическое ожидание для равномерно распределённой случайной величины $X$ равно

M(X)=\int \limits _{a}^{b}{\frac {x}{b-a}}\,dx={\frac {1}{b-a}}{\frac {x^{2}}{2}}{\biggr |}_{a}^{b}={\frac {1}{b-a}}\left({\frac {b^{2}}{2}}-{\frac {a^{2}}{2}}\right)={\frac {a+b}{2}}

.

Для рассматриваемых в настоящей главе случайных величин верны все те свойства математических ожиданий и дисперсий, которые были рассмотрены ранее для дискретных случайных величин с конечным числом значений. Однако доказательства этих свойств не приводим, поскольку они требуют углубления в математические тонкости, не являющегося необходимым для понимания и квалифицированного применения вероятностно-статистических методов принятия решений.

Замечание. В этой книге сознательно обходятся математические тонкости, связанные, в частности, с понятиями измеримых множеств и измеримых функций, σ-алгебры событий и тому подобное. Желающим освоить эти понятия следует обратиться к специальной литературе, в частности, к энциклопедии^[1].

Каждая из трёх характеристик — математическое ожидание, медиана, мода — описывает «центр» распределения вероятностей. Понятие «центр» можно определять разными способами, отсюда три разные характеристики. Однако для важного класса распределений — симметричных унимодальных — все три характеристики совпадают.

Плотность распределения $f(x)$ — плотность симметричного распределения, если найдётся число $x_{0}$ такое, что(15)

f(x)=f(2x_{0}-x)

.

Равенство означает, что график функции $y=f(x)$ симметричен относительно вертикальной прямой, проходящей через центр симметрии $x=x_{0}$ . Из (15) следует, что функция симметричного распределения удовлетворяет соотношению(16)

$F(x)=1-F(2x_{0}-x)$ .

Для симметричного распределения с одной модой математическое ожидание, медиана и мода совпадают и равны $x_{0}$ .

Наиболее важен случай симметрии относительно нуля, то есть $x_{0}=0$ . Тогда (15) и (16) переходят в равенства(17)

$f(x)=f(-x)$

и(18)

$F(x)=1-F(-x)$

соответственно. Приведённые соотношения показывают, что симметричные распределения нет необходимости табулировать при всех $x$ , достаточно иметь таблицы при $x\geqslant x_{0}$ .

Отметим ещё одно свойство симметричных распределений, постоянно используемое в вероятностно-статистических методах принятия решений и других прикладных исследованиях. Для непрерывной функции распределения

P(|X|\leqslant a)=P(-a\leqslant X\leqslant a)=F(a)-F(-a)

,

где $F$ — функция распределения случайной величины $X$ . Если функция распределения $F$ симметрична относительно нуля, то есть для неё справедлива формула (18), то

P(|X|\leqslant a)=2F(a)-1

.

Часто используют другую формулировку рассматриваемого утверждения: если $1-F(a)=\alpha$ , то $P(|X|>a)=2\alpha$ .

Если $x_{\alpha }$ и $x_{1-\alpha }$ — квантили порядка $\alpha$ и $1-\alpha$ соответственно (см. (13)) функции распределения, симметричной относительно нуля, то из (18) следует, что $x_{\alpha }=-x_{1-\alpha }$ .

Характеристики разброса

От характеристик положения — математического ожидания, медианы, моды — перейдём к характеристикам разброса случайной величины $X$ : дисперсии $D(X)=\sigma ^{2}$ , среднеквадратичному отклонению $\sigma$ и коэффициенту вариации $v$ . Определение и свойства дисперсии для дискретных случайных величин рассмотрены в предыдущей главе. Для непрерывных случайных величин

D(X)=M\left[{\Big (}X-M(X){\Big )}^{2}\right]=\int \limits _{-\infty }^{+\infty }{\Big (}x-M(X){\Big )}^{2}f(x)\,dx

.

Среднеквадратичное отклонение — это неотрицательное значение квадратного корня из дисперсии: $\sigma =+{\sqrt {D(X)}}$

Коэффициент вариации — это отношение среднеквадратичного отклонения к математическому ожиданию:

$v={\frac {\sigma }{M(X)}}$ .

Коэффициент вариации применяется при $M(X)>0$ . Он измеряет разброс в относительных единицах, в то время как среднеквадратичное отклонение — в абсолютных.

Пример 22. Для равномерно распределённой случайной величины $X$ найдём дисперсию, среднеквадратичное отклонение и коэффициент вариации. Дисперсия равна:

D(X)=\int \limits _{a}^{b}{\frac {1}{b-a}}\left(x-{\frac {a+b}{2}}\right)^{2}\,dx

.

Замена переменной $y=x-{\frac {a+b}{2}}$ даёт возможность записать:

D(X)={\frac {1}{b-a}}\int \limits _{-c}^{c}y^{2}\,dy={\frac {1}{b-a}}{\frac {y^{3}}{3}}{\biggr |}_{-c}^{c}={\frac {2c^{3}}{3(b-a)}}={\frac {(b-a)^{2}}{12}}

,

где $c={\frac {b-a}{2}}$ . Следовательно, среднеквадратичное отклонение

\sigma ={\frac {b-a}{2{\sqrt {3}}}}

,

а коэффициент вариации таков:

v={\frac {b-a}{{\sqrt {3}}(a+b)}}

.

Преобразования случайных величин

По каждой случайной величине $X$ определяют ещё три величины: центрированную $Y$ , нормированную $V$ и приведённую $U$ . Центрированная случайная величина $Y$ — это разность между данной случайной величиной $X$ и её математическим ожиданием $M(X)$ , то есть $Y=X-M(X)$ . Математическое ожидание центрированной случайной величины $Y$ равно нулю, а дисперсия — дисперсии данной случайной величины: $M(Y)=0$ , $D(Y)=D(X)$ . Функция распределения $F_{Y}(x)$ центрированной случайной величины $Y$ связана с функцией распределения $F(x)$ исходной случайной величины $X$ соотношением

F_{Y}(x)=F{\Big (}x+M(X){\Big )}

.

Для плотностей этих случайных величин справедливо равенство

f_{Y}(x)=f{\Big (}x+M(X){\Big )}

.

Нормированная случайная величина $V$ — это отношение данной случайной величины $X$ к её среднеквадратичному отклонению $\sigma$ , то есть $V={\frac {X}{\sigma }}$ . Математическое ожидание и дисперсия нормированной случайной величины $V$ выражаются через характеристики $X$ так:

M(V)={\frac {M(X)}{\sigma }}={\frac {1}{v}}

,

D(V)=1

,

где $v$ — коэффициент вариации исходной случайной величины $X$ . Для функции распределения $F_{V}(x)$ и плотности $f_{V}(x)$ нормированной случайной величины $V$ имеем:

F_{V}(x)=F(\sigma x)

,

f_{V}(x)=\sigma f(\sigma x)

,

где $F(x)$ — функция распределения исходной случайной величины $X$ , а $f(x)$ — её плотность вероятности.

Приведённая случайная величина $U$ — это центрированная и нормированная случайная величина:

U={\frac {X-M(X)}{\sigma }}

.

Для приведённой случайной величины(19)

M(U)=0

,

D(U)=1

,

F_{U}(x)=F{\Big (}\sigma x+M(X){\Big )}

,

f_{U}(x)=\sigma f{\Big (}\sigma x+M(X){\Big )}

.

Нормированные, центрированные и приведённые случайные величины постоянно используются как в теоретических исследованиях, так и в алгоритмах, программных продуктах, нормативно-технической и инструктивно-методической документации. В частности, потому, что равенства $M(U)=0$ , $D(U)=1$ позволяют упростить обоснования методов, формулировки теорем и расчётные формулы.

Используются преобразования случайных величин и более общего плана. Так, если $Y=aX+b$ , где $a$ и $b$ — некоторые числа, то(20)

M(Y)=aM(X)+b

,

D(Y)=a^{2}D(X)

,

F_{Y}(x)=F\left({\frac {x-b}{a}}\right)

,

f_{Y}(x)={\frac {1}{a}}f\left({\frac {x-b}{a}}\right)

.

Пример 23. Если $a={\frac {1}{\sigma }}$ , $b={\frac {-M(X)}{\sigma }}$ , то $Y$ — приведённая случайная величина, и формулы (20) переходят в формулы (19).

С каждой случайной величиной $X$ можно связать множество случайных величин $Y$ , заданных формулой $Y=aX+b$ при различных $a>0$ и $b$ . Это множество называют масштабно-сдвиговым семейством, порождённым случайной величиной $X$ . Функции распределения $F_{Y}(x)$ составляют масштабно сдвиговое семейство распределений, порождённое функцией распределения $F(x)$ . Вместо $Y=aX+b$ часто используют запись(21)

Y={\frac {X-c}{d}}

,

где

d={\frac {1}{a}}>0

,

c=-{\frac {b}{a}}

.

Число $c$ называют параметром сдвига, а число $d$ — параметром масштаба. Формула (21) показывает, что $X$ — результат измерения некоторой величины — переходит в $Y$ — результат измерения той же величины, если начало измерения перенести в точку $c$ , а затем использовать новую единицу измерения, в $d$ раз бо́льшую старой.

Для масштабно-сдвигового семейства (21) распределение $X$ называют стандартным. В вероятностно-статистических методах принятия решений и других прикладных исследованиях используют стандартное нормальное распределение, стандартное распределение Вейбулла-Гнеденко, стандартное гамма-распределение и другие (см. ниже).

Применяют и другие преобразования случайных величин. Например, для положительной случайной величины $X$ рассматривают $Y=\lg X$ , где $\lg X$ — десятичный логарифм числа $X$ . Цепочка равенств

F_{Y}(x)=P(\lg X<x)=P(X<10^{x})=F(10^{x})

связывает функции распределения $X$ и $Y$ .

Моменты случайных величин

При обработке данных используют такие характеристики случайной величины $X$ как моменты порядка $q$ , то есть математические ожидания случайной величины $X^{q}$ , $q=1,2,\dots$ . Так, само математическое ожидание — это момент порядка 1. Для дискретной случайной величины момент порядка $q$ может быть рассчитан как

m_{q}=M(X^{q})=\sum _{i}x_{i}^{q}P(X=x_{i})

.

Для непрерывной случайной величины

m_{q}=M(X^{q})=\int \limits _{-\infty }^{+\infty }x^{q}f(x)\,dx

.

Моменты порядка $q$ называют также начальными моментами порядка $q$ , в отличие от родственных характеристик — центральных моментов порядка $q$ , задаваемых формулой

\mu _{q}=M\left[{\Big (}X-M(X){\Big )}^{q}\right]

,

q=2,3,\dots

,

Так, дисперсия — это центральный момент порядка 2.

Стандартное нормальное распределение и центральная предельная теорема

В вероятностно-статистических методах часто идёт речь о нормальном распределении. Иногда его пытаются использовать для моделирования распределения исходных данных (эти попытки не всегда являются обоснованными — см. ниже). Более существенно, что многие методы обработки данных основаны на том, что расчётные величины имеют распределения, близкие к нормальному.

Пусть $X_{1},X_{2},\dots ,X_{n},\dots$ — независимые одинаково распределённые случайные величины с математическими ожиданиями $M(X_{i})=m$ и дисперсиями $D(X_{i})=\sigma ^{2}$ , $i=1,2,\dots ,n,\dots$ . Как следует из результатов предыдущей главы,

M(X_{1}+X_{2}+\dots +X_{n})=nm

,

D(X_{1}+X_{2}+\dots +X_{n})=n\sigma ^{2}

.

Рассмотрим приведённую случайную величину $U_{n}$ для суммы $X_{1}+X_{2}+\dots +X_{n}$ , а именно

U_{n}={\frac {X_{1}+X_{2}+\dots +X_{n}-nm}{\sigma {\sqrt {n}}}}

.

Как следует из формул (19), $M(U_{n})=0$ , $D(U_{n})=1$ .

Центральная предельная теорема (для одинаково распределённых слагаемых). Пусть $X_{1},X_{2},\dots ,X_{n},\dots$ — независимые одинаково распределённые случайные величины с математическими ожиданиями $M(X_{i})=m$ и дисперсиями $D(X_{i})=\sigma ^{2}$ , $i=1,2,\dots ,n,\dots$ . Тогда для любого $x$ существует предел

\lim _{n\to \infty }P\left({\frac {X_{1}+X_{2}+\dots +X_{n}-nm}{\sigma {\sqrt {n}}}}<x\right)=\Phi (x)

,

где $\Phi (x)$ — функция стандартного нормального распределения.

Подробнее о функции $\Phi (x)$ — ниже (читается «фи от икс»; тут $\Phi$ — греческая прописная буква «фи»).

Центральная предельная теорема (ЦПТ) носит своё название по той причине, что она является центральным, наиболее часто применяющимся математическим результатом теории вероятностей и математической статистики. История ЦПТ занимает около 200 лет — с 1730 года, когда английский математик Абрахам де Муавр (1667—1754) опубликовал первый результат, относящийся к ЦПТ (см. ниже о теореме Муавра — Лапласа), до двадцатых — тридцатых годов ХХ века, когда финн Дж. У. Линдеберг, француз Поль Леви (1886—1971), югослав В. Феллер (1906—1970), русский А. Я. Хинчин (1894—1959) и другие учёные получили необходимые и достаточные условия справедливости классической центральной предельной теоремы.

Развитие рассматриваемой тематики на этом отнюдь не прекратилось — изучали случайные величины, не имеющие дисперсии, то есть те, для которых

\int \limits _{-\infty }^{\infty }x^{2}f(x)\,dx=+\infty

(Гнеденко и другие), ситуацию, когда суммируются случайные величины (точнее, случайные элементы) более сложной природы, чем числа (Ю. В. Прохоров, А. А. Боровков и их соратники), и так далее.

Функция распределения $\Phi (x)$ задаётся равенством

\Phi (x)=\int \limits _{-\infty }^{x}\phi (y)\,dy

,

где $\phi (y)$ — плотность стандартного нормального распределения, имеющая довольно сложное выражение:

\phi (y)={\frac {1}{\sqrt {2\pi }}}e^{-{\frac {y^{2}}{2}}}

.

Здесь $\pi =3{,}1415925$ — известная константа пи. $e$ — основание натурального логарифма. Как известно из математического анализа,

e=\lim _{n\to \infty }\left(1+{\frac {1}{n}}\right)^{n}

.

При обработке результатов наблюдений функцию нормального распределения в настоящее время уже́ не вычисляют по приведённым формулам, а находят с помощью специальных таблиц или компьютерных программ. Лучшие на русском языке «Таблицы математической статистики» составлены Л. Н. Большевым и Н. В. Смирновым ^[8].

Вид плотности стандартного нормального распределения $\phi (y)$ вытекает из математической теории, которую не имеем возможности здесь рассматривать, равно как и доказательство ЦПТ.

Для иллюстрации приводим небольшие таблицы функции распределения $\Phi (x)$ (таблица 3) и её квантилей (таблица 4). Функция $\Phi (x)$ симметрична относительно нуля, что отражается в таблицах 3 и 4.

Если случайная величина $X$ имеет функцию распределения $\Phi (x)$ , то $M(X)=0$ , $D(X)=1$ . Это утверждение доказывается в теории вероятностей, исходя из вида плотности вероятностей $\phi (y)$ . Оно согласуется с аналогичным утверждением для характеристик приведённой случайной величины $U_{n}$ , что вполне естественно, поскольку ЦПТ утверждает, что при безграничном возрастании числа слагаемых функция распределения $U_{n}$ стремится к функции стандартного нормального распределения $\Phi (x)$ , причём этот предельный переход справедлив для любого числа $x$ .

Таблица 3. Функция стандартного нормального распределения
$x$	$\Phi (x)$
-5,0	0,00000029
-4,0	0,00003167
-3,0	0,00134990
-2,5	0,00620967
-2,0	0,0227501
-1,5	0,0668072
-1,0	0,158655
-0,5	0,308538
0,0	0,500000
0,5	0,691462
1,0	0,841345
1,5	0,9331928
2,0	0,9772499
2,5	0,99379033
3,0	0,99865010
4,0	0,99996833
5,0	0,99999971

Таблица 4. Квантили стандартного нормального распределения.
$p$	Квантиль порядка $p$
0,01	-2,326348
0,025	-1,959964
0,05	-1,644854
0,10	-1,281552
0,30	-0,524401
0,40	-0,253347
0,50	0,000000
0,60	0,253347
0,70	0,524401
0,80	0,841621
0,90	1,281552
0,95	1,644854
0,975	1,959964
0,99	2,326348

Семейство нормальных распределений

Введём понятие семейства нормальных распределений. По определению нормальным распределением называется распределение случайной величины $x$ , для которой распределение приведённой случайной величины есть $\Phi (x)$ . Как следует из общих свойств масштабно-сдвиговых семейств распределений (см. выше), нормальное распределение — это распределение случайной величины

Y=\sigma X+m

,

где $X$ — случайная величина с распределением $\Phi (x)$ , причём $m=M(Y)$ , $\sigma ^{2}=D(Y)$ . Нормальное распределение с параметрами сдвига $m$ и масштаба $\sigma$ обычно обозначается $N(m,\sigma )$ (иногда используется обозначение $N(m,\sigma ^{2})$ ).

Как следует из (20), плотность вероятности нормального распределения $N(m,\sigma )$ есть

f(x)={\frac {1}{\sigma {\sqrt {2\pi }}}}e^{-{\frac {(x-m)^{2}}{2\sigma ^{2}}}}

.

Нормальные распределения образуют масштабно-сдвиговое семейство. При этом параметром масштаба является $d={\frac {1}{\sigma }}$ , а параметром сдвига $c=-{\frac {m}{\sigma }}$ .

Для центральных моментов третьего и четвёртого порядка нормального распределения справедливы равенства

\mu _{3}=0

,

\mu _{4}=3\sigma ^{4}

.

Эти равенства лежат в основе классических методов проверки того, что результаты наблюдений подчиняются нормальному распределению. В настоящее время нормальность обычно рекомендуется проверять по критерию $W$ Шапиро — Уилка. Проблема проверки нормальности обсуждается ниже.

Если случайные величины $X_{1}$ и $X_{2}$ имеют функции распределения $N(m_{1},\sigma _{1})$ и $N(m_{2},\sigma _{2})$ соответственно, то $X_{1}+X_{2}$ имеет распределение $N(m_{1}+m_{2};{\sqrt {\sigma _{1}^{2}+\sigma _{2}^{2}}})$ . Следовательно, если случайные величины $X_{1},X_{2},\dots ,X_{n}$ независимы и имеют одно и тоже распределение $N(m,\sigma )$ , то их среднее арифметическое

{\overline {X}}={\frac {X_{1}+X_{2}+\dots +X_{n}}{n}}

имеет распределение $N\left(m,{\frac {\sigma }{\sqrt {n}}}\right)$ . Эти свойства нормального распределения постоянно используются в различных вероятностно-статистических методах принятия решений, в частности, при статистическом регулировании технологических процессов и в статистическом приёмочном контроле по количественному признаку.

Распределения Пирсона (хи-квадрат, Стьюдента и Фишера)

С помощью нормального распределения определяются три распределения, которые в настоящее время часто используются при статистической обработке данных. В дальнейших разделах книги много раз встречаются эти распределения.

Распределение Пирсона $\chi ^{2}$ (хи-квадрат) — распределение случайной величины

X=X_{1}^{2}+X_{2}^{2}+\dots +X_{n}^{2}

,

где случайные величины $X_{1},X_{2},\dots ,X_{n}$ независимы и имеют одно и тоже распределение $N(0,1)$ . При этом число слагаемых, то есть $n$ , называется «числом степеней свободы» распределения хи-квадрат.

Распределение хи-квадрат используют при оценивании дисперсии (с помощью доверительного интервала), при проверке гипотез согласия, однородности, независимости, прежде всего для качественных (категоризованных) переменных, принимающих конечное число значений, и во многих других задачах статистического анализа данных ^[8], ^[9], ^[10], ^[11].

Распределение $t$ Стьюдента — это распределение случайной величины

T={\frac {U{\sqrt {n}}}{\sqrt {X}}}

,

где случайные величины $U$ и $X$ независимы, $U$ имеет стандартное нормальное распределение $N(0,1)$ , а $X$ — распределение хи-квадрат с $n$ степенями свободы. При этом $n$ называется «числом степеней свободы» распределения Стьюдента.

Распределение Стьюдента было введено в 1908 году английским статистиком В. Госсетом, работавшем на фабрике, выпускающей пиво. Вероятностно-статистические методы использовались для принятия экономических и технических решений на этой фабрике, поэтому её руководство запрещало Госсету публиковать научные статьи под своим именем. Таким способом охранялась коммерческая тайна, «ноу-хау» в виде вероятностно-статистических методов, разработанных Госсетом. Однако он имел возможность публиковаться под псевдонимом «Стьюдент». История Госсета — Стьюдента показывает, что ещё сто лет назад менеджерам Великобритании была очевидна большая экономическая эффективность вероятностно-статистических методов.

В настоящее время распределение Стьюдента — одно из наиболее известных распределений среди используемых при анализе реальных данных. Его применяют при оценивании математического ожидания, прогнозного значения и других характеристик с помощью доверительных интервалов, по проверке гипотез о значениях математических ожиданий, коэффициентов регрессионной зависимости, гипотез однородности выборок и так далее ^[8], ^[9], ^[10].

Распределение Фишера — это распределение случайной величины

F={\frac {{\frac {1}{k_{1}}}X_{1}}{{\frac {1}{k_{2}}}X_{2}}}

,

где случайные величины $X_{1}$ и $X_{2}$ независимы и имеют распределения хи-квадрат с числом степеней свободы $k_{1}$ и $k_{2}$ соответственно. При этом пара $(k_{1},k_{2})$ — пара «чисел степеней свободы» распределения Фишера, а именно, $k_{1}$ — число степеней свободы числителя, а $k_{2}$ — число степеней свободы знаменателя. Распределение случайной величины $F$ названо в честь великого английского статистика Р. Фишера (1890—1962), активно использовавшего его в своих работах.

Распределение Фишера используют при проверке гипотез об адекватности модели в регрессионном анализе, о равенстве дисперсий и в других задачах прикладной статистики ^[8], ^[9], ^[10].

Выражения для функций распределения хи-квадрат, Стьюдента и Фишера, их плотностей и характеристик, а также таблицы, необходимые для их практического использования, можно найти в специальной литературе (например, ^[8]).

Центральная предельная теорема (общий случай)

Как уже́ отмечалось, нормальные распределения в настоящее время часто используют в вероятностных моделях в различных прикладных областях. В чём причина такой широкой распространённости этого двухпараметрического семейства распределений? Она проясняется следующей теоремой.

Центральная предельная теорема (для разнораспределённых слагаемых). Пусть $X_{1},X_{2},\dots ,X_{n},\dots$ — независимые случайные величины с математическими ожиданиями $M(X_{1}),M(X_{2}),\dots ,M(X_{n}),\dots$ и дисперсиями $D(X_{1}),D(X_{2}),\dots ,D(X_{n}),\dots$ соответственно. Пусть

U_{n}={\frac {X_{1}+X_{2}+\dots +X_{n}-M(X_{1})-M(X_{2})-\dots -M(X_{n})}{\sqrt {D(X_{1})+D(X_{2})+\dots +D(X_{n})}}}

.

Тогда при справедливости некоторых условий, обеспечивающих малость вклада любого из слагаемых в $U_{n}$ ,

\lim _{n\to \infty }P(U_{n}<x)=\Phi (x)

для любого $x$ .

Условия, о которых идёт речь, не будем здесь формулировать. Их можно найти в специальной литературе (см., например, ^[6]). «Выяснение условий, при которых действует ЦПТ, составляет заслугу выдающихся русских ученых А. А. Маркова (1857—1922) и, в особенности, А. М. Ляпунова (1857—1918)» (^[9], с. 197).

Центральная предельная теорема показывает, что в случае, когда результат измерения (наблюдения) складывается под действием многих причин, причём каждая из них вносит лишь малый вклад, а совокупный итог определяется аддитивно, то есть путем сложения, то распределение результата измерения (наблюдения) близко к нормальному.

Иногда считают, что для нормальности распределения достаточно того, что результат измерения (наблюдения) $X$ формируется под действием многих причин, каждая из которых оказывает малое воздействие. Это заключение неверно. Важно, как эти причины действуют. Если аддитивно, то $X$ имеет приближённо нормальное распределение. Если мультипликативно (то есть действия отдельных причин перемножаются, а не складываются), то распределение $X$ близко не к нормальному, а к так называемому логарифмически нормальному, то есть не $X$ , а $\lg X$ имеет приблизительно нормальное распределение. Если же нет оснований считать, что действует один из этих двух механизмов формирования итогового результата (или какой-либо иной вполне определённый механизм), то про распределение $X$ ничего определённого сказать нельзя.

Из сказанного вытекает, что в конкретной прикладной задаче нормальность результатов измерений (наблюдений), как правило, нельзя установить из общих соображений, её следует проверять с помощью статистических критериев. Или же использовать непараметрические статистические методы, не опирающиеся на предположения о принадлежности функций распределения результатов измерений (наблюдений) к тому или иному параметрическому семейству.

Непрерывные распределения, используемые в вероятностно-статистических методах

Кроме масштабно-сдвигового семейства нормальных распределений, широко используют ряд других семейств распределения — логарифмически нормальных, экспоненциальных, Вейбулла-Гнеденко, гамма-распределений. Рассмотрим эти семейства.

Логарифмически нормальные распределения

Случайная величина $X$ имеет логарифмически нормальное распределение, если случайная величина $Y=\lg X$ имеет нормальное распределение. Тогда $Z=\ln X=2{,}3026\dots Y$ также имеет нормальное распределение $N(a_{1},\sigma _{1})$ , где $\ln X$ — натуральный логарифм $X$ . Плотность логарифмически нормального распределения такова:

f(x;a_{1},\sigma _{1})=\left\{{\begin{matrix}{\frac {1}{\sigma _{1}{\sqrt {2\pi }}x}}e^{-{\frac {(\ln x-a_{1})^{2}}{2\sigma _{1}^{2}}}},&x>0\\0,&x\leqslant 0.\end{matrix}}\right.

Из центральной предельной теоремы следует, что произведение $X=X_{1},X_{2},\dots ,X_{n}$ независимых положительных случайных величин $X_{i}$ , $i=1,2,\dots ,n$ , при больши́х $n$ можно аппроксимировать логарифмически нормальным распределением. В частности, мультипликативная модель формирования заработной платы или дохода приводит к рекомендации приближать распределения заработной платы и дохода логарифмически нормальными законами. Для России эта рекомендация оказалась обоснованной — статистические данные подтверждают её.

Имеются и другие вероятностные модели, приводящие к логарифмически нормальному закону. Классический пример такой модели дан Колмогоровым ^[12], который из физически обоснованной системы постулатов вывел заключение о том, что размеры частиц при дроблении кусков руды, угля и тому подобного на шаровых мельницах имеют логарифмически нормальное распределение.

Экспоненциальные распределения

Перейдём к другому семейству распределений, широко используемому в различных вероятностно-статистических методах принятия решений и других прикладных исследованиях, — семейству экспоненциальных распределений. Начнем с вероятностной модели, приводящей к таким распределениям. Для этого рассмотрим «поток событий», то есть последовательность событий, происходящих одно за другим в какие-то моменты времени. Примерами могут служить: поток вызовов на телефонной станции; поток отказов оборудования в технологической цепочке; поток отказов изделий при испытаниях продукции; поток обращений клиентов в отделение банка; поток покупателей, обращающихся за товарами и услугами, и так далее. В теории потоков событий справедлива теорема, аналогичная центральной предельной теореме, но в ней речь идёт не о суммировании случайных величин, а о суммировании потоков событий. Рассматривается суммарный поток, составленный из большого числа независимых потоков, ни один из которых не оказывает преобладающего влияния на суммарный поток. Например, поток вызовов, поступающих на телефонную станцию, слагается из большого числа независимых потоков вызовов, исходящих от отдельных абонентов. Доказано ^[6], что в случае, когда характеристики потоков не зависят от времени, суммарный поток полностью описывается одним числом $\lambda$ — интенсивностью потока. Для суммарного потока рассмотрим случайную величину $X$ — длину промежутка времени между последовательными событиями. Её функция распределения имеет вид(22)

F(x;\lambda )=P(X\leqslant x)=\left\{{\begin{matrix}1-e^{-\lambda x},&x\geqslant 0\\0,&x<0.\end{matrix}}\right.

Это распределение называется экспоненциальным распределением, так как в формуле (22) участвует экспоненциальная функция $e^{-\lambda x}$ . Величина ${\frac {1}{\lambda }}$ — масштабный параметр. Иногда вводят и параметр сдвига $c$ , при этом экспоненциальным распределением называют распределение случайной величины $X+c$ , где распределение $X$ задаётся формулой (22).

В формуле (22) $e$ — основание натурального логарифма. Функция экспоненциального распределения $F(x,\lambda )$ и его плотность $f(x,\lambda )$ связаны простым соотношением

f(x,\lambda )=\lambda {\Big (}1-F(x,\lambda ){\Big )}

.

Это соотношение имеет простую интерпретацию в терминах теории надёжности технических изделий и устройств. Оно означает, что интенсивность отказов (то есть интенсивность выхода изделий из строя) постоянна, другими словами, не зависит от того, сколько времени изделие уже́ проработало. Обычно интенсивность отказов постоянна на основном этапе эксплуатации, после того, как на начальном этапе выявлены скрытые дефекты, и до того, как из-за естественного старения материалов начинает происходить ускоренный износ с резким возрастанием интенсивности выхода изделия из строя.

Распределения Вейбулла — Гнеденко

Экспоненциальные распределения — частный случай так называемых распределений Вейбулла — Гнеденко. Они названы по фамилиям инженера В. Вейбулла, введшего эти распределения в практику анализа результатов усталостных испытаний, и математика Бориса Владимировича Гнеденко (1912—1995), получившего такие распределения в качестве предельных при изучении максимального из результатов испытаний. Пусть $X$ — случайная величина, характеризующая длительность функционирования изделия, сложной системы, элемента (то есть ресурс, наработку до предельного состояния и тому подобное), длительность функционирования предприятия или жизни живого существа и так далее. Важную роль играет интенсивность отказа(23)

\lambda (x)={\frac {f(x)}{1-F(x)}}

,

где $F(x)$ и $f(x)$ — функция распределения и плотность случайной величины $X$ .

Опишем типичное поведение интенсивности отказа. Весь интервал времени можно разбить на три периода. На первом из них функция $\lambda (x)$ имеет высокие значения и явную тенденцию к убыванию (чаще всего она монотонно убывает). Это можно объяснить наличием в рассматриваемой партии единиц продукции с явными и скрытыми дефектами, которые приводят к относительно быстрому выходу из строя этих единиц продукции. Первый период называют «периодом приработки» (или «обкатки»). Именно на него обычно распространяется гарантийный срок.

Затем наступает период нормальной эксплуатации, характеризующийся приблизительно постоянной и сравнительно низкой интенсивностью отказов. Природа отказов в этот период носит внезапный характер (аварии, ошибки эксплуатационных работников и тому подобное) и не зависит от длительности эксплуатации единицы продукции.

Наконец, последний период эксплуатации — период старения и износа. Природа отказов в этот период — в необратимых физико-механических и химических изменениях материалов, приводящих к прогрессирующему ухудшению качества единицы продукции и окончательному выходу её из строя.

Каждому периоду соответствует свой вид функции $\lambda (x)$ . Рассмотрим класс степенных зависимостей(24)

\lambda (x)=\lambda _{0}bx^{b-1}

,

где $\lambda _{0}>0$ и $b>0$ — некоторые числовые параметры. Значения $b<1$ , $b=0$ и $b>1$ отвечают виду интенсивности отказов в периоды приработки, нормальной эксплуатации и старения соответственно.

Соотношение (23) при заданной интенсивности отказа $\lambda (x)$ — дифференциальное уравнение относительно функции $F(x)$ . Из теории дифференциальных уравнений следует, что(25)

F(x)=1-\exp \left(-\int \limits _{0}^{x}\lambda (t)\,dt\right)

.

Подставив (14) в (25), получим, что(26)

f(x)=\left\{{\begin{matrix}1-\exp \left(-\lambda _{0}x^{b}\right),&x\geqslant 0\\0,&x<0.\end{matrix}}\right.

.

Распределение, задаваемое формулой (26) называется распределением Вейбулла — Гнеденко. Поскольку

\lambda _{0}x^{b}=\left({\frac {x}{a}}\right)^{b}

,

где(27)

a=\lambda _{0}^{-{\frac {1}{b}}}

,

то из формулы (26) следует, что величина $a$ , задаваемая формулой (27), является масштабным параметром. Иногда вводят и параметр сдвига, то есть функциями распределения Вейбулла — Гнеденко называют $F(x-c)$ , где $F(x)$ задаётся формулой (26) при некоторых $\lambda _{0}$ и $b$ .

Плотность распределения Вейбулла — Гнеденко имеет вид(28)

f(x;\,a,b,c)=\left\{{\begin{matrix}{\frac {b}{a}}\left({\frac {x-c}{a}}\right)^{b-1}\exp \left(-\left({\frac {x-c}{a}}\right)^{b}\right),&x\geqslant c\\0,&x<c\end{matrix}}\right.

где $a>0$ — параметр масштаба, $b>0$ — параметр формы, $c$ — параметр сдвига. При этом параметр $a$ из формулы (28) связан с параметром $\lambda _{0}$ из формулы (26) соотношением, указанным в формуле (27).

Экспоненциальное распределение — весьма частный случай распределения Вейбулла — Гнеденко, соответствующий значению параметра формы $b=1$ .

Распределение Вейбулла — Гнеденко применяется также при построении вероятностных моделей ситуаций, в которых поведение объекта определяется «наиболее слабым звеном». Подразумевается аналогия с цепью, сохранность которой определяется тем её звеном, которое имеет наименьшую прочность. Другими словами, пусть $X_{1},X_{2},\dots ,X_{n}$ — независимые одинаково распределённые случайные величины, $X(1)=\min(X_{1},X_{2},\dots ,X_{n})$ , $X(n)=\max(X_{1},X_{2},\dots ,X_{n})$ .

В ряде прикладных задач большу́ю роль играют $X(1)$ и $X(n)$ , в частности, при исследовании максимально возможных значений («рекордов») тех или иных значений, например, страховых выплат или потерь из-за коммерческих рисков, при изучении пределов упругости и выносливости стали, ряда характеристик надёжности и тому подобного. Показано, что при больши́х $n$ распределения $X(1)$ и $X(n)$ , как правило, хорошо описываются распределениями Вейбулла — Гнеденко. Основополагающий вклад в изучение распределений $X(1)$ и $X(n)$ внёс Гнеденко. Использованию полученных результатов в экономике, менеджменте, технике и других областях посвящены труды Вейбулла, Э. Гумбеля, В. Б. Невзорова, Э. М. Кудлаева и многих иных специалистов.

Гамма-распределения

Перейдём к семейству гамма-распределений. Они широко применяются в экономике и менеджменте, теории и практике надёжности и испытаний, в различных областях техники, метеорологии и так далее. В частности, гамма-распределению подчинены во многих ситуациях такие величины, как общий срок службы изделия, длина цепочки токопроводящих пылинок, время достижения изделием предельного состояния при коррозии, время наработки до $k$ -го отказа, $k=1,2,\dots$ , и так далее. Продолжительность жизни больных хроническими заболеваниями, время достижения определённого эффекта при лечении в ряде случаев имеют гамма-распределение. Это распределение наиболее адекватно для описания спроса в экономико-математических моделях управления запасами (логистики).

Плотность гамма-распределения имеет вид(29)

f(x;\,a,b,c)=\left\{{\begin{matrix}{\frac {1}{\Gamma (a)}}(x-c)^{a-1}b^{-a}e^{-{\frac {x-c}{b}}},&x\geqslant c\\0,&x<c\end{matrix}}\right.

.

Плотность вероятности в формуле (29) определяется трёмя параметрами $a$ , $b$ , $c$ , где $a>0$ , $b>0$ . При этом $a$ является параметром формы, $b$ — параметром масштаба и $c$ — параметром сдвига. Множитель ${\frac {1}{\Gamma (a)}}$ является нормировочным, он введён, чтобы

\int \limits _{-\infty }^{+\infty }f(x;\,a,b,c)\,dx=1

.

Здесь $\Gamma (a)$ — одна из используемых в математике специальных функций, так называемая «гамма-функция», по которой названо и распределение, задаваемое формулой (17):

\Gamma (a)=\int \limits _{0}^{+\infty }x^{a-1}e^{-x}\,dx

.

При фиксированном а формула (29) задает масштабно-сдвиговое семейство распределений, порождаемое распределением с плотностью(30)

f(x,a)=\left\{{\begin{matrix}{\frac {1}{\Gamma (a)}}x^{a-1}e^{-x},&x\geqslant 0\\0,&x<0\end{matrix}}\right.

.

Распределение вида (30) называется стандартным гамма-распределением. Оно получается из формулы (29) при $b=1$ и $c=0$ .

Частным случаем гамма-распределений при $a=1$ являются экспоненциальные распределения (с $\lambda ={\frac {1}{b}}$ ). При натуральном $a$ и $c=0$ гамма-распределения называются распределениями Эрланга. С работ датского ученого Агнера Крарупа Эрланга (1878—1929), сотрудника Копенгагенской телефонной компании, изучавшего в 1908—1922 годах функционирование телефонных сетей, началось развитие теории массового обслуживания. Эта теория занимается вероятностно-статистическим моделированием систем, в которых происходит обслуживание потока заявок, с целью принятия оптимальных решений. Распределения Эрланга используют в тех же прикладных областях, в которых применяют экспоненциальные распределения. Это основано на следующем математическом факте: сумма $k$ независимых случайных величин, экспоненциально распределённых с одинаковыми параметрами $\lambda$ и $c$ , имеет гамма-распределение с параметром формы $a=k$ , параметром масштаба $b={\frac {1}{\lambda }}$ и параметром сдвига $kc$ . При $c=0$ получаем распределение Эрланга.

Если случайная величина $X$ имеет гамма-распределение с параметром формы $a$ таким, что $d=2a$ — целое число, $b=1$ и $c=0$ , то $2X$ имеет распределение хи-квадрат с $d$ степенями свободы.

Случайная величина $X$ с гамма-распределением имеет следующие характеристики:

математическое ожидание $M(X)=ab+c$ ,
дисперсию $D(X)=\sigma ^{2}=ab^{2}$ ,
коэффициент вариации $\nu ={\frac {b{\sqrt {a}}}{ab+c}}$ ,
асимметрию $M\left[{\Big (}X-M(X){\Big )}^{3}\right]={\frac {2}{\sqrt {a}}}$ ,
эксцесс ${\frac {M\left[{\Big (}X-M(X){\Big )}^{4}\right]}{\sigma ^{4}}}-3={\frac {6}{a}}$ .

Нормальное распределение — предельный случай гамма-распределения. Точнее, пусть $Z$ — случайная величина, имеющая стандартное гамма-распределение, заданное формулой (30). Тогда

\lim _{a\to \infty }P\left\{{\frac {Z-a}{\sqrt {a}}}<x\right\}=\Phi (x)

для любого действительного числа $x$ , где $\Phi (x)$ — функция стандартного нормального распределения $N(0,1)$ .

В прикладных исследованиях используются и другие параметрические семейства распределений, из которых наиболее известны система кривых Пирсона, ряды Эджворта и Шарлье. Здесь они не рассматриваются.

Дискретные распределения, используемые в вероятностно-статистических методах

Наиболее часто используют три семейства дискретных распределений — биномиальных, гипергеометрических и Пуассона, а также некоторые другие семейства — геометрических, отрицательных биномиальных, мультиномиальных, отрицательных гипергеометрических и так далее.

Подробнее о биномиальном распределении

Как уже́ говорилось, биномиальное распределение имеет место при независимых испытаниях, в каждом из которых с вероятностью $p$ появляется событие $A$ . Если общее число испытаний $n$ задано, то число испытаний $Y$ , в которых появилось событие $A$ , имеет биномиальное распределение. Для биномиального распределения вероятность принятия случайной величиной $Y$ значения $y$ определяется формулой (31)

P(Y=y\;|\;p,n)={n \choose y}p^{y}(1-p)^{n-y}

,

y=0,1,2,\dots ,n

,

где ${n \choose y}={\frac {n!}{y!(n-y)!}}=C_{n}^{y}$ — число сочетаний из $n$ элементов по $y$ , известное из комбинаторики. Для всех $y$ , кроме $0,1,2,\dots ,n$ , имеем $P(Y=y)=0$ . Биномиальное распределение при фиксированном объёме выборки $n$ задаётся параметром $p$ , то есть биномиальные распределения образуют однопараметрическое семейство. Они применяются при анализе данных выборочных исследований ^[2], в частности, при изучении предпочтений потребителей, выборочном контроле качества продукции по планам одноступенчатого контроля, при испытаниях совокупностей индивидуумов в демографии, социологии, медицине, биологии и другом.

Если $Y_{1}$ и $Y_{2}$ — независимые биномиальные случайные величины с одним и тем же параметром $p_{0}$ , определённые по выборкам с объёмами $n_{1}$ и $n_{2}$ соответственно, то $Y_{1}+Y_{2}$ — биномиальная случайная величина, имеющая распределение (31) с $p=p_{0}$ и $n=n_{1}+n_{2}$ . Это замечание расширяет область применимости биномиального распределения, позволяя объединять результаты нескольких групп испытаний, когда есть основания полагать, что всем этим группам соответствует один и тот же параметр.

Характеристики биномиального распределения вычислены ранее:

M(Y)=np

,

D(Y)=np(1-p)

.

В главе «События и множества» для биномиальной случайной величины доказан закон больши́х чисел:

\lim _{n\to \infty }P\left\{\left|{\frac {Y}{n}}-p\right|\geqslant \varepsilon \right\}=0

для любого $\varepsilon >0$ . С помощью центральной предельной теоремы закон больши́х чисел можно уточнить, указав, насколько ${\frac {Y}{n}}$ отличается от $p$ .

Теорема Муавра — Лапласа

Для любых чисел $a$ и $b$ , $a<b$ , имеем

\lim _{n\to \infty }P\left\{a\leqslant {\frac {Y-np}{\sqrt {np(1-p)}}}<b\right\}=\Phi (b)-\Phi (a)

,

где $\Phi (x)$ — функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1.

Для доказательства достаточно воспользоваться представлением $Y$ в виде суммы независимых случайных величин, соответствующих исходам отдельных испытаний, формулами для $M(Y)$ и $D(Y)$ и центральной предельной теоремой.

Эта теорема для случая $p={\frac {1}{2}}$ доказана английским математиком Абрахамом де Муавром (1667—1754) в 1730 году. В приведённой выше формулировке она была доказана в 1810 году французским математиком Пьером-Симоном Лапласом (1749—1827).

Гипергеометрическое распределение

Гипергеометрическое распределение имеет место при выборочном контроле конечной совокупности объектов объёма $N$ по альтернативному признаку. Каждый контролируемый объект классифицируется либо как обладающий признаком $A$ , либо как не обладающий этим признаком. Гипергеометрическое распределение имеет случайная величина $Y$ , равная числу объектов, обладающих признаком $A$ в случайной выборке объёма $n$ , где $n<N$ . Например, число $Y$ дефектных единиц продукции в случайной выборке объёма $n$ из партии объёма $N$ имеет гипергеометрическое распределение, если $n<N$ . Другой пример — лотерея. Пусть признак $A$ билета — это признак «быть выигрышным». Пусть всего билетов $N$ , а некоторое лицо приобрело $n$ из них. Тогда число выигрышных билетов у этого лица имеет гипергеометрическое распределение.

Для гипергеометрического распределения вероятность принятия случайной величиной $Y$ значения $y$ имеет вид(32)

P(Y=y|N,d,n)={\frac {{n \choose y}{N-n \choose D-y}}{N \choose D}}

,

где $D$ — число объектов, обладающих признаком $A$ , в рассматриваемой совокупности объёма $N$ . При этом $y$ принимает значения от $\max\{0,n-(N-D)\}$ до $\min\{n,D\}$ , при прочих $y$ вероятность в формуле (32) равна нулю. Таким образом, гипергеометрическое распределение определяется тремя параметрами — объёмом генеральной совокупности $N$ , числом объектов $D$ в ней, обладающих рассматриваемым признаком $A$ , и объёмом выборки $n$ .

Простой случайной выборкой объёма $n$ из совокупности объёма $N$ называется выборка, полученная в результате случайного отбора, при котором любой из $N \choose n$ наборов из $n$ объектов имеет одну и ту же вероятность быть отобранным. Методы случайного отбора выборок респондентов (опрашиваемых) или единиц штучной продукции рассматриваются в инструктивно-методических и нормативно-технических документах. Один из методов отбора таков: объекты отбирают один из другим, причём на каждом шаге каждый из оставшихся в совокупности объектов имеет одинаковые шансы быть отобранным. В литературе для рассматриваемого типа выборок используются также термины «случайная выборка», «случайная выборка без возвращения».

Поскольку объёмы генеральной совокупности (партии) $N$ и выборки $n$ обычно известны, то подлежащим оцениванию параметром гипергеометрического распределения является $D$ . В статистических методах управления качеством продукции $D$ — обычно число дефектных единиц продукции в партии. Представляет интерес также характеристика распределения ${\frac {D}{N}}$ — уровень дефектности.

Для гипергеометрического распределения

M(Y)=n{\frac {D}{N}}

,

D(Y)=n{\frac {D}{N}}\left(1-{\frac {D}{N}}\right)\left(1-{\frac {n-1}{N-1}}\right)

.

Последний множитель в выражении для дисперсии близок к 1, если $N>10n$ . Если при этом сделать замену $p={\frac {D}{N}}$ , то выражения для математического ожидания и дисперсии гипергеометрического распределения перейдут в выражения для математического ожидания и дисперсии биномиального распределения. Это не случайно. Можно показать, что

P(Y=y\;|\;N,d,n)={\frac {{n \choose y}{N-n \choose D-y}}{N \choose D}}\approx P(Y=y\;|\;p,n)={n \choose y}p^{y}(1-p)^{n-y}

,

y=0,1,2,\dots ,n

,

при $N>10n$ , где $p={\frac {D}{N}}$ . Точнее, справедливо предельное соотношение

lim_{N\to \infty ,{\frac {D}{N}}\to p}P(Y=y\;|\;N,d,n)=P(Y=y\;|\;p,n)

,

y=0,1,2,\dots ,n

,

и этим предельным соотношением можно пользоваться при $N>10n$ .

Распределение Пуассона

Третье широко используемое дискретное распределение — распределение Пуассона. Случайная величина $Y$ имеет распределение Пуассона, если

P(Y=y)={\frac {\lambda ^{y}e^{-\lambda }}{y!}}

,

y=0,1,2,\dots

,

где $\lambda$ — параметр распределения Пуассона, и $P(Y=y)=0$ для всех прочих $y$ (при $y=0$ обозначено $0!=1$ ). Для распределения Пуассона

M(Y)=\lambda

,

D(Y)=\lambda

.

Это распределение названо в честь французского математика Симеона-Дени Пуассона (1781—1840), впервые получившего его в 1837 году. Распределение Пуассона является предельным случаем биномиального распределения, когда вероятность $p$ осуществления события мала, но число испытаний $n$ велико, причём $np=\lambda$ . Точнее, справедливо предельное соотношение

\lim _{n\to \infty ,np\to \lambda }P(Y=y|p,n)={\frac {\lambda ^{y}e^{-\lambda }}{y!}}

,

y=0,1,2,\dots

.

Поэтому распределение Пуассона (в старой терминологии «закон распределения») часто называют также «законом редких событий».

Распределение Пуассона возникает в теории потоков событий (см. выше). Доказано, что для простейшего потока с постоянной интенсивностью $\Lambda$ число событий (вызовов), происшедших за время $t$ , имеет распределение Пуассона с параметром $\lambda =\Lambda t$ . Следовательно, вероятность того, что за время $t$ не произойдет ни одного события, равна $e^{\Lambda t}$ , то есть функция распределения длины промежутка между событиями является экспоненциальной.

Распределение Пуассона используется при анализе результатов выборочных потребителей товара, расчёте оперативных характеристик планов статистического приёмочного контроля в случае малых значений приёмочного уровня дефектности, для описания числа разладок статистически управляемого технологического процесса в единицу времени, числа «требований на обслуживание», поступающих в единицу времени в систему массового обслуживания, статистических закономерностей несчастных случаев и редких заболеваний, и так далее.

Описание иных параметрических семейств дискретных распределений и возможности их практического использования рассматриваются в обширной (более миллиона названий статей и книг на десятках языков) литературе по вероятностно-статистическим методам.

Основные проблемы прикладной статистики — описание данных, оценивание и проверка гипотез

Выделяют три основные области статистических методов обработки результатов наблюдений — описание данных, оценивание (характеристик и параметров распределений, регрессионных зависимостей и другого) и проверка статистических гипотез. Рассмотрим основные понятия, применяемые в этих областях.

Основные понятия для описания данных

Описание данных — предварительный этап статистической обработки. Используемые при описании данных величины применяются при дальнейших этапах статистического анализа — оценивании и проверке гипотез, а также при решении иных задач, возникающих при применении вероятностно-статистических методов принятия решений, например, при статистическом контроле качества продукции и статистическом регулировании технологических процессов.

Статистические данные — это результаты наблюдений (измерений, испытаний, опытов, анализов). Функции результатов наблюдений, используемые, в частности, для оценки параметров распределений и (или) для проверки статистических гипотез, называют «статистиками». (Для математиков надо добавить, что речь идёт об измеримых функциях.) Если в вероятностной модели результаты наблюдений рассматриваются как случайные величины (или случайные элементы), то статистики, как функции случайных величин (элементов), сами являются случайными величинами (элементами). Статистики, являющиеся выборочными аналогами характеристик случайных величин (математического ожидания, медианы, дисперсии, моментов и других) и используемые для оценивания этих характеристик, называют статистическими характеристиками.

Виды выборок

Основополагающее понятие в вероятностно-статистических методах принятия решений — выборка. Как уже́ говорилось, выборка — это набор наблюдаемых значений или множество объектов, отобранные из изучаемой совокупности.

Например, единицы продукции, отобранные из контролируемой партии или потока продукции для контроля и принятия решений. Наблюдаемые значения обозначим $x_{1},x_{2},\dots ,x_{n}$ где $n$ — объём выборки, то есть число наблюдаемых значений, составляющих выборку. О втором виде выборок уже́ шла речь при рассмотрении гипергеометрического распределения, когда под выборкой понимался набор единиц продукции, отобранных из партии. Там же обсуждалась вероятностная модель случайной выборки.

В вероятностной модели выборки первого вида наблюдаемые значения обычно рассматривают как реализацию независимых одинаково распределённых случайных величин $X_{1}(\omega ),X_{2}(\omega ),\dots ,X_{n}(\omega )$ , $\omega \in \Omega$ . При этом считают, что полученные при наблюдениях конкретные значения $x_{1},x_{2},\dots ,x_{n}$ соответствуют определённому элементарному событию $\omega =\omega _{0}$ , то есть

$x_{1}=X_{1}(\omega _{0}),\;x_{2}=X_{2}(\omega _{0}),\;\dots ,\;x_{n}=X_{n}(\omega _{0})$ , $\omega _{0}\in \Omega$ .

При повторных наблюдениях будут получены иные наблюдаемые значения, соответствующие другому элементарному событию $\omega =\omega _{1}$ . Цель обработки статистических данных состоит в том, чтобы по результатам наблюдений, соответствующим элементарному событию $\omega =\omega _{0}$ , сделать выводы о вероятностной мере $P$ и результатах наблюдений при различных возможных $\omega =\omega _{1}$ .

Применяют и другие, более сложные вероятностные модели выборок. Например, цензурированные выборки соответствуют испытаниям, проводящимся в течение определённого промежутка времени. При этом для части изделий удаётся замерить время наработки на отказ, а для остальных лишь констатируется, что наработки на отказ для них больше времени испытания. Для выборок второго вида отбор объектов может проводиться в несколько этапов. Например, для входного контроля сигарет могут сначала отбираться коробки, в отобранных коробках — блоки, в выбранных блоках — пачки, а в пачках — сигареты. Четыре ступени отбора. Ясно, что выборка будет обладать иными свойствами, чем простая случайная выборка из совокупности сигарет.

Часто́ты

Из приведённого выше определения математической статистики следует, что описание статистических данных даётся с помощью частот. Частота — это отношение числа $X$ наблюдаемых единиц, которые принимают заданное значение или лежат в заданном интервале, к общему числу наблюдений $n$ , то есть частота — это ${\frac {X}{n}}$ . (В более старой литературе иногда ${\frac {X}{n}}$ называется относительной частотой, а под частотой имеется в виду $X$ . В старой терминологии можно сказать, что относительная частота — это отношение частоты к общему числу наблюдений.)

Отметим, что обсуждаемое определение приспособлено к нуждам одномерной статистики. В случае многомерного статистического анализа, статистики случайных процессов и временны́х рядов, статистики объектов нечисловой природы нужны несколько иные определения понятия «статистические данные». Не считая нужным давать такие определения, отметим, что в подавляющем большинстве практических постановок исходные статистические данные — это выборка или несколько выборок. А выборка — это конечная совокупность соответствующих математических объектов (чисел, векторов, функций, объектов нечисловой природы).

Число $X$ имеет биномиальное распределение, задаваемое вероятностью $p$ того, что случайная величина, с помощью которой моделируются результаты наблюдений, принимает заданное значение или лежит в заданном интервале, и общим числом наблюдений $n$ . Из закона больши́х чисел (теорема Бернулли) следует, что ${\frac {X}{n}}\to p$ при $n\to \infty$ (сходимость по вероятности), то есть частота сходится к вероятности. Теорема Муавра — Лапласа позволяет уточнить скорость сходимости в этом предельном соотношении.

Эмпирическая функция распределения

Чтобы от отдельных событий перейти к одновременному рассмотрению многих событий, используют накопленную частоту. Так называется отношение числа единиц, для которых результаты наблюдения меньше заданного значения, к общему числу наблюдений. (Это понятие используется, если результаты наблюдения — действительные числа, а не вектора, функции или объекты нечисловой природы.) Функция, которая выражает зависимость между значениями количественного признака и накопленной частотой, называется эмпирической функцией распределения. Итак, эмпирической функцией распределения $F_{n}(x)$ называется доля элементов выборки, меньших $x$ . Эмпирическая функция распределения содержит всю информацию о результатах наблюдений.

Чтобы записать выражение для эмпирической функции распределения в виде формулы, введём функцию $c(x,y)$ двух переменных:

c(x,y)=\left\{{\begin{matrix}0,&x\leqslant y,\\1,&x>y.\end{matrix}}\right.

Случайные величины, моделирующие результаты наблюдений, обозначим $X_{1}(\omega ),X_{2}(\omega ),\dots ,X_{n}(\omega )$ , $\omega \in \Omega$ . Тогда эмпирическая функция распределения $F_{n}(x)$ имеет вид

F_{n}(x)=F_{n}(x,\omega )={\frac {1}{n}}\sum _{1\leqslant i\leqslant n}c{\Big (}x,X_{i}(\omega ){\Big )}

.

Из закона больши́х чисел следует, что для каждого действительного числа $x$ эмпирическая функция распределения $F_{n}(x)$ сходится к функции распределения $F(x)$ результатов наблюдений, то есть(33)

F_{n}(x)\to F(x)

при $n\to \infty$ . Советский математик В. И. Гливенко (1897—1940) доказал в 1933 году более сильное утверждение: сходимость в (33) равномерна по $x$ , то есть(34)

\sup _{x}|F_{n}(x)-F(x)|\to 0

при $n\to \infty$ (сходимость по вероятности).

В (34) использовано обозначение $\sup$ (читается как «супремум»). Для функции $g(x)$ под $\sup _{x}g(x)$ понимают наименьшее из чисел $a$ таких, что $g(x)\leqslant a$ при всех $x$ . Если функция $g(x)$ достигает максимума в точке $x_{0}$ , то $\sup _{x}g(x)=g(x_{0})$ . В таком случае вместо $\sup$ пишут $\max$ . Хорошо известно, что не все функции достигают максимума.

В том же 1933 году Колмогоров усилил результат Гливенко для непрерывных функций распределения $F(x)$ . Рассмотрим случайную величину

D_{n}={\sqrt {n}}\sup _{x}|F_{n}(x)-F_{0}(x)|

и её функцию распределения

K_{n}(x)=P\{D_{n}\leqslant x\}

.

По теореме Колмогорова

\lim _{n\to \infty }K_{n}(x)=K(x)

при каждом $x$ , где $K(x)$ — так называемая функция распределения Колмогорова.

Рассматриваемая работа Колмогорова породила одно из основных направлений математической статистики — так называемую непараметрическую статистику. И в настоящее время непараметрические критерии согласия Колмогорова, Смирнова, омега-квадрат широко используются. Они были разработаны для проверки согласия с полностью известным теоретическим распределением, то есть предназначены для проверки гипотезы $H_{0}{:}\;F(x)\equiv F_{0}(x)$ . Основная идея критериев Колмогорова, омега-квадрат и аналогичных им состоит в измерении расстояния между функцией эмпирического распределения и функцией теоретического распределения. Различаются эти критерии видом расстояний в пространстве функций распределения. Аналитические выражения для предельных распределений статистик, расчётные формулы, таблицы распределений и критических значений широко распространены ^[8], поэтому не будем их приводить.

Выборочные характеристики распределения

Кроме эмпирической функции распределения, для описания данных используют и другие статистические характеристики. В качестве выборочных средних величин постоянно используют выборочное среднее арифметическое, то есть сумму значений рассматриваемой величины, полученных по результатам испытания выборки, делённую на её объём:

{\overline {x}}={\frac {1}{n}}\sum _{1\leqslant i\leqslant n}x_{i}

,

где $n$ — объём выборки, $x_{i}$ — результат измерения (испытания) $i$ -го элемента выборки.

Другой вид выборочного среднего — выборочная медиана. Она определяется через порядковые статистики.

Порядковые статистики — это члены вариационного ряда, который получается, если элементы выборки $x_{1},x_{2},\dots ,x_{n}$ расположить в порядке неубывания:

x(1)\leqslant x(2)\leqslant \dots \leqslant x(k)\leqslant \dots \leqslant x(n)

.

Пример 24. Для выборки $x_{1}=1$ , $x_{2}=7$ , $x_{3}=4$ , $x_{4}=2$ , $x_{5}=8$ , $x_{6}=0$ , $x_{7}=5$ , $x_{8}=7$ вариационный ряд имеет вид 0, 1, 2, 4, 5, 7, 7, 8, то есть $x(1)=0=x_{6},$ $x(2)=1=x_{1},$ $x(3)=2=x_{4},$ $x(4)=4=x_{3},$ $x(5)=5=x_{7},$ $x(6)=x(7)=7=x_{2}=x_{8},$ $x(8)=8=x_{5}$ .

В вариационном ряду элемент $x(k)$ называется $k$ -й порядковой статистикой. Порядковые статистики и функции от них широко используются в вероятностно-статистических методах принятия решений, в эконометрике и в других прикладных областях ^[2].

Выборочная медиана ${\tilde {x}}$ — результат наблюдения, занимающий центральное место в вариационном ряду, построенном по выборке с нечётным числом элементов, или полусумма двух результатов наблюдений, занимающих два центральных места в вариационном ряду, построенном по выборке с чётным числом элементов. Таким образом, если объём выборки $n$ — нечётное число, $n=2k+1$ , то медиана ${\tilde {x}}=x(k+1)$ , если же $n$ — чётное число, $n=2k$ , то медиана ${\tilde {x}}={\frac {x(k)+x(k+1)}{2}}$ , где $x(k)$ и $x(k+1)$ — порядковые статистики.

В качестве выборочных показателей рассеивания результатов наблюдений чаще всего используют выборочную дисперсию, выборочное среднеквадратичное отклонение и размах выборки.

Согласно ^[8], выборочная дисперсия $s^{2}$ — это сумма квадратов отклонений выборочных результатов наблюдений от их среднего арифметического, делённая на объём выборки:

s^{2}={\frac {1}{n}}\sum _{1\leqslant i\leqslant n}(x_{i}-{\overline {x}})^{2}

.

Выборочное среднеквадратичное отклонение $s$ — неотрицательный квадратный корень из дисперсии, то есть $s=+{\sqrt {s^{2}}}$ .

В некоторых литературных источниках выборочной дисперсией называют другую величину:

s_{0}^{2}={\frac {1}{n-1}}\sum _{1\leqslant i\leqslant n}(x_{i}-{\overline {x}})^{2}

.

Она отличается от $s^{2}$ постоянным множителем:

s^{2}=\left(1-{\frac {1}{n}}\right)s_{0}^{2}

.

Соответственно выборочным среднеквадратичным отклонением в этих литературных источниках называют величину $s_{0}=+{\sqrt {s_{0}^{2}}}$ . Тогда, очевидно,

s={\sqrt {1-{\frac {1}{n}}}}s_{0}

.

Различие в определениях приводит к различию в алгоритмах расчётов, правилах принятия решений и соответствующих таблицах. Поэтому при использовании тех или иных нормативно-технических и инструктивно-методических материалов, программных продуктов, таблиц, следует обращать внимание на способ определения выборочных характеристик.

Выбор $s_{0}^{2}$ , а не $s^{2}$ , объясняется тем, что

M(s_{0}^{2})=D(X=\sigma ^{2})

,

где $X$ — случайная величина, имеющая такое же распределение, как и результаты наблюдений. В терминах теории статистического оценивания это означает, что $s_{0}^{2}$ — несмещённая оценка дисперсии (см. ниже). В то же время статистика $s^{2}$ не является несмещённой оценкой дисперсии результатов наблюдений, поскольку

M(s^{2})=\left(1-{\frac {1}{n}}\right)\sigma ^{2}

.

Однако у $s^{2}$ есть другое свойство, оправдывающее использование этой статистики в качестве выборочного показателя рассеивания. Для известных результатов наблюдений $x_{1},x_{2},\dots ,x_{n}$ рассмотрим случайную величину $Y$ с распределением вероятностей

P(Y=x_{i})={\frac {1}{n}},

i=1,2,\dots ,n

и $P(Y=x)=0$ для всех прочих $x$ . Это распределение вероятностей называется эмпирическим. Тогда функция распределения $Y$ — это эмпирическая функция распределения, построенная по результатам наблюдений $x_{1},x_{2},\dots ,x_{n}$ . Вычислим математическое ожидание и дисперсию случайной величины $Y$ :

M(Y)={\overline {x}}

,

D(Y)=s^{2}

.

Второе из этих равенств и является основанием для использования $s^{2}$ в качестве выборочного показателя рассеивания.

Отметим, что математические ожидания выборочных среднеквадратичных отклонений $M(s)$ и $M(s_{0})$ , вообще говоря, не равняются теоретическому среднеквадратичному отклонению $\sigma$ . Например, если $X$ имеет нормальное распределение, объём выборки $n=3$ , то

M(s)=0{,}724

,

\sigma M(s_{0})=0{,}887\sigma

.

Кроме перечисленных выше статистических характеристик, в качестве выборочного показателя рассеивания используют размах $R$ — разность между $n$ -й и первой порядковыми статистиками в выборке объёма $n$ , то есть разность между наибольшим и наименьшим значениями в выборке: $R=x(n)-x(1)$ .

В ряде вероятностно-статистических методов применяют и иные показатели рассеивания. В частности, в методах статистического регулирования процессов используют средний размах — среднее арифметическое размахов, полученных в определённом количестве выборок одинакового объёма. Популярно и межквартильное расстояние, то есть расстояние между выборочными квартилями $x{\Big (}[0{,}75n]{\Big )}$ и $x{\Big (}[0{,}25n]{\Big )}$ порядка 0,75 и 0,25 соответственно, где $[0{,}75n]$ — целая часть числа $0{,}75n$ , а $[0{,}25n]$ — целая часть числа $0{,}25n$ .

Основные понятия, используемые при оценивании

Оценивание — это определение приближённого значения неизвестной характеристики или параметра распределения (генеральной совокупности), иной оцениваемой составляющей математической модели реального (экономического, технического и других) явления или процесса по результатам наблюдений. Иногда формулируют более коротко: оценивание — это определение приближённого значения неизвестного параметра генеральной совокупности по результатам наблюдений. При этом параметром генеральной совокупности может быть либо число, либо набор чисел (вектор), либо функция, либо множество или иной объект нечисловой природы. Например, по результатам наблюдений, распределённых согласно биномиальному закону, оценивают число — параметр $p$ (вероятность успеха). По результатам наблюдений, имеющих гамма-распределение, оценивают набор из трёх чисел — параметры формы $a$ , масштаба $b$ и сдвига $c$ . Способ оценивания функции распределения даётся теоремами Гливенко и Колмогорова. Оценивают также плотности вероятности, функции, выражающие зависимости между переменными, включенными в вероятностные модели экономических, управленческих или технологических процессов, и так далее. Целью оценивания может быть нахождение упорядочения инвестиционных проектов по экономической эффективности или технических изделий (объектов) по качеству, формулировка правил технической или медицинской диагностики и так далее. (Упорядочения в математической статистике называют также ранжировками. Это — один из видов объектов нечисловой природы.)

Оценивание проводят с помощью оценок — статистик, являющихся основой для оценивания неизвестного параметра распределения. В ряде литературных источников термин «оценка» встречается в качестве синонима термина «оценивание». Употреблять одно и то же слово для обозначения двух разных понятий нецелесообразно: оценивание — это действие, а оценка — статистика (функция от результатов наблюдений), используемая в процессе указанного действия или являющаяся его результатом.

Оценивание бывает двух видов — точечное оценивание и оценивание с помощью доверительной области.

Точечное оценивание

Точечное оценивание — способ оценивания, заключающийся в том, что значение оценки принимается как неизвестное значение параметра распределения.

Пример 25. Пусть результаты наблюдений $x_{1},x_{2},\dots ,x_{n}$ рассматривают в вероятностной модели как случайную выборку из нормального распределения $N(m,\sigma )$ . То есть считают, что результаты наблюдений моделируются как реализации $n$ независимых одинаково распределённых случайных величин, имеющих функцию нормального распределения $N(m,\sigma )$ с некоторыми математическим ожиданием $m$ и среднеквадратичным отклонением $\sigma$ , неизвестными статистику. Требуется оценить параметры $m$ и $\sigma$ (или $\sigma ^{2}$ ) по результатам наблюдений. Оценки обозначим $m^{*}$ и $(\sigma ^{2})^{*}$ соответственно. Обычно в качестве оценки $m^{*}$ математического ожидания $m$ используют выборочное среднее арифметическое ${\overline {x}}$ , а в качестве оценки $(\sigma ^{2})^{*}$ дисперсии $\sigma ^{2}$ используют выборочную дисперсию $s^{2}$ , то есть

m^{*}={\overline {x}}

,

(\sigma ^{2})^{*}=s^{2}

.

Для оценивания математического ожидания m могут использоваться и другие статистики, например, выборочная медиана ${\tilde {x}}$ , полусумма минимального и максимального членов вариационного ряда

m^{**}={\frac {x(1)+x(n)}{2}}

и другие. Для оценивания дисперсии $\sigma ^{2}$ также имеется ряд оценок, в частности, $s_{0}^{2}$ (см. выше) и оценка, основанная на размахе $R$ , имеющая вид

(\sigma ^{2})^{**}={\Big (}a(n)R{\Big )}^{2}

,

где коэффициенты $a(n)$ берут из специальных таблиц ^[8]. Эти коэффициенты подобраны так, чтобы для выборок из нормального распределения

M{\Big (}a(n)R{\Big )}=\sigma

.

Наличие нескольких методов оценивания одних и тех же параметров приводит к необходимости выбора между этими методами.

Состоятельность, несмещённость и эффективность оценок

Как сравнивать методы оценивания между собой? Сравнение проводят на основе таких показателей качества методов оценивания, как состоятельность, несмещённость, эффективность и других.

Рассмотрим оценку $\theta _{n}$ числового параметра $\theta$ , определённую при $n=1,2,\dots$ . Оценка $\theta _{n}$ называется состоятельной, если она сходится по вероятности к значению оцениваемого параметра $\theta$ при безграничном возрастании объёма выборки. Выразим сказанное более подробно. Статистика $\theta _{n}$ является состоятельной оценкой параметра $\theta$ тогда и только тогда, когда для любого положительного числа $\varepsilon$ справедливо предельное соотношение

\lim _{n\to \infty }P\{|\theta _{n}-\theta |>\varepsilon \}=0

.

Пример 26. Из закона больши́х чисел следует, что $\theta _{n}={\overline {x}}$ является состоятельной оценкой $\theta =M(X)$ (в приведённой выше теореме Чебышёва предполагалось существование дисперсии $D(X)$ ; однако, как доказал А. Я. Хинчин ^[6], достаточно выполнения более слабого условия — существования математического ожидания $M(X)$ ).

Пример 27. Все указанные выше оценки параметров нормального распределения являются состоятельными.

Вообще, все (за редчайшими исключениями) оценки параметров, используемые в вероятностно-статистических методах принятия решений, являются состоятельными.

Пример 28. Так, согласно теореме Гливенко, эмпирическая функция распределения $F_{n}(x)$ является состоятельной оценкой функции распределения результатов наблюдений $F(x)$ .

При разработке новых методов оценивания следует в первую очередь проверять состоятельность предлагаемых методов.

Второе важное свойство оценок — несмещённость. Несмещённая оценка $\theta _{n}$ — это оценка параметра $\theta$ , математическое ожидание которой равно значению оцениваемого параметра: $M(\theta _{n})=\theta$ .

Пример 29. Из приведённых выше результатов следует, что ${\overline {x}}$ и $s_{0}^{2}$ являются несмещёнными оценками параметров $m$ и $\sigma ^{2}$ нормального распределения. Поскольку $M({\tilde {x}})=M(m^{**})=m$ , то выборочная медиана ${\tilde {x}}$ и полусумма крайних членов вариационного ряда $m^{**}$ — также несмещённые оценки математического ожидания $m$ нормального распределения. Однако

M(s^{2})\neq \sigma ^{2}

,

M[(\sigma ^{2})^{**}]\neq \sigma ^{2}

,

поэтому оценки $s^{2}$ и $(\sigma ^{2})^{**}$ не являются несмещёнными оценками дисперсии $\sigma ^{2}$ нормального распределения.

Оценки, для которых соотношение $M(\theta _{n})=\theta$ неверно, называются смещёнными. При этом разность между математическим ожиданием оценки $\theta _{n}$ и оцениваемым параметром $\theta$ , то есть $M(\theta _{n})-\theta$ , называется смещением оценки.

Пример 30. Для оценки $s^{2}$ , как следует из сказанного выше, смещение равно

M(s^{2})-\sigma ^{2}=-{\frac {\sigma ^{2}}{n}}

.

Смещение оценки $s^{2}$ стремится к нулю при $n\to \infty$ .

Оценка, для которой смещение стремится к нулю, когда объём выборки стремится к бесконечности, называется асимптотически несмещённой. В примере 30 показано, что оценка $s^{2}$ является асимптотически несмещённой.

Практически все оценки параметров, используемые в вероятностно-статистических методах принятия решений, являются либо несмещёнными, либо асимптотически несмещёнными. Для несмещённых оценок показателем точности оценки служит дисперсия — чем дисперсия меньше, тем оценка лучше. Для смещённых оценок показателем точности служит математическое ожидание квадрата оценки $M(\theta _{n}-\Theta )^{2}$ . Как следует из основных свойств математического ожидания и дисперсии,(35)

d_{n}(\theta _{n})=M\left((\theta _{n}-\theta )^{2}\right)=D(\theta _{n})+{\Big (}M(\theta _{n})-\theta {\Big )}^{2}

,

то есть математическое ожидание квадрата ошибки складывается из дисперсии оценки и квадрата её смещения.

Для подавляющего большинства оценок параметров, используемых в вероятностно-статистических методах принятия решений, дисперсия имеет порядок ${\frac {1}{n}}$ , а смещение — не более чем ${\frac {1}{n}}$ , где $n$ — объём выборки. Для таких оценок при больши́х $n$ второе слагаемое в правой части (35) пренебрежимо мало по сравнению с первым, и для них справедливо приближённое равенство(36)

d_{n}(\theta _{n})=M\left((\theta _{n}-\theta )^{2}\right)\approx D(\theta _{n})\approx {\frac {c}{n}}

,

c=c(\theta _{n},\Theta )

,

где $c$ — число, определяемое методом вычисления оценок $\Theta _{n}$ и истинным значением оцениваемого параметра $\theta$ .

С дисперсией оценки связано третье важное свойство метода оценивания — эффективность. Эффективная оценка — это несмещённая оценка, имеющая наименьшую дисперсию из всех возможных несмещённых оценок данного параметра.

Доказано ^[10], что ${\overline {x}}$ и $s_{0}^{2}$ являются эффективными оценками параметров $m$ и $\sigma ^{2}$ нормального распределения. В то же время для выборочной медианы ${\tilde {x}}$ справедливо предельное соотношение

\lim _{n\to \infty }{\frac {D({\overline {x}})}{D({\tilde {x}})}}={\frac {2}{\pi }}\approx 0{,}637

.

Другими словами, эффективность выборочной медианы, то есть отношение дисперсии эффективной оценки ${\overline {x}}$ параметра $m$ к дисперсии несмещённой оценки ${\tilde {x}}$ этого параметра при больши́х $n$ близка к 0,637. Именно из-за сравнительно низкой эффективности выборочной медианы в качестве оценки математического ожидания нормального распределения обычно используют выборочное среднее арифметическое.

Понятие эффективности вводится для несмещённых оценок, для которых $M(\theta _{n})=\theta$ для всех возможных значений параметра $\theta$ . Если не требовать несмещённости, то можно указать оценки, при некоторых $\theta$ имеющие меньшую дисперсию и средний квадрат ошибки, чем эффективные.

Пример 31. Рассмотрим «оценку» математического ожидания $m_{1}\equiv 0$ . Тогда $D(m_{1})=0$ , то есть всегда меньше дисперсии $D({\overline {x}})$ эффективной оценки ${\overline {x}}$ . Математическое ожидание среднего квадрата ошибки $d_{n}(m_{1})=m^{2}$ , то есть при $|m|<{\frac {\sigma }{\sqrt {n}}}$ имеем $d_{n}(m_{1})<d_{n}({\overline {x}})$ . Ясно, однако, что статистику $m_{1}\equiv 0$ бессмысленно рассматривать в качестве оценки математического ожидания $m$ .

Пример 32. Более интересный пример рассмотрен американским математиком Дж. Ходжесом:

T_{n}=\left\{{\begin{matrix}{\overline {x}},&|{\overline {x}}|>n^{-{\frac {1}{4}}},\\0{,}5{\overline {x}},&|{\overline {x}}|\leqslant n^{-{\frac {1}{4}}}.\end{matrix}}\right.

Ясно, что $T_{n}$ — состоятельная, асимптотически несмещённая оценка математического ожидания $m$ , при этом, как нетрудно вычислить,

\lim _{n\to \infty }nd_{n}(T_{n})=\left\{{\begin{matrix}\sigma ^{2},&m\neq 0,\\{\frac {\sigma ^{2}}{4}},&m=0.\end{matrix}}\right.

Последняя формула показывает, что при $m\neq 0$ оценка $T_{n}$ не хуже ${\overline {x}}$ (при сравнении по среднему квадрату ошибки $d_{n}$ ), а при $m=0$ — в четыре раза лучше.

Подавляющее большинство оценок $\theta _{n}$ , используемых в вероятностно-статистических методах, являются асимптотически нормальными, то есть для них справедливы предельные соотношения:

\lim _{n\to \infty }P\left\{{\frac {\theta _{n}-M(\theta _{n})}{\sqrt {D(\theta _{n})}}}<x\right\}=\Phi (x)

.

для любого $x$ , где $\Phi (x)$ — функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. Это означает, что для больши́х объёмов выборок (практически — несколько десятков или сотен наблюдений) распределения оценок полностью описываются их математическими ожиданиями и дисперсиями, а качество оценок — значениями средних квадратов ошибок $d_{n}(\theta _{n})$ .

Наилучшие асимптотически нормальные оценки

Наилучшие асимптотически нормальные оценки, сокращенно НАН-оценки, — это оценки, для которых средний квадрат ошибки $d_{n}(\theta _{n})$ принимает при больши́х объёмах выборки наименьшее возможное значение, то есть величина $c=c(\theta _{n},\theta )$ в формуле (36) минимальна. Ряд видов оценок — так называемые одношаговые оценки и оценки максимального правдоподобия — являются НАН-оценками, именно они обычно используются в вероятностно-статистических методах принятия решений.

Доверительное оценивание

Какова точность оценки параметра? В каких границах он может лежать? В научных публикациях и учебной литературе, в нормативно-технической и инструктивно-методической документации, в таблицах и программных продуктах наряду с алгоритмами расчётов точечных оценок даются правила нахождения доверительных границ. Они и указывают точность точечной оценки. При этом используются такие термины, как доверительная вероятность, доверительный интервал. Если речь идёт об оценивании нескольких числовых параметров, или же функции, упорядочения и тому подобного, то говорят об оценивании с помощью доверительной области.

Доверительная область — это область в пространстве параметров, в которую с заданной вероятностью входит неизвестное значение оцениваемого параметра распределения. «Заданная вероятность» называется доверительной вероятностью и обычно обозначается $\gamma$ . Пусть $\Theta$ — пространство параметров. Рассмотрим статистику $\Theta _{1}=\Theta _{1}(x_{1},x_{2},\dots ,x_{n})$ — функцию от результатов наблюдений $x_{1},x_{2},\dots ,x_{n}$ , значениями которой являются подмножества пространства параметров $\Theta$ . Так как результаты наблюдений — случайные величины, то $\Theta _{1}$ — также случайная величина, значения которой — подмножества множества $\Theta$ , то есть $\Theta _{1}$ — случайное множество. Напомним, что множество — один из видов объектов нечисловой природы, случайные множества изучают в теории вероятностей и статистике объектов нечисловой природы.

В ряде литературных источников, к настоящему времени во многом устаревших, под случайными величинами понимают только те из них, которые в качестве значений принимают действительные числа. Согласно справочнику Ю. В. Прохорова и Ю. А. Розанова ^[13] случайные величины могут принимать значения из любого множества. Так, случайные вектора, случайные функции, случайные множества, случайные ранжировки (упорядочения) — это отдельные виды случайных величин. Используется и иная терминология: термин «случайная величина» сохраняется только за числовыми функциями, определёнными на пространстве элементарных событий, а в случае иных областей значений используется термин «случайный элемент». (Замечание для математиков: все рассматриваемые функции, определённые на пространстве элементарных событий, предполагаются измеримыми.)

Статистика $\Theta _{1}$ называется доверительной областью, соответствующей доверительной вероятности $\gamma$ , если(37)

P\{\theta \in \Theta _{1}(x_{1},x_{2},\dots ,x_{n})\}=\gamma

.

Ясно, что этому условию удовлетворяет, как правило, не одна, а много доверительных областей. Из них выбирают для практического применения какую-либо одну, исходя из дополнительных соображений, например, из соображений симметрии или минимизируя объём доверительной области, то есть меру множества $\Theta _{1}$ .

При оценке одного числового параметра в качестве доверительных областей обычно применяют доверительные интервалы (в том числе лучи), а не иные типа подмножеств прямой. Более того, для многих двухпараметрических и трёхпараметрических распределений (нормальных, логарифмически нормальных, Вейбулла-Гнеденко, гамма-распределений и других) обычно используют точечные оценки и построенные на их основе доверительные границы для каждого из двух или трёх параметров отдельно. Это делают для удобства пользования результатами расчётов: доверительные интервалы легче применять, чем фигуры на плоскости или тела в трёхмерном пространстве.

Как следует из сказанного выше, доверительный интервал — это интервал, который с заданной вероятностью накроет неизвестное значение оцениваемого параметра распределения. Границы доверительного интервала называют доверительными границами. Доверительная вероятность $\gamma$ — вероятность того, что доверительный интервал накроет действительное значение параметра, оцениваемого по выборочным данным. Оцениванием с помощью доверительного интервала называют способ оценки, при котором с заданной доверительной вероятностью устанавливают границы доверительного интервала.

Для числового параметра $\theta$ рассматривают верхнюю доверительную границу $\theta _{B}$ , нижнюю доверительную границу $\theta _{H}$ и двусторонние доверительные границы — верхнюю $\theta _{1B}$ и нижнюю $\theta _{1H}$ . Все четыре доверительные границы — функции от результатов наблюдений $x_{1},x_{2},\dots ,x_{n}$ и доверительной вероятности $\gamma$ .

Верхняя доверительная граница $\theta _{B}$ — случайная величина $\theta _{B}=\theta _{B}(x_{1},x_{2},\dots ,x_{n};\gamma )$ , для которой $P(\theta \leqslant \theta _{B})=\gamma$ , где $\theta$ — истинное значение оцениваемого параметра. Доверительный интервал в этом случае имеет вид $(-\infty ;\theta _{B}]$ .

Нижняя доверительная граница $\theta _{H}$ — случайная величина $\theta _{H}=\theta _{H}(x_{1},x_{2},\dots ,x_{n};\gamma )$ , для которой $P(\theta \geqslant \theta _{H})=\gamma$ , где $\theta$ — истинное значение оцениваемого параметра. Доверительный интервал в этом случае имеет вид $[\theta _{H};+\infty )$ .

Двусторонние доверительные границы — верхняя $\theta _{1B}$ и нижняя $\theta _{1H}$ — это случайные величины $\theta _{1B}=\theta _{1B}(x_{1},x_{2},\dots ,x_{n};\gamma )$ и $\theta _{1H}=\theta _{1H}(x_{1},x_{2},\dots ,x_{n};\gamma )$ такие, что $P(\theta _{1H}\leqslant \theta \leqslant \theta _{1B})=\gamma$ , где $\theta$ — истинное значение оцениваемого параметра. Доверительный интервал в этом случае имеет вид $[\theta _{1H};\theta _{1B}]$ .

Вероятности, связанные с доверительными границами, можно записать в виде частных случаев формулы (37):

P\{\theta \in (-\infty ;\theta _{B}]\}=\gamma

,

P\{\theta \in [\theta _{H};+\infty )\}=\gamma

,

P\{\theta \in [\theta _{H};\theta _{B}]\}=\gamma

.

В нормативно-технической и инструктивно-методической документации, научной и учебной литературе используют два типа правил определения доверительных границ — построенных на основе точного распределения и построенных на основе асимптотического распределения некоторой точечной оценки $\theta _{n}$ параметра $\theta$ . Рассмотрим примеры.

Пример 33. Пусть $x_{1},x_{2},\dots ,x_{n}$ — выборка из нормального закона $N(m,\sigma )$ , параметры $m$ и $\sigma$ неизвестны. Укажем доверительные границы для $m$ .

Известно ^[10], что случайная величина

Y={\sqrt {n}}{\frac {{\overline {x}}-m}{\sigma _{0}}}

имеет распределение Стьюдента с $(n-1)$ степенью свободы, где ${\overline {x}}$ — выборочное среднее арифметическое и $\sigma _{0}$ — выборочное среднеквадратичное отклонение. Пусть $t_{\gamma }(n-1)$ и $t_{1-\gamma }(n-1)$ — квантили указанного распределения порядка $\gamma$ и $1-\gamma$ соответственно. Тогда

P\{Y\leqslant t_{\gamma }(n-1)\}=\gamma ,

P\{Y\geqslant t_{1-\gamma }(n-1)\}=\gamma

.

Следовательно,

P\{m\geqslant {\overline {x}}-t_{\gamma }(n-1){\frac {\sigma _{0}}{\sqrt {n}}}\}=\gamma

,

то есть в качестве нижней доверительной границы $\theta _{H}$ , соответствующей доверительной вероятности $\gamma$ , следует взять(38)

\theta _{H}(x_{1},x_{2},\dots ,x_{n};\gamma )={\overline {x}}-t_{\gamma }(n-1){\frac {\sigma _{0}}{\sqrt {n}}}

.

Аналогично получаем, что

P\{m\leqslant {\overline {x}}-t_{1-\gamma }(n-1){\frac {\sigma _{0}}{\sqrt {n}}}\}=\gamma

.

Поскольку распределение Стьюдента симметрично относительно нуля, то

t_{1-\gamma }(n-1)=-t_{1-\gamma }(n-1)t_{\gamma }(n-1)

.

Следовательно, в качестве верхней доверительной границы $\gamma _{B}$ для $m$ , соответствующей доверительной вероятности $\gamma$ , следует взять(39)

\theta _{B}(x_{1},x_{2},\dots ,x_{n};\gamma )={\overline {x}}+t_{\gamma }(n-1){\frac {\sigma _{0}}{\sqrt {n}}}

.

Как построить двусторонние доверительные границы? Положим

\theta _{1H}=\theta _{H}(x_{1},x_{2},\dots ,x_{n};\gamma _{1})

,

\theta _{1B}=\theta _{B}(x_{1},x_{2},\dots ,x_{n};\gamma _{2})

,

где $\theta _{1H}$ и $\theta _{1B}$ заданы формулами (38) и (39) соответственно. Поскольку неравенство $\theta _{1H}\leqslant m\leqslant \theta _{1B}$ выполнено тогда и только тогда, когда

t_{\gamma _{2}}(n-1)\geqslant Y\geqslant t_{1-\gamma _{1}}(n-1)

,

то

P\{\theta _{1H}\leqslant m\leqslant \theta _{1B}\}=\gamma _{1}+\gamma _{2}-1

,

(в предположении, что $\gamma _{1}>0{,}5$ ; $\gamma _{2}>0{,}5$ ). Следовательно, если $\gamma =\gamma _{1}+\gamma _{2}-1$ , то $\theta _{1H}$ и $\theta _{1B}$ — двусторонние доверительные границы для $m$ , соответствующие доверительной вероятности $\gamma$ . Обычно полагают $\gamma _{1}=\gamma _{2}$ , то есть в качестве двусторонних доверительных границ $\theta _{1H}$ и $\theta _{1B}$ , соответствующих доверительной вероятности $\gamma$ , используют односторонние доверительные границы $\theta _{H}$ и $\theta _{B}$ , соответствующие доверительной вероятности ${\frac {1+\gamma }{2}}$ .

Другой вид правил построения доверительных границ для параметра $\theta$ основан на асимптотической нормальности некоторой точечной оценки $\theta _{n}$ этого параметра. В вероятностно-статистических методах принятия решений используют, как уже́ отмечалось, несмещённые или асимптотически несмещённые оценки $\theta _{n}$ , для которых смещение либо равно нулю, либо при больш́их объёмах выборки пренебрежимо мало по сравнению со среднеквадратичным отклонением оценки $\theta _{n}$ . Для таких оценок при всех $x$

\lim _{n\to \infty }P\left\{{\frac {\theta _{n}-\theta }{\sqrt {D(\theta _{n})}}}\leqslant x\right\}=\Phi (x)

,

где $\Phi (x)$ — функция нормального распределения $N(0;1)$ . Пусть $u_{\gamma }$ — квантиль порядка $\gamma$ распределения $N(0;1)$ . Тогда(40)

\lim _{n\to \infty }P\left\{{\frac {\theta _{n}-\theta }{\sqrt {D(\theta _{n})}}}\leqslant u_{\gamma }\right\}=\gamma

.

Поскольку неравенство

{\frac {\theta _{n}-\theta }{\sqrt {D(\theta _{n})}}}\leqslant u_{\gamma }

равносильно неравенству

\theta _{n}-u_{\gamma }{\sqrt {D(\theta _{n})}}\leqslant \theta

,

то в качестве $\theta _{H}$ можно было бы взять левую часть последнего неравенства. Однако точное значение дисперсии $D(\theta _{n})$ обычно неизвестно. Зато часто удаётся доказать, что дисперсия оценки имеет вид

D(\theta _{n})={\frac {h(\theta )}{n}}

(с точностью до пренебрежимо малых при росте $n$ слагаемых), где $h(\theta )$ — некоторая функция от неизвестного параметра $\theta$ . Справедлива теорема о наследовании сходимости (^[14], § 2.4), согласно которой при подстановке в $h(\theta )$ оценки $\theta _{n}$ вместо $\theta$ соотношение (40) остается справедливым, то есть

\lim _{n\to \infty }P\left\{\theta _{n}-u_{\gamma }{\frac {\sqrt {h(\theta _{n})}}{\sqrt {n}}}\leqslant \theta \right\}=\gamma

.

Следовательно, в качестве приближённой нижней доверительной границы следует взять

\theta _{H}=\theta _{n}-u_{\gamma }{\frac {\sqrt {h(\theta _{n}}}{\sqrt {n}}}

,

а в качестве приближённой верхней доверительной границы —

\theta _{B}=\theta _{n}+u_{\gamma }{\frac {\sqrt {h(\theta _{n})}}{\sqrt {n}}}

.

С ростом объёма выборки качество приближённых доверительных границ улучшается, так как вероятности событий $\{\theta \geqslant \theta _{H}\}$ и $\{\theta \leqslant \theta _{B}\}$ стремятся к $\gamma$ . Для построения двусторонних доверительных границ поступают аналогично правилу, указанному выше в примере 33 для интервального оценивания параметра $m$ нормального распределения. А именно, используют односторонние доверительные границы, соответствующие доверительной вероятности ${\frac {1+\gamma }{2}}$ .

При обработке экономических, управленческих или технических статистических данных обычно используют значение доверительной вероятности $\gamma =0{,}95$ . Применяют также значения $\gamma =0{,}99$ или $\gamma =0{,}90$ . Иногда встречаются значения $\gamma =0{,}80$ , $\gamma =0{,}975$ , $\gamma =0{,}98$ и другие.

Доверительное оценивание для дискретных распределений

Для дискретных распределений, таких как биномиальное, гипергеометрическое или распределение Пуассона (а также распределения статистики Колмогорова

D_{n}={\sqrt {n}}\,\sup _{n}|F_{n}(x)-F_{0}(x)|

и других непараметрических статистик), функции распределения имеют скачки. Поэтому для заданного заранее значения $\gamma$ , например, $\gamma =0{,}95$ , нельзя указать доверительные границы, поскольку уравнения, с помощью которых вводятся доверительные границы, не имеют ни одного решения. Так, рассмотрим биномиальное распределение

P(Y=y|p,n)={n \choose y}p^{y}(1-p)^{n-y}

,

y=0,1,2,\dots ,n

,

где $Y$ — число осуществлений события, $n$ — объём выборки. Для него нельзя указать статистику $K(Y,n)$ такую, что

P\{p\leqslant K(Y,n)\}=\gamma

,

поскольку $K(Y,n)$ — функция от $Y$ и может принимать не больше значений, чем принимает $Y$ , то есть $n+1$ , а для $\gamma$ имеется бесконечно много возможных значений — столько, сколько точек на отрезке. Сказанное означает, что верхней доверительной границы в случае биномиального распределения не существует.

Для дискретных распределений приходится изменить определения доверительных границ. Покажем изменения на примере биномиального распределения. Так, в качестве верхней доверительной границы $\theta _{B}$ используют наименьшее $K(Y,n)$ такое, что

P\{p\leqslant K(Y,n)\}\geqslant \gamma

.

Аналогичным образом поступают для других доверительных границ и других распределений. Необходимо иметь в виду, что при небольших $n$ и $p$ истинная доверительная вероятность $P\{p\leqslant K(Y,n)\}$ может существенно отличаться от номинальной $\gamma$ , как это подробно продемонстрировано в работе ^[15]. Поэтому наряду с величинами типа $K(Y,n)$ (то есть доверительных границ) при разработке таблиц и компьютерных программ необходимо предусматривать возможность получения и величин типа $P\{p\leqslant K(Y,n)\}$ (то есть достигаемых доверительных вероятностей).

Основные понятия, используемые при проверке гипотез

Статистическая гипотеза — любое предположение, касающееся неизвестного распределения случайных величин (элементов). Приведём формулировки нескольких статистических гипотез:

Результаты наблюдений имеют нормальное распределение с нулевым математическим ожиданием.
Результаты наблюдений имеют функцию распределения $N(0,1)$ .
Результаты наблюдений имеют нормальное распределение.
Результаты наблюдений в двух независимых выборках имеют одно и то же нормальное распределение.
Результаты наблюдений в двух независимых выборках имеют одно и то же распределение.

Различают нулевую и альтернативную гипотезы. Нулевая гипотеза — гипотеза, подлежащая проверке. Альтернативная гипотеза — каждая допустимая гипотеза, отличная от нулевой. Нулевую гипотезу обозначают $H_{0}$ , альтернативную — $H_{1}$ (от англ. Hypothesis — «гипотеза»).

Выбор тех или иных нулевых или альтернативных гипотез определяется стоящими перед менеджером, экономистом, инженером, исследователем прикладными задачами. Рассмотрим примеры.

Пример 34. Пусть нулевая гипотеза — гипотеза 2 из приведённого выше списка, а альтернативная — гипотеза 1. Сказанное означает, что реальная ситуация описывается вероятностной моделью, согласно которой результаты наблюдений рассматриваются как реализации независимых одинаково распределённых случайных величин с функцией распределения $N(0,\sigma )$ , где параметр $\sigma$ неизвестен статистику. В рамках этой модели нулевую гипотезу записывают так:

H_{0}{:}\;\sigma =1

,

а альтернативную так:

H_{1}{:}\;\sigma \neq 1

.

Пример 35. Пусть нулевая гипотеза — по-прежнему гипотеза 2 из приведённого выше списка, а альтернативная — гипотеза 3 из того же списка. Тогда в вероятностной модели управленческой, экономической или производственной ситуации предполагается, что результаты наблюдений образуют выборку из нормального распределения $N(m,\sigma )$ при некоторых значениях $m$ и $\sigma$ . Гипотезы записываются так:

H_{0}{:}\;m=0,\;\sigma =1

(оба параметра принимают фиксированные значения);

H_{1}{:}\;m\neq 0

и/или

\sigma \neq 1

(то есть либо $m\neq 0$ , либо $\sigma \neq 1$ , либо и $m\neq 0$ , и $\sigma \neq 1$ ).

Пример 36. Пусть $H_{0}$ — гипотеза 1 из приведённого выше списка, а $H_{1}$ — гипотеза 3 из того же списка. Тогда вероятностная модель — та же, что в примере 35,

H_{0}{:}\;m=0

,

\sigma

произвольно;

$H_{1}{:}\;m\neq 0$ , $\sigma$ произвольно.

Пример 37. Пусть $H_{0}$ — гипотеза 2 из приведённого выше списка, а согласно $H_{1}$ результаты наблюдений имеют функцию распределения $F(x)$ , не совпадающую с функцией стандартного нормального распределения $\Phi (x)$ . Тогда

H_{0}{:}\;F(x)=\Phi (x)

при всех $x$ (записывается как $F(x)\equiv \Phi (x)$ );

H_{1}{:}\;F(x_{0})\neq \Phi (x_{0})

при некотором $x_{0}$ (то есть неверно, что $F(x)\equiv \Phi (x)$ ).

Примечание. Здесь $\equiv$ — знак тождественного совпадения функций (то есть совпадения при всех возможных значениях аргумента $x$ ).

Пример 38. Пусть $H_{0}$ — гипотеза 3 из приведённого выше списка, а согласно $H_{1}$ результаты наблюдений имеют функцию распределения $F(x)$ , не являющуюся нормальной. Тогда

$H_{0}{:}\;F(x)\equiv \Phi \left({\frac {x-m}{\sigma }}\right)$ при некоторых $m,\sigma$ ;

$H_{1}{:}$ для любых $m,\sigma$ найдётся $x_{0}=x_{0}(m,\sigma )$ такое, что $F(x_{0})\neq \Phi \left({\frac {x_{0}-m}{\sigma }}\right)$ .

Пример 39. Пусть $H_{0}$ — гипотеза 4 из приведённого выше списка, согласно вероятностной модели две выборки извлечены из совокупностей с функциями распределения $F(x)$ и $G(x)$ , являющихся нормальными с параметрами $m_{1},\sigma _{1}$ и $m_{2},\sigma _{2}$ соответственно, а $H_{1}$ — отрицание $H_{0}$ . Тогда

$H_{0}{:}\;m_{1}=m_{2},\;\sigma _{1}=\sigma _{2}$ , причём $m_{1}$ и $\sigma _{1}$ произвольны;
$H_{1}{:}\;m_{1}\neq m_{2}$ и/или $\sigma _{1}\neq \sigma _{2}$ .

Пример 40. Пусть в условиях примера 39 дополнительно известно, что $\sigma _{1}=\sigma _{2}$ . Тогда

$H_{0}{:}\;m_{1}=m_{2},\;\sigma >0$ , причём $m_{1}$ и $\sigma$ произвольны;

$H_{1}{:}\;m_{1}\neq m_{2},\sigma >0$ .

Пример 41. Пусть $H_{0}$ — гипотеза 5 из приведённого выше списка, согласно вероятностной модели две выборки извлечены из совокупностей с функциями распределения $F(x)$ и $G(x)$ соответственно, а $H_{1}$ — отрицание $H_{0}$ . Тогда

$H_{0}{:}\;F(x)\equiv G(x)$ , где $F(x)$ — произвольная функция распределения;

$H_{1}{:}\;F(x)$ и $G(x)$ — произвольные функции распределения, причём $F(x)\neq G(x)$ при некоторых $x$ .

Пример 42. Пусть в условиях примера 40 дополнительно предполагается, что функции распределения $F(x)$ и $G(x)$ отличаются только сдвигом, то есть $G(x)=F(x-a)$ при некотором $a$ . Тогда

$H_{0}{:}\;F(x)\equiv G(x)$ , где $F(x)$ — произвольная функция распределения;

$H_{1}{:}\;G(x)=F(x-a),\;a\neq 0$ , где $F(x)$ — произвольная функция распределения.

Пример 43. Пусть в условиях примера 37 дополнительно известно, что согласно вероятностной модели ситуации $F(x)$ — функция нормального распределения с единичной дисперсией, то есть имеет вид $N(m,1)$ . Тогда

H_{0}{:}\;m=0

(то есть $F(x)=\Phi (x)$ при всех $x$ , записывается как $F(x)\equiv \Phi (x)$ );

H_{1}{:}\;m\neq 0

(то есть неверно, что $F(x)\equiv \Phi (x)$ ).

Пример 44. При статистическом регулировании технологических, экономических, управленческих или иных процессов ^[2] рассматривают выборку, извлечённую из совокупности с нормальным распределением и известной дисперсией, и гипотезы

$H_{0}{:}\;m=m_{0}$ ,

$H_{1}{:}\;m=m_{1}$ ,

где значение параметра $m=m_{0}$ соответствует налаженному ходу процесса, а переход к $m=m_{1}$ свидетельствует о разладке.

Пример 45. При статистическом приёмочном контроле число дефектных единиц продукции в выборке подчиняется гипергеометрическому распределению, неизвестным параметром является $p={\frac {D}{N}}$ — уровень дефектности, где $N$ — объём партии продукции, $D$ — общее число дефектных единиц продукции в партии. Используемые в нормативно-технической и коммерческой документации (стандартах, договорах на поставку и другом) планы контроля часто нацелены на проверку гипотезы

$H_{0}{:}\;p\leqslant \mathrm {AQL}$

против альтернативной гипотезы

H_{1}{:}\;p\geqslant \mathrm {LQ}

,

где $\mathrm {AQL}$ — приёмочный уровень дефектности, $\mathrm {LQ}$ — браковочный уровень дефектности (очевидно, что $\mathrm {AQL} <\mathrm {LQ}$ ).

Пример 46. В качестве показателей стабильности технологического, экономического, управленческого или иного процесса используют ряд характеристик распределений контролируемых показателей, в частности, коэффициент вариации $\nu ={\frac {\sigma }{M(X)}}$ . Требуется проверить нулевую гипотезу

$H_{0}{:}\;\nu \leqslant \nu _{0}$

при альтернативной гипотезе

$H_{1}{:}\;\nu >\nu _{0}$ ,

где $\nu _{0}$ — некоторое заранее заданное граничное значение.

Пример 47. Пусть вероятностная модель двух выборок — та же, что в примере 41, математические ожидания результатов наблюдений в первой и второй выборках обозначим $M(X)$ и $M(Y)$ соответственно. В ряде ситуаций проверяют нулевую гипотезу

$H_{0}{:}\;M(X)=M(Y)$

против альтернативной гипотезы

$H_{1}{:}\;M(X)\neq M(Y)$ .

Пример 48. Выше отмечалось большое значение в математической статистике функций распределения, симметричных относительно нуля, При проверке симметричности

$H_{0}{:}\;F(-x)=1-F(x)$ при всех $x$ , в остальном $F$ произвольна;

$H_{1}{:}\;F(-x_{0})\neq 1-F(x_{0})$ при некотором $x_{0}$ , в остальном $F$ произвольна.

В вероятностно-статистических методах принятия решений используются и многие другие постановки задач проверки статистических гипотез. Некоторые из них рассматриваются ниже.

Конкретная задача проверки статистической гипотезы полностью описана, если заданы нулевая и альтернативная гипотезы. Выбор метода проверки статистической гипотезы, свойства и характеристики методов определяются как нулевой, так и альтернативной гипотезами. Для проверки одной и той же нулевой гипотезы при различных альтернативных гипотезах следует использовать, вообще говоря, различные методы. Так, в примерах 37 и 43 нулевая гипотеза одна и та же, а альтернативные — различны. Поэтому в условиях примера 37 следует применять непараметрические критерии однородности (статистики Смирнова или типа омега-квадрат), а в условиях примера 43 — методы на основе критерия Стьюдента или критерия Крамера-Уэлча ^[2], ^[10]. Если в условиях примера 37 использовать критерий Стьюдента, то он не будет решать поставленных задач. Если в условиях примера 43 использовать критерий согласия типа Колмогорова, то он, напротив, будет решать поставленные задачи, хотя, возможно, и хуже, чем специально приспособленный для этого случая критерий Стьюдента.

При обработке реальных данных большое значение имеет правильный выбор гипотез $H_{0}$ и $H_{1}$ . Принимаемые предположения, например, нормальность распределения, должны быть тщательно обоснованы, в частности, статистическими методами. Отметим, что в подавляющем большинстве конкретных прикладных постановок распределение результатов наблюдений отлично от нормального.

Часто возникает ситуация, когда вид нулевой гипотезы вытекает из постановки прикладной задачи, а вид альтернативной гипотезы не ясен. В таких случаях следует рассматривать альтернативную гипотезу наиболее общего вида и использовать методы, решающие поставленную задачу при всех возможных $H_{1}$ . В частности при проверке гипотезы 2 (из приведённого выше списка) как нулевой следует в качестве альтернативной гипотезы использовать $H_{1}$ из примера 37, а не из примера 43, если нет специальных обоснований нормальности распределения результатов наблюдений при альтернативной гипотезе.

Параметрические и непараметрические гипотезы

Статистические гипотезы бывают параметрические и непараметрические. Предположение, которое касается неизвестного значения параметра распределения, входящего в некоторое параметрическое семейство распределений, называется параметрической гипотезой (напомним, что параметр может быть и многомерным). Предположение, при котором вид распределения неизвестен (то есть не предполагается, что оно входит в некоторое параметрическое семейство распределений), называется непараметрической гипотезой. Таким образом, если распределение $F(x)$ результатов наблюдений в выборке согласно принятой вероятностной модели входит в некоторое параметрическое семейство $\{F(x;\theta ),\theta \in \Theta \}$ , то есть $F(x)=F(x;\theta _{0})$ при некотором $\theta _{0}\in \Theta$ , то рассматриваемая гипотеза — параметрическая, в противном случае — непараметрическая.

Если и $H_{0}$ и $H_{1}$ — параметрические гипотезы, то задача проверки статистической гипотезы параметрическая. Если хотя бы одна из гипотез $H_{0}$ и $H_{1}$ непараметрическая, то задача проверки статистической гипотезы непараметрическая. Другими словами, если вероятностная модель ситуации параметрическая, то есть полностью описывается в терминах того или иного параметрического семейства распределений вероятностей, то и задача проверки статистической гипотезы параметрическая. Если же вероятностная модель ситуации непараметрическая, то есть её нельзя полностью описать в терминах какого-либо параметрического семейства распределений вероятностей, то и задача проверки статистической гипотезы непараметрическая. В примерах 34—36, 39, 40, 43—45 даны постановки параметрических задач проверки гипотез, а в примерах 37, 38, 41, 42, 46—48 — непараметрических. Непараметрические задачи делятся на два класса: в одном из них речь идёт о проверке утверждений, касающихся функций распределения (примеры 37, 38, 41, 42, 48), во втором — о проверке утверждений, касающихся характеристик распределений (примеры 46, 47).

Статистическая гипотеза называется простой, если она однозначно задает распределение результатов наблюдений, вошедших в выборку. В противном случае статистическая гипотеза называется сложной. Гипотеза 2 из приведённого выше списка, нулевые гипотезы в примерах 34, 35, 37, 43, нулевая и альтернативная гипотезы в примере 44 — простые, все остальные упомянутые выше гипотезы — сложные.

Статистические критерии

Однозначно определённый способ проверки статистических гипотез называется статистическим критерием. Статистический критерий строится с помощью статистики $U(x_{1},x_{2},\dots ,x_{n})$ — функции от результатов наблюдений $x_{1},x_{2},\dots ,x_{n}$ . В пространстве значений статистики $U$ выделяют критическую область $\Psi$ , то есть область со следующим свойством: если значения применяемой статистики принадлежат данной области, то отклоняют (иногда говорят — отвергают) нулевую гипотезу, в противном случае — не отвергают (то есть принимают).

Статистику $U$ , используемую при построении определённого статистического критерия, называют статистикой этого критерия. Например, в задаче проверки статистической гипотезы, приведённой в примере 37, применяют критерий Колмогорова, основанный на статистике

D_{n}={\sqrt {n}}\;\sup _{n}|F_{n}(x)-F_{0}(x)|

.

При этом $D_{n}$ называют статистикой критерия Колмогорова.

Частным случаем статистики $U$ является векторзначная функция результатов наблюдений $U_{0}(x_{1},x_{2},\dots ,x_{n})=(x_{1},x_{2},\dots ,x_{n})$ , значения которой — набор результатов наблюдений. Если $x_{i}$ — числа, то $U_{0}$ — набор $n$ чисел, то есть точка $n$ -мерного пространства. Ясно, что статистика критерия $U$ является функцией от $U_{0}$ , то есть $U=f(U_{0})$ . Поэтому можно считать, что $\Psi$ — область в том же $n$ -мерном пространстве, нулевая гипотеза отвергается, если $(x_{1},x_{2},\dots ,x_{n})\in \Psi$ , и принимается в противном случае.

В вероятностно-статистических методах обработки данных и принятия решений статистические критерии, как правило, основаны на статистиках $U$ , принимающих числовые значения, и критические области имеют вид(41)

\Psi =\{U(x_{1},x_{2},\dots ,x_{n})>C\}

,

где $C$ — некоторые числа.

Статистические критерии делятся на параметрические и непараметрические. Параметрические критерии используются в параметрических задачах проверки статистических гипотез, а непараметрические — в непараметрических задачах.

Уровень значимости и мощность

При проверке статистической гипотезы возможны ошибки. Есть два рода ошибок. Ошибка первого рода заключается в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Ошибка второго рода состоит в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна.

Вероятность ошибки первого рода называется уровнем значимости и обозначается $\alpha$ . Таким образом, $\alpha =P\{U\in \Psi |H_{0}\}$ , то есть уровень значимости $\alpha$ — это вероятность события $\{U\in \alpha \}$ , вычисленная в предположении, что верна нулевая гипотеза $H_{0}$ .

Уровень значимости однозначно определён, если $H_{0}$ — простая гипотеза. Если же $H_{0}$ — сложная гипотеза, то уровень значимости, вообще говоря, зависит от функции распределения результатов наблюдений, удовлетворяющей $H_{0}$ . Статистику критерия $U$ обычно строят так, чтобы вероятность события $\{U\in \alpha \}$ не зависела от того, какое именно распределение (из удовлетворяющих нулевой гипотезе $H_{0}$ ) имеют результаты наблюдений. Для статистик критерия $U$ общего вида под уровнем значимости понимают максимально возможную ошибку первого рода. Максимум (точнее, супремум) берётся по всем возможным распределениям, удовлетворяющим нулевой гипотезе $H_{0}$ , то есть $\alpha =\sup P\{U\in \Psi |H_{0}\}$ .

Если критическая область имеет вид, указанный в формуле (41), то(42)

P\{U>C|H_{0}\}=\alpha

.

Если $C$ задано, то из последнего соотношения определяют $\alpha$ . Часто поступают по иному — задавая $\alpha$ (обычно $\alpha =0{,}05$ , иногда $\alpha =0{,}01$ или $\alpha =0{,}1$ , другие значения $\alpha$ используются гораздо реже), определяют $C$ из уравнения (42), обозначая его $C_{\alpha }$ , и используют критическую область $\Psi =\{U>C_{\alpha }\}$ с заданным уровнем значимости $\alpha$ .

Вероятность ошибки второго рода есть $P\{U\notin \Psi |H_{1}\}$ . Обычно используют не эту вероятность, а её дополнение до единицы, то есть $P\{U\in \Psi |H_{1}\}=1-P\{U\notin \Psi |H_{1}\}$ . Эта величина носит название мощности критерия. Итак, мощность критерия — это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная гипотеза верна.

Понятия уровня значимости и мощности критерия объединяются в понятии функции мощности критерия — функции, определяющей вероятность того, что нулевая гипотеза будет отвергнута. Функция мощности зависит от критической области $\Psi$ и действительного распределения результатов наблюдений. В параметрической задаче проверки гипотез распределение результатов наблюдений задаётся параметром $\theta$ . В этом случае функция мощности обозначается $M(\Psi ,\theta )$ и зависит от критической области $\Psi$ и действительного значения исследуемого параметра $\theta$ . Если

H_{0}{:}\;\theta =\theta _{0}

,

H_{1}{:}\;\theta =\theta _{1}

,

то

M(\Psi ,\theta _{0})=\alpha

,

M(\Psi ,\theta _{1})=1-\beta

,

где $\alpha$ — вероятность ошибки первого рода, $\beta$ — вероятность ошибки второго рода. В статистическом приёмочном контроле $\alpha$ — риск изготовителя, $\beta$ — риск потребителя. При статистическом регулировании технологического процесса $\alpha$ — риск излишней наладки, $\beta$ — риск незамеченной разладки.

Функция мощности $M(\Psi ,\theta )$ в случае одномерного параметра $\theta$ обычно достигает минимума, равного $\alpha$ , при $\theta =\theta _{0}$ , монотонно возрастает при удалении от $\theta _{0}$ и приближается к единице при $|\theta -\theta _{0}|\to \infty$ .

В ряде вероятностно-статистических методов принятия решений используется оперативная характеристика $L(\Psi ,\theta )$ — вероятность принятия нулевой гипотезы в зависимости от критической области $\Psi$ и действительного значения исследуемого параметра $\theta$ . Ясно, что

L(\Psi ,\theta )=1-M(\Psi ,\theta )

.

Состоятельность и несмещённость критериев

Основной характеристикой статистического критерия является функция мощности. Для многих задач проверки статистических гипотез разработан не один статистический критерий, а целый ряд. Чтобы выбрать из них определённый критерий для использования в конкретной практической ситуации, проводят сравнение критериев по различным показателям качества (^[2], приложение 3), прежде всего с помощью их функций мощности. В качестве примера рассмотрим лишь два показателя качества критерия проверки статистической гипотезы — состоятельность и несмещённость.

Пусть объём выборки $n$ растёт, а $U_{n}$ и $\Psi _{n}$ — статистики критерия и критические области соответственно. Критерий называется состоятельным, если

\lim _{n\to \infty }P\{U_{n}\in \Psi _{n}|H_{1}\}=1

,

то есть вероятность отвергнуть нулевую гипотезу стремится к единице, если верна альтернативная гипотеза.

Статистический критерий называется несмещённым, если для любого $\theta _{0}$ , удовлетворяющего $H_{0}$ , и любого $\theta _{1}$ , удовлетворяющего $H_{1}$ , справедливо неравенство

P\{U\in \Psi |\theta _{0}\}<P\{U\in \Psi |\theta _{1}\}

,

то есть при справедливости $H_{0}$ вероятность отвергнуть $H_{0}$ меньше, чем при справедливости $H_{1}$ .

При наличии нескольких статистических критериев в одной и той же задаче проверки статистических гипотез следует использовать состоятельные и несмещённые критерии.

Некоторые типовые задачи прикладной статистики

Статистические данные и прикладная статистика

Под прикладной статистикой обычно понимают часть математической статистики, посвящённую методам обработки реальных статистических данных, а также соответствующее математическое и программное обеспечение. Таким образом, чисто математические задачи не включают в прикладную статистику. В последние десятилетия термин «математическая статистика» всё чаще применяют для обозначения чисто математической дисциплины, которая изучает свойства математических объектов и структур, введённых в классической статистике ранее середины ХХ века. При таком понимании прикладная статистика — самостоятельная научно-практическая дисциплина, не имеющая пересечения с математической статистикой. Прикладную статистику и статистические методы в целом можно отнести к кибернетике или прикладной математике.

Под статистическими данными понимают числовые или нечисловые значения контролируемых параметров (признаков) исследуемых объектов, которые получены в результате наблюдений (измерений, анализов, испытаний, опытов и так далее) определённого числа признаков, у каждой единицы, вошедшей в исследование. Способы получения статистических данных и объёмы выборок устанавливают, исходя из постановок конкретной прикладной задачи на основе методов математической теории планирования эксперимента.

Результат наблюдения $x_{i}$ исследуемого признака $X$ (или совокупности исследуемых признаков $X$ ) у $i$ -ой единицы выборки отражает количественные и/или качественные свойства обследованной единицы с номером $i$ (здесь $i=1,2,\dots ,n$ , где $n$ — объём выборки). Деление прикладной статистики на направления соответственно виду обрабатываемых результатов наблюдений (то есть на статистику случайных величин, многомерный статистический анализ, статистику временны́х рядов и статистику объектов нечисловой природы) обсуждалось выше.

Результаты наблюдений $x_{1},x_{2},\dots ,x_{n}$ , где $x_{i}$ — результат наблюдения $i$ -ой единицы выборки, или результаты наблюдений для нескольких выборок, обрабатывают с помощью методов прикладной статистики, соответствующих поставленной задаче. Используют, как правило, аналитические методы, то есть методы, основанные на численных расчётах (объекты нечисловой природы при этом описывают с помощью чисел). В отдельных случаях допустимо применение графических методов (визуального анализа).

Количество разработанных к настоящему времени методов обработки данных весьма велико. Они описаны в сотнях тысяч книг и статей, а также в стандартах и других нормативно-технических и инструктивно-методических документах.

Многие методы прикладной статистики требуют проведения трудоемких расчётов, поэтому для их реализации нужны компьютеры. Программы расчётов на ЭВМ должны соответствовать современному научному уровню. Однако для единичных расчётов при отсутствии соответствующего программного обеспечения успешно используют микрокалькуляторы.

Статистический анализ точности и стабильности технологических процессов и качества продукции

Статистические методы используют, в частности, для анализа точности и стабильности технологических процессов и качества продукции. Цель — подготовка решений, обеспечивающих эффективное функционирование технологических единиц и повышение качества и конкурентоспособности выпускаемой продукции. Статистические методы следует применять во всех случаях, когда по результатам ограниченного числа наблюдений требуется установить причины улучшения или ухудшения точности и стабильности технологического оборудования. Под точностью технологического процесса понимают свойство технологического процесса, обусловливающее близость действительных и номинальных значений параметров производимой продукции. Под стабильностью технологического процесса понимают свойство технологического процесса, обусловливающее постоянство распределений вероятностей для его параметров в течение некоторого интервала времени без вмешательства извне.

Целями применения статистических методов анализа точности и стабильности технологических процессов и качества продукции на стадиях разработки, производства и эксплуатации (потребления) продукции являются, в частности:

определение фактических показателей точности и стабильности технологического процесса, оборудования или качества продукции;
установление соответствия качества продукции требованиям нормативно-технической документации;
проверка соблюдения технологической дисциплины;
изучение случайных и систематических факторов, способных привести к появлению дефектов;
выявление резервов производства и технологии;
обоснование технических норм и допусков на продукцию;
оценка результатов испытаний опытных образцов при обосновании требований к продукции и нормативов на неё;
обоснование выбора технологического оборудования и средств измерений и испытаний;
сравнение различных образцов продукции;
обоснование замены сплошного контроля статистическим;
выявление возможности внедрения статистических методов управления качеством продукции, и так далее.

Для достижения перечисленных выше целей применяют различные методы описания данных, оценивания и проверки гипотез. Приведём примеры постановок задач.

Задачи одномерной статистики (статистики случайных величин)

Сравнение математических ожиданий проводят в тех случаях, когда требуется установить соответствие показателей качества изготовленной продукции и эталонного образца. Это — задача проверки гипотезы:

H_{0}{:}\;M(X)=m_{0}

,

где $m_{0}$ — значение, соответствующее эталонному образцу; $X$ — случайная величина, моделирующая результаты наблюдений. В зависимости от формулировки вероятностной модели ситуации и альтернативной гипотезы сравнение математических ожиданий проводят либо параметрическими, либо непараметрическими методами.

Сравнение дисперсий проводят тогда, когда требуется установить отличие рассеивания показателя качества от номинального. Для этого проверяют гипотезу:

H_{0}{:}\;D(X)=\sigma _{0}^{2}

.

Ряд иных постановок задач одномерной статистики приведён ниже. Не меньшее значение, чем задачи проверки гипотез, имеют задачи оценивания параметров. Они, как и задачи проверки гипотез, в зависимости от используемой вероятностной модели ситуации делятся на параметрические и непараметрические.

В параметрических задачах оценивания принимают вероятностную модель, согласно которой результаты наблюдений $x_{1},x_{2},\dots ,x_{n}$ рассматривают как реализации $n$ независимых случайных величин с функцией распределения $F(x;\theta )$ . Здесь $\theta$ — неизвестный параметр, лежащий в пространстве параметров $\Theta$ заданном используемой вероятностной моделью. Задача оценивания состоит в определении точечной оценок и доверительных границ (либо доверительной области) для параметра $\theta$ .

Параметр $\theta$ — либо число, либо вектор фиксированной конечной размерности. Так, для нормального распределения $\theta =(m,\sigma ^{2})$ — двумерный вектор, для биномиального $\theta =p$ — число, для гамма-распределения $\theta =(a,b,c)$ — трёхмерный вектор, и так далее.

В современной математической статистике разработан ряд общих методов определения оценок и доверительных границ — метод моментов, метод максимального правдоподобия, метод одношаговых оценок, метод устойчивых (робастных) оценок, метод несмещённых оценок и другие. Кратко рассмотрим первые три из них. Теоретические основы различных методов оценивания и полученные с их помощью конкретные правила определения оценок и доверительных границ для тех или иных параметрических семейств распределений рассмотрены в специальной литературе, включены в нормативно-техническую и инструктивно-методическую документацию.

Метод моментов основан на использовании выражений для моментов рассматриваемых случайных величин через параметры их функций распределения. Оценки метода моментов получают, подставляя выборочные моменты вместо теоретических в функции, выражающие параметры через моменты.

В методе максимального правдоподобия, разработанном в основном Р. А. Фишером, в качестве оценки параметра $\theta$ берут значение $\theta ^{*}$ , для которого максимальна так называемая функция правдоподобия

f(x_{1},\theta )\;f(x_{2},\theta )\;\dots \;f(x_{n},\theta )

,

где $x_{1},x_{2},\dots ,x_{n}$ — результаты наблюдений; $f(x,\theta )$ — их плотность распределения, зависящая от параметра $\theta$ , который нужно оценить.

Оценки максимального правдоподобия, как правило, эффективны (или асимптотически эффективны) и имеют меньшую дисперсию, чем оценки метода моментов. В отдельных случаях формулы для них выписываются явно (нормальное распределение, экспоненциальное распределение без сдвига). Однако чаще для их нахождения надо численно решать систему трансцендентных уравнений (распределения Вейбулла-Гнеденко, гамма). В подобных случаях целесообразно использовать не оценки максимального правдоподобия, а другие виды оценок, прежде всего одношаговые оценки. В литературе их иногда не вполне точно называют «приближённые оценки максимального правдоподобия». При достаточно больши́х объёмах выборок они имеют столь же хорошие свойства, как и оценки максимального правдоподобия. Поэтому их следует рассматривать не как «приближённые», а как оценки, полученные по другому методу, не менее обоснованному и эффективному, чем метод максимального правдоподобия. Одношаговые оценки вычисляют по явным формулам (^[16]).

В непараметрических задачах оценивания принимают вероятностную модель, в которой результаты наблюдений $x_{1},x_{2},\dots ,x_{n}$ рассматривают как реализации $n$ независимых случайных величин с функцией распределения $F(x)$ общего вида. От $F(x)$ требуют лишь выполнения некоторых условий типа непрерывности, существования математического ожидания и дисперсии и тому подобного. Подобные условия не являются столь жёсткими, как условие принадлежности к определённому параметрическому семейству.

Непараметрическое оценивание математического ожидания

В непараметрической постановке оценивают либо характеристики случайной величины (математическое ожидание, дисперсию, коэффициент вариации), либо её функцию распределения, плотность и тому подобное. Так, в силу закона больши́х чисел выборочное среднее арифметическое ${\overline {x}}$ является состоятельной оценкой математического ожидания $M(X)$ (при любой функции распределения $F(x)$ результатов наблюдений, для которой математическое ожидание существует). С помощью центральной предельной теоремы определяют асимптотические доверительные границы

{\Big (}M(X){\Big )}_{H}={\overline {x}}-u\left({\frac {1+\gamma }{2}}\right){\frac {s}{\sqrt {n}}}

,

{\Big (}M(X){\Big )}_{B}={\overline {x}}+u\left({\frac {1+\gamma }{2}}\right){\frac {s}{\sqrt {n}}}

,

где $\gamma$ — доверительная вероятность, $u{\frac {1+\gamma }{2}}$ — квантиль порядка ${\frac {1+\gamma }{2}}$ стандартного нормального распределения $N(0;1)$ с нулевым математическим ожиданием и единичной дисперсией, ${\overline {x}}$ — выборочное среднее арифметическое, $s$ — выборочное среднеквадратичное отклонение. Термин «асимптотические доверительные границы» означает, что вероятности $P\left\{{\Big (}M(X){\Big )}_{H}<M(X)\right\}$ , $P\left\{{\Big (}M(X){\Big )}_{B}>M(X)\right\}$ , $P\left\{{\Big (}M(X){\Big )}_{H}<M(X)<{\Big (}M(X){\Big )}_{B}\right\}$ стремятся к ${\frac {1+\gamma }{2}}$ , ${\frac {1+\gamma }{2}}$ и $\gamma$ соответственно при $n\to \infty$ , но, вообще говоря, не равны этим значениям при конечных $n$ . Практически асимптотические доверительные границы дают достаточную точность при $n$ порядка 10.

Непараметрическое оценивание функции распределения

Второй пример непараметрического оценивания — оценивание функции распределения. По теореме Гливенко эмпирическая функция распределения $F_{n}(x)$ является состоятельной оценкой функции распределения $F(x)$ . Если $F(x)$ — непрерывная функция, то на основе теоремы Колмогорова доверительные границы для функции распределения $F(x)$ задают в виде

{\Big (}F(x){\Big )}_{H}=\max \left\{0,F_{n}(x)-{\frac {k(\gamma ,n)}{\sqrt {n}}}\right\}

,

{\Big (}F(x){\Big )}_{B}=\min \left\{1,F_{n}(x)+{\frac {k(\gamma ,n)}{\sqrt {n}}}\right\}

,

где $k(\gamma ,n)$ — квантиль порядка $\gamma$ распределения статистики Колмогорова при объёме выборки $n$ (напомним, что распределение этой статистики не зависит от $F(x)$ ).

Правила определения оценок и доверительных границ в параметрическом случае строятся на основе параметрического семейства распределений $F(x;\theta )$ . При обработке реальных данных возникает вопрос — соответствуют ли эти данные принятой вероятностной модели? То есть статистической гипотезе о том, что результаты наблюдений имеют функцию распределения из семейства $\{F(x;\theta ),\,\theta \in \Theta \}$ при некотором $\theta =\theta _{0}$ Такие гипотезы называют гипотезами согласия, а критерии их проверки — критериями согласия.

Если истинное значение параметра $\theta =\theta _{0}$ известно, функция распределения $F(x;\theta _{0})$ непрерывна, то для проверки гипотезы согласия часто применяют критерий Колмогорова, основанный на статистике

D_{n}={\sqrt {n}}\,\sup _{x}|F_{n}(x)-F(x,\theta _{0})|

,

где $F_{n}(x)$ — эмпирическая функция распределения.

Если истинное значение параметра $\theta _{0}$ неизвестно, например, при проверке гипотезы о нормальности распределения результатов наблюдения (то есть при проверке принадлежности этого распределения к семейству нормальных распределений), то иногда используют статистику

D_{n}(\theta ^{*})={\sqrt {n}}\,\sup _{x}|F_{n}(x)-F(x,\theta ^{*})|

.

Она отличается от статистики Колмогорова $D_{n}$ тем, что вместо истинного значения параметра $\theta _{0}$ подставлена его оценка $\theta ^{*}$ .

Распределение статистики $D_{n}(\theta ^{*})$ сильно отличается от распределения статистики $D_{n}$ . В качестве примера рассмотрим проверку нормальности, когда $\theta =(m,\sigma ^{2})$ , а $\sigma ^{*}=({\overline {x}},\sigma ^{2})$ . Для этого случая квантили распределений статистик $D_{n}$ и $D_{n}(\theta ^{*})$ приведены в таблице 5 (см., например, ^[17]). Таким образом, квантили отличаются примерно в 1,5 раза.

Таблица 5. Квантили статистик $D_{n}$ и $D_{n}(\theta ^{*})$ при проверке нормальности
$p$	0,85	0,90	0,95	0,975	0,99
Квантили порядка $p$ для $D_{n}$	1,138	1,224	1,358	1,480	1,626
Квантили порядка $p$ для $D_{n}(\theta ^{*})$	0,775	0,819	0,895	0,955	1,035

Проблема исключения промахов

При первичной обработке статистических данных важной задачей является исключение результатов наблюдений, полученных в результате грубых погрешностей и промахов. Например, при просмотре данных о весе (в килограммах) новорожденных детей наряду с числами 3,500, 2,750, 4,200 может встретиться число 35,00. Ясно, что это промах, и получено ошибочное число при ошибочной записи — запятая сдвинута на один знак, в результате результат наблюдения ошибочно увеличен в 10 раз.

Статистические методы исключения резко выделяющихся результатов наблюдений основаны на предположении, что подобные результаты наблюдений имеют распределения, резко отличающиеся от изучаемых, а потому их следует исключить из выборки.

Простейшая вероятностная модель такова. При нулевой гипотезе результаты наблюдений рассматриваются как реализации независимых одинаково распределённых случайных величин $X_{1},X_{2},\dots ,X_{n}$ с функцией распределения $F(x)$ . При альтернативной гипотезе $X_{1},X_{2},\dots ,X_{n-1}$ — такие же, как и при нулевой гипотезе, а $X_{n}$ соответствует грубой погрешности и имеет функцию распределения $G(x)=F(x-c)$ , где $c$ велико. Тогда с вероятностью, близкой к 1 (точнее, стремящейся к 1 при росте объёма выборки),

X_{n}=\max\{X_{1},X_{2},\dots ,X_{n}\}=X_{\max }

,

то есть при описании данных в качестве возможной грубой ошибки следует рассматривать $X_{\max }$ . Критическая область имеет вид

\Psi =\{x{:}\;x\geqslant d\}

.

Критическое значение $d=d(\alpha ,n)$ выбирают в зависимости от уровня значимости $\alpha$ и объёма выборки $n$ из условия(43)

P\{X_{\max }\geqslant d|H_{0}\}=\alpha

.

Условие (43) эквивалентно при больши́х $n$ и малых $\alpha$ следующему:(44)

F(d)={\sqrt[{n}]{1-\alpha }}\approx 1-{\frac {\alpha }{n}}

.

Если функция распределения результатов наблюдений $F(x)$ известна, то критическое значение $d$ находят из соотношения (44). Если $F(x)$ известна с точностью до параметров, например, известно, что $F(x)$ — нормальная функция распределения, то также разработаны правила проверки рассматриваемой гипотезы ^[8].

Однако часто вид функции распределения результатов наблюдений известен не абсолютно точно и не с точностью до параметров, а лишь с некоторой погрешностью. Тогда соотношение (44) становится практически бесполезным, поскольку малая погрешность в определении $F(x)$ , как можно показать, приводит к большой погрешности при определении критического значения $d$ из условия (44), а при фиксированном $d$ уровень значимости критерия может существенно отличаться от номинального ^[2].

Поэтому в ситуации, когда о $F(x)$ нет полной информации, однако известны математическое ожидание $M(X)$ и дисперсия $\sigma ^{2}=D(X)$ результатов наблюдений $X_{1},X_{2},\dots ,X_{n}$ , можно использовать непараметрические правила отбраковки, основанные на неравенстве Чебышёва. С помощью этого неравенства найдём критическое значение $d=d(\alpha ,n)$ такое, что(45)

P\left\{\max _{1\leqslant i\leqslant n}|X_{i}-M(X)|\geqslant d\right\}\leqslant \alpha

.

Так как

P\left\{\max _{1\leqslant i\leqslant n}|X_{i}-M(X)|<d\right\}=\left[P{\Big \{}|X-M(X)|<d{\Big \}}\right]^{n}

,

то соотношение (45) будет выполнено, если(46)

P{\Big \{}|X-M(X)|\geqslant d{\Big \}}\leqslant 1-{\sqrt[{n}]{1-\alpha }}\approx {\frac {\alpha }{n}}

.

По неравенству Чебышёва(47)

P{\Big \{}|X-M(X)|\geqslant d{\Big \}}\leqslant {\frac {\sigma ^{2}}{d^{2}}}

,

поэтому для того, чтобы (45) было выполнено, достаточно приравнять правые части формул (46) и (47), то есть определить $d$ из условия(48)

{\frac {\sigma ^{2}}{d^{2}}}={\frac {\alpha }{n}}

,

d={\frac {\sigma {\sqrt {n}}}{\sqrt {\alpha }}}

.

Правило отбраковки, основанное на критическом значении $d$ , вычисленном по формуле (48), использует минимальную информацию о функции распределения $F(x)$ и поэтому исключает лишь результаты наблюдений, весьма далеко отстоящие от основной массы. Другими словами, значение $d_{1}$ , заданное соотношением (43), обычно много меньше, чем значение $d_{2}$ , заданное соотношением (48).

Многомерный статистический анализ

Перейдём к многомерному статистическому анализу. Его применяют при решении следующих задач:

исследование зависимости между признаками;
классификация объектов или признаков, заданных векторами;
снижение размерности пространства признаков.

При этом результат наблюдений — вектор значений фиксированного числа количественных и иногда качественных признаков, измеренных у объекта. Напомним, что количественный признак — признак наблюдаемой единицы, который можно непосредственно выразить числом и единицей измерения. Количественный признак противопоставляется качественному — признаку наблюдаемой единицы, определяемому отнесением к одной из двух или более условных категорий (если имеется ровно две категории, то признак называется альтернативным). Статистический анализ качественных признаков — часть статистики объектов нечисловой природы. Количественные признаки делятся на признаки, измеренные в шкалах интервалов, отношений, разностей, абсолютной шкале. А качественные — на признаки, измеренные в шкале наименований и порядковой шкале. Методы обработки данных должны быть согласованы со шкалами, в которых измерены рассматриваемые признаки.

Корреляция и регрессия

Целями исследования зависимости между признаками являются доказательство наличия связи между признаками и изучение этой связи. Для доказательства наличия связи между двумя случайными величинами $X$ и $Y$ применяют корреляционный анализ. Если совместное распределение $X$ и $Y$ является нормальным, то статистические выводы основывают на выборочном коэффициенте линейной корреляции, в остальных случаях используют коэффициенты ранговой корреляции Кендалла и Спирмена, а для качественных признаков — критерий хи-квадрат.

Регрессионный анализ применяют для изучения функциональной зависимости количественного признака $Y$ от количественных признаков $x(1),x(2),\dots ,x(k)$ . Эту зависимость называют регрессионной или, кратко, регрессией. Простейшая вероятностная модель регрессионного анализа (в случае $k=1$ ) использует в качестве исходной информации набор пар результатов наблюдений $(x_{i},y_{i})$ , $i=1,2,\dots ,n$ , и имеет вид

y_{i}=ax_{i}+b+\varepsilon _{i}

,

i=1,2,\dots ,n

,

где $\varepsilon _{i}$ — ошибки наблюдений. Иногда предполагают, что $\varepsilon _{i}$ — независимые случайные величины с одним и тем же нормальным распределением $N(0,\sigma ^{2})$ . Поскольку распределение ошибок наблюдения обычно отлично от нормального, то целесообразно рассматривать регрессионную модель в непараметрической постановке, то есть при произвольном распределении $\varepsilon _{i}$ .

Основная задача регрессионного анализа состоит в оценке неизвестных параметров $a$ и $b$ , задающих линейную зависимость $y$ от $x$ . Для решения этой задачи применяют разработанный ещё Гауссом в 1794 году метод наименьших квадратов, то есть находят оценки неизвестных параметров модели $a$ и $b$ из условия минимизации суммы квадратов

\sum _{1\leqslant i\leqslant n}(y_{i}-ax_{i}-b)^{2}

по переменным $a$ и $b$ .

Теория регрессионного анализа описана, и расчётные формулы даны в специальной литературе ^[2], ^[18]. В этой теории разработаны методы точечного и интервального оценивания параметров, задающих функциональную зависимость, а также непараметрические методы оценивания этой зависимости, методы проверки различных гипотез, связанных с регрессионными зависимостями. Выбор планов эксперимента, то есть точек $x_{i}$ , в которых будут проводиться эксперименты по наблюдению $y_{i}$ — предмет теории планирования эксперимента ^[19].

Дисперсионный анализ

Дисперсионный анализ применяют для изучения влияния качественных признаков на количественную переменную. Например, пусть имеются $k$ выборок результатов измерений количественного показателя качества единиц продукции, выпущенных на $k$ станках, то есть набор чисел ${\Big (}x_{1}(j),x_{2}(j),\dots ,x_{n}(j){\Big )}$ , где $j$ — номер станка, $j=1,2,\dots ,k$ , а $n$ — объём выборки. В распространённой постановке дисперсионного анализа предполагают, что результаты измерений независимы и в каждой выборке имеют нормальное распределение $N{\Big (}m(j),\sigma ^{2}{\Big )}$ с одной и той же дисперсией. Хорошо разработаны и непараметрические постановки ^[20].

Проверка однородности качества продукции, то есть отсутствия влияния номера станка на качество продукции, сводится к проверке гипотезы

H_{0}{:}\;m(1)=m(2)=\dots =m(k)

.

В дисперсионном анализе разработаны методы проверки подобных гипотез. Теория дисперсионного анализа и расчётные формулы рассмотрены в специальной литературе ^[21].

Гипотезу $H_{0}$ проверяют против альтернативной гипотезы $H_{1}$ , согласно которой хотя бы одно из указанных равенств не выполнено. Проверка этой гипотезы основана на следующем «разложении дисперсий», указанном Р. А. Фишером:(49)

(kn)\sigma ^{2}=n\sum _{j=1}^{k}\sigma ^{2}(j)+(kn)\sigma _{1}^{2}

,

где $\sigma ^{2}$ — выборочная дисперсия в объединённой выборке, то есть

\sigma ^{2}={\frac {1}{kn}}\sum _{i=1}^{n}\sum _{j=1}^{k}(x_{i}(j)-{\overline {x}})^{2}

,

{\overline {x}}={\frac {1}{kn}}\sum _{i=1}^{n}\sum _{j=1}^{k}x_{i}(j)

.

Далее, $\sigma ^{2}(j)$ — выборочная дисперсия в $j$ -й группе,

\sigma ^{2}(j)={\frac {1}{n}}\sum _{i=1}^{n}{\Big (}x_{i}(j)-{\overline {x}}(j){\Big )}^{2}

,

{\overline {x}}(j)={\frac {1}{n}}\sum _{i=1}^{n}x_{i}(j)

,

j=1,2,\dots ,k

.

Таким образом, первое слагаемое в правой части формулы (49) отражает внутригрупповую дисперсию. Наконец, $\sigma _{1}^{2}$ — межгрупповая дисперсия:

\sigma _{1}^{2}={\frac {1}{k}}\sum _{j=1}^{k}{\Big (}{\overline {x}}(j)-{\overline {x}}{\Big )}^{2}

.

Область прикладной статистики, связанную с разложениями дисперсии типа формулы (49), называют дисперсионным анализом. В качестве примера задачи дисперсионного анализа рассмотрим проверку приведённой выше гипотезы $H_{0}$ в предположении, что результаты измерений независимы и в каждой выборке имеют нормальное распределение $N{\Big (}m(j),\sigma ^{2}{\Big )}$ с одной и той же дисперсией. При справедливости $H_{0}$ первое слагаемое в правой части формулы (49), делённое на $\sigma ^{2}$ , имеет распределение хи-квадрат с $k(n-1)$ степенями свободы, а второе слагаемое, делённое на $\sigma ^{2}$ , также имеет распределение хи-квадрат, но с $(k-1)$ степенями свободы, причём первое и второе слагаемые независимы как случайные величины. Поэтому случайная величина

F={\frac {k(n-1)}{k-1}}{\frac {(kn)\sigma _{i}^{2}}{n\sum _{j=1}^{k}\sigma ^{2}(j)}}={\frac {k^{2}(n-1)\sigma _{1}^{2}}{(k-1)\sum _{j=1}^{k}\sigma ^{2}(j)}}

имеет распределение Фишера с $(k-1)$ степенями свободы числителя и $k(n-1)$ степенями свободы знаменателя. Гипотеза $H_{0}$ принимается, если $F\leqslant F_{1-\alpha }$ , и отвергается в противном случае, где $F_{1-\alpha }$ — квантиль порядка $1-\alpha$ распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при $H_{1}$ величина $F$ безгранично увеличивается при росте объёма выборок $n$ . Значения $F_{1-\alpha }$ берут из соответствующих таблиц ^[8].

Разработаны непараметрические методы решения классических задач дисперсионного анализа ^[20], в частности, проверки гипотезы $H_{0}$ .

Методы классификации

Следующий тип задач многомерного статистического анализа — задачи классификации. Они согласно [2, 20] делятся на три принципиально различных вида — дискриминантный анализ, кластерный анализ, задачи группировки.

Дискриминантный анализ

Задача дискриминантного анализа состоит в нахождении правила отнесения наблюдаемого объекта к одному из ранее описанных классов. При этом объекты описывают в математической модели с помощью векторов, координаты которых — результаты наблюдения ряда признаков у каждого объекта. Классы описывают либо непосредственно в математических терминах, либо с помощью обучающих выборок. Обучающая выборка — это выборка, для каждого элемента которой указано, к какому классу он относится.

Рассмотрим пример применения дискриминантного анализа для принятия решений в технической диагностике. Пусть по результатам измерения ряда параметров продукции требуется установить наличие или отсутствие дефектов. В этом случае для элементов обучающей выборки указаны дефекты, обнаруженные в ходе дополнительного исследования, например, провёденного после определённого периода эксплуатации. Дискриминантный анализ позволяет сократить объём контроля, а также предсказать будущее поведение продукции. Дискриминантный анализ сходен с регрессионным — первый позволяет предсказывать значение качественного признака, а второй — количественного. В статистике объектов нечисловой природы разработана математическая схема, частными случаями которой являются регрессионный и дискриминантный анализы ^[22].

Кластерный анализ

Кластерный анализ применяют, когда по статистическим данным нужно разделить элементы выборки на группы. Причём два элемента группы из одной и той же группы должны быть «близкими» по совокупности значений, измеренных у них признаков, а два элемента из разных групп должны быть «далёкими» в том же смысле. В отличие от дискриминантного анализа в кластерном анализе классы не заданы, а формируются в процессе обработки статистических данных. Например, кластерный анализ может быть применён для разбиения совокупности марок стали (или марок холодильников) на группы сходных между собой.

Другой вид кластерного анализа — разбиение признаков на группы близких между собой. Показателем близости признаков может служить выборочный коэффициент корреляции. Цель кластерного анализа признаков может состоять в уменьшении числа контролируемых параметров, что позволяет существенно сократить затраты на контроль. Для этого из группы тесно связанных между собой признаков (у которых коэффициент корреляции близок к единице — своему максимальному значению) измеряют значение одного, а значения остальных рассчитывают с помощью регрессионного анализа.

Задачи группировки

Задачи группировки решают тогда, когда классы заранее не заданы и не обязаны быть «далёкими» друг от друга. Примером является группировка студентов по учебным группам. В технике решением задачи группировки часто является параметрический ряд — возможные типоразмеры группируются согласно элементам параметрического ряда. В литературе, нормативно-технических и инструктивно-методических документах по прикладной статистике также иногда используется группировка результатов наблюдений (например, при построении гистограмм).

Задачи классификации решают не только в многомерном статистическом анализе, но и тогда, когда результатами наблюдений являются числа, функции или объекты нечисловой природы. Так, многие алгоритмы кластерного анализа используют только расстояния между объектами. Поэтому их можно применять и для классификации объектов нечисловой природы, лишь бы были заданы расстояния между ними. Простейшая задача классификации такова: даны две независимые выборки, требуется определить, представляют они два класса или один. В одномерной статистике эта задача сводится к проверке гипотезы однородности ^[2].

Снижение размерности

Третий раздел многомерного статистического анализа — задачи снижения размерности с целью сжатия информации. Цель их решения состоит в определении набора производных показателей, полученных преобразованием исходных признаков, такого, что число производных показателей значительно меньше числа исходных признаков, но они содержат возможно бо́льшую часть информации, имеющейся в исходных статистических данных. Задачи снижения размерности решают с помощью методов многомерного шкалирования, главных компонент, факторного анализа и других. Например, в простейшей модели многомерного шкалирования исходные данные — попарные расстояния $\rho _{ij}$ , $i,j=1,2,\dots ,k$ , $i\neq j$ между $k$ объектами, а цель расчётов состоит в представлении объектов точками на плоскости. Это даёт возможность в буквальном смысле слова увидеть, как объекты соотносятся между собой. Для достижения этой цели необходимо каждому объекту поставить в соответствие точку на плоскости так, чтобы попарные расстояния $s_{ij}$ между точками, соответствующими объектам с номерами $i$ и $j$ , возможно точнее воспроизводили расстояния $\rho _{ij}$ между этими объектами. Согласно основной идее метода наименьших квадратов находят точки на плоскости так, чтобы величина

\sum _{i=1}^{k}\sum _{j=1}^{k}(s_{ij}-\rho _{ij})^{2}

достигала своего наименьшего значения. Есть и многие другие постановки задач снижения размерности и визуализации данных.

Статистика случайных процессов и временны́х рядов

Методы статистики случайных процессов и временны́х рядов применяют для постановки и решения, в частности, следующих задач:

предсказание будущего развития случайного процесса или временно́го ряда;
управление случайным процессом (временны́м рядом) с целью достижения поставленных целей, например, заданных значений контролируемых параметров;
построение вероятностной модели реального процесса, обычно длящегося во времени, и изучение свойств этой модели.

Пример 49. При внедрении статистического регулирования технологического процесса нужно проверить, что в налаженном состоянии математическое ожидание контролируемого параметра не меняется со временем. Если подобное изменение будет обнаружено, то следует установить подналадочное устройство.

Пример 50. Следящие системы, например, входящие в состав автоматизированной системы управления технологическим процессом, должны выделять полезный сигнал на фоне шумов. Это — задача оценивания (полезного сигнала), в то время как в примере 49 речь шла о задаче проверки гипотезы.

Методы статистики случайных процессов и временны́х рядов описаны в литературе ^[2], ^[21].

Статистика объектов нечисловой природы

Методы статистики объектов нечисловой природы (статистики нечисловых данных, или нечисловой статистики) применяют всегда, когда результаты наблюдений являются объектами нечисловой природы. Например:

сообщениями о годности или дефектности единиц продукции,
информацией о сортности единиц продукции,
разбиениями единиц продукции на группы соответственно значения контролируемых параметров,
упорядочениями единиц продукции по качеству или инвестиционных проектов по предпочтительности,
фотографиями поверхности изделия, пораженной коррозией,

и так далее. Итак, объекты нечисловой природы — это измерения по качественному признаку, множества, бинарные отношения (разбиения, упорядочения и другое) и многие другие математические объекты ^[2]. Они используются в различных вероятностно-статистических методах принятия решений. В частности, в задачах управления качеством продукции, а также, например, в медицине и социологии, как для описания результатов приборных измерений, так и для анализа экспертных оценок.

Для описания данных, являющихся объектами нечисловой природы, применяют, в частности, таблицы сопряжённости, а в качестве средних величин — решения оптимизационных задач ^[2]. В качестве выборочных средних для измерений в порядковой шкале используют медиану и моду, а в шкале наименований — только моду. О методах классификации нечисловых данных говорилось выше.

Для решения параметрических задач оценивания используют оптимизационный подход, метод одношаговых оценок, метод максимального правдоподобия, метод устойчивых оценок. Для решения непараметрических задач оценивания наряду с оптимизационными подходами к оцениванию характеристик используют непараметрические оценки распределения случайного элемента, плотности распределения, функции, выражающей зависимость ^[2].

В качестве примера методов проверки статистических гипотез для объектов нечисловой природы рассмотрим критерий «хи-квадрат» (обозначают $\chi ^{2}$ ), разработанный К. Пирсоном для проверки гипотезы однородности (другими словами, совпадения) распределений, соответствующих двум независимым выборкам.

Рассматриваются две выборки объёмов $n_{1}$ и $n_{2}$ , состоящие из результатов наблюдений качественного признака, имеющего $k$ градаций. Пусть $m_{1j}$ и $m_{2j}$ — количества элементов первой и второй выборок соответственно, для которых наблюдается $j$ -я градация, а $p_{1j}$ и $p_{2j}$ — вероятности того, что эта градация будет принята, для элементов первой и второй выборок, $j=1,2,\dots ,k$ .

Для проверки гипотезы однородности распределений, соответствующих двум независимым выборкам

H_{0}{:}\;p_{1j}=p_{2j},\quad j=1,2,\dots ,k

,

применяют критерий $\chi ^{2}$ со статистикой

\chi ^{2}=n_{1}n_{2}\sum _{j=1}^{k}{\frac {1}{m_{1j}+m_{2j}}}\left({\frac {m_{1j}}{n_{1}}}-{\frac {m_{2j}}{n_{2}}}\right)^{2}

.

Установлено ^[9], ^[10], что статистика $\chi ^{2}$ при больши́х объёмах выборок $n_{1}$ и $n_{2}$ имеет асимптотическое распределение хи-квадрат с $(k-1)$ степенью свободы.

Пример 51. В таблице приведены данные о содержании серы в углеродистой стали, выплавляемой двумя металлургическими заводами. Проверим, можно ли считать распределения примеси серы в плавках стали этих двух заводов одинаковыми.

Распределения плавок стали по процентному содержанию серы
Содержание серы, в %	Число плавок
Содержание серы, в %	Завод А	Завод Б
$0{,}00\div 0{,}02$	82	63
$0{,}02\div 0{,}04$	535	429
$0{,}04\div 0{,}06$	1173	995
$0{,}06\div 0{,}08$	1714	1307

Расчёт по данным даёт $X^{2}=3{,}39$ . Квантиль порядка 0,95 распределения хи-квадрат с $k-1=3$ степенями свободы равен $\chi _{0{,}95}^{2}(3)=7{,}8$ , поэтому гипотезу о совпадении функций распределения нельзя отклонить, а следует принять на уровне значимости $\alpha =0{,}05$ .

Выше дано лишь краткое описание содержания прикладной статистики на современном этапе. Подробное изложение конкретных методов содержится в специальной литературе.

Литература

↑ ^а ^б ^в Вероятность и математическая статистика: Энциклопедия / Гл. ред. акад. РАН Ю. В. Прохоров. — М.: Большая Российская энциклопедия, 1999. — 910 с.
↑ ^а ^б ^в ^г ^д ^е ^ё ^ж ^з ^и ^й ^к ^л ^м Орлов А. И. Эконометрика. Учебник. 2-е изд. — М.: Экзамен, 2003. — 576 с.
↑ Рекомендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики / Орлов А. И., Фомин В. Н. и др. — М.: ВНИИ Стандартизации, 1987. — 62 с.
↑ Колмогоров А. Н. Основные понятия теории вероятностей. — М.-Л.: ОНТИ, 1936. — 80 с.
↑ Колмогоров А. Н. Теория информации и теория алгоритмов. — М.: Наука, 1987. — 304 с.
↑ ^а ^б ^в ^г Гнеденко Б. В. Курс теории вероятностей: Учебник. 7-е изд., исправл. — М.: Эдиториал УРСC, 2001. — 320 с.
↑ Анализ нечисловой информации в социологических исследованиях (в соавторстве). — М.: Наука, 1985. — 220 с.
↑ ^а ^б ^в ^г ^д ^е ^ё ^ж ^з ^и Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. — М.: Наука, 1965 (1-е изд.), 1968 (2-е изд.), 1983 (3-е изд.).
↑ ^а ^б ^в ^г ^д Смирнов Н. В., Дунин-Барковский И. В. Курс теории вероятностей и математической статистики для технических приложений. – М.: Наука, 1969. — 512 с.
↑ ^а ^б ^в ^г ^д ^е ^ё Крамер Г. Математические методы статистики. – М.: Мир, 1975. — 648 с.
↑ Кендалл М. Дж., Стъюарт А. Статистические выводы и связи. — М.: Наука, 1973. – 900 с.
↑ Колмогоров А. Н. О логарифмически нормальном законе распределения размеров частиц при дроблении / Доклады АН СССР. 1941. Т. 31. С. 99—101.
↑ Прохоров Ю. В., Розанов Ю. А. Теория вероятностей. (Основные понятия. Предельные теоремы. Случайные процессы.) – М.: Наука, 1973. — 496 с.
↑ Орлов А. И. Устойчивость в социально-экономических моделях. – М.: Наука, 1979. — 296 с.
↑ Камень Ю. Э., Камень Я. Э., Орлов А. И. Реальные и номинальные уровни значимости в задачах проверки статистических гипотез. — Журнал «Заводская лаборатория», 1986. Т. 52. № 12. С. 55—57.
↑ Орлов А. И. О нецелесообразности использования итеративных процедур нахождения оценок максимального правдоподобия. – Журнал «Заводская лаборатория», 1986, Т. 52. № 5. С. 67—69.
↑ Орлов А. И. Распространенная ошибка при использовании критериев Колмогорова и омега-квадрат. – Журнал «Заводская лаборатория», 1985, т. 51, № 1, c. 60—62.
↑ Себер Дж. Линейный регрессионный анализ. — М.: Мир, 1980. — 456 с.
↑ Математическая теория планирования эксперимента / Под ред. С. М. Ермакова. — М.: Наука, 1983. – 392 с.
↑ ^а ^б Холлендер М., Вульф Д. Непараметрические методы статистики. – М.: Финансы и статистика, 1983. — 518 с.
↑ ^а ^б Кендалл М. Дж., Стьюарт А. Многомерный статистический анализ и временны́е ряды. — М.: Наука, 1976. – 736 с.
↑ Орлов А. И. Некоторые неклассические постановки в регрессионном анализе и теории классификации. — В сб.: Программно-алгоритмическое обеспечение анализа данных в медико-биологических исследованиях. — М.: Наука, 1987. С. 27—40.

Контрольные вопросы и задачи

1. Расскажите о понятиях случайного события и его вероятности.

2. Почему закон больши́х чисел и центральная предельная теорема занимают центральное место в вероятностно-статистических методах?

3. Чем многомерный статистический анализ отличается от статистики объектов нечисловой природы?

4. Имеются три одинаковые с виду ящика. В первом $a$ белых шаров и $b$ чёрных; во втором $c$ белых и $d$ чёрных; в третьем только белые шары. Найдите вероятность случайного вытягивания белого шара.

5. Есть два трамвая с разными маршрутами. Один следует с интервалом $T_{1}$ , другой — $T_{2}$ . Пассажир может подойти к остановке в произвольное время. Какой может быть вероятность того, что пассажир, пришедший на остановку, будет ждать не дольше $t$ , где $0<t<\min(T_{1},T_{2})$ ?

6. Два стрелка́ независимо один от другого делают по два выстрела каждый по своей мишени. Вероятность попадания в мишень при одном выстреле для первого стрелка́ равна $p_{1}$ , для второго — $p_{2}$ . Выигравшим считается стрело́к, в мишени которого будет больше пробоин. Найти вероятность победы первого стрелка.

7. Колода из 52 игральных карт делится на две равные стопки. Найти вероятности событий:

в каждой из пачек окажется по два туза;
в одной из пачек не будет ни одного туза, а в другой все четыре;
в одной из пачек будет один туз, а в другой три.

8. Случайная величина $X$ принимает значения 0 и 1, а случайная величина $Y$ — значения -1, 0 и 1. Вероятности $P(X=i,\,Y=j)$ задаются таблицей:

	$Y=-1$	$Y=0$	$Y=1$
$X=0$	${\frac {1}{16}}$	${\frac {1}{4}}$	${\frac {1}{16}}$
$X=1$	${\frac {1}{16}}$	${\frac {1}{4}}$	${\frac {5}{16}}$

Найдите распределение случайной величины $Z=XY$ , её математическое ожидание и дисперсию.

9. В условиях задачи 8 найдите распределение случайной величины $W={\frac {X}{Y+3}}$ , её математическое ожидание и дисперсию.

10. Даны независимые случайные величины $X$ и $Y$ такие, что $M(X)=1$ , $D(X)=3$ , $M(Y)=-1$ , $D(Y)=2$ . Найдите $M(aX+bY)$ и $D(aX+bY)$ , где $a=3$ , $b=-2$ .

Темы докладов, рефератов, исследовательских работ

Описание данных с помощью гистограмм и непараметрических оценок плотности.
Сравнительный анализ методов оценивания параметров и характеристик.
Преимущества одношаговых оценок по сравнению с оценками метода максимального правдоподобия.
Методы проверки однородности для независимых и связанных выборок.
Непараметрический регрессионный анализ.
Структура статистики нечисловых данных.
Аксиоматическое введение метрик и их использование в статистике объектов нечисловой природы.
Законы больши́х чисел в пространствах произвольной природы.
Непараметрические оценки плотности в пространствах произвольной природы, в том числе в дискретных пространствах.
Основные идеи статистики интервальных данных.
Оптимизационные постановки в вероятностно-статистических задачах принятия решений.

Приложение

Темы задач прикладной статистики

Чтобы дать представление о богатом содержании теории рассматриваемых методов, приведём краткий перечень основных типов постановок задач прикладной статистики, широко используемых в практической деятельности и в научных исследованиях. Задачи рассмотрим в соответствии с описанной выше классификацией областей прикладной статистики.

Одномерная статистика.
- Описание материала.
  - Расчёт выборочных характеристик распределения.
  - Построение гистограмм и полигонов частот.
  - Приближение эмпирических распределений с помощью распределений из системы Пирсона и других систем.
  - …
- Оценивание.
  - Параметрическое оценивание.
    - Правила определения оценок и доверительных границ для параметров устойчивого распределения.
    - Правила определения оценок и доверительных границ для параметров логистического распределения.
    - Правила определения оценок и доверительных границ для параметров экспоненциального распределения и смеси экспоненциальных распределений
    - … (И так далее для различных семейств распределений.)
  - Непараметрическое оценивание.
    - Непараметрическое точечное и доверительное оценивание основных характеристик распределения — математического ожидания, дисперсии, среднеквадратичного отклонения, коэффициента вариации, квантилей, прежде всего медианы.
    - Непараметрические оценки плотности и функции распределения.
    - Непараметрическое оценивание параметра сдвига.
    - …
- Проверка гипотез.
  - Параметрические задачи проверки гипотез.
    - Проверка равенства математических ожиданий для двух нормальных совокупностей.
    - Проверка равенства дисперсий для двух нормальных совокупностей.
    - Проверка равенства коэффициентов вариации для двух нормальных совокупностей.
    - Проверка равенства математических ожиданий и дисперсий для двух нормальных совокупностей.
    - Проверка равенства математического ожидания нормального распределения определённому значению.
    - Проверка равенства дисперсии нормального распределения определённому значению
    - …
    - Проверка равенства параметров двух экспоненциальных совокупностей
    - … (И так далее — проверка утверждений о параметрах для различных семейств распределений.)
  - Непараметрические задачи проверки гипотез.
    - Непараметрическая проверка равенства математических ожиданий для двух совокупностей.
    - Непараметрическая проверка равенства дисперсий для двух совокупностей.
    - Непараметрическая проверка равенства коэффициентов вариации для двух совокупностей.
    - Непараметрическая проверка равенства математических ожиданий и дисперсий для двух совокупностей.
    - Непараметрическая проверка равенства математического ожидания определённому значению.
    - Непараметрическая проверка равенства дисперсии определённому значению.
    - …
    - Проверка гипотезы согласия с равномерным распределением по критерию Колмогорова.
    - Проверка гипотезы согласия с равномерным распределением по критерию омега-квадрат (Крамера — Мизеса — Смирнова).
    - Проверка гипотезы согласия с равномерным распределением по критерию Смирнова.
    - Проверка гипотезы согласия с нормальным семейством распределений по критерию типа Колмогорова при известной дисперсии.
    - Проверка гипотезы согласия с нормальным семейством распределений по критерию типа Колмогорова при известном математическом ожидании.
    - Проверка гипотезы согласия с нормальным семейством распределений по критерию типа Колмогорова (оба параметра неизвестны).
    - Проверка гипотезы согласия с нормальным семейством распределений по критерию типа омега-квадрат при известной дисперсии.
    - Проверка гипотезы согласия с нормальным семейством распределений по критерию типа омега-квадрат при известном математическом ожидании.
    - Проверка гипотезы согласия с нормальным семейством распределений по критерию типа омега-квадрат (оба параметра неизвестны).
    - Проверка гипотезы согласия с экспоненциальным семейством распределений по критерию типа омега-квадрат
    - … (И так далее для различных семейств распределений, тех или иных предположениях о параметрах, всевозможных критериев.)
    - Проверка гипотезы однородности двух выборок методом Смирнова.
    - Проверка гипотезы однородности двух выборок методом омега-квадрат.
    - Проверка гипотезы однородности двух выборок с помощью критерия Уилкоксона.
    - Проверка гипотезы однородности двух выборок по критерию Ван дер Вардена.
    - Проверка гипотезы симметрии функции распределения относительно 0 методом Смирнова.
    - Проверка гипотезы симметрии функции распределения относительно 0 с помощью критерия типа омега-квадрат (Орлова).
    - Проверка гипотезы независимости элементов выборки.
    - Проверка гипотезы одинаковой распределённости элементов выборки
    - … (И так далее.)
Многомерный статистический анализ.
- Описание материала.
  - Расчёт выборочных характеристик (вектора средних, ковариационной и корреляционной матриц и других).
  - Таблицы сопряжённости.
  - Детерминированные методы приближения функциональной зависимости.
    - Метод наименьших квадратов.
    - Метод наименьших модулей.
    - Сплайны и другие.
  - Методы снижения размерности.
    - Алгоритмы факторного анализа.
    - Алгоритмы метода главных компонент.
    - Алгоритмы многомерного метрического шкалирования.
    - Алгоритмы многомерного неметрического шкалирования.
    - Методы оптимального проецирования и другие.
  - Методы классификации.
    - Методы кластерного анализа — иерархические процедуры.
    - Методы кластерного анализа — оптимизационный подход.
    - Методы кластерного анализа — итерационные процедуры.
    - …
    - Методы группировки.
    - …
- Оценивание.
  - Параметрическое оценивание.
    - Оценивание параметров многомерного нормального распределения.
    - Оценивание параметров в нормальной модели линейной регрессии.
    - Методы расщепления смесей.
    - Оценивание компонент дисперсии в дисперсионном анализе (в нормальной модели).
    - Оценивание размерности и структуры модели в регрессионном анализе (в нормальной модели).
    - Оценивание в дискриминантном анализе (в нормальной модели).
    - Оценивание в методах снижения размерности (в нормальной модели).
    - Нелинейная регрессия.
    - Методы планирования эксперимента.
  - Непараметрическое оценивание.
    - Непараметрические оценки многомерной плотности.
    - Непараметрическая регрессия (с погрешностями наблюдений произвольного вида).
    - Непараметрическая регрессия (на основе непараметрических оценок многомерной плотности).
    - Монотонная регрессия.
    - Непараметрический дискриминантный анализ.
    - Непараметрический дисперсионный анализ.
    - …
- Проверка гипотез.
  - Параметрические задачи проверки гипотез.
    - Корреляционный анализ (нормальная модель).
    - Проверка гипотез об отличии коэффициентов при предикторах от 0 в линейной регрессии при справедливости нормальной модели.
    - Проверка гипотезы о равенстве математических ожиданий нормальных совокупностей (дисперсионный анализ).
    - Проверка гипотезы о совпадении двух линий регрессии (нормальная модель).
    - … (И так далее.)
  - Непараметрические задачи проверки гипотез.
    - Непараметрический корреляционный анализ.
    - Проверка гипотез об отличии коэффициентов при предикторах от 0 в линейной регрессии (непараметрическая постановка).
    - Проверка гипотез в непараметрическом дисперсионном анализе.
    - Проверка гипотезы о совпадении двух линий регрессии (непараметрическая постановка).
    - …

Здесь остановимся, ибо продолжение содержало бы много сложных тем, не освещённых в этой книге. Приведённый перечень даёт первоначальное представление об обширности разработанных математической статистикой средств познания.

Авторство

Изначальный вариант текста учебника был электронной копией книги «Математика случая. Вероятность и статистика – основные факты. Учебное пособие», помещённой на сайте Викиучебник лично её автором — Александром Ивановичем Орловым. Сама электронная книга также доступна с его личного сайта (http://orlovs.pp.ru/stat/matslu.zip, RTF-документ в zip-архиве).

Рецензентами книги были доктор физико-математических наук, профессор Я. Ю. Никитин и кафедра «Анализ стохастических процессов в экономике» Российской экономической академии им. Г. В. Плеханова

Книга причастна серии «Статистические методы», в редакционном совете которой:

Богданов Ю. И.
Вощинин А. П.
Горбачёв О. Г.
Горский В. Г.
Кудлаев Э. М.
Натан А. А.
Новиков Д. А.
Орлов А. И. (председатель).
Татарова Г. Г.
Толстова Ю. Н.
Фалько С. Г.
Шведовский В. А.

[ver_mat_stat-1] а ^б ^в Вероятность и математическая статистика: Энциклопедия / Гл. ред. акад. РАН Ю. В. Прохоров. — М.: Большая Российская энциклопедия, 1999. — 910 с.

[orlov_ekon-2] а ^б ^в ^г ^д ^е ^ё ^ж ^з ^и ^й ^к ^л ^м Орлов А. И. Эконометрика. Учебник. 2-е изд. — М.: Экзамен, 2003. — 576 с.

[rekom-3] Рекомендации. Прикладная статистика. Методы обработки данных. Основные требования и характеристики / Орлов А. И., Фомин В. Н. и др. — М.: ВНИИ Стандартизации, 1987. — 62 с.

[kolm_osn-4] Колмогоров А. Н. Основные понятия теории вероятностей. — М.-Л.: ОНТИ, 1936. — 80 с.

[kolm_teor_inf-5] Колмогоров А. Н. Теория информации и теория алгоритмов. — М.: Наука, 1987. — 304 с.

[gned_kurs-6] а ^б ^в ^г Гнеденко Б. В. Курс теории вероятностей: Учебник. 7-е изд., исправл. — М.: Эдиториал УРСC, 2001. — 320 с.

[an_nechisl-7] Анализ нечисловой информации в социологических исследованиях (в соавторстве). — М.: Наука, 1985. — 220 с.

[tab_mat_stat-8] а ^б ^в ^г ^д ^е ^ё ^ж ^з ^и Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. — М.: Наука, 1965 (1-е изд.), 1968 (2-е изд.), 1983 (3-е изд.).

[kurs_tex_pril-9] а ^б ^в ^г ^д Смирнов Н. В., Дунин-Барковский И. В. Курс теории вероятностей и математической статистики для технических приложений. – М.: Наука, 1969. — 512 с.

[mat_met_stat-10] а ^б ^в ^г ^д ^е ^ё Крамер Г. Математические методы статистики. – М.: Мир, 1975. — 648 с.

[mat_vyv_sv-11] Кендалл М. Дж., Стъюарт А. Статистические выводы и связи. — М.: Наука, 1973. – 900 с.

[kolm_o_logarifm-12] Колмогоров А. Н. О логарифмически нормальном законе распределения размеров частиц при дроблении / Доклады АН СССР. 1941. Т. 31. С. 99—101.

[prox_roz-13] Прохоров Ю. В., Розанов Ю. А. Теория вероятностей. (Основные понятия. Предельные теоремы. Случайные процессы.) – М.: Наука, 1973. — 496 с.

[orlov_ust-14] Орлов А. И. Устойчивость в социально-экономических моделях. – М.: Наука, 1979. — 296 с.

[ur_znach-15] Камень Ю. Э., Камень Я. Э., Орлов А. И. Реальные и номинальные уровни значимости в задачах проверки статистических гипотез. — Журнал «Заводская лаборатория», 1986. Т. 52. № 12. С. 55—57.

[orlov_necel-16] Орлов А. И. О нецелесообразности использования итеративных процедур нахождения оценок максимального правдоподобия. – Журнал «Заводская лаборатория», 1986, Т. 52. № 5. С. 67—69.

[rasp_osh-17] Орлов А. И. Распространенная ошибка при использовании критериев Колмогорова и омега-квадрат. – Журнал «Заводская лаборатория», 1985, т. 51, № 1, c. 60—62.

[lin_reg_an-18] Себер Дж. Линейный регрессионный анализ. — М.: Мир, 1980. — 456 с.

[teo_plan_exp-19] Математическая теория планирования эксперимента / Под ред. С. М. Ермакова. — М.: Наука, 1983. – 392 с.

[neparam-20] а ^б Холлендер М., Вульф Д. Непараметрические методы статистики. – М.: Финансы и статистика, 1983. — 518 с.

[mnogom-21] а ^б Кендалл М. Дж., Стьюарт А. Многомерный статистический анализ и временны́е ряды. — М.: Наука, 1976. – 736 с.

[22] Орлов А. И. Некоторые неклассические постановки в регрессионном анализе и теории классификации. — В сб.: Программно-алгоритмическое обеспечение анализа данных в медико-биологических исследованиях. — М.: Наука, 1987. С. 27—40.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]