МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ Белорусский национальный технический университет Кафедра «Горные машины» ОСНОВЫ НАУЧНЫХ ИССЛЕДОВАНИЙ И ИННОВАЦИОННОЙ ДЕЯТЕЛЬНОСТИ Методические указания к практической работе «Предварительная обработка экспериментальных данных» Минск БНТУ 2013 1 МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ Белорусский национальный технический университет Кафедра «Горные машины» ОСНОВЫ НАУЧНЫХ ИССЛЕДОВАНИЙ И ИННОВАЦИОННОЙ ДЕЯТЕЛЬНОСТИ Методические указания к практической работе «Предварительная обработка экспериментальных данных» для студентов специальностей 1-36 10 01 «Горные машины и оборудование (по направлениям)», 1-36 13 01 «Технология и оборудование торфяного производства» Минск БНТУ 2013 2 УДК 001.891+001.895(076.5)(075.8) ББК 72я7 О-75 Составители: Е. К. Костюкевич, Н. И. Березовский Рецензенты: Ф. Г. Халявкин, В. К. Мелешко Методические указания содержат методику предварительной обработки экспериментальных данных и алгоритм решения задач статистического анализа экспериментальных данных средствами MS Excel. © Белорусский национальный технический университет, 2013 3 ВВЕДЕНИЕ Изучение материала студент должен производить последова- тельно, раздел за разделом. В случае затруднений или при углуб- ленном изучении материала следует обратиться к источникам ин- формации, рекомендуемым преподавателем. Отчет о работе рекомендуется выполнять в соответствии с ГОСТ 7.32–2001 «Отчет о научно-исследовательской работе». Об- щие требования к правилам оформления: четкость построения, ло- гическая последовательность изложения материала, убедительность аргументов, краткость и точность формулировок, конкретность из- ложения результатов расчета, доказательность выводов и обосно- ванность рекомендаций. Построение отчета рекомендуется делать в соответствии с ниже- изложенной структурой: 1. Титульный лист. 2. Введение, в котором кратко дается состояние проблемы, выявляется необходимость и цель проведения работы. 3. Краткий анализ возможных подходов к решению постав- ленной задачи, выбор путей и средств достижения целей. 4. Методика исследования, описание эксперимента с указани- ем его цели, изложение сущности эксперимента и последовательно- сти его проведения. 5. Оценка достоверности полученных результатов. (Произво- дится в соответствии с методическими указаниями.) 6. Краткое заключение об основных результатах, о соответ- ствии результатов и поставленной цели работы; возможность при- менения полученных результатов либо обоснование нецелесообраз- ности продолжения исследований. 7. Список использованных источников. (Список использован- ных источников формируется в порядке появления ссылок на ис- точники в тексте отчета. Нумерация источников производится араб- скими цифрами (ссылки на источники указываются в тексте в квад- ратных скобках). Библиографические описания источников приводятся в соответствии с ГОСТ 7.1 и ГОСТ 7.82.) 4 П р а к т и ч е с к а я р а б о т а ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ Цель работы: изучение методики предварительной обработки экспериментальных данных, проверки соответствия распределения результатов измерения закону нормального распределения; изуче- ние возможностей пакета MS Excel при решении задач статистиче- ской обработки экспериментальных данных. Общие положения Объект исследования – это объект любого характера, который изучается экспериментальным путем. Эксперимент – это специальным образом спланированная и ор- ганизованная процедура изучения некоторого объекта исследова- ния, при которой на этот объект оказывают запланированные воз- действия и регистрируют его реакции на эти воздействия. Экспериментальные данные – все исходные и выходные число- вые данные эксперимента, сведенные в таблицу экспериментальных данных. Обработка экспериментальных данных – различные методы построения математической модели объекта по таблице экспери- ментальных данных. Основным «рабочим инструментом» эксперимента и обработки экспериментальных данных является численное значение факторов воздействия и откликов объекта исследования, т. е. число. Числа при экспериментировании получают тремя способами:  подсчетом;  измерением;  методом экспертных оценок. Предварительная обработка результатов измерений и наблюде- ний необходима для того, чтобы в дальнейшем, при построении эм- пирических зависимостей, эффективно использовать статистиче- ские методы и корректно анализировать полученные результаты. 5 Содержание предварительной обработки в основном состоит в отсеивании грубых погрешностей измерения или погрешностей, неизбежно имеющих место при переписывании цифрового матери- ала или при вводе на электронный носитель информации. Другим важным моментом предварительной обработки данных является проверка соответствия распределения результатов изме- рения закону нормального распределения. Если эта гипотеза неприемлема, то следует определить, какому закону распределения подчиняются опытные данные, и, если это возможно, преобразовать данное распределение к нормальному. Только после выполнения перечисленных выше операций можно перейти к построению эмпирических формул, применяя, например, метод наименьших квадратов. 1. Генеральная совокупность и выборка. Генеральной называют совокупность всех мыслимых наблюдений, которые могли бы быть сделаны при данном комплексе условий. Генеральная совокупность может быть конечной и бесконечной. Данное выше определение генеральной совокупности можно счи- тать строго обоснованным только для случаев конечных генераль- ных совокупностей. Понятие бесконечной генеральной совокупности – математиче- ская абстракция, как и представление о том, что измерить случай- ную величину можно бесконечное число раз. Приближенно беско- нечную генеральную совокупность можно истолковать как пре- дельный случай конечной генеральной совокупности. В распо- ряжении исследователя, никогда нет генеральной совокупности, он может изучать только ее часть – выборку, причем всегда ограни- ченного объема. Результаты ограниченного ряда наблюдений х1, х2, ..., хn случайной величины можно рассматривать как выборку из данной генеральной совокупности. Выборка – любое конечное подмножество генеральной совокуп- ности, предназначенное для непосредственных исследований, Объем – количество единиц в выборке. Относительной частотой случайного события, называется от- ношение числа появлений этого события к общему числу произве- денных испытаний. Мера объективной возможности случайного события называется вероятностью случайных событий. Относи- 6 тельные частоты можно истолковать как выборочные значения ве- роятностей случайных событий. Характеристики теоретических распределений можно рассмат- ривать как характеристики, существующие в генеральной совокуп- ности, а характеристики эмпирических распределений – как выбо- рочные характеристики. Можно встретить и другую терминологию. Характеристики рас- пределения вероятностей в генеральной совокупности называют параметрами, а выборочные (эмпирические) значения характери- стик – оценками или статистиками. Параметры обозначаются буквами греческого алфавита, а оцен- ки – соответствующими буквами латинского алфавита. Исходными данными при оценивании, как и при проверке лю- бых предположений (статистических гипотез), касающихся неиз- вестного распределения случайной величины могут быть лишь только те результаты наблюдений, которые были получены в ходе проведения опытов (на выборке ограниченного объема). Причем предварительная обработка экспериментальных данных обычно начинается с подсчета тех или иных функций от результатов наблюдений (статистик). Оценивание – определение приближенного значения неизвестного параметра генеральной совокупности по результатам наблюдений. К оценкам предъявляются требования состоятельности, несме- щенности, эффективности. Состоятельная оценка – оценка, сходящаяся по вероятности к значению оцениваемого параметра при безграничном возрастании объема выборки. Несмещенная оценка – оценка, математическое ожидание кото- рой равно значению оцениваемого параметра. Оценка параметра называется эффективной, если среди прочих оценок того же параметра она обладает наименьшей дисперсией. 2. Вычисление характеристик эмпирических распределений (выборочных характеристик). Здесь и в дальнейшем речь идет только о непрерывно распреде- ленных случайных величинах. 7 Пусть имеется ограниченный ряд наблюдений x1, х2, ..., хn слу- чайной величины. Среднее значение наблюдаемого признака опре- деляется по формуле    n i ix n x 1 1 , (1) где n – количество хi значений выборки или объем выборки; хi - результат измерения i-й единицы. Таким образом, x представляет собой эмпирическое или выбо- рочное среднее. Если вычислено среднее, то легко найти отклоне- ние каждого наблюдения oт среднего: xxd ii  . (2) Величину    n i i xx n S 1 22 )( 1 (3) называют дисперсией или вторым центральным моментом эмпири- ческого распределения S2 = m2. В случае одномерного эмпирического распределения произволь- ным моментом порядка k называется сумма k-х степеней отклоне- ний результатов наблюдений от произвольного числа с, деленная на объем выборки п:    n i k ik xx n m 1 )( 1 , (4) где k может принимать любые значения натурального ряда чисел. Первый центральный момент    n i i xx n m 1 1 )( 1 . (5) 8 Второй центральный момент    n i i xx n m 1 2 2 )( 1 . (6) Несмещенную оценку для 2S (или σ2 - дисперсия теоретическо- го распределения) можно найти по формуле      n i i xx n S 1 22 )( 1 1 . (7) Выборочные среднеквадратические отклонения соответственно могут быть найдены по формулам: 22 ; SSSS  . (8) Из других моментов чаще всего используют моменты третьего и четвертого порядка:    n i i xx n m 1 3 3 )( 1 , (9)    n i i xx n m 1 4 4 )( 1 . (10) Выборочное значение коэффициента вариации V, являющееся мерой относительной изменчивости наблюдаемой случайной вели- чины в %, определяют по формуле %100 x S V . (11) Для нормальных и близких к нормальному распределений пока- затель V служит индикатором однородности выборочных наблюде- 9 ний: принято считать, что при выполнимости неравенства V ≤ 33 % выборка является количественно однородной по данному признаку. Выборочные значения характеристик распределения имеет смысл вычислять только в случае, если выборка является случай- ной. Обычно на практике наблюдаемые значения x1, х2, ..., хn вели- чины случайные и отклонения их от среднего значения обусловле- ны погрешностями измерения и т. д. В свою очередь, погрешно- сти – результат действия многих факторов. Если имеет место такой редкий случай, когда в распоряжении исследователя имеется вся генеральная совокупность и необходимо сделать из нее выборку, то используют один из методов рандомиза- ции (случайного выбора). 3. Отсев грубых погрешностей. Можно встретить большое количество различных рекомендаций для проведения отсева грубых погрешностей наблюдения (ано- мальных значений). Рассмотрим наиболее простой метод отсева грубых погрешностей. Если в распоряжении экспериментатора име- ется выборка небольшого объема, то можно воспользоваться мето- дом вычисления максимального относительного отклонения:    1 min(max) S xx , (12) где xmin(max) - крайний (наибольший или наименьший) элемент вы- борки, по которой подчитывается x , S и τ, вычисленной при дове- рительной вероятности р = 1 – α. Таким образом, для выделения аномального значения вычисляют т, которое затем сравнивают с табличным значением τ1-α. Если это неравенство τ < τ1-α соблюдается, то наблюдение не от- сеивают, если не соблюдаются, то наблюдение исключают. После исключения того или иного наблюдения или нескольких наблюде- ний характеристики эмпирического распределения должны быть пересчитаны по данным сокращенной выборки. Квантили распре- деления статистики τ при уровнях значимости α = 0,10, α = 0,05, α = 0,025, α = 0,01 или доверительной вероятности р =1 - α = 0,90; 10 0,95; 0,975; 0,99 даны в приложении А (табл. А1). На практике обычно используют уровень значимости α = 0,05 (результат получа- ется с 95%-й доверительной вероятностью). Процедуру отсева нужно повторить и для следующего по абсо- лютной величине максимального относительного отклонения, но предварительно необходимо пересчитать x и S для выборки нового объема (n–1). 4. Полигон и гистограмма частот распределения. Если полученные экспериментальные данные разделить на клас- сы, то можно построить полигон и гистограмму частот. Разбиение на классы можно выполнить по правилу Штюргеса с округлением полученного значения до ближайшего целого числа. Число классов определяется по формуле k ≈ 1 + 3,32  lg(n). (13) Далее определяют размах варьирования: R = xmax - xmin. (14) Определяют ширину интервала k R h  . (15) Затем устанавливают границы интервалов и подсчитывают число попаданий случайной величины в каждый из выбранных интерва- лов (абсолютные частоты Вj), для этого значения эксперименталь- ных данных просматривают по порядку от первой до последней строчки, и при чтении каждого результата соответствующую метку (точку или черточку) заносят в тот класс, к которому относится данное наблюдение. Каждая метка соответствует одному значению из выборки. Затем определяют относительные частоты попаданий в j-й ин- тервал (класс) как (Вj / n) и относительные накопленные частоты как Σ(Вj / n). 11 Для проверки, сумма Вj равна количеству экспериментальных данных (опытов) n. Гистограмма и полигон распределений являются графическим отображением частот, которые, в свою очередь, представляют собой оценки плотностей вероятностей. Кумулятивная линия – график накопленных частот, в свою очередь оценивающих функцию распределения F(x) в точке х. Мно- гие наблюдения в природе при такой обработке дают колоколооб- разные полигоны распределения. Если распределение случайной величины подчиняется опреде- ленному закону и может быть хотя бы приближенно описано кри- вой 2bxaey  , то такое распределение называют нормальным. Так как к коэффициентам a и b предъявляется только одно требование, а именно: а, b > 0, то можно говорить о семействе кривых нормально- го распределения. С увеличением коэффициента а кривая «вытяги- вается» в высоту; при увеличении коэффициента b кривая «сплю- щивается». Нормальное распределение обладает и другими важными свой- ствами, которые позволяют считать это распределение основой ма- тематической статистики. Рассмотрим эти свойства. 1. Ордината y, которая определяет высоту кривой для каждой точки оси Ох (абсциссы), представляет собой плотность вероятно- сти некоторого значения переменной х и определяется следующей формулой: )( 2 1 2 1 )(      x exfy , (16) –∞ < x < +∞, σ > 0, где σ – среднеквадратическое отклонение теоретического распреде- ления; μ – среднее значение (математическое ожидание) теоретическо- го распределения. 12 Из формулы (16) следует, что нормальное распределение пол- ностью определяется величинами μ и σ (π = 3,141593... и е = = 2,718282... – математические постоянные). Математическое ожидание μ определяет положение кривой рас- пределения относительно оси Ох. Среднеквадратическое отклонение σ определяет форму кривой. Чем больше а (разброс данных), тем кривая становится более поло- гой (ее основание более широкое). 2. Кривая нормального распределения симметрична относи- тельно среднего значения. 3. Максимум ординаты кривой   2 1 maxy , (17) что при σ = 1 составляет примерно 0,4. Если х → ± ∞, то у →0 (асимптотически). Другими словами, очень большие и очень малые значения переменной х маловероятны. 4. Примерно 2/3 всех наблюдений лежит в площади, отсекае- мой перпендикулярами к оси Ох (μ ± σ). При большом объеме вы- борки примерно 90 % всех наблюдений лежит между -1,64σ и +1,64σ. Границы -0,675σ и +0,675σ называют вероятными откло- нениями: в этом интервале находится около 50 % всех наблюдений. Для нормального распределения среднее, мода и медиана совпадают. Медианой выборки является среднее значение из всего упорядо- ченного набора значений. Модой выборки называется значение, которое встречается боль- шее число раз в выборке. Для статистических методов построения эмпирических за- висимостей очень важно, чтобы результаты наблюдений под- чинялись нормальному закону распределения, поэтому проверка нормальности распределения – основное содержание предвари- тельной обработки результатов наблюдений. 13 5. Проверка гипотезы нормальности распределения. 1. Среднее абсолютное отклонение. Для небольших выборок (n < 120) можно найти простые реко- мендации по проверке нормальности распределения. Для этого необходимо вычислить среднее абсолютное отклонение (САО) по формуле    n i i xx n 1 1 ÑÀÎ . (18) Для выборки, имеющей приближенно нормальный закон распре- деления, должно быть справедливо выражение nS 4,0 7979,0 ÑÀÎ  . (19) Пользуясь САО, можно также с 95%-й доверительной вероят- ностью оценить µ (среднее значение теоретического распределе- ния) по x : µ = x ± (0,71 ÷ 0,6)  САО. (20) Коэффициент (0,71 ÷ 0,6) зависит от величины выборки n (в дан- ном случае n = 15÷20) и 1 - α = 0,95. Коэффициенты для определе- ния 95%-х доверительных границ для среднего значения по САО приведены в приложении А (табл. А2). 2. Размах варьирования R. Быструю проверку гипотезы нормальности распределения для сравнительно широкого класса выборок 3 < n < 1000 можно выпол- нить, используя размах варьирования R. Подсчитываем отношение R S и сопоставляем с критическими верхними и нижними границами этого отношения, приведенными в табл. А3 приложения А). 14 âí k S R k  . (21) Если S R меньше нижней или больше верхней границы, то нор- мального распределения нет. Особенно важно, чтобы это условие соблюдалось при α = 0,10 (10%-й уровень значимости). 3. Показатели асимметрии и эксцесса. Некоторое представление о близости эмпирического распреде- ления к нормальному может дать анализ показателей асимметрии и эксцесса. Показатель асимметрии можно определяют по формуле 2/3 2 3 1 m m g  . (22) Для симметричных распределений m3 = 0 и g1 = 0. Для нормаль- ного распределения m4 / m22 = 3. Для удобства сравнения эмпирического распределения и нор- мального в качестве показателя эксцесса принимают величину 3 2 2 4 2  m m g . (23) Несмещенные оценки для показателей асимметрии G1 и эксцесса G2 определяют соответственно по формулам: 11 2 )1( g n nn G    ; (24)  6)1( )3)(2( 1 22     gn nn n G . (25) Для проверки гипотезы нормальности распределения следует также вычислить среднеквадратические отклонения для показате- лей асимметрии и эксцесса соответственно: 15 )3)(1)(2( )1(6 1    nnn nn SG ; (26) )5)(3)(2)(3( )1(24 2 2    nnnn nn SG . (27) Если выполняются условия ,5,3 21 21 GG SGSG  то гипотеза нормальности исследуемого распределения может быть принята. 4. По критерию 2 (хи-квадрат) Рассмотрим методику проверки гипотезы нормальности распре- деления по 2 критерию. Применение критерия 2 предполагает также использование свойств так называемого стандартного нор- мального распределения, которое имеет вид: 22 22 4,0 2 1 )( zz eezfy     . (28) Расчеты выполняют в табличной форме. Значения 2 определяют по формуле     êë 1 2 2 )(n j j jj E EB , (29) где Bj – наблюдаемая частота; Ej – ожидаемая по стандартному нормальному распределению частота. Ej = f(zj)  k′, (30) îæèä êë S nn k   , (31) 16 где f(zj) – уравнение кривой стандартного нормального распределения: 2 2 2 1 )( jz j ezf   ; (32) zj – степень функции кривой нормального распределения: ожид ожид S xx z j j   ; (33) îæèäx – ожидаемое среднее значение наблюдаемого признака:    кл 1 ожид 1 n j jj xB n x ; (34) îæèäS – ожидаемая дисперсия: 1 )( 2 1 1 2 ожид кл кл        n n xB xB S n j jjn j jj ; (35) nкл - число классов (интервалов). Полученное значение 2 сравнивают с табличным или критиче- ским значением 2êð 2 ),( êë  n (приложение А, табл. А4, где значе- ния уровней значимости приведены в %). Число степеней свободы v определяют по формуле v = nкл – 1 – r, (36) 17 где r – число параметров распределения (для нормального распре- деления r = 2, так как оцениваются два параметра Sx, ). Гипотеза нормальности распределения принимается в случае выполнения условия 2 ≤ 2 кр . Методика проверки нормальности распределения по показателям асимметрии и эксцесса очень хорошо иллюстрирует использование моментов, а также удобна при использовании компьютерных тех- нологий. Для практического применения (особенно при расчетах с использованием компьютерных технологий) рекомендуются в основном две методики: по размаху варьирования и по χ2-критерию, причем первая служит для быстрой «прикидочной» проверки, а вторая – для основательной проверки нормальности распределения. В настоящее время обработку экспериментальных данных суще- ственно облегчают современные компьютерные технологии, совре- менное программное обеспечение. Например, электронные таблицы MS Excel. Особенности использования средств инструмента «Описательная статистика» в надстройке «Пакет анализа» MS Excel В состав MS Excel входит надстройка «Пакет анализа», которая содержит 19 статистических процедур и около 50 функций. Для анализа данных с помощью средств этого пакета следует указать входные данные и выбрать параметры; в итоге расчет будет выполнен с помощью подходящей статистической или инженерной макрофункции, а результат будет помещен в выходной диапазон. Для доступа к этим инструментам необходимо в меню «Данные» нажать кнопку «Анализ данных». Если кнопка «Анализ данных» недоступна, необходимо загрузить надстройку «Пакет анализа». Инструмент «Описательная статистика» (вместе с инструмен- том «Гистограмма», алгоритм использования которого будет описан далее) является наиболее часто используемым из всего «Пакета анализа», поскольку быстро и просто вычисляет основные стати- стические характеристики одномерных выборок. 18 В «Пакете анализа» инструмент «Описательная статистика» ис- пользуется для генерации одномерного статистического отчета, ко- торый включает ряд показателей положения, вариации и формы распределения признаков выборочной и генеральной совокупно- стей, а также среднюю и предельную ошибки выборки для средней. После выбора инструмента «Описательная статистика» в по- явившемся диалоговом окне инструмента (рис. 1) задаются следу- ющие параметры: 1. Поле Входной интервал – вводится ссылка на диапазон яче- ек, содержащих значения анализируемого признака или признаков. В качестве входного интервала может быть указан диапазон, кото- рый содержит ряды значений сразу нескольких анализируемых при- знаков. В таком случае показатели «Описательной статистики» бу- дут рассчитаны для каждого ряда и представлены в единой таблице в виде отдельных столбцов. 2. Переключатель Группирование: по столбцам/строкам – устанавливается в положение по столбцам или по строкам в зави- симости от того, в каком направлении располагаются анализируе- мые данные во входном диапазоне – вертикальном (по столбцам) или горизонтальном (по строкам). Рис. 1. Диалоговое окно инструмента «Описательная статистика» 19 3. Флажок Метки в первой строке – устанавливается в актив- ное состояние, если первая строка во входном диапазоне содержит заголовки. Если заголовки отсутствуют, поле не активизируется. В этом случае будут автоматически созданы стандартные названия для данных выходного диапазона. 4. Поле Выходной интервал – вводится ссылка на ячейку заго- ловка первого столбца выходной результативной таблицы. Размер выходного диапазона ячеек определяется автоматически. В случае возможного наложения выходного диапазона на другие данные на экране появится соответствующее сообщение. 5. Переключатели Новый рабочий лист и Новая рабочая кни- га – устанавливаются в активное положение при необходимости открытия соответственно нового листа или новой книги. В новом листе результаты анализа располагаются начиная с ячейки А1, в новой книге – на первом листе начиная с ячейки А1. 6. Флажок Итоговая статистика – устанавливается в актив- ное состояние, если для данных входного диапазона необходимо произвести расчет основных показателей. 7. Флажок Уровень надежности – устанавливается в активное состояние, если в результативную таблицу необходимо включить строку для оценки предельной ошибки выборки с заданной довери- тельной вероятностью. Значение уровня надежности выражается в процентах и задается в поле напротив флажка Уровень надежности. Уровень надежности 95,0 % (что равносильно доверительной веро- ятности р = 0,95 или же уровню значимости α = 0,05) фиксируется в поле автоматически. 8. Флажки K-й наименьший и K-й наибольший – активизиру- ются, если в результативную таблицу необходимо включить строку соответственно для k-го наименьшего (начиная с минимума xmin) и k-го наибольшего (начиная с максимума xmax) значений элементов в выборке. В этом случае в поле, расположенном напротив каждого флажка, вводится число k. При k = 1 выходные строки будут содер- жать соответственно xmin и xmax. Между терминологией инструмента «Описательная статистика» и терминами, принятыми в отечественной статистике, имеется ряд расхождений. Согласование терминологии приводится в табл. 1. Вычисленные значения всех вышеперечисленных показателей представляются в единой результативной таблице на рабочем листе 20 Excel. При этом показатели могут рассчитываться сразу для не- скольких рядов данных в соответствии с заданным входным диапа- зоном ячеек. Следует обратить внимание на то, что расчет параметров в режи- ме «Описательная статистика» имеет ряд важных особенностей: 1. В качестве значений параметров: Стандартное отклонение, Дисперсия выборки, Эксцесс, Асимметричность – MS Excel генери- рует оценки соответствующих параметров для генеральной сово- купности, а не для выборки. 2. Для применения «Описательной статистики» предваритель- ное ранжирование исходных данных не требуется: при вычислении показателей ранжирование выполняется автоматически. Таблица1 Статистическая интерпретация параметров описательной статистики Параметр инструмента «Описательная статистика» Статистический показатель Обозначение Среднее Средняя арифметическая вели- чина признака в выборке, вы- численная по несгруппирован- ным данным x Стандартная ошибка Средняя ошибка выборки – среднее квадратическое откло- нение выборочной средней x от математического ожидания ге- неральной средней x х Медиана Значение признака, приходящее- ся на середину ранжированного ряда выборочных данных Me 21 Окончание табл. 1 Параметр инструмента «Описательная статистика» Статистический показатель Обозначение Мода Значение признака, повторяю- щееся в выборке с наибольшей частотой Mo Стандартное отклонение Генеральное среднее квадрати- ческое отклонение, оцененное по выборке S Дисперсия выборки Генеральная дисперсия, оценен- ная по выборке 2 S Эксцесс Коэффициент эксцесса, оцени- вающий по выборке значение эксцесса в генеральной совокуп- ности G2 Асимметричность Коэффициент асимметрии, оце- нивающий по выборке величину асимметрии в генеральной сово- купности G1 Интервал Размах вариации в выборке R Минимум Минимальное значение признака в выборке xmin Максимум Максимальное значение призна- ка в выборке xmax Сумма Суммарное значение элементов выборки xi. Счет Объем выборки n Уровень надежности (95,0 %) Предельная ошибка выборки, оцененная с заданным уровнем надежности Δx 22 3. Появление в ячейке Мода индикатора ошибки #Н/Д указы- вает на то, что в анализируемых данных нет одинаковых значений признака. В этом случае в качестве моды Мо выбирается то значе- ние признака, которое соответствует максимальной ординате теоре- тической кривой распределения. 4. Индикатор ошибки # ДЕЛ/0! в ячейке Эксцесс и/или Асим- метричность означает, что в результативной таблице стандартное отклонение является нулевым или же заданный входной диапазон данных содержит менее четырех элементов данных. Особенности использования средств инструмента «Гистограмма» в надстройке «Пакет анализа» MS Excel В надстройке Excel «Пакет анализа» инструмент «Гистограмма» используется для генерации интервального вариационного ряда с равными по величине интервалами, а также для построения гисто- граммы и кумуляты сформированного ряда распределения. Инструмент «Гистограмма» производит следующие действия:  рассчитывает число интервалов по формуле (13);  определяет величину интервала h по формуле несколько от- личной от формулы (15): 1  k R h ;  определяет нижние границы интервалов;  формирует интервальный вариационный ряд в соответствии с величинами k, h;  рассчитывает частоты и накопленные частоты интервалов, определяя число попаданий данных в сформированные интервалы;  строит столбиковую диаграмму частот (которая может быть преобразована в гистограмму) и кумуляту накопленных частот для полученного ряда распределения;  генерирует для вариационного ряда выходную таблицу. Между терминологией, генерируемой в режиме «Гистограмма» выходной таблицы, и терминами, принятыми для вариационных рядов, имеются расхождения. Согласование терминологии приво- дится в табл. 2. 23 Таблица 2 Статистическая интерпретация терминологии инструмента «Гистограмма» Термин инструмента «Гистограмма» Термин, принятый в статистике Карманы Интервалы вариационного ряда Интервал карманов Диапазон ячеек, содержащих в возраста- ющем порядке верхние границы интер- валов Интегральный процент Накопленная частота, выраженная в про- центах Инструмент «Гистограмма» имеет два режима работы:  режим автоматического формирования интервалов вариаци- онного ряда, имеющих равную величину h;  режим формирования интервалов ряда в соответствии с гра- ницами, заданными пользователем. Если при этом заданные интер- валы будут не равны между собой, то в сгенерированной столбико- вой диаграмме частоты попадания в интервал не будут связаны с размером интервала, что не позволит правильно оценить характер распределения единиц изучаемой совокупности. Запуск инструмента «Гистограмма» осуществляется аналогично инструменту «Описательная статистика» надстройки «Пакет анализа». В появившемся диалоговом окне инструмента «Гистограмма» (рис. 2) задаются следующие параметры: 24 Рис. 2. Диалоговое окно инструмента «Гистограмма» 1. Поле Входной интервал – вводится ссылка на диапазон яче- ек, содержащих значения анализируемого признака. 2. Интервал карманов (необязательный параметр) – вводится ссылка на диапазон ячеек, в которых задаются верхние границы ин- тервалов. Если такой диапазон не указан, Excel осуществляет расчет нижних границ интервалов автоматически. 3. Флажок Метки не активизируется. 4. Поле Выходной интервал – вводится ссылка на ячейку заго- ловка первого столбца формируемой таблицы интервального вари- ационного ряда. 5. Переключатель Новый рабочий лист/Новая рабочая книга – открывает Новый рабочий лист/Новую рабочую книгу. 6. Флажок Парето (отсортированная гистограмма) – устанав- ливается в активное состояние при необходимости представить данные в порядке убывания частоты. Если флажок снят, то данные в выходном диапазоне будут приведены в порядке следования ин- тервалов. 7. Флажок Интегральный процент – устанавливается в актив- ное состояние, если необходимо рассчитать накопленные частоты (выраженные в процентах) и построить график кумуляты. 25 8. Флажок Вывод графика – устанавливается в активное состо- яние при необходимости автоматического построения столбиковой диаграммы. Необходимо отметить, что инструменты «Пакет анализа» имеют определенные ограничения и иногда удобнее воспользоваться ста- тистическими функциями или другими средствами MS Excel. Пре- имуществом функций перед данными средствами является то, что функции автоматически пересчитываются при любых изменениях, сделанных в выборке, тогда как эти средства необходимо выпол- нять заново, если выборка изменилась. В приложении Б представлен перечень в алфавитном порядке некоторых функций MS Excel, позволяющих реализовывать обра- ботку экспериментальных данных, непосредственно на листе элек- тронной таблицы. Демонстрационный пример выполнения Исходные данные демонстрационного примера: Данные наблюдения роста группы двадцатилетних юношей- студентов-третьекурсников (табл. 3). 1. Определяем среднее значение выборки x по (1): .45,1813629 20 1 x 2. Определяем дисперсию по (7): .313,52995,10056 19 12 S 3. Среднеквадратичное отклонение по (8): .007,23S 4. Определяем отсев грубых погрешностей. Для отсева погрешностей используем метод максимального от- носительного отклонения. 26 Условие отсева    1 min(max) S xx . Таблица 3 Исходные данные и данные для вычисления x , 2S , S № п/п хi, см хi – x 2)( xxi  1 183 1,6 2,403 2 170 –11,5 131,103 3 176 –5,4 29,702 4 178 –3,4 11,902 5 176 –5,4 29,702 6 180 –1,4 2,102 7 176 –5,4 29,702 8 185 3,6 12,603 9 184 2,6 6,503 10 174 –7,4 55,502 11 168 –13,5 180,903 12 174 –7,4 55,502 13 189 7,6 57,003 14 172 –9,4 89,302 15 175 –6,4 41,602 16 167 –14,5 208,803 17 179 –2,4 6,002 18 276 94,6 8939,703 19 169 –12,5 155,003 20 178 –3,4 11,902 ∑ 3629,00 0 10056,95 276max x 55,94max  xx 167min x 45,14min  xx 27 Выбираем наибольший xx minmax/ . 007,23 55,94  Сравниваем с квантилью распределения, зависящей от количе- ства наблюдений (приложение А, табл. А1), при n = 20 и α = 0,05 τ1–α = 2,62; 4,11 > 2,62. Следовательно условие отсева не соблюдается, производим от- сев значения 276. Поэтому необходимо повторить вычисления, начиная с п. 1, производя проверку присутствия грубых погрешностей, после каж- дого отсева значений. Результаты приведены в табл. 4. Таблица 4 Повторные данные для вычисления x , 2S , S № п/п хi, см хi – x 2)( xxi  3)( xxi  4)( xxi  1 183 6,5 42,593 277,974 1814,146 2 170 –6,5 41,909 –271,303 1756,330 3 176 –0,5 0,224 –0,106 0,050 4 178 1,5 2,330 3,556 5,427 5 176 –0,5 0,224 –0,106 0,050 6 180 3,5 12,435 43,849 154,627 7 176 –0,5 0,224 –0,106 0,050 8 185 8,5 72,698 619,847 5285,008 9 184 7,5 56,645 426,331 3208,705 10 174 –2,5 6,119 –15,137 37,444 11 168 –8,5 71,803 –608,439 5155,717 12 174 –2,5 6,119 –15,137 37,444 13 189 12,5 156,909 1965,487 24620,305 14 172 –4,5 20,014 –89,536 400,554 28 Окончание табл. 4 № п/п хi, см хi – x 2)( xxi  3)( xxi  4)( xxi  15 175 –1,5 2,172 –3,200 4,716 16 167 –9,5 89,751 –850,270 8055,187 17 179 2,5 6,382 16,124 40,733 18 169 –7,5 55,856 –417,450 3119,888 19 178 1,5 2,330 3,555766147 5,427222013 ∑ 3353,00 0 646,74 1085,93 53701,81 ∑mod 88,42 Примечание: ∑mod =   n i i xx 1 . 5. Определяем другие статистические характеристики:  коэффициент вариации по формуле (11) %;4,3%100 47,176 944,5 V  коэффициент асимметрии по формуле (22). Для начала определяем второй центральный момент и момент третьего по- рядка по формуле (4): 2 1 646,74 35,93 ; 18 m    3 1 1085,93 60,33 ; 18 m    1 3/2 6,33 0,28 0 . 35,93 g    Следовательно, некоторая асимметрия имеет место.  коэффициент эксцесса по формуле (23). Для начала опреде- ляем момент четвертого порядка по формуле (4) 29 4 1 53701,81 2983,43 ; 18 m    2 2 2983,43 3 0,689 0 . 35,93 g      Имеется также и небольшой эксцесс. Результаты вычисления выборочных характеристик, упомяну- тых, выше сведены в табл. 5. Таблица 5 Выборочные характеристики распределения x S V, % m2 m3 m4 g1 g2 176,47 5,994 3,4 35,93 60,33 2983,43 0,28 –0,689 6. Полигон и гистограмма частот распределения. Число классов k приблизительно можно вычислить по фор- муле (15) k ≈ 1 + 3,32 lg n = 1+3,32 lg 19 = 5,2 ≈ 5. Размах варьирования по формуле (14) R = xmax - xmin = 189 – 167 = 22 см. Ширина интервалов по формуле (15) .4,4 5 22 h В табл. 6 приведены результаты разбивки массива исходных данных на классы, вычисления частот. 30 Таблица 6 Разбивка массива исходных данных на классы, вычисление частот № п/п Классы С ер ед и н ы и н те р в ал о в П о д сч ет ч ас то т Частоты А б со л ю тн ы е, В j О тн о си те л ьн ы е, В j / n О тн о си те л ьн ы е н ак о п л ен н ы е, Σ (В j / n ) 1 От 167 до 171,4 исключит. 169,2 **** 4 0,21 0,211 2 [171,4…175,8] 173,6 **** 4 0,21 0,421 3 [175,8…180,2] 178,0 ******* 7 0,37 0,789 4 [180,2…184,6] 182,4 ** 2 0,11 0,895 5 От 184,6 до 189 включит. 186,8 ** 2 0,11 1,00 Проверка 1 19 клn j j B n    1 ( / ) 1 клn j j B n   Кумулятивная линия, гистограмма и полигон распределений, по- строенные по данным табл.6, представлены на диаграммах (рис. 3). 7. Выполняем проверку выборки на нормальность распределе- ния по следующим критериям: – по среднему абсолютному отклонению САО согласно (18) ;654,442,88 19 1 ÑÀÎ  – условие соответствия по (19): . 19 4,0 7979,0 994,5 654,4  0,022 < 0,092. 31 Рис. 3. Графическое изображение распределения частот: 1 – полигон распределения; 2 – гистограмма распределения; 3 – кумулятивная линия 0 1 2 3 4 5 6 7 8 169,2 173,6 178 182,4 186,8 А б со л ю тн ы е ч ас то ты х 2 1 0 0,2 0,4 0,6 0,8 1 0 1 2 3 4 5 3 32 Условие соответствия выполняется, следовательно, гипотеза нормальности распределения выборки данных, приведенных в табл. 4, подтверждается. Среднее значение теоретического распределения по (20)  = 176,47 ± 0,62  4,654 (см). По этим данным средний рост двадцатилетних юношей- студентов генеральной совокупности может колебаться от 173,58 до 179,36 см.  по размаху варьирования R S (21) .67,3 994,5 22  S R При n = 19 и α = 0,10 нижняя и верхняя границы по табл. А3 приложения А соответственно равны 3,25 и 4,27, т. е. 3,25 < 3,67 < 4,27. Следовательно, гипотеза нормальности распределения под- тверждается и по этому критерию.  по коэффициентам асимметрии и эксцесса. Условия: 1) ,3 11 G SG  где G1 - несмещенная оценка для показателя асимметрии (24).   .305,028,0 219 11919 1    G 2) ,5 22 G SG  где G2 - несмещенная оценка для показателя эксцесса (25).   .515,06)689,0)(119( )319)(219( 119 1    G 1G S , 2G S - среднеквадратическое отклонения для показателей асимметрии и эксцесса соответственно (26)-(27). 33 .524,0 )319)(119)(219( )119(196 1    GS ; 0,305 < 1,572. .014,1 )519)(319)(219)(319( )119(1924 2 2    GS 0,515 > 5,071. Выполнение указанных условий свидетельствует, что гипотеза нормальности распределения может быть принята.  по критерию 2 (свойства кривой нормального распределения) должно выполняться условие , )(êë 1j 2 êð 2 2      n j jj E EB где Bj — абсолютная частота в классе (табл. 6); Ej — ожидаемая частота по кривой нормального распределения (30). Процедура вычисления приведена χ2 в табл. 7. 2 êð зависит от числа классов и уровня значимости. Ожидаемое среднее значение наблюдаемого признака îæèäx определяется по формуле (34): .611,176 19 6,3355 îæèä x Ожидаемая дисперсия 𝑆̅ожид определяется по формуле (35): .498,5 119 19 6,3355 4,593178 2 îæèä    S 34 Таблица 7 Процедура вычисления 2 № п /п С ер ед и н ы и н те р ва л о в х j Ч ас то ты B j 2 jx jxB 2 j xB jj xx  zj f(zj) Ej B j – E j (B j – E j) 2 j jj E EB 2)(  1 169,2 4 28628,64 676,80 114514,56 -7,41 1,35 0,16 2,78 1,22 1,49 0,54 2 173,6 4 30136,96 694,40 120547,84 -3,01 0,55 0,34 5,93 -1,93 3,74 0,63 3 178,0 7 31684,00 1246,00 221788,00 1,39 0,25 0,39 6,68 0,32 0,10 0,02 4 182,4 2 33269,76 364,80 66539,52 5,79 1,05 0,23 3,96 -1,96 3,84 0,97 5 186,8 2 34894,24 373,60 69788,48 10,19 1,85 0,07 1,24 0,76 0,58 0,47 ∑ 3355,60 593178,40 2,62 k′ определяется по (36) .279,17 498,5 519   k zj определяется по (33). Вычисляется вектор-столбец f(zj) (32). Вычисляется для всех классов ожидаемую частоту по кривой нормального распределения Еj по формуле (30) и т. п. В результате расчетов полностью заполняется табл. 7 и по фор- муле (29) определяется расчетное значение критерия Пирсона 2 В табл. 7 критерий 2 = 2,62. По табл. А4 приложения А нахо- дят табличное значение: .62,206,4 2êð 2 )10;2(  Таким образом, гипотеза о том, что наблюдаемые частоты распределены нормально, принимается на 10%-м уровне. Вывод: так как условия соответствия на нормальность рас- пределения выполняются, то распределение величин идет по нор- мальному закону. Гипотеза нормального распределения на доста- точно «жестком» 10%-м уровне принимается. 95 % всех значений выборки варьируется в пределах от 173,58 до 179,36. 35 ЗАДАНИЕ 1. Изучить методику предварительной обработки эксперименталь- ных данных. 2. Получить исходные данные у преподавателя. Исходными дан- ными для выполнения работы являются значения в выбранном столбце (от 17 до 20 значений) соответствующей задачи. 3. Оформить отчет в соответствии со структурой указанной во вве- дении. Задача 1 В лаборатории ОАО «Белгорхимпрома» определено процентное содержание частиц галитовых отходов фракции крупнее 5 мм. Ре- зультаты исследования гранулометрического состава приведены в таблице ниже. Требуется определить статистические характеристи- ки результатов определения процентного содержания частиц гали- товых отходов фракции крупнее 5 мм. Номер варианта 1 2 3 4 5 6 7 8 9 10 28 11 21 10 29 24 29 23 26 11 18 22 22 29 18 25 28 19 18 23 15 23 13 28 26 14 28 21 14 18 23 14 24 16 25 12 19 20 23 29 11 25 25 25 25 28 24 17 29 16 22 15 25 14 14 29 13 21 15 23 33 22 26 34 13 19 23 18 24 20 36 18 28 23 23 14 20 26 11 21 11 29 19 22 22 21 25 25 23 29 20 10 10 21 21 10 23 19 21 18 22 18 29 17 23 23 25 18 35 19 22 20 19 18 25 20 23 14 22 16 19 22 21 25 18 15 21 16 18 36 20 18 23 18 23 25 20 28 7 23 14 21 22 25 7 35 9 18 25 21 22 22 23 18 25 19 15 15 21 16 18 19 21 20 25 18 20 17 21 20 - 20 22 - 23 19 - 21 17 19 - - 25 - 19 - - 22 - 23 - - - - 21 - - 18 - 29 36 Задача 2 При исследовании инженерно-геологических характеристик сме- си галитовых и шламовых отходов в лаборатории ОАО «Бел- горхимпрома» определена их пористость, %. Результаты лабора- торных исследований приведены в таблице ниже. Требуется опре- делить статистические характеристики полученных в лаборатории результатов исследований. Номер варианта 1 2 3 4 5 6 7 8 9 10 44 53 38 32 52 39 40 37 52 28 32 44 50 39 48 36 36 40 48 48 45 51 52 36 35 42 51 38 50 46 38 47 37 47 56 48 44 56 42 50 50 43 46 51 38 39 40 43 32 38 48 37 33 44 43 50 38 52 53 44 33 36 51 43 40 44 54 47 41 33 42 41 35 38 42 45 46 32 33 52 33 38 41 47 33 52 35 41 51 41 44 36 41 38 50 48 52 42 33 51 53 44 51 47 43 37 29 41 44 39 42 50 48 37 46 33 51 38 41 36 37 39 53 47 51 44 43 50 42 45 52 48 45 56 38 43 40 42 33 39 52 34 42 48 39 50 44 45 51 35 39 43 51 44 40 38 54 46 40 37 40 37 38 56 43 33 52 38 47 32 39 - 48 46 - 39 41 - 50 49 44 - - 48 - 36 45 - 52 51 39 - - 36 - 42 40 - 48 - 37 Задача 3 Лабораторией ОАО «Белгорхимпрома» проводились исследова- ния фильтрационных свойств солеотвальных техногенных грунтов, были определены значения пористости в верхней части солеотва- лов, %. Данные исследований приведены в таблице ниже. Требуется определить статистические характеристики полученных в лабора- тории результатов определения пористости в верхней части солеот- валов. Номер варианта 1 2 3 4 5 6 7 8 9 10 30,2 25,9 29,2 26,9 23,7 21,3 26,7 25,2 22,1 22,2 27,6 21,4 23,5 35,7 26,8 28,3 33,5 24,3 29,3 28,5 29,1 21,3 21,4 26,5 25,2 33,5 25,7 26,8 34,1 27,6 28,0 27,3 28,5 28,2 21,9 25,8 32,4 28,7 36,8 29,7 31,7 29,9 24,1 26,9 21,4 22,2 32,3 36,3 35,5 24,8 29,8 25,5 26,6 27,7 38,8 32,9 36,1 31,1 32,2 33,3 27,4 28,6 28,3 27,7 25,8 27,6 26,3 32,3 31,2 25,2 28,6 29,4 29,2 29,4 36,3 30,9 29,6 27,6 27,6 28,9 26,2 28,4 35,3 29,5 28,6 29,8 33,8 26,4 32,6 31,4 27,3 35,4 30,5 21,5 28,1 30,4 28,7 33,09 31,3 30,4 29,7 36,4 35,3 36,8 35,3 37,8 22,8 24,1 30,6 27,6 31,2 33,8 27,3 29,4 26,3 31,6 29,3 33,3 34,8 28,9 27,6 22,4 27,5 28,7 26,8 28,3 31,5 37,3 37,3 28,5 28,6 24,4 23,2 29,4 26,3 30,9 27,6 27,6 25,6 28,9 26,2 24,4 31,3 21,5 28,6 29,8 24,8 26,4 31,6 31,4 29,7 27,4 25,3 27,8 24,3 27,8 32,1 36,1 29,6 27,6 30,2 25,9 24,2 26,9 27,7 24,3 26,7 22,2 22,1 25,2 27,6 28,1 39,6 12,3 36,5 36,1 21,4 29,7 27,5 28,2 42,1 23,9 27,2 28,7 - - 23,7 22,2 21,5 36,1 - 36,8 22,2 - - - 26,8 - 23,5 - 38 Задача 4 Лабораторией ОАО «Белгорхимпрома» проводились исследова- ния шламовых грунтов и определены значения естественного рас- солосодержания, %. Результаты лабораторных исследований приве- дены в таблице ниже. Требуется определить статистические харак- теристики полученных результатов исследований. Номер варианта 1 2 3 4 5 6 7 8 9 10 44,07 43,41 42,9 49,1 28,6 59,80 37,14 49,1 41,8 42,12 43,02 53,3 39,9 59,5 35,13 62,80 37,63 58,2 44,5 55,2 54,31 52,9 47,5 49,1 32,34 61,65 38,13 54,5 52,6 46,1 45,19 55,29 45,1 50,5 39,55 60,10 38,94 57,95 42,5 45,9 43,41 51,06 50,5 48,5 32,88 59,00 39,60 54,4 50,4 42,9 45,3 48,18 50,12 45,2 36,1 62,00 40,13 60,7 53,34 46,2 57,9 57,89 47,1 58,2 36,13 59,63 40,34 58,8 64,7 50,3 54,29 48,26 46,1 49,9 44,3 59,80 40,55 58,2 61,13 63,2 41,06 49,46 44,2 59,5 37,41 61,80 40,88 52,5 54,25 45,3 58,18 56,19 55,1 46,9 31,46 62,00 41,00 57,95 63,3 40,9 58,89 51,77 54,1 62,2 45,46 60,00 41,13 57,4 54,2 54,29 42,26 52,88 47,5 62,5 41,41 59,80 41,30 50,25 41,77 55,25 54,46 56,44 53,1 57,68 40,32 60,12 41,41 50,8 42,88 40,3 58,19 56,41 50,5 58,02 36,19 61,32 41,46 65,1 53,44 46,28 51,77 51,3 43,1 58,18 34,25 60,25 41,46 61,35 52,41 43,29 38,88 52,9 42,99 58,34 39,13 60,70 41,41 65,1 61,3 54,1 43,44 39,29 46,2 48,63 40,35 58,80 41,32 58,2 52,9 50,2 39,07 51,06 49,1 58,89 34,34 58,20 41,19 48,5 44,41 53,9 51,42 - 48,4 49,12 35,9 58,50 37,65 - 53,32 42,1 40,31 - - - 30,5 - 40,30 - 64,32 - 39 Задача 5 Проводились исследования физико-механических характеристик фрезерного торфа. Результаты лабораторных исследований влажно- сти (%) приведены в таблице ниже. Требуется определить статисти- ческие характеристики полученных в лаборатории результатов определения влажности торфа. Номер варианта 1 2 3 4 5 6 7 8 9 10 53 44 38 40 52 39 32 28 52 37 44 39 50 36 48 36 39 48 48 40 51 45 52 51 35 42 36 46 50 38 47 38 37 44 56 48 47 50 42 56 43 50 46 40 38 39 51 38 32 43 37 48 33 38 43 50 44 44 53 52 36 33 51 54 40 44 43 33 41 47 41 42 35 46 42 45 38 52 33 32 38 33 41 35 33 52 47 41 51 41 36 44 41 52 50 48 38 51 33 42 44 53 51 29 43 37 47 39 44 41 50 42 48 51 46 33 37 36 41 38 39 37 53 43 51 44 47 45 42 50 48 52 45 40 38 43 56 39 33 42 34 52 42 44 39 50 48 35 51 45 43 39 51 54 40 38 44 37 40 46 37 40 38 52 43 33 56 32 47 38 - 39 48 41 - 39 46 49 50 - - 44 - 45 - 36 48 51 52 - - 32 - 40 - 42 36 - 48 - 40 ПРИЛОЖЕНИЯ ПРИЛОЖЕНИЕ А Таблица А1 Квантили распределения максимального относительного отклонения τ1–α Объем выборки n Уровни значимости 0,10 0,05 0,025 0,01 15 2,33 2,49 2,64 2,80 16 2,35 2,52 2,67 2,84 17 2,38 2,55 2,70 2,87 18 2,40 2,58 2,73 2,90 19 2,43 2,60 2,75 2,93 20 2,45 2,62 2,78 2,96 21 2,47 2,64 2,80 2,98 22 2,49 2,66 2,82 3,01 23 2,50 2,68 2,84 3,03 24 2,52 2,70 2,86 3,05 25 2,54 2,72 2,88 3,07 Таблица А2 Коэффициенты для определения 95%-х доверительных границ для среднего значения по САО n Коэффициент n Коэффициент n Коэффициент 2 12,71 9 1,00 20 0,60 3 3,45 10 0,93 25 0,53 4 2,16 11 0,87 30 0,48 5 1,66 12 0,82 40 0,41 6 1,40 13 0,78 60 0,33 7 1,21 14 0,75 120 0,23 8 1,09 15 0,71 41 Таблица А3 Критические границы отношений R/S Объем выборки п Нижние границы kн Верхние границы kв Вероятность ошибки p 0,005 0,01 0,025 0,05 0,10 0,10 0,05 0,025 0,01 0,005 3 1,735 1,737 1,745 1,758 1,782 1,997 1,999 2,000 2,000 2,000 4 1,83 1,87 1,93 1,98 2,04 2,409 2,429 2,439 2,445 2,447 5 1,98 2,02 2,09 2,15 2,22 2,712 3,753 2,782 2,803 2,813 6 2,11 2,15 2,22 2,28 2,37 2,949 3,012 3,056 3,095 3,115 7 2,22 2,26 2,33 2,40 2,49 3,143 3,222 3,282 3,338 3,369 8 2,31 2,35 2,43 2,50 2,59 3,308 3,399 3,471 3,543 3,585 9 2,39 2,44 2,51 2,59 2,68 3,449 3,552 3,634 3,720 3,772 10 2,46 2,51 2,59 2,67 2,76 3,57 3,685 3,777 3,875 3,935 11 2,53 2,58 2,66 2,74 2,84 3,68 3,80 5,903 4,012 4,079 12 2,59 2,64 2,72 2,80 2,90 3,78 3,91 4,02 4,134 4,208 13 2,64 2,70 2,78 2,86 2,96 3,87 4,00 4,12 4,244 4,325 14 2,70 2,75 2,8З 2,92 3,02 3,95 4,09 4,21 4,34 4,431 15 2,74 2,80 2,88 2,97 3,07 4,02 4,17 4,29 4,44 4,53 16 2,79 2,84 2,93 3,01 3,12 4,09 4,24 4,37 4,52 4,62 17 2,83 2,88 2,97 3,06 3,17 4,15 4,31 4,44 4,60 4,70 18 2,87 2,92 3,01 3,10 3,21 4,21 4,37 4,51 4,67 4,78 19 2,90 2,96 3,05 3,14 3,25 4,27 4,43 4,57 4,74 4,85 20 2,94 2,99 3,09 3,18 3,29 4,32 4,49 4,63 4,80 4,91 25 3,09 3,15 3,24 3,34 3,45 4,53 4,71 4,87 5,06 5,19 30 3,21 3,27 3,37 3,47 3,59 4,70 4,89 5,06 5,26 5,40 35 3,32 3,38 3,48 3,58 3,70 4,84 5,04 5,21 5,42 5,57 40 3,41 3,47 3,57 3,67 3,79 4,96 5,16 5,34 5,56 5,71 45 3,49 3,55 3,66 3,75 3,88 5,06 5,26 5,45 5,67 5,83 50 3,56 3,62 3,73 3,83 3,95 5,14 5,35 5,54 5,77 5,93 55 3,62 3,69 3,80 3,90 4,02 5,22 5,43 5,63 5,86 6,02 60 3,68 3,75 3,86 3,96 4,08 5,29 5,51 5,70 5,94 6,10 65 3,74 3,80 3,91 4,01 4,14 5,35 5,57 5,77 6,01 6,17 70 3,79 3,85 3,96 4,06 4,19 5,41 5,63 5,83 6,07 6,24 75 3,83 3,90 4,01 4,11 4,24 5,46 5,68 5,88 6,13 6,30 80 3,88 3,94 4,05 4,16 4,28 5,51 5,73 5,93 6,18 6,35 85 3,92 3,99 4,09 4,20 4,33 5,56 5,78 5,98 6,23 6,40 90 3,96 4,02 4,13 4,24 4,36 5,60 5,82 6,03 6,27 6,45 42 Таблица А4 Процентные точки распределения 2-критерия m Уровни значимости 40 % 30 % 20 % 10 % 5 % 2,5 % 1 % 0,5 % 0,1 % 0,05 % 1 0,708 1,074 1,642 2,706 3,841 5,024 6,635 7,879 10,828 12,116 2 1,833 2,408 3,219 4,605 5,991 7,378 9,210 10,597 13,816 15,202 3 2,946 3,665 4,642 6,251 7,815 9,348 11,345 12,838 16,266 17,730 4 4,045 4,878 5,989 7,779 9,488 11,143 13,277 14,860 18,467 19,997 5 5,132 6,064 7,289 9,236 11,070 12,832 15,086 16,750 20,515 22,105 6 6,211 7,231 8,558 10,645 12,592 14,449 16,812 18,548 22,458 24,103 7 7,283 8,383 9,803 12,017 14,067 16,013 18,475 20,278 24,322 26,018 8 8,351 9,524 11,030 13,362 15,507 17,535 20,090 21,955 26,125 27,868 9 9,414 10,656 12,242 14,684 16,919 19,023 21,666 23,589 27,877 29,666 10 10,473 11,781 13,442 15,987 18,307 20,483 23,209 25,188 29,588 31,420 11 11,530 12,899 14,631 17,275 19,675 21,920 24,725 26,757 31,264 33,136 12 12,584 14,011 15,812 18,549 21,026 23,336 26,217 28,300 32,909 34,821 13 13,636 15,119 16,985 19,812 22,362 24,736 27,688 29,819 34,528 36,478 14 14,685 16,222 18,151 21,064 23,685 26,119 29,141 31,319 36,123 38,109 15 15,733 17,322 19,311 22,307 24,996 27,488 30,578 32,801 37,697 39,719 16 16,780 18,418 20,465 23,542 26,296 28,845 32,000 34,267 39,252 41,308 17 17,824 19,511 21,615 24,769 27,587 30,191 33,409 35,718 40,790 42,879 18 18,868 20,601 22,760 25,989 28,869 31,526 34,805 37,156 42,312 44,434 19 19,910 21,689 23,900 27,204 30,144 32,852 36,191 38,582 43,820 45,973 20 20,951 22,775 25,038 28,412 31,410 34,170 37,566 39,997 45,315 47,498 43 ПРИЛОЖЕНИЕ Б Некоторые функции MS Excel, позволяющие реализовывать обработку экспериментальных данных Функция Описание ДИСП Оценивает дисперсию по выборке. ДИСП(число1;число2; ...) КВАДРОТКЛ Возвращает сумму квадратов отклонений. КВАДРОТКЛ(число1;число2;...) МАКС Возвращает наибольшее значение из набо- ра значений. МАКС(число1 ;число2; ...) МЕДИАНА Возвращает медиану заданных чисел. МЕДИАНА(число1; число2; ....) МИН Возвращает наименьшее значение в списке аргументов. МИН(число1; число2; ...) МОДА Возвращает значение моды множества данных. Возвращает наиболее часто встре- чающееся или повторяющееся значение в массиве или интервале данных МОДА(число1; число2;...) СКОС Возвращает асимметрию распределения. СКОС(число1;число2; ...) СРЗНАЧ Возвращает среднее арифметическое аргу- ментов. СРЗНАЧ(число1; число2; ...) СРОТКЛ Возвращает среднее арифметическое абсо- лютных значений отклонений точек дан- ных от среднего. СРОТКЛ(число1; число2;...) СТАНДОТКЛОН Оценивает стандартное отклонение по вы- борке. СТАНДОТКЛОН(число1; число2; ...) СЧЁТ Подсчитывает количество чисел в списке аргументов. СЧЁТ(значение1; значение2; ...) 44 Функция Описание СЧЁТЕСЛИ Подсчитывает количество ячеек в диапа- зоне, удовлетворяющих заданному усло- вию. СЧЁТЕСЛИ(диапазон;критерий) СЧЁТЗ Подсчитывает количество значений в списке аргументов. СЧЁТЗ(значение1; значение2; ...) ХИ2ОБР Возвращает обратное значение односто- ронней вероятности распределения χ2- квадрат. ХИ2ОБР(вероятность;степени_свободы) ЧАСТОТА Возвращает распределение частот в виде вертикального массива. ЧАСТОТА(массив_данных;массив_интервалов) ЭКСЦЕСС Возвращает эксцесс множества данных ЭКСЦЕСС (число1; число2; ...) 45 СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 1. Львовский, Е. Н. Статистические методы построения эмпириче- ских формул : учебное пособие для втузов / Е. Н. Львовский. – М. : Высшая школа, 1988. – 239 с. 2. Статистическая обработка данных : методические рекоменда- ции по курсу «Основы научных исследований» /А. А. Павленко, С. А. Федоров. – Хабаровск : ТОГУ, 2008. – 24 с. 3. Обработка экспериментальных данных в MS Excel : методиче- ские указания к выполнению лабораторных работ для студентов дневной формы обучения / сост. Е. Г. Агапова, Е. А. Битехти- на. – Хабаровск : ТОГУ, 2012. – 32 с. 4. Основы научных исследований : учебник для техн. вузов / В. И. Крутов [и др.] ; под. ред. В. И. Крутова. – М. : Высшая школа, 1988. – 400 с. 5. Первозванский, А. А. Математические модели в управлении производством / А. А.Первозванский. – М. : Наука, 1975. – 615 с. 6. Вентцель, Е. С. Исследование операций / Е. С. Венцель. – М. : Наука, 1988. – 208 с. 7. Герасимович, А. И. Математическая статистика / А. И. Гераси- мович, Я. И. Матвеева. – М. : Высшая школа, 1978. – 279 с. 8. Кислов, Н. В. Учебное пособие по курсу «Основы научных ис- следований» для студентов специальности 0507 – «Торфяные машины и комплексы» / Н. В. Кислов, В. Т. Васильев; кол. авт. Белорусского политехнического института, кафедра «Торфяные машины». – Минск : БПИ, 1981. – 114 с. 9. Анализ статистической совокупности в программе MS Excel : методические указания и задание к лабораторной работе № 1 / сост. А. Н. Акжигитова, Н. С. Циндин, Н. Ф. Разуваева. – Пенза: Информационно-издательский центр ПГУ, 2007. – 52 с. 10. Вадзинский, Р. Статистические вычисления в среде Excel. Биб- лиотека пользователя / Р. Вадзинский. – СПб. : Питер, 2008. – 608 с. 11. Веденеева, Е. А. Функции и формулы. Excel 2007. Библиотека пользователя / Е. А. Веденеева. – СПБ. : Питер, 2008. – 384 с. 46 Учебное издание ОСНОВЫ НАУЧНЫХ ИССЛЕДОВАНИЙ И ИННОВАЦИОННОЙ ДЕЯТЕЛЬНОСТИ Методические указания к практической работе «Предварительная обработка экспериментальных данных» для студентов специальностей 1-36 10 01 «Горные машины и оборудование (по направлениям)», 1-36 13 01 «Технология и оборудование торфяного производства» Составители: КОСТЮКЕВИЧ Елена Казимировна БЕРЕЗОВСКИЙ Николай Иванович Подписано в печать 21.03.2013. Формат 6084 1/16. Бумага офсетная. Ризография. Усл. печ. л. 2,67. Уч.-изд. л. 2,09. Тираж 100. Заказ 1254. Издатель и полиграфическое исполнение: Белорусский национальный технический университет. ЛИ № 02330/0494349 от 16.03.2009. Пр. Независимости, 65. 220013, г. Минск.