Метрологические основы аналитической химии - pismo.netnado.ru o_O
Главная
Поиск по ключевым словам:
страница 1страница 2
Похожие работы
Метрологические основы аналитической химии - страница №1/2

Метрологические основы аналитической химии
Любая методика химического анализа имеет своей задачей извлечение информации о веществе с использованием тех или иных средств измерений. Таким образом, методика анализа есть сложная, многостадийная измерительная процедура. Именно на стадии измерения (и последующей обработки и интерпретации результатов) ярко проявляется глубокое внутреннее единство самых различных методов анализа, а закономерности измерения химических величин имеют фундаментальное значение для всех разделов аналитической химии, составляя, по существу, ее философский базис. Изучением общих вопросов, связанных с измерением, обработкой и интерпретацией результатов химического анализа занимается специальный раздел аналитической химии, называемый химической метрологией.
Химические величины, способы их выражения и измерения. Аналитический сигнал, градуировочная функция
Основной химической величиной является количество вещества (n), а основной единицей ее измерения - моль. По определению, 1 моль - это количество вещества, содержащее столько частиц, сколько атомов содержится в 0.012 кг изотопно чистого простого вещества 12C. Оно составляет приблизительно 6.02045.1023 частиц. Таким образом, по смыслу количество вещества есть число частиц, составляющих вещество. Эту величину не следует отождествлять ни с массой, ни с объемом, ни с какими-либо иными физическими характеристиками.

Наряду с количеством вещества в химии широко используют и производные от него величины. Важнейшая из них - концентрация (c), представляющая собой количество вещества в единице объема V:


. (1)
Наиболее употребительная единица измерения концентрации - моль/л (М). В дальнейшем все химические величины, как само количество вещества, так и производные от него, мы будем обозначать собирательным термином "содержание".

Из определения понятия "количество вещества" следует, что прямые, непосредственные измерения химических величин невозможны. Действительно, непосредственно измерить количество какого-либо вещества в образце означало бы пересчитать в нем поштучно все частицы определенного сорта, что технически неосуществимо. Однако существует множество физических величин, вполне доступных прямым измерениям и функционально связанных с содержанием вещества. Например, масса (m) любого чистого вещества пропорциональна его количеству:


m = Mn (2)
(коэффициент пропорциональности - молярная масса M). При титровании количество определяемого вещества связано с объемом стандартного раствора титранта VТ концентрации cТ:
. (3)
В окрашенных растворах существует связь между концентрацией светопоглощающего вещества и оптической плотностью A:
A = lc (4)
(основной закон светопоглощения). И так далее. Таким образом, едва ли не любая механическая, оптическая или электрическая величина может при тех или иных условиях быть связанной с содержанием вещества и, следовательно, быть использованной для его определения. В общем случае такая физическая величина называется аналитическим сигналом (y). Функциональную связь между аналитическим сигналом и содержанием (например, концентрацией) можно представить как
y = f(c) . (5)
Функция f, связывающая содержание и аналитический сигнал, называется градуировочной функцией.

Общая схема измерения содержания вещества состоит в следующем.

1. Установление градуировочной функции f.

2. Измерение аналитического сигнала анализируемого образца y.

3. Нахождение по величине y с помощью функции f содержания определяемого компонента c.

Таким образом, все измерения химических величин являются косвенными, основанными на использовании градуировочной функции. Ввиду ключевой роли градуировочной функции в процессе химических измерений рассмотрим это понятие подробнее.


Абсолютные и относительные методы анализа. Градуировка. Образцы сравнения и стандартные образцы
Подчеркнем, что для осуществления химического анализа необходимо знание точного вида градуировочной функции (т.е., например, не только общей формы описывающего ее алгебраического уравнения, но и конкретных значений его параметров).

Для некоторых методов анализа точный вид градуировочной функции известен из теории. Примером таких методов служит гравиметрия, в котором аналитическим сигналом является масса, а градуировочная функция описывается уравнением (2). Его единственный параметр - молярная масса вещества M, установленная с высокой точностью. Подобные методы, которые не нуждаются в экспериментальном определении градуировочной функции, называют абсолютными. Однако абсолютных методов химического анализа очень мало.

Гораздо более распространен случай, когда из теории известен в лучшем случае общий (и при этом зачастую приближенный) вид градуировочной функции, а ее параметры (применительно к данным конкретным условиям анализа) либо заранее неизвестны вообще, либо известны лишь ориентировочно, с точностью, не удовлетворяющей возможностям метода и требованиям к результатам анализа. В таких случаях необходимо устанавливать градуировочную функцию экспериментально, эмпирически, как правило, непосредственно перед проведением анализа, поскольку она может сильно зависеть от его условий. Такие методы называют относительными, а процедуру экспериментального построения градуировочной функции - градуировкой. Поэтому коротко можно сказать, что абсолютные методы - это методы, не требующие градуировки, а относительные - нуждающиеся в ней. А поскольку относительные методы составляют подавляющее большинство, то градуировка - это важнейшая составная часть практически любой методики анализа. Как же ее проводят?

Очевидно, что для осуществления градуировки необходим прежде всего набор образцов с надежно установленным содержанием определяемого компонента. В общем случае такие образцы называют образцами сравнения (ОС). Среди ОС следует особо выделить класс, называемый стандартными образцами (СО). СО - это специально приготовленный материал, состав которого надежно установлен и юридически удостоверен. Последнее означает, что каждый СО имеет официальный документ (паспорт, аттестат), выданный уполномоченным органом (системы Госстандарта, отраслевой метрологической службой и т.д.), в котором содержатся данные о его составе (как правило, содержания всех макрокомпонентов и важнейших микрокомпонентов). Во многих определенных законодательством случаях (прежде всего - при официальной аттестации новой методики) применение СО является обязательным.



Величины аналитических сигналов (и, соответственно, конкретный вид градуировочной функции) могут зависеть, и порой сильно, от условий измерения. Поэтому важнейшее требование к процессу градуировки - обеспечение максимально точного соответствия условий градуировки и последующего анализа образца. Это означает, в частности, что как градуировку, так и собственно анализ следует выполнять на одном и том же приборе, при одних и тех же значениях инструментальных параметров, а временной интервал между градуировкой и анализом должен быть как можно короче. Кроме того, если на величины аналитических сигналов влияют посторонние компоненты образца (его матрица) или его физическое состояние, то ОС, используемые для градуировки, должны как можно больше соответствовать анализируемому образцу с точки зрения этих параметров. Поэтому ОС, а в особенности СО, очень часто имитируют типичные объекты анализа (существуют, например, СО почв, пищевых продуктов, природных вод, рудных концентратов и т.д.). Применяют и специальные приемы градуировки, обеспечивающие максимальную адекватность ее условий условиям анализа.
Способ внешних стандартов
Наиболее простой и распространенный способ градуировки - способ внешних стандартов. Его часто называют также способом "обычной" градуировки либо способом "градуировочного графика" (правомерность применения последнего термина, однако, вызывает сомнение, поскольку и при других, специальных, способах градуировки градуировочную функцию также часто представляют в графическом виде). В этом способе берут ряд ОС с содержанием определяемого компонента c1, c2, ... cn, проводят с ними все необходимые согласно методике аналитические процедуры и измеряют их аналитические сигналы (y1, y2, ... yn, соответственно). По полученным парам экспериментальных значений (ci, yi) строят зависимость y от c и аппроксимируют ее подходящей алгебраической функцией либо графически (рис. 1). При этом обычно стараются выбирать такие условия анализа, чтобы эта зависимость была линейной. Затем анализируют неизвестный образец, измеряют его аналитический сигнал yx и с использованием полученной градуировочной функции находят (также алгебраически либо графически) соответствующее ему значение cx. Например, в случае линейной градуировочной функции, описываемой уравнением y = kc + b, неизвестное содержание можно найти как
. (6)
В
Рис. 1.Градуировка и определение содержания по способу внешних стандартов


еличина b, представляющая собой значение аналитического сигнала при нулевой концентрации определяемого компонента, называется фоновым значением сигнала. Она играет важную роль при оценке чувствительности методик (с. 33).

Иногда способ внешних стандартов дополнительно упрощают, сокращая число ОС до двух (способ ограничивающих растворов) или даже одного (способ одного стандарта). В способе ограничивающих растворов линейный (в выбранном концентрационном диапазоне) характер градуировочной функции постулируют заранее (и, при возможности, экспериментально проверяют), а ОС выбирают так, чтобы c1x2. Легко убедиться, проведя соответствующие математические преобразования, что в этом случае


. (7)
Если c1 и c2 достаточно близки к cx, то способ ограничивающих растворов иногда дает более точные результаты, чем "полный" вариант способа внешних стандартов.

В способе одного стандарта предполагают уже не просто линейный, но прямо пропорциональный вид градуировочной функции y = kx (без свободного члена, фоновый сигнал отсутствует). В этом случае


. (8)
В любом варианте способа внешних стандартов ОС готовят и применяют отдельно от анализируемого образца (отсюда и название). Поэтому состав и свойства ОС не всегда достаточно точно соответствуют таковым для анализируемой пробы. В некоторых случаях это может привести к значительным погрешностям результатов. В подобных ситуациях следует применять специальные способы градуировки (с. 25).
Погрешности и неопределенности измерений. Точность и ее составляющие
Любой измерительный процесс подвержен влиянию множества факторов, искажающих результаты измерения. Отличие результата измерения от истинного значения измеряемой величины называется погрешностью. Ввиду того, что любой результат измерения в общем случае содержит погрешность, точное значение измеряемой величины никогда не может быть установлено. Однако возможно указать некоторый диапазон значений, в пределах которого может с той или иной степенью достоверности находиться истинное значение. Этот диапазон называется неопределенностью результата измерения. Оценка неопределенности результатов химического анализа является важнейшей задачей химической метрологии.

В суммарную неопределенность результата измерения вносят вклад погрешности двух различных типов. Пусть в результате однократного измерения некоторой величины получено значение x*, отличающееся от истинного значения x0 (рис. 2, а). Повторим измерение еще несколько раз. Возможные варианты взаимного расположения серии измеренных значений и истинного значения показаны на рис. 2, б и 2, в. В первом случае (рис. 2, б) имеет место смещение всей серии данных (и ее среднего) относительно истинного значения. Соответствующая составляющая неопределенности называется систематической погрешностью. Во втором случае (рис. 2, в) наблюдается разброс данных относительно среднего значения из результатов измерения. Такая составляющая неопределенности называется случайной погрешностью. Разумеется, в реальном случае мы всегда имеем и систематическую, и случайную составляющую. Так, на рис. 2, б наряду со значительным смещением данных мы видим и некоторый их разброс, а на рис 2, в - на фоне большого разброса незначительное смещение среднего относительно истинного. Происхождение систематических и случайных погрешностей связано с различной природой факторов, воздействующих на измерительный процесс. Факторы постоянного характера или мало изменяющиеся от измерения к измерению вызывают систематические погрешности, быстро и


Рис. 2. Иллюстрация понятий систематическая и случайная погрешность. Точки и звездочки - результаты единичных измерений, вертикальные отрезки - средние значения, прочие пояснения даны в тексте.




зменяющиеся факторы - случайные погрешности.

С понятиями систематической и случайной погрешностей тесно связаны два важнейших метрологических понятия - правильность и воспроизводимость (или, по современной терминологии, прецизионность). Правильностью называется качество результатов измерения (или измерительной процедуры в целом), характеризующее малость (близость к нулю) систематической погрешности, воспроизводимостью (прецизионностью) - качество, характеризующее малость случайной погрешности. Иными словами, правильность результатов - это их несмещенность, а воспроизводимость - их стабильность. Обобщающее понятие, характеризующее малость любой составляющей неопределенности, как систематической, так и случайной, - называется точностью. Мы назовем результаты точными только в том случае, если для них мала как систематическая, так и случайная погрешность. Таким образом, правильность и воспроизводимость - это две составляющие точности, называемые поэтому точностными характеристиками.

В химической метрологии традиционно принято оценивать точностные характеристики по отдельности. Рассмотрим основные способы количественной оценки воспроизводимости и правильности результатов химического анализа.
Случайная погрешность: численные характеристики воспроизводимости
Воспроизводимость характеризует степень рассеяния данных относительно среднего значения. Поэтому для оценки воспроизводимости необходимо предварительно вычислить среднее из серии результатов повторных (параллельных) измерений x1, x2, ... xn:
. (9)
Отметим, что в обрабатываемой серии должны отсутствовать промахи - отдельные значения, резко отличающиеся от остальных и, как правило, полученные в условиях грубого нарушения измерительной процедуры (методики анализа). Поэтому прежде всего (еще до вычисления среднего) следует с помощью специальных статистических тестов (с. 23) и, если возможно, путем детального изучения условий эксперимента проверить серию данных на наличие промахов и, при обнаружении таковых, исключить их из рассмотрения.

В качестве меры разброса данных относительно среднего чаще всего используют дисперсию


(10)
и производные от нее величины - (абсолютное) стандартное отклонение
(11)
и относительное стандартное отклонение
. (12)
По смыслу дисперсия - это усредненная величина квадрата отклонения результата измерения от своего среднего значения. Несмотря на то, что числитель выражения (10) содержит n слагаемых, знаменатель равен n-1. Причина состоит в том, что среди n слагаемых числителя только n-1 независимых (поскольку по n-1 значениям xi и среднему всегда возможно вычислить недостающее n-е слагаемое). Величина знаменателя в выражении (10) обозначается f (или ) и называется числом степеней свободы дисперсии s2(x). Оно играет очень важную роль при статистической проверке различных гипотез (с. 17).

В химическом анализе для характеристики воспроизводимости обычно используют не дисперсию, а абсолютное или, чаще всего, относительное стандартное отклонение. Это объясняется соображениями практического удобства. Размерности s(x) и x совпадают, поэтому абсолютное стандартное отклонение можно непосредственно сопоставлять с результатом анализа. Величина же sr(x) - безразмерная и потому наиболее наглядная. С помощью относительных стандартных отклонений можно сравнивать между собой воспроизводимости не только конкретных данных, но и различных методик и даже методов в целом.

Среди всех существующих методов химического анализа наилучшие воспроизводимости (т.е. наименьшие sr) характерны прежде всего для "классических" химических методов анализа - титриметрии и, особенно, гравиметрии. В оптимальных условиях типичные величины sr для них составляют порядка n.10-3 (десятые доли процента). Среди инструментальных методов такой же (а в ряде методик - и более высокой) воспроизводимостью обладает кулонометрия, особенно в прямом варианте (до n.10-4). Большинство прочих инструментальных методов характеризуются величинами sr от 0.005 до 0.10. Методы с еще более низкой воспроизводимостью относятся к полуколичественным. Несмотря на невысокую точность, они часто обладают другими достоинствами: исключительной простотой, экспрессностью, экономичностью (тест-методы). Они бывают очень полезны, например, для быстрой оценки состояния окружающей среды.

Подчеркнем, что любые величины sr, приводимые для методик (тем более методов) в целом, являются лишь ориентировочными и обычно относятся лишь к оптимальным условиям их выполнения. В иных условиях, особенно при понижении содержания определяемого компонента (с. 32), эти величины могут быть значительно (на порядок и более) выше.


Условия анализа и воспроизводимость результатов
Как отмечено выше, случайные погрешности вызваны действием различных (обычно очень многих) факторов, часто неизвестной природы, быстро и непредсказуемо изменяющихся во времени. Поэтому решающую роль в улучшении воспроизводимости результатов анализа играет строгий контроль условий эксперимента. Очевидно, что при выполнении серии анализов одного и того же образца в одной и той же лаборатории и на одном и том же приборе воспроизводимость будет выше, чем при работе с тем же образцом в разных лабораториях, на разных приборах. Поэтому любые численные характеристики воспроизводимости, вообще говоря, имеют смысл только тогда, когда указано, к каким условиям анализа они относятся.

Принято различать три основных типа таких условий, различающихся по степени строгости их контроля.

1. Работа в максимально строго контролируемых условиях. Это означает выполнение серии анализов в одной и той же лаборатории, на одной и той же аппаратуре, одним и тем же человеком и, что немаловажно, в течение как можно более короткого промежутка времени (максимум в течение одного дня). Воспроизводимость, рассчитанная применительно к таким условиям, носит специальное название сходимость.

2. Выполнение серии анализов в одной лаборатории, на одном оборудовании, но, возможно, разными операторами и в разные дни. В этом случае воспроизводимость называется внутрилабораторной (по современной терминологии – промежуточной прецизионностью). Внутрилабораторная воспроизводимость ниже, чем сходимость (соответствующее значение sr выше).

3. Выполнение серии анализов в разных лабораториях, на разном оборудовании, разными людьми и в разное время. Иными словами, это – варьирование условий выполнения методики в максимально широких пределах. Соответствующая воспроизводимость называется межлабораторной (по современной терминологии – просто воспроизводимостью). Если методику предполагается применять повсеместно, то очевидно, что именно межлабораторная воспроизводимость (а не внутрилабораторная и уж тем более не сходимость!) является реальной характеристикой возможного разброса результатов анализа. Поэтому для всех официально рекомендуемых или предписываемых (аттестуемых, стандартизуемых) методик обязательно проводится межлабораторное исследование – испытание методики в различных лабораториях и оценка ее межлабораторной воспроизводимости.

В силу большого практического значения межлабораторной воспроизводимости в современных нормативных документах именно этот вид воспроизводимости именуется просто воспроизводимостью (без какого-либо дополнительного определения). Что же касается термина "воспроизводимость" в широком смысле слова (т.е. характеристики случайной погрешности результатов безотносительно к условиям, в которых они получены), то во избежание путаницы сейчас рекомендуется в этом случае использовать упомянутый выше синоним "прецизионность". Однако термин "воспроизводимость" в обобщенном его значении глубоко укоренился в научном обиходе, а из контекста обычно бывает понятно, о какой воспроизводимости идет речь – о воспроизводимости "вообще" или конкретно о межлабораторной. Поэтому в данном пособии мы будем продолжать использовать термин "воспроизводимость" в широком смысле слова (как и делали до сих пор).


Случайная погрешность: интервальная оценка
Вклад случайной погрешности в общую неопределенность результата измерения можно оценить с помощью методов теории вероятностей и математической статистики.

Ввиду наличия случайной погрешности одна и та же величина x при каждом последующем измерении приобретает новое, непрогнозируемое значение. Такие величины называют случайными. Случайными величинами являются не только отдельные результаты измерений xi, но и средние (а также дисперсии s2(x) и все производные от них величины). Поэтому может служить лишь приближенной оценкой результата измерения. В то же время, используя величины и s2(x), возможно оценить диапазон значений, в котором с заданной вероятностью P может находиться результат. Эта вероятность P называется доверительной вероятностью, а соответствующий ей интервал значений - доверительным интервалом.

Строгий расчет границ доверительного интервала случайной величины возможен лишь в предположении, что эта величина подчиняется некоторому известному закону распределения. Закон распределения случайной величины - одно из фундаментальных понятий теории вероятностей. Он характеризует относительную долю (частоту, вероятность появления) тех или иных значений случайной величины при ее многократном воспроизведении. Математическим выражением закона распределения случайной величины служит ее функция распределения (функция плотности вероятности) p(x). Например, функция распределения, изображенная на рис. 3, означает, что для соответствующей ей случайной величины x наиболее часто встречаются значения вблизи x=10, а большие и меньшие значения встречаются тем реже, чем дальше они отстоят от 10.

В качестве примера не случайно приведена колоколообразная, симметричная функция распределения. Именно такой ее вид наиболее характерен для результатов химического анализа. В большинстве случаев закон распределения результатов химического анализа можно удовлетворительно аппроксимировать так называемой функцией нормального (или гауссова) распределения:


. (13)
Параметр этой функции характеризует положение максимума кривой, т.е. собственно значение результата анализа, а параметр - ширину "колокола", т.е. воспроизводимость результатов. Можно показать, что среднее является приближенным значением , а стандартное отклонение s(x) - приближенным значением . Естественно, эти приближения тем точнее, чем больше объем экспериментальных данных, из которых они рассчитаны, т.е. чем больше число параллельных измерений n и, соответственно, число степеней свободы f.


Рис. 3. Функция нормального распределения случайной величины x с параметрами =10 и =1.


В предположении подчинения случайной величины x нормальному закону распределения ее доверительный интервал рассчитывается как


. (14)
Ширина доверительного интервала нормально распределенной случайной величины пропорциональна величине ее стандартного отклонения. Численные значения коэффициентов пропорциональности t были впервые рассчитаны английским математиком У.Госсетом, подписывавшим свои труды псевдонимом Стьюдент, и потому называются коэффициентами Стьюдента. Они зависят от двух параметров: доверительной вероятности P и числа степеней свободы f, соответствующего стандартному отклонению s(x).

Причина зависимости t от P очевидна: чем выше доверительная вероятность, тем шире должен быть доверительный интервал с тем, чтобы можно было гарантировать попадание в него значения величины x. Поэтому с ростом P значения t возрастают. Зависимость t от f объясняется следующим образом. Поскольку s(x) - величина случайная, то в силу случайных причин ее значение может оказаться заниженным. В этом случае и доверительный интервал окажется более узким, и попадание в него значения величины x уже не может быть гарантировано с заданной доверительной вероятностью. Чтобы "подстраховаться" от подобных неприятностей, следует расширить доверительный интервал, увеличить значение t, причем тем больше, чем менее надежно известно значение s, т.е. чем меньше число его степеней свободы. Поэтому с уменьшением f величины t возрастают.

Коэффициенты Стьюдента для различных значений P и f приведены в табл. 1 (приложение). Полезно проанализировать ее и обратить внимание на отмеченные закономерности в изменении величин t в зависимости от P и f.

Если единичные значения x имеют нормальное распределение, то и среднее тоже имеет нормальное распределение. Поэтому формулу Стьюдента для расчета доверительного интервала можно записать и для среднего:


. (15)
Величина меньше, чем s(x) (среднее точнее единичного). Можно показать (с. 31), что для серии из n значений . Поэтому доверительный интервал для величины, рассчитанной из серии n параллельных измерений, можно записать как
, (16)
где f=n-1, а величины и s(x) рассчитывают по формулам (9) и (11).

Пример 1. Для серии значений объемов титранта, равных 9.22, 9.26, 9.24 и 9.27 мл, рассчитать среднее и доверительный интервал среднего при P=0.95.

Решение. Среднее значение равно мл. Стандартное отклонение равно

= 0.0222 мл. Табличное значение коэффициента Стьюдента t(P=0.95, f=3)=3.18. Доверительный интервал составляет = 9.2480.035 = 9.250.04 мл (полученный результат округляем так, чтобы полуширина доверительного интервала содержала только одну значащую цифру).

При расчете доверительного интервала встает вопрос о выборе доверительной вероятности P. При слишком малых значениях P выводы становятся недостаточно надежными. Слишком большие (близкие к 1) значения брать тоже нецелесообразно, так как в этом случае доверительные интервалы оказываются слишком широкими, малоинформативными. Для большинства химико-аналитических задач оптимальным значением P является 0.95. Именно эту величину доверительной вероятности (за исключением специально оговоренных случаев) мы и будем использовать в дальнейшем.

Подчеркнем еще раз, что величина доверительного интервала сама по себе позволяет охарактеризовать лишь случайную составляющую неопределенности. Оценка систематической составляющей представляет собой самостоятельную задачу.
Систематическая погрешность: общие подходы к оценке
Оценка правильности результатов анализа - проблема значительно более трудная, чем оценка воспроизводимости. Как видно из предыдущих разделов, для оценки воспроизводимости достаточно иметь только серию параллельных результатов измерения. Для оценки же правильности необходимо сравнение результата измерения с истинным значением. Строго говоря, такое значение никогда не может быть известно. Однако для практических целей можно вместо истинного использовать любое значение, систематическая погрешность которого пренебрежимо мала. Если при этом и случайная погрешность также пренебрежимо мала, то такое значение можно считать точной величиной (константой) и постулировать в качестве истинного. Величина, принимаемая за истинное значение, называется действительной величиной и обозначается a.

Важнейшие способы получения информации о действительном (или, по крайней мере, не содержащем систематической погрешности) значении содержания определяемого компонента в анализируемом образце состоят в следующем.

1. Данные независимого анализа. Образец анализируют повторно, используя другую методику анализа, о которой известно (из опыта практического применения), что она не содержит систематической погрешности. При этом важно, чтобы такая методика была действительно независима от проверяемой, т.е. чтобы она по возможности принадлежала к другому методу и не содержала общих операций пробоподготовки. Еще лучше, если такой сравнительный анализ проводят в другой лаборатории, особенно официально аккредитованной.

2. Способ "введено - найдено". В этом случае аналитик сам готовит для анализа образец с известным содержанием определяемого компонента. Полученный результат ("найдено") сравнивают с заданным содержанием ("введено").

3. Использование стандартных образцов. В качестве объекта анализа выбирают подходящий СО, а данные о содержании определяемого компонента берут из паспорта СО.

После получения тем или иным способом независимых данных о содержании определяемого компонента их необходимо сравнить с результатами, полученными с помощью проверяемой методики. Эта задача тоже далеко не так проста и требует отдельного рассмотрения.


Сравнение результатов анализов. Значимое и незначимое различие случайных величин
Вспомним еще раз, что любой результат измерения (в том числе среднее значение) представляет собой, вообще говоря, случайную величину. Поэтому численное различие двух результатов может быть вызвано случайными причинами и вовсе не свидетельствовать о том, что эти результаты действительно разные. Так, если результаты титрования двух аликвот равны, к примеру, 9.22 и 9.26 мл, то из этого нельзя заключить, что они имеют разный состав, поскольку случайная погрешность измерения объемов титранта составляет несколько сотых миллилитра (см. пример 1 на с. 14).

Подобное различие случайных величин, которое (при некоторой доверительной вероятности) может быть обусловлено только случайными причинами, в математической статистике называется незначимым. Очевидно, что если две величины различаются незначимо, то их можно рассматривать как два приближенных значения одного и того же, общего результата измерения. Напротив, значимое, т.е. превышающее уровень случайных погрешностей, различие свидетельствует о том, что соответствующие величины представляют собой два действительно разных результата. Естественно, различие можно считать значимым только тогда, когда оно достаточно велико. Граница, отделяющая значимые различия от незначимых, называется критической величиной. Ее можно рассчитать с помощью методов теории вероятностей.

Таким образом, задача сравнения результатов химического анализа состоит в том, чтобы выяснить, является ли различие между ними значимым. Сравнивать данные химического состава (и, шире, - любые экспериментальные данные) по обычным арифметическим правилам недопустимо! Вместо этого следует применять специальные приемы, называемые статистическими тестами или критериями проверки статистических гипотез. С некоторыми простейшими и в то же время наиболее важными для химика-аналитика статистическими тестами мы сейчас познакомимся.
Сравнение среднего и константы: простой тест Стьюдента
Вернемся к задаче проверки правильности результата химического анализа путем сравнения его с независимыми данными. Проверяемый результат, являясь средним из нескольких параллельных определений, представляет собой случайную величину . Результат же, используемый для сравнения, в ряде случаев можно считать точной (действительной) величиной a, т.е. константой. Это может быть тогда, когда случайная погрешность результата, используемого для сравнения, намного меньше, чем проверяемого, т.е. пренебрежимо мала. Например, в способе "введено-найдено" введенное содержание определяемого компонента обычно известно значительно точнее, чем найденное. Аналогично, при использовании СО паспортное значение содержания также можно считать точной величиной. Наконец, и при анализе образца независимым методом содержание компонента может быть определено с точностью, намного превышающей точность проверяемой методики, например, при проверке атомно-эмиссионной методики с помощью гравиметрической (о типичных величинах случайной погрешности различных методов см. с. 9). Во всех этих случаях задача сравнения данных с математической точки зрения сводится к проверке значимости отличия случайной величины от константы a.

Для решения этой задачи можно использовать уже известный нам подход, описанный выше (с. 13) и основанный на интервальной оценке неопределенности величины . Доверительный интервал для среднего, рассчитанный по формуле Стьюдента (16), характеризует неопределенность значения , обусловленную его случайной погрешностью. Поэтому если величина a входит в этот доверительный интервал, утверждать, что различие между и a значимо, нет оснований. Если же величина a в этот интервал не входит, различие между и a следует считать значимым. Таким образом, полуширина доверительного интервала, равная , является критической величиной для разности : различие является значимым, если


>. (17)
Для проверки значимости различия между средним и константой вместо вычисления доверительного интервала можно поступить следующим образом. Легко видеть, что выражение (17) эквивалентно выражению
. (18)
Величина, стоящая в левой части выражения (18), характеризует степень различия между и a с учетом случайной погрешности s(x). Она называется тестовой статистикой (и в общем случае обозначается в дальнейшем как ) для сравниваемых значений. Коэффициент Стьюдента, стоящий в правой части выражения (18), в этом случае непосредственно является критической величиной. Поэтому для проверки значимости различия между и a можно вычислить соответствующую тестовую статистику и сравнить ее с критическим значением, в данном случае табличным значением коэффициента Стьюдента. Если тестовая статистика превосходит критическое значение, различие между сравниваемыми величинами следует признать значимым.

Описанный способ сравнения случайных величин - вычисление тестовой статистики и сравнение ее с табличным критическим значением - является весьма общим. На таком принципе основано множество статистических тестов (или критериев) - процедур, призванных установить значимость различия между теми или иными случайными величинами. Тест, представленный формулой (18) и предназначенный для сравнения среднего значения и константы, называется простым тестом Стьюдента. В химическом анализе его следует применять всегда, когда возникает задача сравнения результатов анализа с каким-либо значением, которое можно считать точной величиной.



Пример 2. При определении никеля в стандартном образце сплава получена серия значений (% масс.) 12.11, 12.44, 12.32, 12.28, 12.42. Содержание никеля согласно паспорту образца - 12.38%. Содержит ли использованная методика систематическую погрешность?

Решение. Паспортное содержание никеля считаем действительным (точным) значением и применяем простой тест Стьюдента. Имеем:
s(x)=0.132, n=5, f=4, a=12.38.

 = = = 1.12 < t(P=0.95, f=4)=2.78.


Отличие результата анализа от действительного значения незначимо, методика не содержит систематической погрешности.

К этому выводу можно прийти и путем непосредственного расчета доверительного интервала среднего значения результатов анализа (формула (16)):


.
Паспортное содержание никеля попадает в доверительный интервал.
Сравнение двух средних. Модифицированный тест Стьюдента
При интерпретации результатов химического анализа возникают и более сложные задачи. Предположим, необходимо сравнить два результата анализа одного и того же образца, полученные разными методами, и при этом оба результата содержат сравнимые между собой случайные погрешности. В этом случае уже нельзя ни один из результатов считать точной величиной и, соответственно, применять простой тест Стьюдента. Математически задача сводится в этом случае к установлению значимости различия между двумя средними значениями и .

Для решения этой задачи используют модифицированный тест Стьюдента. Он существует в двух вариантах: точном и приближенном. Точный вариант применяют тогда, когда дисперсии соответствующих величин и различаются незначимо (что, в свою очередь, необходимо предварительно проверить с помощью еще одного статистического теста - теста Фишера, см. следующий раздел). При значимом различии и применяют приближенный вариант (приближение Уэлча).



В точном варианте модифицированного теста Стьюдента тестовая статистика вычисляется как
. (19)
Как видим, по способу вычисления она весьма похожа на тестовую статистику простого теста Стьюдента (см. формулу (18)). В выражении (19) n1 и n2 - числа параллельных значений, из которых рассчитаны величины и , соответственно, а - среднее стандартное отклонение, вычисляемое как
. (20)
Величины f1 и f2 - числа степеней свободы соответствующих дисперсий, равные n1-1 и n2-1. Критическим значением служит коэффициент Стьюдента t(P,f) для выбранной доверительной вероятности P (обычно 0.95) и числа степеней свободы
f=f1+f2=n1+n2-2 . (21)
Таким образом, значимое различие между и имеет место тогда, когда
. (22)
В приближении Уэлча тестовая статистика вычисляется следующим образом:

. (23)
Критическим значением вновь служит коэффициент Стьюдента t(P,f). Число степеней свободы в этом случае вычисляется как
(24)
и округляется до ближайшего целого числа. Приближенный вариант теста Стьюдента недостаточно достоверен, особенно при малых значениях f1 и f2. На практике тест Стьюдента-Уэлча применяют очень редко. Вместо него почти всегда можно использовать простой вариант теста Стьюдента (см. пример 4).
Сравнение воспроизводимостей двух серий данных. Тест Фишера
Для выбора между точным и приближенным вариантом модифицированного теста Стьюдента необходимо предварительно установить, есть ли значимое различие между величинами и , т.е. воспроизводимостями обеих серий данных. Разумеется, задача сравнения воспроизводимостей имеет и вполне самостоятельное значение.

Как и средние , дисперсии s2 тоже представляют собой случайные величины. Поэтому сравнивать их тоже нужно с использованием соответствующих статистических тестов. Тест для сравнения двух дисперсий был предложен английским биологом Р. Фишером и носит его имя.

В тесте Фишера тестовой статистикой служит отношение большей дисперсии к меньшей:
. (25)
Подчеркнем, что необходимо, чтобы и, соответственно, 1, в противном случае индексы следует поменять местами. Критическим значением служит специальный коэффициент Фишера F(P, f1, f2), зависящий от трех параметров - доверительной вероятности P и чисел степеней свободы f1 и f2 дисперсий и , соответственно. Значения коэффициентов Фишера для стандартной доверительной вероятности P=0.95 приведены в табл. 2 (приложение). Следует обратить внимание, что F(f1, f2)F(f2, f1), поэтому при пользовании этой таблицей надо быть очень внимательными.

Если отношение дисперсий (25) меньше, чем соответствующее значение F(P, f1, f2), это означает, что различие между и незначимо - воспроизводимость обеих серий одинакова, или, как говорят, "дисперсии однородны". В этом случае можно вычислить среднюю дисперсию по формуле (20) и пользоваться ею как общей характеристикой воспроизводимости обеих серий. Число степеней свободы этой дисперсии равно f1 + f2. Если же дисперсии неоднородны, вычисление средней дисперсии, очевидно, лишено смысла.

Еще раз обратим внимание, что тест Фишера предназначен для сравнения только воспроизводимостей результатов (т.е. дисперсий), но никак не самих результатов (т.е. средних). Делать какие-либо выводы о различии средних значений, наличии в той или иной серии данных систематической погрешности, различиях в составе образцов и т.д. на основании теста Фишера недопустимо. Для сравнения средних значений после теста Фишера следует применять тест Стьюдента (в той или иной его разновидности).

Пример 3. Примесь тиофена в бензоле (% масс.) определяли спектрофотометрическим (1) и хроматографическим (2) методами. Получили следующие серии данных:

(1) 0.12 0.19 0.16 0.14;

(2) 0.18 0.32 0.24 0.25 0.28.

Известно, что хроматографическая методика не содержит систематической погрешности. Содержит ли систематическую погрешность спектрофотометрическая методика?



Решение. Вычислим средние и дисперсии для обеих серий:

(1) = 0.153, , n1=4, f1=3;

(2) = 0.254, , n2=5, f2=4.

Сравним воспроизводимости серий по тесту Фишера:

==3.0 (делим большую дисперсию на меньшую!)

Критическое значение F(0.95, 4, 3) = 9.1 (не F(0.95, 3, 4)= 6.6!)

Получаем <F, воспроизводимости данных одинаковы. Поэтому вычисляем среднее стандартное отклонение и применяем точный вариант теста Стьюдента:
= 0.0437;

= 3.27 t(P=0.95, f=7) = 2.37.
Видно, что >t, средние различаются значимо, спектрофотометрическая методика содержит систематическую погрешность (отрицательную).

Пример 4. В образце сплава определили медь спектрографическим атомно-эмиссионным (1) и титриметрическим (2) методами. Получены следующие результаты (% масс.).

(1) 12.1 14.1 13.6 14.8;

(2) 13.40 13.75 13.65 13.58 13.60 13.45.

Известно, что титриметрическая методика не содержит систематической погрешности. Содержит ли систематическую погрешность атомно-эмиссионная методика?



Решение. Вычислим средние и дисперсии для обеих серий:

(1) = 13.65, , n1=4, f1=3;

(2) = 13.57, , n2=6, f2=5.

Сравним воспроизводимости данных по тесту Фишера:


==78.8
Критическое значение F(0.95, 3, 5) = 5.4, >F, воспроизводимости данных различаются. Для сравнения средних значений применяем приближенный тест Стьюдента-Уэлча:
= 0.14, = 3.05 ~ 3.
Величина t(P=0.95, f=3) равна 3.18, <t. Поэтому различие между средними незначимо и систематическая погрешность атомно-эмиссионной методики отсутствуют.

На практике тест Стьюдента-Уэлча применяют очень редко. При малых числах степеней свободы коэффициенты Фишера достаточно велики (см. приложение, табл. 2). Поэтому значимое различие в дисперсиях обычно наблюдается только при их большом численном различии. В этом случае меньшей из двух дисперсий можно пренебречь, считать соответствующее среднее точной величиной и, следовательно, применить простой тест Стьюдента.

В данном примере случайная погрешность титриметрических данных намного меньше, чем атомно-эмиссионных, значение 13.57 можно считать точной величиной и применить простой тест Стьюдента:
 = = 0.14 < t(P=0.95, f=3)=3.18.
И в этом случае также делаем вывод об отсутствии систематической погрешности атомно-эмиссионной методики.
Выявление промахов. Q-тест
В обрабатываемой серии данных должны отсутствовать промахи (с. 8). Поэтому прежде, чем проводить любую обработку данных (начиная с вычисления среднего), следует выяснить, содержит ли она промахи, и если да, то исключить их из рассмотрения. Для выявления промахов служит еще один статистический тест, называемый Q-тестом.

Алгоритм Q-теста состоит в следующем. Серию данных упорядочивают по возрастанию: x1x2  ...  xn-1xn. В качестве возможного промаха рассматривают одно из крайних значений x1 или xn - то, которое дальше отстоит от соседнего значения, т.е. для которого больше разность x2-x1 либо, соответственно, xn-xn-1. Обозначим эту разность как W1. Размах всей серии, т.е. разность между максимальным и минимальным значением xn-x1, обозначим W0. Тестовой статистикой является отношение


. (26)
Эта величина заключена в пределах от 0 до 1. Чем дальше отстоит "подозрительное" значение от основной массы данных, тем выше вероятность того, что это промах - и тем больше, в свою очередь, величина . Критической величиной служит табличное значение Q-коэффициента Q(P, n) (табл. 3, приложение), зависящее от доверительной вероятности и общего числа данных в серии. Если тестовая статистика превышает критическую величину (>Q), соответствующее значение считают промахом и из серии данных исключают. После этого следует проверить на наличие промахов оставшиеся данные (с другим значением Q), поскольку промах в серии может быть не один.

При применении Q-теста вместо стандартной доверительной вероятности, равной 0.95, обычно используют значение P=0.90. Наиболее достоверные результаты получаются при n=5-7. Для серий большего или меньшего размера Q-тест недостаточно надежен.



следующая страница >>