Rambler's Top100


logo














 

Калькулятор CO2

 

Биотест на улитках АКВАРИУМНАЯ ГИДРОХИМИЯ
Статистическая обработка биотеста

Улитка на склоне, или стоит ли верить биотесту?

Сама методика биотеста изложена здесь.

    Биотест - это эксперимент, результатам которого можно верить, а можно не верить.
    А результатам биотеста на улитках от Живой Воды - VW-тесту можно верить? Сейчас узнаем. Однако, для начала результаты эксперимента надо обсчитать.

    Опять обратимся к картинке таблицы Microsoft Exel, в которую занесены результаты биотестирования. Дальнейшее изложение будет понятнее, если файл обсчета результатов будет перед глазами.

Биотест от Живой Воды - VW-биотест
О том, как обсчитать результаты биотеста, пользуясь этим файлом, написано здесь, и здесь же можно его скачать, а также прочитать о самом порядке проведения биотеста

    Остановимся на некоторых свойствах результатов, которые улитки показали, отыскивая пищевую приманку в предварительных экспериментах. Для этого представим полученные данные в виде гистограммы:

Представление результатов, показанных отдельными улитками в предварительном этапе биотестирования, в виде гистограммы

    Эта картинка получилась в результате объединения близких по своей численной величине значений в группы ("карманы" с заданными временными интервалами). Видно, что большинство результатов "стремятся" не слишком сильно отличаться от средней арифметической для всей выборки (всего в ней 60 значений, n=60). Самые высокие столбики, то есть карманы, куда попало больше всего отдельных результатов, расположены вблизи этой средней (3.8). Эта тенденция проявится в полной мере, если получить не 60, а полторы - две сотни результатов*. Значения, сильно отличающиеся от средней, будут встречаться редко, причем тем реже, чем сильнее их отличие. Графически эту ситуацию можно представить так:

Вид гистограммы при увеличении числа использованных улиток с 60 до 144

    Кубики на картинке и есть отдельные наблюдения (результаты). Чем больше в карман попало отдельных наблюдений, тем выше столбик. Красной стрелочкой отмечен интервал, в который включает в себя среднее арифметическое значение всех этих результатов - в нем оказалось больше всего отдельных наблюдений.
    В предварительных экспериментах мы получили совокупность результатов, величины которых по частоте встречаемости могут быть распределены определенном образом, или распределение. В нашем случае распределение получится близким к нормальному. Если число отдельных наблюдений сделать очень большим, то графически его можно представить в виде гауссовой кривой.

Нормальные распределения с одинаковым средним и разными стандартными отклонениями

    Кривая нормального распределения описывается двумя параметрами: средним значением и стандартным отклонением. Среднее значение определяет расположение кривой относительно оси X. Рассчитывают его по формуле:

Формула

    где xi - значения отдельных наблюдений, n - количество наблюдений. Среднее арифметическое для результатов предварительных экспериментов (цифры в зеленом поле) равно 3.8.
    Стандартное отклонение (S) - это мера того, насколько широко разбросаны точки данных относительно их среднего арифметического:

Формула

    От величины стандартного отклонения зависит форма кривой. При уменьшении этого параметра кривая становится более высокой и "острой". Для данных в зеленом поле S=1.5 (на картинке эта величина не показана). На рисунке вверху имеются две гауссовые кривые. Среднее у них одно и тоже, но стандартные отклонения разные. Распределение, представленное более острой кривой, получено из "пологого" следующим образом. Из исходного "пологого" распределения делались случайные выборки заданной численности (N), в этих выборках определялись средние и уже из величин этих средних было составлено новое распределение - распределение выборочных средних. Среднее распределения выборочных средних всегда будет таким же, как и у распределения откуда эти выборки делались (если только это на самом деле случайные выборки), а стандартное отклонение (SM) окажется существенно меньше. Оно определяется по формуле:

Формула

    В биотестировании важно, чтобы получаемые результаты представляли собой как можно более "острое" распределение. От этого зависит чувствительность метода. Большая часть (какая именно будет объяснено ниже) значений такого распределения умещается в интервале, характеризующим "норму", непопадание в него результата биотестирования будет говорить о "патологии", то есть о токсическом действии. Поэтому, более пологое распределение значений "нормы", охватывающее больший временной интервал загрубляет метод: относительно небольшие отклонения, которые на самом деле вызваны токсическим действием, будут отнесены к норме. Вот почему мы использовали средние значения из выборок по 6 улиток, причем крайние результаты отбрасывали, оставляя только четыре значения, по которым определялось выборочное среднее**. Цифры при оценке стандартного отклонения распределения выборочных средних у нас получились такими: N=4, квадратный корень=2, а SM=S:2=1.5:2=0.75
    При проведении биотеста случайная выборка улиток (мы их выбирали из аквариума наугад) подвергалась действию испытуемой воды, а затем эти улитки искали корм. Нами принималась нулевая гипотеза: испытуемая вода никак не изменяет пищевые реакции тест-организмов и определенное по результатам этого эксперимента выборочное среднее должно принадлежать к распределению других выборочных средних, заранее установленных в предварительных экспериментах. Эта гипотеза проверялась при помощи Z-оценки. В таблицах Microsoft Exel эта операция выполняется с помощью функции "нормализация". Формула расчета Z-оценки следующая:

Формула

    где X с двумя черточками сверху - выборочное среднее для группы улиток, использованной в биотесте.
    Вот теперь я показал все формулы, которые используются при обработке результатов в нашем VW-биотесте. В упомянутый выше "экселевский" файл они все должным образом вмонтированы и этим файлом можно пользоваться ни во что не вникая - только результаты в выделенные цветом поля подставлять. Но по приведенным формулам желающие могут проделать все расчеты самостоятельно.
    Конечным итогом этих расчетов будет Z-оценка. Какие выводы о результатах биотеста она позволяет сделать?
    Z-оценка какого-либо элемента в распределении показывает на сколько единиц стандартных отклонений данный элемент больше или меньше средней его ряда распределения. В том случае, если это распределение близко к нормальному, пользуясь таблицей площадей кривых нормального распределения, можно оценить вероятность получения того или иного результата. Таким образом, Z-оценка является, по сути, вероятностной мерой степени отклонения тест-функции от нормы. С помощью Z-оценки легко определить вероятность получения результатов с различными численными значениями. Посмотрим на самую первую картинку в начале материала, ту, что рядом с заголовком. Там улитка ползет по кривой нормального распределения. Эта кривая и ось X ограничивают некоторую площадь (площадь под кривой), которая соответствует распределению всех возможных результатов. Если восстановить перпендикуляр от среднего значения до пересечения с кривой, то вся площадь разобьется на две равные части. Половина всех значений распределения окажется меньше средней, а половина больше. На оси X в обе стороны от значения средней отложены величины стандартных отклонений. Свойство нормального распределения таково, что область, имеющая в своем основании одно стандартное отклонение и примыкающая к средней, охватывает 34% от всех возможных результатов. То есть, если Z-оценка какого-либо результата лежит в пределах 0-1, то вероятность получить таковой составляет 34%. Далее кривая круто понижается и вероятность получения результатов, Z-оценка которых более 1 заметно падает: для интервала 1-2 она составляет только 13.5%. А вот вместе эти два интервала охватят уже 47.5% всех наблюдений. Если рассмотреть область, имеющую своим основанием участок оси X на два стандартных отклонения уходящую в обе стороны от среднего значения распределения (точки, где Z=0), то получится такая картинка:

Вероятности получения результата в зависимости от его Z-оценки

    Неохваченными останутся только два "хвоста", вероятность попадания в которые составляет только 5%. Эти "хвосты" уходят в бесконечность все более приближаясь к оси X. Несмотря на их немеренную, длину, площадь под ними очень мала Надо отметить, что если быть более точным, то "девяностопятипроцентная" область перекрывается величинами Z-оценок плюс-минус 1.96. Вот теперь вернемся к нашей нулевой гипотезе, предполагающей, что испытуемая вода всегда нетоксична. Допустим, что мы провели биотест и получили результат (у нас это будет выборочная средняя времени поиска пищевой приманки), Z-оценка которого равна 0.5. Мы можем сделать вывод, что нами получен вполне обычный для данного распределения (что по сути означает "для нашей совокупности улиток") результат. Область в плюс-минус 1Z охватывает 68% всех возможных результатов, которые в норме показывают наши улитки. Вот они и показали один из них. Мы принимаем нулевую гипотезу: вода не токсична, так как результат биотестирования обычен. Но вот другой пример. Z-оценка результата равна 2,3 (как на картинке "эксельного" файла в начале статьи), то есть результат оказался в одном из "хвостов" распределения. Вероятность получить результат из области "хвостов" менее 5%***. В норме (то есть в предварительных экспериментах) только 5 шестерок из 100, могли бы показать результаты столь сильно отклоняющиеся от среднего значения. Поэтому вряд ли такой результат можно считать обычным для наших улиток. Мы в праве отвергнуть нулевую гипотезу и признать испытуемую воду токсичной, причем вероятность того, что мы ошиблись составит всего 5%. В таких случаях говорят, что мы отвергли нулевую гипотезу (о нетоксичности) при уровне значимости 0.05. Это стандартный для многих токсикологических исследований уровень. Тестам работающим с такой статистической достоверностью вполне можно доверять.
    На приведенном выше рисунке в голубом поле показаны значения реального времени для использованной мною популяции улиток. Это позволяет сразу после проведения биотеста подсчитать среднее значение и прикинуть токсична проба иди нет. (Не забывайте, что у вас будет свое распределение значений и цифры будут иными. Только Z-оценки являются универсальными единицами отклонения экспериментальных значений от нормы, а абсолютные цифры - нет).
    Только что мы рассмотрели теоретические основы VW-биотеста. Теперь отметим несколько важных в практическом плане моментов. Все описанные выше теоретические построения абсолютно верны только, если контрольных опытов на предварительном этапе будет сделано очень много (многие сотни). На самом деле так никогда не бывает - делать сотни однообразных опытов лень, да и некогда. Предварительные гонки из 15 заездов, в ходе которых будет получено 60 отдельных результатов, вот тот минимальный объем работы, который необходим для того, чтобы этот тест представлял практическую ценность. При этом его точность будет меньше теоретической, так как в качестве параметров используемого в тесте распределения, характеризующего поведение нашей совокупности улиток, мы использовали не истинные значения среднего и стандартного отклонения, а их оценки, сделанные по выборке с n=60. Впрочем, это обычнейшая ситуация для научных экспериментов - делать очень много отдельных испытаний - это дорого и долго, да и нужды в этом особой нет: с высокой степенью приближения к истине все работает и так. Однако надо иметь в виду, что Z-оценка превосходящая +1.96 или меньшая -1.96 говорит лишь о высокой вероятности токсического действия воды. Для полной уверенности, стоит повторить биотест хотя бы еще на одной шестерке улиток.
    Положительной особенностью этого теста является, то, что он работает в очень широком диапазоне значений Z-оценок. Приведенный ниже рисунок иллюстрирует этот тезис.

Границы применимости VW-биотеста

    Совершенно очевидно, что получив результат, отмеченный стрелочкой, можно отбросить прочь все сомнения о токсичности испытуемой воды, а такие результаты в реальной практике не такая уж редкость. Улитки перестают целенаправленно искать корм (то есть выбранная тест-функция исчерпывает свои возможности) при значениях Z больших 7-8. Таким образом, определяемая при тестировании Z-оценка, может использоваться и как мера токсичности, позволяющая сравнивать разные пробы воды между собой. При этом и полученная в опыте Z-оценка равная 3 тоже не должна вызывать никаких сомнений относительно верности нулевой гипотезы, которая в этом случае может быть принята только с вероятностью менее 0.27%. Такой вероятностью смело можно пренебречь.

В. Ковалёв, кандидат биологических наук.

Вернуться к статье: "Биотестирование в домашних условиях, часть II".

* Такие опыты на самом деле были проведены мною вместе с Н.Е.Шуваловой. Была получена достаточно многочисленная выборка (n=160) и с помощью критерия Колмогорова доказано, что распределение результатов близко к нормальному.
Вернуться к тексту

** С точки зрения статистика выбрасывание крайних значений неправильно. Но тут в силу вступают другие соображения. Мы ведь оцениваем только пищевое поведение улиток. А крайние результаты скорее всего к нему не относятся. Самый быстрый часто получается при случайной находке корма, а последняя улитка, как правило, просто занята чем-то другим (не поиском пищевой приманки). Биотесты, основанные на поведении тест-организма, с точки зрения биолога чувствительны и информативны, но их статистическая обработка всегда представляет собой некоторую "головную боль", в том смысле, что надо обсчитывать именно то поведение, которое характеризует используемую в методе тест-функцию.
Вернуться к тексту

*** Здесь мы рассматриваем так называемых "двусторонний тест", когда не важно в сторону больших или меньших значений отклонился результат. Если мы решим, что токсичность проявляется только в замедлении поиска приманки, то для нас представляла бы интерес только область, лежащая в двух стандартных отклонениях справа от средней. А вероятность попасть туда составляет менее 2,5%.
Вернуться к тексту


Наверх   На Главную страницу

Rambler's Top100      Рейтинг@Mail.ru     

Аквариум. Современная Аквариумистика.
Правообладатель: Живая Вода®   Любые способы полного или частичного копирования и публикации данного текста и иллюстраций без письменного разрешения администрации интернет-ресурса vitawater.ru запрещены.

   © Живая Вода, 2001-2016 гг.   @webmaster

Реклама