Математические методы обработки исходных данных
Методика морфометрических исследований может быть самой разнообразной. Это подсчет меристических признаков, простое на хождение линейных размеров признаков, выражение одного признака в простом, процентном или продецимильном отношении к другому (метод индексов), выражение зависимости между приз наками в виде линий регрессии, нахождение коэффициентов корреляции и аллометрии,
Обычно зависимость величины одного признака от другого выражается уравнением
где X и Y- размеры двух признаков; — константа; а-коэффи циент аллометрии. При а=1 наблюдается изометрический рост, при a=0 - признаки равны (X=Y), при >1 — положительная аллометрия, при а<1— отрицательная аллометрия [Huxley, 1932).
Морфометрия и биостатистика. В зарубежной ихтиологической литературе для сравнения морфологических признаков широко используются уравнения регрессии, в отечественной литературе этот метод применяется сравнительно редко. Более широкое при менение у нас нашел метод индексов. К нам он пришел из работ Гейнке [Heineke, 1898] по сельдевым рыбам, впервые для сигов рода Coregonus этот метод использовал Смитт [Smitt, 1886]. Эта методика сводится к выявлению признаков количественного харак тера, когда между двумя группами рыб по ряду признаков наб людается разрыв (hiatus). Сразвитием методов вариационной статистики и с введением критерия достоверности Стьюдента (t) (в ранних ихтиологических работах он фигурирует как Main) деление на внутривидовые таксономические единицы стали про водить по этому чисто формально-статистическому пути. У нас в стране впервые метод морфометрии для изучения подвидов плотвы, горбуши, а затем и сигов стал широко применять И, Ф. Правдин [1924, 1925, 1931 и др.].
Однако уже в те времена некоторые авторы предостерігалі от чрезмерного дробления видов и увлечения биостатистикоіі [Гуд вил, 1915; Березовский, 1924). Об этом же писал и сам И. Ф. Прав диш [ 1931, с. 171]: «Метод далеко не всегда указывает безусловно дciiствительные различия морфологических признаков в тех случаях, когда формальные (расчисленные) расхождения рядов этих признаков имеются».
Вопрос о достоверності различий двух выборок заслуживает подробного обсуждения, поскольку с математической точки зре ния в «Руководстве по изучению рыб» [Правдин, 1966a) имеется много ошибок. Обычно * для расчета средних значенні X и сред неквадратичного отклонения о пользуются формулозі
Несомненно, что «дифференция рядов» — это переименован НЫії критерий Стьюдента для проверки гипотезы о равенстве средних значений при неравенстве дисперсий признака. Однако эта формула позволяет выявить только грубые различия, а ее применение может привести к нежелательным последствия?.
Малая мощность критерия дифференции становится особенно очевидной, если учесть, что при использовании формулы (3) чис ло степеней свободы f связано с численностью выборок следующим соотношением:
которое при сілытых различиях дисперсий меные суммарной численности примерно вдвое. К сожалению, валяный вопрос () числе степеней свободы при расчете «дифференции» в «Руководстве» совсем не затрагивается. Видимо, по этой причине в последние
В некоторых случаях при ручном счете рекомендуется группировать исходные данные в ряды, что позволяет существенно сократить объем вычислений [Плохинский, 1961; Правдин, 1966а), но при группировке проис ходит потеря информации (Кульбак, 1967].
2 Некоторые авторы предлагают использовать Diff > 8 для меристических признаков и Diff > 10 - для пластических признаков [Кириллов, 1972], наивно полагая, что этим (III повышают достоверность раз. Пчнії.
годы все больше ихтиологов начинают ссылаться на специальные руководства по математической статистике [Урбах, 1964).
Уместно отметить и такую немаловажную деталь. Формула (3) применяется для проверки нуль-гипотезы о равенстве средних значений (H-X, X,), когда заведомо ясна принадлежность выборок к разным популяциям. В практике же ихтиологических исследований чаще бывает противоположное явление, когда при надлежность сравниваемых выборок к разным популяциям неизвестна, а следовательно, и нуль-гипотеза (Н)-Х, =X., o=0,”), и способы ее проверки должны быть иными (Урбах, 1964].
Устранение перечисленных недостатков позволяет существен но улучшить результаты сравнения, однако и такое улучшение может оказаться недостаточным. Дело в том, что рассматриваемые критерии являются «одномерными», т. е, такими, которые используются при измерениях единственного признака и не учитывают его связей со всеми остальными. Поскольку в морфологических исследованиях измеряется некоторое множество признаков, то игнорирование коррелятивной взаимосвязи приводит к существенной потере информации, заключенной в измерениях.
Кроме перечисленных недостатков, нельзя не отметить путаницы в употреблении таких разных понятий, какими являются «достоверность различий средних значений признака» и «различия по учитываемому признаку». Например, из формулы (3) следует, что величина Diff зависит от численности проб и, следовательно, хотя бы по этой причине, не может характеризовать различия или расхождения. Между тем именно в этом смысле употребляется значение Diff на примере анализа сходства и различий биологиче ских форм ІІлотвы по числу чешуй в боковой линии [Правдин, 1966a]. По этой же причине нельзя использовать для этих же це лей среднее по всем признакам значение Diff или их суммировать, Статистические свойства таких показателей не выяснены, поэто му и нет оснований для их применения при решении вопроса о достоверности различий.
Увлечение формально-статистическими методами привело к бесконечному описанию разных внутривидовых форм. Внутривидовая систематика, выраженная в описании подвидов, в руках не которых специалистов, оказавших немалое влияние на развитие науки, превратилась в простое средство формального описания морфологического разнообразия составляющих вид популяций [ Шварц, 1963 ]. Для суждения о структуре вида следует рассматривать вид в целом, в совокупности всех его экологических форм и подвидов. И, хотя в литературе иногда еще появляются описания новых форм на примере только своего местного материала, все же можно полагать, что на сегодняшний день старый формально статистический метод практически себя не оправдал. Таким обра зом, статистически достоверные различия между выборками не мо гут применяться в качестве критерия таксономической близости или расхождения, они предназначены исключительно для проверки гипотезы о равенстве средних значений признака в двух выборках [Андреев, Решетников, 1977]. Об этом всегда следует помнить.
Применявшиеся до сих пор методы морфометрии обладают многими недостаткам: они не составляли целостной системы рас чета, имели слабые возможности уплотнения информации, малую мощность критериев и другие недостатки, что часто приводило к неэффективному использованию исходной информации. Поэтому в последнее время все чаще для этих целей используют математический аппарат теории информации [Кульбак, 1967]. Рассмотрим некоторые из этих методов, которые мы применяли при исследова нии внутри видової їзменчивостiк сигов.