Анализ показателей разнообразия STR-локусов в выборках производителей красной скандинавской и голштинской пород
Аннотация
Методами одно-двухмерной и многомерной статистики анализ и ровалистандартизированные показатели α- и β-разнообразия (𝒚𝒌𝒎 ′ ), рассчитанные по микросателлитам ДНК (STR) в выборках быков красной скандинавской (RED, n = 29) и голштинской (HOL, n = 45) пород (в каждой по три субвыборки). Данные представляли две матрицы 11×7: объекты – 11 STR-локусов (Eth3, Inra23, Tgla227, Tgla126, Tgla122, Sps115, Eth225, Tgla53, Bm2113, Bm1824, Eth10; №№1-11), переменные – три показателя α-разнообразия (число аллелей и эффективных аллелей на локус, гетерозиготность) и четыре – β-разнообразия (индексы:фиксации по Nei, дифференциации по Meirmans-Hedrick, Jost и Shannon-Sherwin). ANOVA по модели фиксированного типа выявил статистически значимое (pvalue< 0,02) влияние на изменчивость 𝒚𝒌𝒎 ′ факторов «порода» (2 %), «локус» (36,7 %) и их взаимодействие (15,6 %). По модели смешанного типа (фактор «локус» как случайный) статистически значимым установлен только эффект взаимодействия (25,8 %, pvalue< 0,0001). Вероятность несовпадения номеров наугад выбранной пары локусов из RED- и HOL-выборок составила 31 %. Усреднённая евклидова дистанция между двумя выборками, рассчитанная по однономерным локусам, составила 37,8±5,35 %. Корреляция Мантеля между матрицами парных межлокусных дистанций в RED- и HOL-выборках была 0,257±0,130 (pvalue = 0,056). Ординации локусов и их группировка (структурирование) в пространстве двух главных компонент выборки REL и выборки HOL отличались (прокрустов тест: m2 = 0,994, m12 = 0,747, pperm = 0,164, 𝒓𝟐𝑷𝒓𝒐𝒄 = 0,253). Оценки расстояния между выборками по профилям показателей α- и β-разнообразия локусов не противоречили, в общем, генетическим дистанциям, рассчитанным по аллельным частотам (29–37 %). Для анализа ковариации (общности) многомерных данных RED и HOL выборок использовали двухблочный метод частных наименьших квадратов (2B-PLS). Интегрированные латентные переменные (LV) максимизировали общий квадрат ковариации («squaredcovar» = 14,3 %), в котором 83 % приходилось на первую LV с max «весами» по показателям α-разнообразия (αLV). На вторую LV приходилось 16,7 % с max «весами» по показателям β-разнообразия (βLV). Линейная связь между RED и HOL выборками по αlV составила 0,717 (pvalue = 0,013), по βLV–0,395 (pvalue = 0,229), усреднённая – 0,56 (pvalue = 0,025). Общность (ко-дисперсия) двух выборок по αLV и Βlv оценивалась в 25,0–32,5 %. 2B-PLS-анализ по редуцированным данным (только по α-разнообразию) показал max «squaredcovar» 0,393, в которой 99,9 % приходилось на первую LV (LV1). По LV1 линейная связь между RED- и HOL- выборками оценивалась в 0,659 (pvalue = 0,0253), ко-дисперсия – в 43,4 % (по αLV была 51,4 %). Ординации локусов в пространстве координат выборок RED и HOL по полному (αLV) и редуцированному (LV1) наборам данных имели хорошее соответствие (прокрустов тест: m2 = 0,0742, m12 = 0,0728, pperm = 0,001, 𝒓2𝑷𝒓𝒐𝒄 = 0,927).В структуре межвыборочной ковариации выделялись «сгустки» локусов с бутстрэп-вероятностью [группировки] 50, 75 и 100 %. Можно полагать, что RED и HOL выборки имели некоторую согласованность (конгруэнтность) по показателям α-разнообразия одноимённых локусов. Распространение «многомерного» подхода на описательную статистику α-разнообразия 7 пород молочного скота и 11 пород свиней показало достаточно хорошее соответствие результатов (индекс дифференциации, РСА-ординация) с таковыми, полученными при использовании «традиционных» методов (pperm соответствия ординаций 0,054 и 0,004).Рассмотренные подходы и методы расширяют возможности популяционно-генетических [и селекционно-зоотехнических] исследований, в которых многомерные наборы данных являются нормой, а не исключением.