Я пытаюсь использовать adegent в R для расчета D Tajima. У меня есть объект DNA.bin, содержащий мои последовательности из разных популяций. Последовательности имеют разную длину из-за SNP и вставок в них. Я получаю следующую ошибку при запуске функции tajima.test:
Ошибка в as.matrix.DNAbin(x): последовательности ДНК в списке не одинаковой длины.
Как можно вычислить D Тадзимы для последовательностей разной длины?
Вот что я сделал до сих пор:
x <- structure(c("55548", "43297", "35309", "34468", "AATTCAATGCTCGGGAAGCAAGGAAAGCTGGGGACCAACTTCTCTTGGAGACATGAGCTTAGTGCAGTTAGATCGGAAGAGCA", "AATTCCTAAAACACCAATCAAGTTGGTGTTGCTAATTTCAACACCAACTTGTTGATCTTCACGTTCACAACCGTCTTCACGTT", "AATTCACCACCACCACTAGCATACCATCCACCTCCATCACCACCACCGGTTAAGATCGGAAGAGCACACTCTGAACTGTAAACCCAGTC", "AATTCTATTGGTCATCACAATGGTGGTCCGTGGCTCACGTGCGTTCCTTGTGCAGGTCAACAGGTCAAGTTAAGATCGGAAGA"), .Dim = c(4L, 2L))
y <- t(sapply(strsplit(x[,2],""), tolower))
my.dnabin <- as.DNAbin(y)
tajima.test(my.dnabin)
tajima.test
изpegas
? Вadegenet
его нет. Ваши последовательности ДНК должны быть выровнены внутри объекта DNA.bin, поэтому все они должны быть одинакового размера. Попробуйте включить некоторые данные в вопрос - person jeremycg   schedule 23.10.2015