Имею два фаста файла. Каждый файл содержит последовательности коротких геномных участков крысы или мыши с известным видоспецифическим SNP.
File_1 :
>Rat_1
GGTGCCTGTGTATTGCCTCTGTCGACTGCCTTACGATGTGACCCGCTTCATGAT
>Rat_2
AAGCGGCCGGTTTCCTTGGCGACGAAGAGCGCGGGAATTTCAGATAGATTGTAATTGCGGCTGC
>Rat_3
GCAGCCATCTCTGCAACAATTGTGACAATGGCTGAGCCTAGCACAGACCCCAACAAAGAT
File_2 :
>Mouse_1
GGTGCCTGTGTATTACCTCTGTCGACTGCCTTACGATGTGACCCGCTTCATGAT
>Mouse_1_2
AAGCGGCCGGTTTCCTTGGCGTCGAAGAGCGCGGGAATTTCAGATAGATTGTAATTGCGGCTGC
>Mouse_1_3
GCAGCCATCTCTGCAACAATTGTGACAATGGTTGAGCCTAGCACAGACCCCAACAAAGAT
Я хочу найти SNP и извлечь из него около 20 оснований. Результат должен выглядеть примерно так ...
Resut_file :
>Rat_1
CTGTGTATTGCCTCTGTC
^
>Mouse_1
CTGTGTATTACCTCTGTC
^
Просветите меня, мастера программирования !!!
Спасибо.