выравнивание последовательностей ДНК и маркировка SNP

Имею два фаста файла. Каждый файл содержит последовательности коротких геномных участков крысы или мыши с известным видоспецифическим SNP.

File_1 :

>Rat_1
GGTGCCTGTGTATTGCCTCTGTCGACTGCCTTACGATGTGACCCGCTTCATGAT
>Rat_2
AAGCGGCCGGTTTCCTTGGCGACGAAGAGCGCGGGAATTTCAGATAGATTGTAATTGCGGCTGC
>Rat_3
GCAGCCATCTCTGCAACAATTGTGACAATGGCTGAGCCTAGCACAGACCCCAACAAAGAT


File_2 :

>Mouse_1
GGTGCCTGTGTATTACCTCTGTCGACTGCCTTACGATGTGACCCGCTTCATGAT
>Mouse_1_2
AAGCGGCCGGTTTCCTTGGCGTCGAAGAGCGCGGGAATTTCAGATAGATTGTAATTGCGGCTGC
>Mouse_1_3
GCAGCCATCTCTGCAACAATTGTGACAATGGTTGAGCCTAGCACAGACCCCAACAAAGAT

Я хочу найти SNP и извлечь из него около 20 оснований. Результат должен выглядеть примерно так ...

Resut_file :

>Rat_1
CTGTGTATTGCCTCTGTC
         ^  
>Mouse_1
CTGTGTATTACCTCTGTC
         ^ 

Просветите меня, мастера программирования !!!

Спасибо.


person mbk0asis    schedule 27.04.2015    source источник
comment
Это не конкретный вопрос программирования, вы просто хотите, чтобы мы написали вашу программу. Кроме того, мы даже не знаем, что такое SNP, что затрудняет его поиск.   -  person chw21    schedule 27.04.2015


Ответы (1)


Есть много инструментов для вывода различий, таких как vimdiff, diff и т. Д.

Попробуйте посмотреть на аналогичный вопрос здесь

P.S. Задавать такой вопрос здесь неуместно, нужно хотя бы показать, что вы пытались сделать.

person deimus    schedule 27.04.2015