Как изменить последовательность записи GenBank?

Что я хотел бы сделать, так это сделать все не предполагаемые последовательности записи GenBank в нижнем регистре в файле генома.

До сих пор мне удалось получить начальное и конечное расположение белков в gbk. Оттуда я делаю следующее:

start = feature.location.nofuzzy_start
end = feature.location.nofuzzy_end
gb_record.seq[start:end]

Теперь у меня есть начальное и конечное расположение последовательности в геноме. Но как изменить файл генома? gb_record.seq[start:end].lower() или что-то подобное не помогло.

Когда я назначаю gb_record.seq = gb_record.seq[start:end].lower, это явно идет не так, как я заменяю файл генома. Любые идеи?


person Jasper    schedule 12.03.2012    source источник
comment
Решение: решение найдено, но на самом деле это не решение для биопитона. Сначала поместите файл genome.seq в строковый файл генома. genome = str(gb_record.seq) Затем при переходе через gb_record.featers start = feature.location.nofuzzy_start end = feature.location.nofuzzy_end upper = genome[start:end] lower = genome[start:end].lower() genome = genome.replace(upper,lower)....... Извините за форматирование, но я не могу сам дать решение (не разрешено)   -  person Jasper    schedule 12.03.2012


Ответы (1)


Bio.Seq.Seq объектов есть метод lower(), который что вы ищете.

Работая над своим кодом, вы получите:

seq_lower = gb_record.seq.lower()

Затем вы сможете использовать модуль SeqIO для записи последовательностей в нижнем регистре в файл.

from Bio import SeqIO

with open("example.fasta", 'w') as handle:
    SeqIO.write(lower_records, handle, 'fasta')
person David Cain    schedule 01.04.2012