Всем добрый день,
Я начинаю программировать на Biopython и мне интересно, как извлечь последовательности генов и идентификаторы белков из файла GenBank генома (*.gb), имеющего координаты всех признаков.
Моя идея состоит в том, чтобы создать текстовый файл, содержащий идентификаторы белков, координаты генов и последовательности генов.
Если у вас есть какие-либо идеи, я был бы очень признателен за них.
Я пробовал это до сих пор:
for seq_record in seq_record.features:
if seq_record.type == 'CDS':
x=seq_record.qualifiers['protein_id']
i=seq_record.location._start.position
f=seq_record.location._end.position
sq = seq_record.seq
FEAT_LIST.append('START END STRAND ID')
FEAT_LIST.append(str(((i, f), s, x, sq)))
print(FEAT_LIST)
Однако я получаю эту ошибку: sq = seq_record.seq AttributeError: объект «SeqFeature» не имеет атрибута «seq».
Спасибо за помощь.