Я пытаюсь запустить blastn через biopython с помощью NCBIWWW.
Я использую функцию qblast для заданного файла примера.
У меня определено несколько методов, и все работает как шарм, когда мой fasta содержит достаточно длинные последовательности. . Единственный случай, когда он терпит неудачу, это когда мне нужно взорвать чтения, поступающие от секвенирования Illumina, которые слишком короткие. Так что я бы сказал, что это, вероятно, связано с тем, что нет автоматического переопределения параметров взрывания при сдаче работы.
Я пробовал все, что мог, чтобы приблизиться к условиям короткого замыкания (см. таблицу C2 из здесь) без какого-либо успеха.
Похоже, я не могу ввести правильные параметры.
Чем ближе, я думаю, я подошел к рабочей ситуации со следующим:
result_handle = NCBIWWW.qblast("blastn", "nr",
fastaSequence,
word_size=7,
gapcosts='5 2',
nucl_reward=1,
nucl_penalty='-3',
expect=1000)
Спасибо за любой совет / совет, чтобы заставить его работать.
Мой пример быстрого чтения следующий:
>TEST 1-211670
AGACTGCGATCCGAACTGAGAAC
Ошибка, которую я получаю, следующая:
>ValueError: Error message from NCBI: Message ID#24 Error: Failed to read the Blast query: Protein FASTA provided for nucleotide sequence
И когда я смотрю на эту страницу, она кажется, что моя проблема связана с исправлением порога, но, очевидно, мне пока не удалось заставить его работать.
Спасибо за любую помощь.