У меня есть относительно большой выходной файл blastn. Поскольку нет возможности указать минимальную длину последовательности запроса в нуклеотидах, моя идея состоит в том, чтобы искать ее после запуска с помощью awk.
пример файла такой:
> abc
Length=4553119
Score = 273 bits (302), Expect = 3e-74
Identities = 151/151 (100%), Gaps = 0/151 (0%)
Strand=Plus/Plus
Query 1 CCCACATCGAACTCGACGGTGACCATTCCCATGTTGCGCCGGGACGCCGAGTAGACGTGC 60
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 4297151 CCCACATCGAACTCGACGGTGACCATTCCCATGTTGCGCCGGGACGCCGAGTAGACGTGC 4297210
Query 61 TTGACCCCCGGAATTTCGCTCATGATGCGCTCGAGCGGCTGCATCGCCAGGTTCGACACC 120
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 4297211 TTGACCCCCGGAATTTCGCTCATGATGCGCTCGAGCGGCTGCATCGCCAGGTTCGACACC 4297270
Query 121 TGCTGCGCGGAGGCCCCCGGGTACTGCACCA 151
|||||||||||||||||||||||||||||||
Sbjct 4297271 TGCTGCGCGGAGGCCCCCGGGTACTGCACCA 4297301
Score = 28.3 bits (30), Expect = 1.7
Identities = 15/15 (100%), Gaps = 0/15 (0%)
Strand=Plus/Minus
Query 97 GGCTGCATCGCCAGG 111
|||||||||||||||
Sbjct 63261 GGCTGCATCGCCAGG 63247
используя awk, я ищу все строки, содержащие Identities = [>=50]
awk 'Identities = >= 50'
Меня не волнует остальная часть строки (начиная с /151 (100%)
).
но я получаю синтаксическую ошибку, так как мне поместить туда «больше и равно»?
I do not care about the rest of the line (from /151 (100%) on).
, вы имеете в виду, что не хотите, чтобы он проверялся как часть сравнения ввода, или вы не хотите, чтобы он печатался как часть вывода, или и то, и другое, или что-то еще? отредактируйте свой вопрос, чтобы показать точный ожидаемый результат, чтобы помочь уточнить. Требования по английскому языку полезны, но неоднозначны и расплывчаты - очень нужны полные конкретные примеры! - person Ed Morton   schedule 26.05.2017Identities
, поэтому строка, начинающаяся сSbjct
), если условие (›=50) выполняется - person rororo   schedule 26.05.2017Sbjct
, или 5-ю строку послеIdentify
, или если любой критерий работает одинаково или что-то другое. Похоже, то, что вы хотите, вероятно, абсолютно тривиально, если вы можете просто четко указать, что это такое. - person Ed Morton   schedule 26.05.2017