вариант длины для локального взрыва

У меня есть относительно большой выходной файл blastn. Поскольку нет возможности указать минимальную длину последовательности запроса в нуклеотидах, моя идея состоит в том, чтобы искать ее после запуска с помощью awk.

пример файла такой:

> abc
Length=4553119

 Score = 273 bits (302),  Expect = 3e-74
 Identities = 151/151 (100%), Gaps = 0/151 (0%)
 Strand=Plus/Plus

Query  1        CCCACATCGAACTCGACGGTGACCATTCCCATGTTGCGCCGGGACGCCGAGTAGACGTGC  60
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  4297151  CCCACATCGAACTCGACGGTGACCATTCCCATGTTGCGCCGGGACGCCGAGTAGACGTGC  4297210

Query  61       TTGACCCCCGGAATTTCGCTCATGATGCGCTCGAGCGGCTGCATCGCCAGGTTCGACACC  120
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  4297211  TTGACCCCCGGAATTTCGCTCATGATGCGCTCGAGCGGCTGCATCGCCAGGTTCGACACC  4297270

Query  121      TGCTGCGCGGAGGCCCCCGGGTACTGCACCA  151
                |||||||||||||||||||||||||||||||
Sbjct  4297271  TGCTGCGCGGAGGCCCCCGGGTACTGCACCA  4297301


 Score = 28.3 bits (30),  Expect = 1.7
 Identities = 15/15 (100%), Gaps = 0/15 (0%)
 Strand=Plus/Minus

Query  97     GGCTGCATCGCCAGG  111
              |||||||||||||||
Sbjct  63261  GGCTGCATCGCCAGG  63247

используя awk, я ищу все строки, содержащие Identities = [>=50]

awk 'Identities =  >= 50'

Меня не волнует остальная часть строки (начиная с /151 (100%)).

но я получаю синтаксическую ошибку, так как мне поместить туда «больше и равно»?


person rororo    schedule 26.05.2017    source источник
comment
извините за неясность, я хочу значение больше 50, 14 было только примером; Мне нужны все строки с 50/[xx]   -  person rororo    schedule 26.05.2017
comment
извините, я изменил свой вопрос соответственно   -  person rororo    schedule 26.05.2017
comment
Когда вы говорите I do not care about the rest of the line (from /151 (100%) on)., вы имеете в виду, что не хотите, чтобы он проверялся как часть сравнения ввода, или вы не хотите, чтобы он печатался как часть вывода, или и то, и другое, или что-то еще? отредактируйте свой вопрос, чтобы показать точный ожидаемый результат, чтобы помочь уточнить. Требования по английскому языку полезны, но неоднозначны и расплывчаты - очень нужны полные конкретные примеры!   -  person Ed Morton    schedule 26.05.2017
comment
хорошо, на самом деле моя идея решить проблему была другой, чем вы предложили... в любом случае, моя конечная цель - использовать этот шаблон поиска и напечатать 5-ю строку (считая со строки Identities, поэтому строка, начинающаяся с Sbjct), если условие (›=50) выполняется   -  person rororo    schedule 26.05.2017
comment
Просто скажите в своем вопросе, что вы на самом деле пытаетесь сделать с кратким, тестируемым образцом ввода и ожидаемым результатом, и четко укажите, хотите ли вы напечатать строку, начинающуюся с Sbjct, или 5-ю строку после Identify, или если любой критерий работает одинаково или что-то другое. Похоже, то, что вы хотите, вероятно, абсолютно тривиально, если вы можете просто четко указать, что это такое.   -  person Ed Morton    schedule 26.05.2017
comment
извините за это, я не хотел получать полное решение;)   -  person rororo    schedule 26.05.2017