У меня есть пара файлов чтения с парным концом Illumina (например, A_1.fastq.gz и A_2.fastq.gz), созданных из одного бактериального изолята для вызова вариантов. Прежде всего, я использовал FLASH, чтобы объединить перекрывающиеся чтения из-за длины чтения (100 бит / с ), размер вставки (около 230 п.н.) и его стандартное отклонение (около 50 п.н.). FLASH произвел три файла для чтения, два для неперекрывающихся парных чтений и один для объединенных чтений (односторонних). Затем я сопоставил их с общим эталонным геномом с помощью Bowtie, что сгенерировало два файла BAM (один для парных чтений, а другой для односторонних чтений).
Чтобы получить больший охват и глубину чтения для вызова вариантов, я хотел бы объединить оба файла BAM в один. Я планирую использовать BamTools для этой задачи, поскольку он предназначен для обработки файлов BAM. Однако я не уверен, нужно ли сортировать входные файлы BAM перед вызовом команды «bamtools merge»? Это не рассматривается ни в руководстве по программному обеспечению, ни где-либо еще. Я был бы признателен, если бы вы могли помочь.