У меня есть набор данных, который содержит начальное и конечное положение сегментов в определенных местах (скаффолде), некоторые из этих сегментов перекрываются с другими, если они находятся в одном и том же каркасе.
> head(jobs)
JOB_N Genome Scaffold loc_i loc_f
1 PRJNA179522 Contig10285 1251 1502
1 PRJNA179522 Contig10285 1251 1602
2 PRJNA179522 Contig10285 1255 1499
2 PRJNA179522 Contig10285 828 1076
2 PRJNA179522 Contig783 245 1487
2 PRJNA179522 Contig783 822 1073
Я хочу две вещи: первая — найти все перекрывающиеся области во всех отдельных каркасах. Второй — получить новую таблицу, содержащую только первую и последнюю позиции каждого «нового» сегмента. Результат будет:
JOB_N Genome Scaffold loc_i loc_f
1 PRJNA179522 Contig10285 1251 1602
2 PRJNA179522 Contig10285 828 1076
2 PRJNA179522 Contig783 245 1487
Заранее спасибо.
foverlaps
вdata.table
илиfindOverlaps
вIRanges
- person MichaelChirico   schedule 27.02.2016