У меня есть список такси, который выглядит так:
1204725
2162
1300163
420247
Я хочу получить файл с таксономическими идентификаторами в порядке из приведенных выше таксидов:
kingdom_id phylum_id class_id order_id family_id genus_id species_id
Я использую пакет "ete3". Я использую инструмент ete-ncbiquery, который сообщает вам происхождение от приведенных выше идентификаторов. (Я запускаю его со своего ноутбука с Linux с помощью приведенной ниже команды)
ete3 ncbiquery --search 1204725 2162 13000163 420247 --info
Результат выглядит следующим образом:
# Taxid Sci.Name Rank Named Lineage Taxid Lineage
2162 Methanobacterium formicicum species root,cellular organisms,Archaea,Euryarchaeota,Methanobacteria,Methanobacteriales,Methanobacteriaceae,Methanobacterium,Methanobacterium formicicum 1,131567,2157,28890,183925,2158,2159,2160,2162
1204725 Methanobacterium formicicum DSM 3637 no rank root,cellular organisms,Archaea,Euryarchaeota,Methanobacteria,Methanobacteriales,Methanobacteriaceae,Methanobacterium,Methanobacterium formicicum,Methanobacterium formicicum DSM 3637 1,131567,2157,28890,183925,2158,2159,2160,2162,1204725
420247 Methanobrevibacter smithii ATCC 35061 no rank root,cellular organisms,Archaea,Euryarchaeota,Methanobacteria,Methanobacteriales,Methanobacteriaceae,Methanobrevibacter,Methanobrevibacter smithii,Methanobrevibacter smithii ATCC 350611,131567,2157,28890,183925,2158,2159,2172,2173,420247
Я понятия не имею, какие элементы (IDS) соответствуют тому, что я ищу (если есть)