Как импортировать файл .tsv

Мне нужно прочитать таблицу, которая представляет собой файл .tsv в R.

test <- read.table(file='drug_info.tsv')
# Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  : 
#   line 1 did not have 10 elements
test <- read.table(file='drug_info.tsv', )
# Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  : 
#   line 1 did not have 10 elements
scan("drug_info.tsv")
# Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  : 
#   scan() expected 'a real', got 'ChallengeName'
scan(file = "drug_info.tsv")
# Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  : 
#   scan() expected 'a real', got 'ChallengeName'

Как мне это прочитать?

r import readr read.table

Andrew Voronkov 24.10.2015 источник

comment

Пожалуйста, скопируйте/вставьте первые 5 строк файла в свой вопрос и удалите изображение. - Rich Scriven 24.10.2015

comment

почти read.delim с настройками по умолчанию - rawr 24.10.2015

comment

read.table по умолчанию используется разделитель пробелами (обычно это означает пробел или табуляцию). Если у вас есть пробелы, вы можете явно установить разделитель в виде табуляции с помощью sep="\t". read.table работает с допустимыми входными файлами, поэтому, если есть проблема с импортом ваших данных, это связано с файлом, а не с функцией. Поэтому, чтобы помочь вам, нам нужно, чтобы вы предоставили образец файла, который вы на самом деле пытаетесь импортировать, а не изображение данных в какой-либо другой программе. - MrFlick 24.10.2015

Ответы (6)

arrow_upward
33
arrow_downward

Это должно сделать это:

read.table(file = 'drug_info.tsv', sep = '\t', header = TRUE)

Robert 24.10.2015

comment

Это должно дать ту же ошибку, что и сообщалось, в строке 1 недостаточно элементов. - Robert Hijmans; 24.10.2015

comment

Я думаю, что голосование против было сделано немного преждевременно, поскольку у нас пока нет реальных данных для проверки каким-либо методом. - Rich Scriven; 24.10.2015

arrow_upward
11
arrow_downward

Использование fread из пакета data.table прочитает данные и пропустит ошибку, которую вы получаете при использовании read.table.

require(data.table)

data<-as.data.frame(fread("drug_info.tsv"))

TBhavnani 12.03.2018

comment

Недурно для этого решения, поскольку оно может обрабатывать большие таблицы данных, избегая времени ожидания сеанса на веб-странице ShinyUI. - Stone; 29.01.2019

arrow_upward
9
arrow_downward

Вы можете обрабатывать данные как CSV и указать разделитель табуляции.

read.csv("drug_info.tsv", sep = "\t")

Sam Old 21.02.2019

arrow_upward
5
arrow_downward

Предполагая, что только первая строка не имеет нужного количества элементов и что это строка имен столбцов. Пропустить первую строку:

 d <- read.table('drug_info.tsv', skip=1)

Теперь прочитайте это

 first <- readLines('drug_info.tsv', n=1)

Осмотрите его, исправьте так, чтобы количество элементов соответствовало d, а затем

 colnames(d) <- first

Если это не работает, вы можете сделать

 x <- readLines('drug_info.tsv')

и такая диагностика:

 sapply(x, length)

Robert Hijmans 24.10.2015

arrow_upward
4
arrow_downward

Вам нужно включить fill = TRUE.

test <- read.table(file='drug_info.tsv', sep = '\t', header = TRUE, fill = TRUE)

woutcault 15.11.2019

arrow_upward
2
arrow_downward

utils::read.delim() чаще всего используется в том случае, если вы не хотите устанавливать другую библиотеку. Пример кода может быть примерно таким:

test <- read.delim(file='drug_info.tsv')

или гораздо более дружественные функции ввода-вывода могут быть доступны на readr library, где read_tsv названная функция доступна напрямую:

test <- readr::read_tsv('drug_info.tsv')

千木郷 26.01.2019

Как импортировать файл .tsv

Ответы (6)

Похожие вопросы