Не знаю, как это задать, но попробую:
У меня есть 20 data.frames (например, 2006_1, 2006_2, 2007_1, 2007_2, ...), которые я импортировал из MS Access.
Каждый data.frame имеет 10 столбцов и примерно 3 миллиона строк.
Первый столбец в каждом data.frame называется secuityName
, который представляет собой список тикеров акций, за которыми следуют некоторые теги.
Я хотел бы поднять каждую строку в столбце SecurityName
в каждом из 20 кадров data.frames.
Структура следующая:
2006_1
> **SecurityName** **...**
> AAPL abcdef **...**
> MSFT abcdef **...**
2006_2
> **SecurityName** **...**
> AAPL abcdef **...**
> MSFT abcdef **...**
Я бы хотел, чтобы каждый выглядел так:
2006_1
> **SecurityName** **...**
> AAPL ABCDEF **...**
> MSFT ABCDEF **...**
У меня есть вектор с именем * Raw_data_vector *, который имеет все имена data.frame
Raw_data_vector
> 2006_1
> 2006_2
> 2007_1
> 2007_2
> ...
Я пытался использовать lapply, но не могу заставить его работать:
lapply(1:length(Raw_data_vector), function(x) toupper(get(x)[,1]),Raw_data_vector)
data.frame
имена, используя аргумент шаблона дляls
, однако переменные, названные с использованием чисел, часто вызывают больше головной боли, чем пользы. вы можете подумать об изменении их имен, прежде чем продолжить. - person Justin   schedule 19.06.2012data.table
является удобнее и быстрее. Лучше всего начать с отзывов пользователей, а затем с презентаций. - person Matt Dowle   schedule 21.06.2012