Python 3 — объединение .xls/удаление строк/удаление дубликатов

Я пытаюсь объединить 3 файла .xls и хочу сделать это в python3.

Мне нужно сначала удалить некоторые строки, затем объединить их в один .xls, а затем удалить дубликаты (позже я буду манипулировать данными для графиков)

Я ищу рекомендации о том, какие модули использовать, которые работают в python3 и могут достичь этого эффекта.

Будем очень благодарны любой помощи.


person Kuzen    schedule 23.04.2014    source источник


Ответы (1)


Я ищу рекомендации о том, какие модули использовать, которые работают в python3 и могут достичь этого эффекта.

Pandas определенно ваш лучший выбор.

03 - Урок: - Создание функций - Чтение из EXCEL - Экспорт в EXCEL - Нарезка и нарезка данных

04 - Урок: - Добавление/удаление столбцов - Операции с индексами

http://pandas.pydata.org/pandas-docs/stable/tutorials.html

Вот как объединить отдельные файлы в один лист: one-dat">Импорт нескольких файлов Excel в python pandas и объединение их в один фрейм данных

Вот как можно удалить строки: Удаление строки DataFrame в Pandas на основе столбца значение

Вот как удалить дубликаты: Удалить строки с повторяющимися индексами (Pandas DataFrame и временные ряды)

person Charles Clayton    schedule 23.04.2014
comment
Это идеально, после нескольких часов установки (ошибки компиляции ‹Вздох›) получил именно то, что мне было нужно. Спасибо за быстрый ответ. - person Kuzen; 24.04.2014