Там, где я работаю, у меня есть несколько сотен файлов xlsx (созданных с помощью Office 2010 Starter), из которых мне нужно извлечь информацию. Это разовая работа, поэтому вопрос в том, какой способ самый быстрый. Существующий инструмент? Запрограммировать решение?
Информация — это просто строки, форматирование не имеет значения. Эти файлы содержат данные о клиентах. Один файл для каждого клиента. И прежде чем вы спросите, да, это глупая система, и мы отказываемся от нее. Поскольку сейчас мы переходим на новую систему, нам нужно экспортировать существующие данные о клиентах в файл CSV, который можно импортировать в новую систему.
Если бы я написал для этого компьютерную программу, мне нужно было бы иметь доступ к первому рабочему листу в каждом файле и иметь возможность читать содержимое любой заданной ячейки (A1, C5 и т. д.). Вот и все.
Поскольку xlsx-файл — это всего лишь несколько заархивированных XML-файлов, одним из подходов может быть написание кода, который распаковывает и анализирует XML-файлы. Это пахнет очень трудоемким решением, поэтому я бы предпочел использовать бесплатную библиотеку, если она существует.
Из языков, которые могли бы здесь пригодиться, лучше всего я разбираюсь в C++ и C, но немного разбирался в C#, VB6 и VB.NET, а также немного в Python.