В настоящее время я использую xml.dom.minidom для анализа XML в python. После синтаксического анализа я делаю некоторые отчеты о содержании и хотел бы сообщить строку (и столбец), где начинается тег в исходном XML-документе, но я не понимаю, как это возможно.
Я хотел бы придерживаться xml.dom / xml.dom.minidom, если это возможно, но если мне нужно использовать синтаксический анализатор SAX для получения информации об источнике, я могу сделать это - идеальным в этом случае было бы использование SAX для отслеживания node, но все равно получаю DOM для постобработки.
Любые предложения о том, как это сделать? Надеюсь, я просто что-то упускаю из виду в документах, и это очень просто.
xmlparser
изxml.parsers.expat
поддерживает номера строк/столбцов. docs.python.org/library/pyexpat.html - person jfs   schedule 25.01.2011lxml.etree
поддерживает номера строк. codespeak.net/lxml - person jfs   schedule 25.01.2011