Есть ли легкий анализатор multipart/form-data на C или C++?

Я рассматриваю интеграцию синтаксического анализа составных данных формы в модуль веб-сервера, чтобы я мог избавить серверные веб-приложения (часто написанные на динамических языках) от синтаксического анализа самих составных данных. Составная грамматика (RFC 2046) выглядит нетривиально, и если я реализую ее вручную, многое может пойти не так. Есть ли уже хороший, легкий анализатор multipart/form-data, написанный на C или C++? Я ищу тот, у которого нет внешних зависимостей, кроме стандартной библиотеки C или C++. Мне не нужна обработка вложений электронной почты, буферизованные классы ввода-вывода, среда выполнения с переносимостью или что-то еще, мне нужен только синтаксический анализ multipart/form-data.

Вещи, которые я рассмотрел:

GMime - зависит от бойкости, так что не пойдет.
libapreq — слишком большой, зависит от APR, плохо документирован, без модульных тестов.

Я также рассматривал возможность написания синтаксического анализатора с помощью Ragel, но не могу понять, как это сделать, потому что грамматика не статична: граница может изменяться произвольно.

Hongli 15.02.2010 источник

comment

GMime - зависит от бойкости, так что не пойдет. - не хочешь объяснить, почему? - John Zwinck 15.02.2010

comment

Вы читали эту тему: stackoverflow.com/questions/218089/simple-c-mime-parser ? - Manuel 15.02.2010

comment

@John: Каждая новая зависимость усложняет установку для моих пользователей, и я хочу свести это к минимуму. На многих серверах не установлен glib. Также каждая новая зависимость увеличивает использование ресурсов. Существует не так много серверных приложений, использующих glib, поэтому, если я завишу от glib, я буду использовать всю потребляемую им память только для анализа некоторых MIME-данных. - Hongli 16.02.2010

comment

Не могли бы вы использовать GMime и статическую ссылку, чтобы избежать проблем с установкой? Я не уверен на 100%, но я подозреваю, что вы могли бы, и что объем памяти, вероятно, не будет проблемой на большинстве серверов. - John Zwinck 16.02.2010

comment

Просто к вашему сведению, но накладные расходы от glib крошечные. Кроме того, каждый дистрибутив Linux по умолчанию поставляется с glib, а многие также включают gmime по умолчанию. - jstedfast 20.02.2012

Ответы (5)

arrow_upward
10
arrow_downward

Я знаю, что этому вопросу уже пару лет, но мне нужно было то же самое, и в итоге я использовал это:

https://github.com/iafonov/multipart-parser-c

James McLaughlin 12.08.2012

comment

Тем не менее, обязательно проверьте проблемы! Например. граничный термин должен иметь префикс -- уже, иначе он не будет работать. - Michael Böckling; 12.03.2017

arrow_upward
6
arrow_downward

Да, там один. Не секрет, что это мое. Не стесняйтесь использовать его. Ссылка: MPFDParser. У него вообще нет зависимостей.

Gorelov Grigory 30.10.2011

arrow_upward
1
arrow_downward

mimetic утверждает, что поддерживает его. Я думаю, что GNU cgicc также может его поддерживать.

Ken Bloom 08.04.2010

arrow_upward
1
arrow_downward

cgicc это поддерживает... Но написан довольно плохо и релится на входной буфер в памяти.

Artyom 12.04.2010

arrow_upward
-5
arrow_downward

это может не отвечать на ваш вопрос напрямую, но рассматривали ли вы хип-хоп для php из facebook?

он преобразует ваш php-код в C++, а затем компилирует с помощью g++.

может сэкономить ваше время при написании чего-то самостоятельно.

hasan 14.04.2010

Есть ли легкий анализатор multipart/form-data на C или C++?

Ответы (5)

Похожие вопросы