Есть ли бесплатный компонент для преобразования арабского html в pdf?

Мне нужно взять HTML-страницу на арабском языке и преобразовать ее в PDF. itextsharp не работает. Вот пример HTML с арабским языком.

<div>
    <table border="1" width="500px">
        <tr>
            <td colspan="2">
                aspdotnetcodebook
                اللغة العربية</td>
        </tr>
        <tr>
            <td>
                cell1
            </td>
            <td>
                cell2
            </td>
        </tr>
        <tr>
            <td colspan="2">
                <asp:Label ID="lblLabel" runat="server" 
                    Text=""></asp:Label>
                <img alt="" src="logo.gif" style="width: 174px; height: 40px" /></td>
        </tr>
        <tr>
            <td colspan="2" dir="rtl">
                <h1>
                    <img alt="" height="168" 
                        src="http://a.cksource.com/c/1/inc/img/demo-little-red.jpg" 
                        style="margin-left: 10px; margin-right: 10px; float: left;" width="120" />تحويل 
                    محتوى الى ملف بي دي اف</h1>
                <p>
                    مجموعة المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث 
                    والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا 
                    كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر 
                    والعلم والفنون والأداب بعيدا الكتابة الإبداعية.
                    <a href="http://en.wikipedia.org/wiki/Brothers_Grimm">
                    الاخوان جريم/a> مجموعة المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة 
                    التعلم بالبحث والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون 
                    ويريدون أن يتعلموا كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى 
                    عربي معاصر في الفكر والعلم والفنون والأداب بعيدا الكتابة الإبداعية. <a href="http://en.wikipedia.org/wiki/Hood_(headgear%2529" 
                        title="Hood (headgear)">ا</a><a 
                        href="http://en.wikipedia.org/wiki/Hood_(headgear%2529">لهودد</a>
                    <a href="http://en.wikipedia.org/wiki/Cape" title="Cape">ك</a><a 
                        href="http://en.wikipedia.org/wiki/Cape">يب</a> أو
                    <a href="http://en.wikipedia.org/wiki/Cloak" title="ويكيبيديا">ويكيبيديا</a> 
                    مجموعة المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث 
                    والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا 
                    كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر 
                    والعلم والفنون والأداب بعيدا الكتابة الإبداعية. .</p>
                <p>
                    مجموعة المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث 
                    والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا 
                    كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر 
                    والعلم والفنون والأداب بعيدا الكتابة الإبداعية.</p>
                <p>
                    مجموعة المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث 
                    والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا 
                    كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر 
                    والعلم والفنون والأداب بعيدا الكتابة الإبداعية.</p>
                <p>
                    مجموعة المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث 
                    والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا 
                    كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر 
                    والعلم والفنون والأداب بعيدا الكتابة الإبداعية.
                    <a href="http://en.wikipedia.org/wiki/Hunter">الصياد</a>, مجموعة المحتوى 
                    العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث والتعلم بالكتابة. 
                    المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا كيف يكتبون كتابة 
                    علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر والعلم والفنون 
                    والأداب بعيدا الكتابة الإبداعية. المحتوى العربي، تعنى بتطوير مهارة الكتابة 
                    وتتبنى فكرة التعلم بالبحث والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين 
                    يكتبون ويريدون أن يتعلموا كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج 
                    محتوى عربي معاصر في الفكر والعلم والفنون والأداب بعيدا الكتابة الإبداعية.</p>
                <p>
                    مجموعة المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث 
                    والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا 
                    كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر 
                    والعلم والفنون والأداب بعيدا الكتابة الإبداعية.                         <a href="http://en.wikipedia.org/wiki/Enchanted_forest">الغابة</a>, مجموعة 
                    المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث والتعلم 
                    بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا كيف 
                    يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر 
                    والعلم والفنون والأداب بعيدا الكتابة الإبداعية. </p>
            </td>
        </tr>
    </table>
</div>

я использую itextsharp для преобразования этого содержимого, которое хранится в БД, в файл PDF для загрузки пользователю


person Mariam    schedule 22.05.2010    source источник
comment
В чем именно заключается ваш вопрос или проблема? Что вы пробовали, что не работает? Почему вы пометили это c # и asp.net - на какой платформе/языке вы пытаетесь это решить?   -  person Pekka    schedule 22.05.2010
comment
Вместо слага HTML я предлагаю опубликовать фрагмент кода того, как вы пытаетесь сделать с itextsharp.   -  person bmargulies    schedule 24.05.2010
comment
проверьте этот вопрос, который может помочь вам stackoverflow.com/questions/16080741/   -  person Mohamed Salah    schedule 27.07.2015


Ответы (4)


у вас есть код С# в руке? есть этот онлайн-ресурс, в котором обсуждается, как использовать itextsharp для создания PDF. это проблема набора символов, шрифта или проблемы справа налево?

http://www.devshed.com/c/a/Java/Creating-Simple-PDF-Files-With-iTextSharp/

http://www.codeproject.com/KB/graphics/ITextSharpHelperClass.aspx

Я надеюсь, что это может помочь

person A.Rashad    schedule 22.05.2010
comment
Вопрос не в том, как создать новый PDF, а в том, как преобразовать HTML в PDF. - person Darin Dimitrov; 22.05.2010
comment
эти примеры имеют дело с созданием новых документов и добавлением некоторых элементов в виде фразы, таблицы или ячейки - я имею в виду, что я создаю и объединяю документ - элемент за элементом, но мой случай отличается, у меня есть содержимое HTML, хранящееся в БД - я получаю его и отобразить его на HTML-странице, также у меня есть ARABIC в HTML, который конвертируется как пустой pdf - person Mariam; 22.05.2010
comment
Я нашел этот пост stackoverflow.com/questions/1322303/ где кто-то сталкивается с проблемой отсутствия турецких символов в PDF, что приводит к выводу, что UTF8 может иметь проблему в itextsharp, однако есть несколько примеров того, как читать текст, написанный в UTF8 в java itextpdf.com/examples/index.php? страница=пример&id=215 - person A.Rashad; 22.05.2010

Apache PDFBox может это сделать, но, возможно, не с тем качеством рендеринга, которое вам нужно. Возможно, вам придется использовать Apache Tika для извлечения текста из HTML, что приведет к потере большей части формата. В любом случае, я боюсь, что отправив вас по пути различных компонентов Java, вы не сможете поднять лодку, но это единственный известный мне бесплатный код, который работает с файлами RTL PDF. Что не означает, что это единственный существующий код.

person bmargulies    schedule 23.05.2010

эти примеры имеют дело с созданием новых документов и добавлением некоторых элементов в виде фразы, таблицы или ячейки - я имею в виду, что я создаю и объединяю документ - элемент за элементом, но мой случай отличается

у меня есть HTML-контент, хранящийся в БД - я извлекаю его и отображаю на HTML-странице

также у меня есть АРАБСКИЙ язык в HTML, который конвертируется как пустой pdf

я использую asp.net с С#, чтобы преобразовать этот ARABIC HTML-контент в pdf, я использую itextsharp для достижения этой цели

person Mariam    schedule 22.05.2010
comment
Пожалуйста, используйте комментарии, а не ответы, для взаимодействия. - person bmargulies; 24.05.2010

Я думаю, что вам нужна утилита CutyCapt, она может конвертировать html в pdf и многие другие форматы.

person Zaheer Ahmed    schedule 08.06.2013