strip_tags, удалите javascript

У меня есть эта проблема с кодом, который я запускаю прямо сейчас.

Мой код заключается в том, что я ввожу URL-адрес, и когда я нажимаю «Отправить», он удаляет все теги. Я использую strip_tags для этого. А затем я использую preg_match_all("/((?:\w'|\w|-)+)/", $contents, $words);, который создает массив каждого слова. Затем у меня есть цикл foreach, который подсчитывает все слова, а затем помещает их в таблицу с другим циклом foreach.

Проблема например. Скажем, я ввожу URL-адрес со следующим содержанием:

<html>
    <head>
        <title>titel1</title>
    </head>
    <body>
        <div id="div1">
            <h1 class="class2">
                Testpage-h1
            </h1>
            <p>
                Testpage-p
            </p>
        </div>
        <script>
            alert('hallo');
            document.getElementById('class2');
        </script>
    </body>
</html>

Это будет повторять следующее, используя мой код:

document         1
getElementById1  1
class2'          1
hallo            1
alert            1
Testpage-h1      1
Testpage-p       1
titel1           1

(извините, что поместил это как «код», но иначе это не позволило бы мне использовать разрывы или размещать числа друг под другом)

Моя проблема в том, что он не должен показывать, что находится между тегами <script></script>, потому что мне это все равно бесполезно. Есть ли решение по этому вопросу?

Я пробовал такие вещи, как санировать фильтрацию, но это мне не помогло.


person Déjà vu    schedule 01.04.2014    source источник


Ответы (1)