Получите заголовок веб-статьи в рабочем процессе Automator

Я пытаюсь создать рабочий процесс, который преобразует список URL-адресов в обычный текст с помощью Instapaper, а затем сохраняет текст в текстовых документах на моем компьютере.

Пока что мне удалось получить список URL-адресов, преобразовать их и сохранить текстовые документы. Проблема в том, что я не могу понять, как использовать имя каждой веб-страницы в качестве имени последующего документа.

Я использую свой URL-адрес RSS в Instapaper, чтобы скачивать статьи. Затем я использую «Получить URL-адреса ссылок из статей», а затем - Applescript для преобразования в текстовую версию. «Получить текст с веб-страницы» захватывает текст. «Новый текстовый файл» позволяет мне сохранять каждый документ, но все они имеют то же имя, которое я ввел во входные данные «Сохранить как» в действии «Новый текстовый файл».

Как я могу сделать так, чтобы это действие сохраняло документы в качестве заголовка каждой веб-страницы?


person Ed.    schedule 15.09.2013    source источник


Ответы (1)


Если вы передадите этому AppleScript URL-адрес, он должен вернуть заголовок страницы ...

on run {input, parameters}
    set pageTitle to do shell script "curl " & quoted form of (first item of input) & " | grep -o \\<title\\>.*\\</title\\> | sed -E 's/<\\/?title>//g'"
    return pageTitle
end run
person adayzdone    schedule 15.09.2013
comment
Привет @adayzdone. У меня возникла проблема, когда URL-адрес, который я тестировал (javascripter.net), имел тег заголовка, который был в заглавных буквах . так что часть скрипта grep и sed возвращалась, я исправил это, используя параметр -i (игнорировать регистр) в команде grep и используя | (или) вариант в sed и добавление версии выражения с заглавными буквами. grep -io \\ ‹title \\›. * \\ ‹/ title \\› | sed -E 's / ‹\\ /? title› | ‹\\ /? TITLE› // g') - person markhunte; 16.09.2013