Я использую API Twitter и Facewbook для извлечения сообщений, которые потенциально могут содержать сокращенные URL-адреса, с помощью таких сервисов, как bit.ly или TinyURL. Мне нужно выполнить расширение в реальном времени, чтобы получить исходный URL-адрес, а затем извлечь содержимое из этого URL-адреса в свое приложение.
Как лучше всего в PHP или JS расширить сокращенные URL-адреса, такие как Bitly, Tinyurl, чтобы найти исходный URL-адрес?
Ответы (4)
Вы можете использовать CURL для расширения короткого URL-адреса.
Попробуй это:
function traceUrl($url, $hops = 0)
{
if ($hops == MAX_URL_HOPS)
{
throw new Exception('TOO_MANY_HOPS');
}
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_HEADER, 1);
curl_setopt($ch, CURLOPT_NOBODY, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0);
$r = curl_exec($ch);
if (preg_match('/Location: (?P<url>.*)/i', $r, $match))
{
return traceUrl($match['url'], $hops + 1);
}
return rtrim($url);
}
Вы можете использовать эту функцию так traceUrl('http://bit.ly/example')
. Эта функция является рекурсивной в том смысле, что она найдет даже укороченные URL-адреса (если это когда-либо произойдет). Убедитесь, что вы установили константу MAX_URL_HOPS
. Я использую define('MAX_URL_HOPS', 5);
.
- христианин
Вы можете просто использовать PHP и CURL для подключения к URL-адресу и вернуть параметр Location
:
Вот что возвращается -
> $ curl -I http://bit.ly/2V6CFi
> HTTP/1.1 301 Moved Server:
> nginx/0.7.67 Date: Tue, 21 Dec 2010
> 01:58:47 GMT Content-Type: text/html;
> charset=utf-8 Connection: keep-alive
> Set-Cookie:
> _bit=4d1009d7-00298-02f7f-c6ac8fa8;domain=.bit.ly;expires=Sat
> Jun 18 21:58:47 2011;path=/; HttpOnly
> Cache-control: private; max-age=90
> Location: http://www.google.com/
> MIME-Version: 1.0
Content-Length: 284
Таким образом, вы можете найти параметр Location в заголовке, чтобы увидеть, куда на самом деле ведет страница страницы.
-X HEAD
, если все, что нужно OP на этом шаге, — это просто длинный URL-адрес.
- person zerkms; 21.12.2010
С nodejs вы можете использовать модуль request.
var request = require('request');
var shortUrl = 'the url that is shortened'
request({method: 'HEAD', url: shortUrl, followAllRedirects: true},
function(err, response, body){
console.log(response.request.href);
})
Я нашел библиотеку php, которая делает именно это, она может быть полезна. Проверьте это: https://launchpad.net/longurl