получение реальной ссылки из ссылки RSS-канала

Я экспериментирую с очисткой определенных страниц из RSS-канала с помощью curl и php. Очистка страницы работала нормально, когда я использовал только фактические ссылки, а не ссылки из RSS-каналов. Однако теперь я понимаю, что ссылки в RSS-потоках обычно являются перенаправлением на настоящую страницу (по крайней мере, так кажется). Потому что теперь, когда я очищаю страницу с помощью rss-ссылки, она фактически не получает информацию, которую я ищу.

Кто-нибудь сталкивался с этим и знает обходной путь. Есть ли способ увидеть, где ссылка rss перенаправляет и захватывает это значение?


person pfunc    schedule 08.05.2010    source источник


Ответы (1)


Я думаю, вам может потребоваться использовать переключатель -L, чтобы он следил за перенаправлениями. Я не уверен, что вы можете сделать это прямо из PHP или вам нужно следовать этому подходу http://php.net/manual/en/function.curl-setopt.php#95027. Всегда возможно, что сайт, который вы очищаете, блокируется пользовательским агентом или чем-то еще. Возможно, попробуйте одну из ссылок в браузере при запуске Fiddler или аналогичного, чтобы увидеть, действительно ли происходит перенаправление.

person Martin Smith    schedule 08.05.2010
comment
спасибо, да, мне удалось найти скрипт, который перебирает перенаправления и находит последний. Похоже, что большинство сайтов не блокируются пользователем, но есть некоторые. - person pfunc; 10.05.2010