Будь мой блог не delphi блог и будь его адрес не parsers.info, я бы никогда не стал массово получать адреса rss лент со списка сайтов.

Программа консольная, использует модуль httpsend из библиотек synapse (Vlad рекомендует этот модуль, проверим?). Также пришлось подключать Classes, так как его использует httpsend, а так как мы его подключили, то и с записью в файл мудрить не будем — не такие у нас большие списки. Еще я подключил StrUtils, общий вес получился 136Kb, в общем, терпимо.

Немного о задачах программы. Вот у нас есть список очень интересных, к примеру, блогов. И у нас есть примитивный rss-ридер, который понимает только адреса на rss-ленту. Мы список блогов помещаем в sites.txt и запускаем программу. Всё! Немного ждём (с потоками я тоже не стал заморачиваться), и у нас есть заветный rss.txt — список лент. Ну и error.txt — там сайты, к которым не удалось подключиться и у которых не оказалось rss-лент.

Стоп. А как Feed link parser узнаёт адрес ленты? Всё просто, обычно лента прописывается в одном из тегов link раздела head страницы. Посмотри исходник сайта, если интересно, не будем вдаваться в подробности. (да, программа берет только первый адрес, это в случае нескольких таких тегов)

скачать feed link parser
скачать исходник feed link parser

(c) crystalbit, http://parsers.info

Постовой: Интереснейшие статьи о блогосфере читай на dofollow блоге ульяновского чувака.