Парсим бэки из yahoo при помощи hrefer

Doorways

Tagged Under : , ,

Свершилось чудо и в новом 2010 году временно я стал счастливым обладателем Хрумера! Один хороший знакомый дал попользоваться, пока он ему не нужен. :)

В связи с этим пробую сейчас свои силы в выколачивании трафа с гугла.

И так одним из хороших способов для создания базы с последующим спамом являеться парсинг обратных ссылок конкурентных доров. Яху позволяет увидеть бэки сайтов но тут возникает пару загвоздок:  1)только в количестве не больше 1к ссылок, 2) часто показывает намного меньше, так как просканить он их видимо еще не успел. Ясно что 1к ссылок для хорошего проспама явно недостаточно.

Как же нам собрать большую базу для последующего использования в хруме?

Можно сделать так: собрать бэки не с одного а гораздо большего количества доров из топа гугла, например с 5к доров, что естественно невозможно сделать вручную. И тут на помощь нам придет универсальная парсилка hrefer, которая идет в комплекте с хрумером.

1) Нам нужно собрать базу линков на доры конкурентов в топе гугля для последующего парсинга бэков из яху. Топ как все знают это верхушка выдачи ПС по поисковому запросу.
И так берем базу ключей по интересующей нас  теме, чем больше тем лучше. Ложим в папку /Words. Открываем любым редактором файл engines.ini. Ищем там следующий код:

[Google]
Hostname=http://[GOOGLEHOST]
Query=ie?as_q=[QUERY]&num=100&hl=en
LinksMask=<a title=»[...]href=[LINK]>
TotalPages=10
NextPage=</nobr><hr><center><a href=[LINK] target=_self>
NextPage2=</a>&nbsp;&nbsp;<a href=[LINK] target=_self>

На данном этапе нас интересует строка TotalPages – отвечает она за то, сколько страниц из выдачи гугла будет парсить хрефер. Устанавливаем TotalPages=1, ведь мы хотим собрать линки на хорошие доры, а не всякую шалупень с последних страниц выдачи.

Далее открываем Hrefer идем в настройки и отключаем использование Additive words и использование фильтров (для тех кто в танке – нужно поставить две галки в разделе query options), сохраняем настройки. Открываем вкладку Search Engines options & Filter, выбираем Google в качестве поисковой системы.

И тут перед нами встает вопрос а как выделить дорвеи от обычных сайтов? Очень просто открывайте гугл и сделайте пару поисков по вашим ключам, как известно гугл очень любит всякие пиаристые фрихи и тп, в моем случае в выдаче было много доров на co.cc.

Поэтому в поле Domain / site я ввел co.cc

Нажимаем старт и ждем окончание парсинга. И так теперь у нас есть база доров на co.cc(в моем случае), по нужным нам запросам из первой страницы выдачи гугла.

Приступаем ко второй части – парсинг бэков:

2) По умолчанию Hrefer не умеет работать с сервисом siteexplorer.search.yahoo.com. Для того чтобы научить его этому добавляем в engines.ini следующий код:

[SiteExplorer]
Hostname=http://siteexplorer.search.yahoo.com
Query=search?p=[QUERY]&bwm=i&bwmo=d&bwmf=u
LinksMask=<span>[LINK]</span>
TotalPages=10
NextPage=<li><a href=»[LINK]«>
NextPage2=<li><a href=»[LINK]«>

Далее копируем файл с ссылками на доры конкурентов в папку Words, выбираем его на вкладке Words database, идем в вкладку с Search Engines options & Filter там выбираем SE: SiteExplorer, тут вы может проявить свою фантазию и выбрать нужные вам фильтры, например Filter: all_forums – для того чтобы в итоге оставить только форумные бэки (для этого  надо сначала включить опцию фильтрации ранее отключенную нами в опциях программы).

Все готово теперь можно запускать парсинг.

В итоге мы получим качественную базу состоящую только из бэков ваших прямых конкурентов, размеры ее будут зависеть в первую очередь от вашей базы ключей.

Комментарии:

Оставить комментарий

ads