1. Если вы первый раз у нас на форуме, то начать лучше с этой темы

Парсер мейлов или всего подряд

Тема в разделе "SEO", создана пользователем reasonablenough, 15 дек 2017.

  1. reasonablenough

    reasonablenough Участник

    Пол:
    Мужской
    День добрый! Кто работал с парсерами? Если детальнее, то мне спарсить надо мейлы, но, думаю, пойдет и мультизадачный.

    Есть база УРЛ, идеально если он и с whois вытягивает.

    Парсить надо обычные мейлы, всякие разные вариации ( at ) (dot) и подобные.

    В первую очередь интересуют бесплатные решения:) Но если неплохой парсер (и универсальный), то можно и за деньги.

    P.S. Это не спамный "крауд-маркетинг", никогда просто раньше с парсерами не работал, но сейчас надо.
     
  2. efs

    efs Повелитель дескрипторов Команда форума

    если хуизы закрыты, то сами понимаете, никаких мейлов. тут только если через форму контакта у регистратора писать (там свои заморочки уже будут)
    какого-то универсального интрумента нет, т.к. мейлы на сайте могут находится на любой странице и в какой угодно форме (текстом, картинкой, выводится при помощи js, etc)
     
  3. reasonablenough

    reasonablenough Участник

    Пол:
    Мужской
    Ок, а те, что поддерживают большинство стандартных паттернов (ссылки на мейл, (at) и подобное?).

    Конечно, на 100 процентов не рассчитываю, нужные можно и руками досмотреть. Но 1900 сайтов сидеть листать умереть можно )

    Может хоть направление - самые популярные чтобы знать с чего начинать пробовать и искать решение под себя?
     
  4. vadim4ukr

    vadim4ukr Участник

    Пол:
    Мужской
    Так тебе нужно напарсить или решение, имейлы сайтов определённой тематики или всё подряд?
     
  5. ergoline

    ergoline Участник

    Пол:
    Мужской
    а что content downloader разве умер?
    на нем можно подобные операции произвести.
    если облом покупать, то можно обратиться к спецам с форума ( этой проги),
    и они тебе в пределах до 20 уе произведут такую манипуляция.
    ( сама прога стоит немного дороже. Но нужно еще время на ее понимание.
    хотя видеоматериалов хватает)
     
  6. efs

    efs Повелитель дескрипторов Команда форума

    с громааааааааааааааааааааааааааадными оговорками
    например, объяснить кд, что необходимо искать мыла на странице контактов, которая может скрывать за адресами: about, contact, kontact, kontakt, o-nas, onas, контакты, о-нас и еще 100500 возможных варицаий написания, ограниченных лишь полетом фантазии вебмастеров
    вариации вывода мыльников в коде:
    Код:
    mail@mail.com
    mail (at) mail.com в разных вариациях
    mail (собака) mail.com
    mail (гав-гав) mail.com
    вывод через скрипт или в виде картинки

    решение в лоб, открыть главную страницу и дернуть простейшей регуляркой типа
    Код:
    \b[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,6}\b
    отработает хорошо если на нескольких ресурсах. и не стоит и пары баксов.
     
    • Нравится Нравится x 2
  7. reasonablenough

    reasonablenough Участник

    Пол:
    Мужской
    Вообще сейчас нужны мейлы. Но если есть универсальное решение ( как кей коллектор, например - комбайн), то это даже лучше.

    Просто раньше кроме screaming frog другими парсерами не пользовался, вот и спрашиваю
     
    Последнее редактирование: 16 дек 2017
  8. reasonablenough

    reasonablenough Участник

    Пол:
    Мужской
    Update: Пока альтернативу нашел только в лице hunter.io (http://prntscr.com/hwk8p1 - http://prntscr.com/hwk9xw), но там только 100шт в месяц.

    Но тема остаеться открытой, хотя бы для обычных мейлов и whois`a
     
  9. reasonablenough

    reasonablenough Участник

    Пол:
    Мужской
    Извиняюсь за ап темы, но вопрос остаеться открытым. Хотя-бы базовый или популярный парсер мейлов пойдет
     
  10. Astraport

    Astraport Постоянец

    Пол:
    Мужской
    A-parser хвалят часто.
    Сначала парсинг выдачи. Потом на вход линки, а он шустро собирает все имейлы.
    Но это только малая часть его возможностей.
     
  11. reasonablenough

    reasonablenough Участник

    Пол:
    Мужской
    А что по поводу scrapebox? Пробовал nulled версию, но ничего хорошего из этого не вышло, ничего не парсило. Но все также хвалят
     
  12. reasonablenough

    reasonablenough Участник

    Пол:
    Мужской
    Интересно, кстати, услышать кто на постоянке работает с парсерами, чем и как? Только свои и на своем сервере или кто-нибудь брал популярные решения
     
  13. Иван Иванович

    Иван Иванович Участник

    Пол:
    Мужской
    Если еще актуально. Есть ~900.000 email'ов с привязкой к сайтам, тематике сайтов, региону. Парсил сам.
     
  14. ecvagel

    ecvagel Новичок

    Пол:
    Мужской
    Здравствуйте. А цена вопроса?
     
  15. Думка

    Думка Контент-генератор

    Пол:
    Мужской
  16. DeveLab

    DeveLab Участник

    Пол:
    Мужской
    Пользуюсь A-Parser с мая 2013 года, хороший комбайн, кучу SEO-задач автоматизировал
    До этого в закромах ломаная Content Downloader была
     
  17. sparsa

    sparsa Новичок

    Пол:
    Мужской
    Могу написать парсер под твои задачи
     
  18. Фокс

    Фокс Участник

    Пол:
    Мужской
    Netpeak Checker умеет такое из коробки. Можно напарсить сайтов по нужным тебе запросам, и потом проверить пачку параметров каждого сайта, в том числе и контакты.
    Правда только с морд собирает, если указываешь домен. + может из хуизов тягать, если открыт мыльник. У них 14 дней триала, можно поковырять.
    https://netpeaksoftware.com/ru/ucp?invite=d7527877 - реф
    https://netpeaksoftware.com/ru/ - не реф.
     
    • Нравится Нравится x 1