1. С 1 марта 2017 на форуме запущен платный закрытый раздел. Вся информация по сабжу ЗДЕСЬ

Поговорим о ядрах или семантика головного мозга.

Тема в разделе "Заработок на статейных сайтах", создана пользователем gromov, 8 янв 2015.

  1. gromov

    gromov админ

    Пол:
    Мужской
    коллеги, я вот сегодня хотел высвободить мозги путем монотонной работы, в итоге загрузился пуще прежнего. Никита, ай нид хелп.

    у нас есть заказ на аналитику для сайта, т.е., мы должны составить структуру сайта, подобрать запросы и составить паспорта для 100 статей. Тематика конкурентная (жен здоровье), поэтому решил под кофеек посмотреть, что там происходит.

    первичное СЯ у меня вышло на тыс 24. Базы, счетчики, поисковые подсказки - никакого WS
    чистка дублей, удаление 2 словников и 7+ словников, чистка нетематических запросов фильтрами - остается примерно 15.5к запросов

    чекаю фразовую частоту:
    запросов, имеющих частоту большую или равную 1 - 4к.
    запросов, имеющих частоту большую или равную 5 - 0.9к
    запросов, имеющих частоту большую или равную 10 - 0.4к
    т.е., 11тыс запросов по вордстату сейчас не имеют трафика, привет LT

    ну это не новость, в целом. Веселье началось дальше:
    48 запросов с частотой выше 100, конка по мутагену вся 20-25, вернее, на 90% 25
    поэтому начал смотреть заросы в районе 50 показов. Наткнулся на очередной запрос, у которого по стате счетчика 72 перехода, а по фразовой вордастата - 18 по всему миру. Т.е, по фильтрам этот запрос бы уже в СЯ не попал бы.

    Дальше началось мое любимое веселье - трехсловные запросы с частотой 0, хвостом 0-5, конкой 5-10-15. Или запросы с частотой 210, конкой 25, в выдаче - пара сайтов компаний, в топ 5 уже форумы и явно нерелевантные страницы случайных сайтов с разовым текстовым вхождением.

    В свое время я поднимал у Леши на форуме этот вопрос, но в обсуждение как-то никто активно не ввязался, все переключились на другое. Хочу возобновить начатое.

    Статистика вордстата, по сути, это слепок данных, полученных как-то откуда-то и с учетом за последние 30 суток. При этом, если вы сейчас будете снимать запросы по фундаментам, то получите данные, которые будут отличаться от майских в 2-3 раза в сторону уменьшения. Т.е, мы имеем дело с слепком за 30 суток без учета распределения в теч. года.

    Мутаген что-то как-то считает сам в себе, показывает аналогичные слепки и дает им показатели условной конкурентности.

    Я не наезжаю, но называю вещи своими именами. Потому что хочу понять, как первое плюс второе получается основна для составления статей, структур сайтов итд, которая КАК-ТО ПРИ ЭТОМ РАБОТАЕТ, и работает весьма неплохо, судя по выборке.

    С одной стороны, я понимаю, что мы складываем красное и квадратное, но эта хрень дает результаты. Вот такой вот диссонанс.

    Мое субъективное мнение:
    запросы - это зоны интересов + формулировки.
    Все, что могут дать запросы - это именно вот эти два момента.
    Зона интересов - это кластеры и рубрики, возможность для навигации. А формулировки - это как именно, какими словами человеки обозначают свои запросы в ПС.

    Нужно все это для одного - TF-IDF
    Есть вхождение нужных словей в тело документа - получили трафик. Нет - извольте. Т.е, все тащит LT по длинющим текстам, которые должны быть нашпигованы большим (максимальным) количеством словей, которые могут быть употреблены для обозначения своей зоны интересов.

    Пока проверял выдачу, в топ 12 нашел сайт, который по основному ВЧ-однословнику занял эту позицию за 4-5 месяцев + мутаген показывает, что этот сайт ВИТАЛЕН ряду СЧ запросов. Сайту, повторюсь, примерно 5 месяцев, 120 статей по ВК тематике, уже под 0.3к трафа в сутки, и думаю, что будет его там скоро дохрена. Потому что там статьи по 15к ЗБП примерно. И на каждой статье ключей по ... 10-40, наверное. Проверил 1 статью по WS - ключи, которые смог вычленить, прогнал по фразовой. Максимальная была 15 (если не брать ВЧ 1-3 словники).

    В общем, я тут давно на нуле сижу, пытаюсь все это из себя как-то выкашлять. Какие-то мысли по черепушке ползают, а вот нормально на бумагу не ложатся. Ну кроме того, что от запросов нужны только формулировки, частоту можно даже не проверять )

    Жду жарких обсуждений, теорий и идей. Следование традициям - это збс, но время от времени нужно менять концепции и признавать, что земля не плоская, и тем более - не на трех слонах.

    Серьезно, для чего вы собираете запросы, как вы их варите итд? У меня вечер осмыслений )
     
    Последнее редактирование: 8 янв 2015
    • Нравится Нравится x 2
  2. iamincognito

    iamincognito Контент-генератор

    Пол:
    Мужской
    Крайние 2 проекта, которые делались не на механическом отборе запросов, а на изучении их семантики (т.е. того, как пользователи их формулируют), взлетели у меня даже лучше, чем я планировал. По факту оказалось, что я все равно упустил целые кластеры LT. Точнее, я их упустил при анализе, но зацепил по факту :)

    Грубо говоря, для каждой потребности есть некое "полное" словесное описание А. И есть туча А1, А2, ..., Аn - модифицированных запросов так как их формулируют люди. Я сейчас нацелился в темы, где я могу эти "искажения" понять заранее настолько точно, чтобы зацепить хвосты из 500К+ запросов. Но в принципе это справедливо для любой темы от похудайки до космоса - для каждой проблемы есть пара-тройка "канонических" формулировок и тьма просторечных.

    Я за то, чтобы из фактических запросов извлекать семантику, то есть находить закономерности с которыми пользователи "искажают правильные запросы". И эту модель натягтвать на экспертное СЯ. Но это в идеале.

    А в реальности вопрос с какой стороны подходить - от потребностей или от того "что спрашивали в этом месяце" - упирается имхо в две вещи: экспертизу и бюджет. От предметной области строить ядро сложнее, потому что нет никакой методологии (точнее они есть, но экспертные, нацеленные на работу с живыми носителями знаний). Сколько денег - столько песен...
     
    • Нравится Нравится x 5
  3. gromov

    gromov админ

    Пол:
    Мужской
    iamincognito, на частотность смотрите? на конку по мутагену? или составляете формулировки и тематики статей "для раскрытия темы", остальное пофиг ?
     
  4. gromov

    gromov админ

    Пол:
    Мужской
    пока плавно продолжу выкладывать свои мысли

    рассмотрим классический пример 300 \ 10
    т.к это слепок за последние 30 суток, то найденные запросы с такими параметрами:
    - или на пике трафика, тогда будет откат в сезонные проседания
    - или в яме трафика - тогда в потенциале запрос даст норм прирост трафика
    - или где-то в дороге между ямой и пиком, но в целом - тоже показатель того, что траф возможен.

    это все было бы ок, если бы не амплитуды по частоте показов с 1к до 15.
    т.е., есть пласты запросов, которые в сезон имеют 1к , а в яме - 15.
    ну или растущие тренды - сейчас 5, в теч 2-3 месяцев - 500.

    соответственно, такие запросы запросто уходят под фильтры < 30

    и если речь про лыжи, это понятно. Но есть же нифига неочевидные тематики, где сезонность понимают только те, кто проработал в теме по 3 и более года. Пример из прошлого - продажа наград. В январе - пик ,т.к проходят все показательные выступления танцоров и многие соревнования по БИ. Конец марта - май - пик, т.к идут защиты мастеров спорта и всякие детские соревнования. Лето, время, казалось бы, самой активности - полный штиль до августа. В августе начинаются ... корпоративы. Да-да, на конец лета у многих компаний ДР и прочие юбилеи, начинается награждение непричастных и наказания невиновных. Октябрь - снова соревнования по мастерам спорта, декабрь -мертвый месяц (в начале только чуток корпоративы).
    И на всех этих этапах продается продукция разного типа. Т.е, внутри тематики разные запросы будут иметь свою собственную сезонность.

    Все больше понимаю, что мне схема подбора запросов исходя из показателей снова задает вопросы, на которые я ну никак не могу ответить.
     
  5. Openixxx

    Openixxx Легенда

    по моему, все дело в целях которые ты ставишь.
    у смарт-формулы 300-10 есть ОДНА простая, понятная, и много раз сформулированная в рамках марафона цель.
    эта формула позволяет новичкам (а таких на марафоне большая часть) на новый сайт опубликовав 50 статей (с ключами найденными по ней).. ну скажем так - на 90% ГАРАНТИРОВАННО получить В СРЕДНЕМ ПО БОЛЬНИЦЕ - примерно 20 уников на 1 опубликованную статью.. через полгода.. может быть)))..
    то есть получить примерно 0,5-1к трафика, которые при самой простой монетизации дадут 5% в месяц от вложений в этот сайт. которые и заявляет Смарт на своем марафоне.
    И ВСЁ.
    не надо искать в ней какой то другой, глубокий смысл - тем более, что его там нету))
     
    • Нравится Нравится x 4
  6. Vikatinova

    Vikatinova Постоянец

    Пол:
    Женский
    Это говорит о качестве сайта, его охвата ниши. Думаю во многих тематиках есть "общая сезонность", которая будет иметь свои подзапросы сезонные. Например, лыжи летом тоже нужны, как смешно бы это не звучало: спортсменам, проф. любителям горнолыжного отдыха, которых меньше чем зимой. Тем самым охватывая полностью нишу, мы получаем околомаксимальный трафик, занимаем твердые позиции. Только надо понимать какой трафик нужен нам.
    Как правильно замечено, понять это можно только проведя в нише несколько лет или имея спеца под боком. Но нам же надо сейчас и на века!

    Мне кажется, всю "рыбу" не выловить, какая бы большая сетка ни была. Опять же чего хотим от этой "рыбы"?
    Какой трафик нужен нам - простой, быстрый, дешевый, большой, коммерческий, бизнес и т.д. Вот с этим надо определятся в первувю очередь, а для этого уже разные варианты есть.
    Образно говоря:
    1. По Алексею (Смарт) - 300/10 по Мутагену
    2. По Александру (Медиалаб) - живые запросы из статистик
    3. По Роману (Пузат) - выбор КейКоллектором из вордстата, баз Пастухого и т.д. пула ключей
    4. Народные способы - :)
    У каждого способа свои задачи...вот и все мое ИМХО.
     
    • Нравится Нравится x 1
  7. gromov

    gromov админ

    Пол:
    Мужской
    да, я, видимо, не объяснил самое главное - я на проблематику смотрю не философски, а с точки зрения клиентского бизнеса.
    пример - все та же широкая (реально широкая) женская тематика. Казалось бы, запросов 300\10 должно быть пруд пруди. А в итоге там 97% запросов - это 5+ словники с частотой не более 30 в месяц. Оставшиеся 3% ВЧ имеют конку 20+-5 по Мутагену.

    Т.е, с точки зрения поиска ключей 300\10 - там новому сайту упасть негде.
    Но я вижу, что сайт там делать можно и нужно (клики от бакса в рунете). Но выгребая в статьи максимум УНЧ.

    все чаще вспоминаю ситуацию "вам шашечки или ехать"
     
  8. iamincognito

    iamincognito Контент-генератор

    Пол:
    Мужской
    "Остальное пофиг" :) Сейчас на всех моих проектах, где есть достаточный для анализа траф (хотя-бы 1К в сутки на протяжении хотя-бы полугода) я вижу, что от 40 до 70% трафика приносят хвосты, которые "невидимы" для традиционных инструментов, хотя легко объяснимы и ожидаемы на уровне здравого смысла.

    Я вижу только один смысл в том, чтобы собирать СЯ "от параметров" (не говорю сейчас об обучении) - быстрое окучивание тем. Но если идти по этому пути, то очевидно, что нужно продавать подобные проекты "на взлете", потому что их среднесрочные перспективы туманны. Точнее, совершенно очевидно что "поверхностные" статейники помрут (скорее всего практически одновеменно), неочеведно только когда.
     
    • Нравится Нравится x 4
  9. gromov

    gromov админ

    Пол:
    Мужской
    тогда закономерен следующий вопрос: есть ли статьи, которые не дают трафа вообще? или дают неоправданно мало трафика
    сделайте мне подарок на прошедший ДР, посмотрите по метрике 1-2 сайта )
    заранее спасибо

    мы аналогично проверили на наших старых проектах, но там картина не показательна - отличается подход. Хотя, если разобраться, там частный случай гео LT и закономерности те же - 60-70% это УНЧ траф (так и хочется его назвать метеоритным дождем - мелькнули и нету их, сгорели в статистике Яндекс-Вордстата)
     
  10. iamincognito

    iamincognito Контент-генератор

    Пол:
    Мужской
    Они обязаны быть чисто логически :) Ведь в любой тематике есть часто возникающие вопросы, а есть достаточно редкие, почти уникальные. Это же и создает трастовость глазами юзеров - попсовыми (трафиковыми) вопросами закакан весь веб, а когда возникает потребность решить специфическую проблему - упаришься искать ответы. И тот, кто их дает - попадает в закладки, социалочки и тэ дэ...

    А у меня тоже уже не осталось чистых статейников, такшта подарок получится второй свежести :)
    Один проект есть хоть как-то релевантный вашему вопросу. Он тоже делался "неправильно", но близко - наполнялся он статьями авторов-"энтузиастов", поэтому с какой-то погрешностью, но большая часть предментых вопросов по тематике сайта рано или поздно оказалась закрыта (некоторые вопросы - избыточным количеством материалов). Не чистый статейник (есть весьма живой проф. форум, который тащит проект последние лет 5), но я смотрел только входы на статейные странички. Всего в индексе порядка 2800 статей, за последний квартал входы были по 2725 (здесь и далее цифры по Гуглу). То есть совсем без трафика статей нет. На первые 20% страниц по посещаемости идет 52% трафа, при этом 10% - всего на три статьи. Статей с неприлично малым трафом много, но учитывая что достались они в свое время бесплатно, меня это никогда особо не парило. Возможно там проблема не только в том, что статьи "не актуальны", а и в их плохом качестве (никакой редактуры не было, постилось все as is).

    С сервисными проектами, которые делались "от преметной области" ситуация сильно иная. К примеру, из 58К страниц в индексе за квартал трафик шел всего на ~19800. То есть страниц, которые не получают трафика на коротких интервалах времени дофгища. Но при этом: а) контент также вообще ничего не стоит, б) любая страница появилась в индексе только после того, как этот вопрос задавал живой юзер, который изначально пришел по другому запросу (или с закладки) на другую страницу.
     
    • Нравится Нравится x 2
  11. Parser

    Parser Постоянец

    Пол:
    Мужской
    Страниц без трафика нет, шастают и по карте сайта и по рекламе.
    Надо бы отсечь переходы по сайту, но не вижу в аналитике простого способа.

    Пример: "почему когда садишься в ванну колики в ногах", нет у меня статей на такую тему, есть про судороги, но особо дотошные могут залесть на 50+ позиции и найти из-за наличия похожих слов (ванна - ванночка).

    Поэтому трафик будет в любом случае, просто случайный.
    Топ 10 статет даёт более 30% трафика, топ 20 около 50%.
    Хвост такой, что метрика за месяц показывает 10000 ключей и говорит, что ешё 17% не показала.

    Такого добра на каждом сайте много.
    Я вижу, что первое место это примерно половина от возможного трафика, что уже говорить про 10+
     
    Последнее редактирование: 15 янв 2015
  12. SET_CAT

    SET_CAT Постоянец

    Пол:
    Мужской
    вот, читай, как посмотреть отфильтрованнные входы с поисковых машин, причем на каждую статью указаны запросы.

    http://alaev.info/blog/post/5352
     
    • Нравится Нравится x 4