Кстати разобрался я с этим скриптом, заполнив по человечески разделы бренд и тип. Посмотрел на работу скрипта, не уверен что все делается как надо.
Просветите, кто в теме: такой способ группировке ведь отстает по качеству от метода с нормальной кластеризацией через использование выдачи ПС (яндекса, гугла) ?
И еще момент, если метод, используемый в скрипте норм, и имеет право на жизнь, то почему бы и не написать программу? Я бы написал, так как думаю что алгоритм несложен.
скрипт не подразумевает кластеризацию как таковую, т.к изначально заточен под первичную быструю обработку больших (личный опыт - 140к запросов, если я правильно помню) массовов:
- быстрая чистка на явные минус-слова
- быстрая группировка по нужным признакам
только после этого наступает момент ручной проработки и нормальной кластеризации.
Идея была увидена у Деваки в блоге, но для опенофиса. Мы ее чутка доработали (идею) под свои нужды и написали под офис, после чего выложили в свободный доступ.
какой смысл писать программу, если существуют проверенные нормальные сервисы.
И мое личное мнение:
метод с нормальной кластеризацией через использование выдачи ПС (яндекса, гугла)
как раз не является нормальным, именно поэтому (в том числе) все больше уходил от механик в сторону маркетинга и бизнесовых подходов. Поэтому скрипт и остановился на том уровне развития, где он есть сейчас.
И именно поэтому любой шарящий семант, а тем более - информационный архитектор сайтов скажет, что любая автоматическая кластеризация требует тщательной ручной проверки и доработки, т.е., это еще один этап работы с СЯ, но никак не конечный продукт.