Сейчас зеброид подбирает ключевые слова по тому, как часто они втречаются в статьях проекта, не учитывая, что частота использования слов в русском языке очень неравномерная. Из-за этого мы имеем картину, когда список подобранных программой ключей на 90% состоит из распространённых обротов, типа "после того", "помните что", "лучше всего", которые приходится чистить руками. Предлагаю следующее: Составить таблицы средней встречаемости отдельных слов в русском языке (это, думаю, будет несложно, достаточно напарсить пару десятков тысяч статей разной тематики и подсчитать слова) и дальше, при подсчете зеброидом частоты встречаемости слов в статьях проекта, считать, что слово является ключевиком, если частота его встречаемости ощутимо (хотя бы процентов на 10) выше, чем средняя для русского языка. Для ключей из нескольких слов можно сделать так - набор слов является ключевиком, если хотя бы одно из его слов в статьях проекта встречается чаще, чем в среднем в русском языке
- О программе
- Новости
- Помощь
- Форум
- Обратная связь
- Купить программу
- Вход и регистрация