ZebroidДокументацияМеткиСоздание словарей меток

Создание словарей меток

В программе: Метки → Словари меток
Zebroid умеет сам подбирать каждой статье релевантные ей метки. Для этого существует инструмент расстановки меток. Но перед тем, как начать расстановку меток вам нужно создать словари меток, которые вы считаете необходимыми и которые программа будет искать в текстах и заголовках (если, конечно, вы не используете режим расстановки меток по популярным в статье словам).

Процесс создания словарей крайне простой, Zebroid сделает самую сложную работу — проанализирует тексты в поиске наиболее подходящих слов.

Составление словарей меток

Составление словарей меток


Прежде всего вам необходимо создать новый словарь меток (Вызвав контекстное меню для левого верхнего списка). Лучше всего называть словари по их тематике (медицина, пища, софт и т.д.). После того, как словарь создан и вы готовы к его наполнению — откройте проект, который будете анализовать и из текстов которых вы будете выбирать слова для будущего словаря меток.

Далее запускайте анализ текстов, предварительно настроив программу так, как вам это нужно:

  • Лемматизировать — эта опция будет приводить слова в начальную форму (только для русского языка), например из слов «зебра, зебры, зебрами» делать одно слово «зебра». Это позволит избавится в списке от лишних вариантов и дать более точные результаты популярности каждого из слов. К тому же метки сразу будут в правильной форме. К сожалению эта опция не работает при работе со словосочетаниями
  • Минимальная длина слова — задайте минимальную длину слова для меток. Это нужно чтобы отсеять «мусорные» слова, такие как «на, от, до, а, и» и т.д.
  • Количество слов или длинна словосочетания, которую должна искать программа для вашего словаря. Подбор слов можно делать в несколько заходов, например: сначала подобрать одиночные слова для меток, потом словосочетание с двух слов, потом с трех и т.д.
  • Лимит выборки — количество слов, которое будет показано для выбора меток после их анализа

После анализа, у вас будет список слов отсортированный в порядке их популярности. Те слова, что вы считаете подходящими можете добавлять в словарь.

Слова, которые вы считаете «мусорными» (т.е. такими, которые точно, по вашему мнению, не войдут ни в один из словарей меток) можно добавить в черный список (кнопка «ЧС» — черный список). При следующих анализах такие слова буду игнорироваться программой. Черный список позднее можно отредактировать (дополнить или изменить).

Так же, вы можете вручную вносить слова в свой словарь меток или редактировать уже добавленные. Для этого воспользуйтесь контекстным меню в левой части окна.