ZebroidФорумПубличный разделБаги / ОшибкиАрхивПопытки разбивки больших текстов на категории.

Попытки разбивки больших текстов на категории.

07 февраля 2010, 11:06
Зарегистрирован: 30 января 2010, 12:31
Обработка 4000-6000 тысяч страниц из xml фида, с попыткой их разбивки на категории и подкатегории.

1) Раздел Автометки.

В тесте 4500 страниц без разбивки по категориям. У каждой 1 кей и 1 метка.

Расставляем метки, Отмечачем "дублировать метки в поле keywords", отключаем леммацию, выбираем словарь.

Итог: Кейворды, которые уже были в постах стерты. Там где требовалось, добавлены новые. Зачем старые стираются?

старые метки то-же стираются...

2) Раздел Автометки.

В тесте 4500 страниц без разбивки по категориям. У каждой 0-2 метки

Нажимаем:Создавать категории по меткам. Без леммации. Количество категорий для поста 4-7 (по дефолту). Выбрал словарь.

Итог: Создано 4 категории из 9 возможных и масса необработанных материалов.

Ок. Сходу повторяем операцию, выбирая оставшиеся не разбитыми на категории посты.

Итог: Со второго захода, доразбилось на категории все оставшееся

3) Раздел автокатегории.

В тесте 4500 страниц разбитых на 50 категорий. У каждой 1 кей и 1 метка.

Нажимаем: автокатегории, дополнительние категории. Каждый раз заново "с руки" вписываем ключевые слова (жаль, из кеев страниц не могут подхватываться или переделываться готовые метки в категории) и присваиваем им категории (категории приходится создавать заранее - по ключу не хотят создаваться. Но, это технические мелочи... Выбираем присвоение категории по ключу, запускаем.

Итог: ничего не происходит. При повторном заходе в раздел автокатегории, введеные руками ключевые слова сохраняются, а присвоенные им категории уже все стали одинаковыми.



07 февраля 2010, 14:00
Зарегистрирован: 10 апреля 2012, 00:00
1) Раздел Автометки.

...

Итог: Кейворды, которые уже были в постах стерты. Там где требовалось, добавлены новые. Зачем старые стираются?

старые метки то-же стираются...


Стирается выходя из логики, что если запускается инструмент Автоматеки, значит старые вас не устраивают.

--------

2) Раздел Автометки.

...

Итог: Со второго захода, доразбилось на категории все оставшееся


Вы можете предоставить для теста такой проект со скриншотом окна автометок перед запуском? Потому что у меня не удалось получить "необработанный материал".

--------

3) Раздел автокатегории.

...

Итог: ничего не происходит.


Это скорее всего от непонимания принципа работы инструмента. Вкратце суть в том, чтобы у постов было несколько родительских категорий (так называемые мультикатегории), но визуально в дереве проекта не будет дублирующихся постов (те, что находятся в разных категориях, но по сути это одна статья). Чтобы увидеть к каким категориям принадлоежит пост (кроме, естественно, родителя в дереве проекта), нужно переключится на закладку "Дополнительное" интересующего поста. Категории к которым принадлежат пост будут выделены. Потому и нету возможности вводить имя поста сразу в инструмента Автокатегорий, ведь при таком подходе существования категории обязательное условие.

При повторном заходе в раздел автокатегории, введеные руками ключевые слова сохраняются, а присвоенные им категории уже все стали одинаковыми.


Этот баг я обнаружил - исправлю.



08 февраля 2010, 10:08
Зарегистрирован: 10 апреля 2012, 00:00
1) возможность сохранения старых меток добавил - будет в сегодняшнем апдейте

2) жду проект для тестов

3) исправил



Тема закрыта