Вопрос

04 декабря 2011, 23:27
Зарегистрирован: 21 июля 2010, 20:04
Здравствуйте!Подскажите, один html файл разделен на рубрики с помощью h1, есть рубрики с одинаковыми названиями. Загружаю файл в зеброид, повторяющиеся названия зеброид пропускает из-за этого теряю порядка 1500 рубрик. При этом когда делал подобный импорт в другом проекте, где рубрики были разбиты на отдельные html файлы, одинаковые названия программа допускала. Что-то можно сделать чтобы при импорте из одного файла допускались рубрики с одинаковыми названиями?

+ почему-то также один файл не делиться на рубрики, если использовать регулярное выражение



05 декабря 2011, 02:52
Зарегистрирован: 10 апреля 2012, 00:00
Здравствуйте!Подскажите, один html файл разделен на рубрики с помощью h1, есть рубрики с одинаковыми названиями. Загружаю файл в зеброид, повторяющиеся названия зеброид пропускает из-за этого теряю порядка 1500 рубрик.


Даже не знаю чем вам помочь, лучше опишите зачем вам куча повторяющихся категорий?

При этом когда делал подобный импорт в другом проекте, где рубрики были разбиты на отдельные html файлы, одинаковые названия программа допускала.


Быть такого не может, потому что проверка наличия рубрики проходит на этапе создания записи, потому программе абсолютно всё равно с какого файла была создана та или иная категория.

+ почему-то также один файл не делиться на рубрики, если использовать регулярное выражение


Где использовать, какое регулярно выражение, как выглядит файл?



05 декабря 2011, 04:07
Зарегистрирован: 21 июля 2010, 20:04
[quote="nikky":2xtgwk1e]Здравствуйте!Подскажите, один html файл разделен на рубрики с помощью h1, есть рубрики с одинаковыми названиями. Загружаю файл в зеброид, повторяющиеся названия зеброид пропускает из-за этого теряю порядка 1500 рубрик.


Даже не знаю чем вам помочь, лучше опишите зачем вам куча повторяющихся категорий?

[/quote:2xtgwk1e]

Может я не совсем до конца понял, мне по большому счету нужны не категории, это большой словарь, в котором одно слово может иметь несколько значений. Слова не делю на категории, просто из html файла нужно получить страницы - на каждое слово своя страница,а на главной просто список ссылок на них.



[quote="nikky":2xtgwk1e]При этом когда делал подобный импорт в другом проекте, где рубрики были разбиты на отдельные html файлы, одинаковые названия программа допускала.


Быть такого не может, потому что проверка наличия рубрики проходит на этапе создания записи, потому программе абсолютно всё равно с какого файла была создана та или иная категория.

[/quote:2xtgwk1e]

Каждая страница была в отдельном html файле, добавлял по регулярному выражению, в имени файла повторяющимся словам добавлялась цифра



05 декабря 2011, 05:46
Зарегистрирован: 21 сентября 2010, 01:15
nikky, я бы сделал так:

Создаём всего две категории (папки) - первая это страницы, на которых попадаются определения.

Вторая категория - это страницы самих определений (в качестве заголовка страницы само слово для которого определение)

Далее, выделяем все страницы определений, кликаем правой кнопкой мышки --> Дополнительно --> Копировать имена в буфер

Буфер вставляем в столбик екселя

Снова выделяем все страницы определений, кликаем правой кнопкой мышки --> Дополнительно --> Копировать идентификаторы

Вставляем в соседний столбик экселя

Т.е. в екселе мы получили два столбика. Определение и id страницы.

Выделяем оба столбика и копируем в буфер.

В зебройде открываем обычную перелинковку и делаем импорт из буфера.

Таблица автоматически заполнится как в экселе.

Запускаем анализ, который покажет сколько было найдено вхождений слов в тексте проекта.

Запуск перелинковки автомат сделает ссылки найденных слов на указанный id

Окончания определений можно заменить на *



05 декабря 2011, 07:52
Зарегистрирован: 10 апреля 2012, 00:00
Может я не совсем до конца понял, мне по большому счету нужны не категории, это большой словарь, в котором одно слово может иметь несколько значений. Слова не делю на категории, просто из html файла нужно получить страницы - на каждое слово своя страница,а на главной просто список ссылок на них.


Можете скинуть мне на почту файл? Я думаю что-то придумаю



06 декабря 2011, 17:13
Зарегистрирован: 21 июля 2010, 20:04
Вопрос решил... поставил всем словам вместо h1 h2 и импортировал, внутри раздела страницы могут повторятся. Ну и потом их выделил и перетащил в разделы.