ZebroidФорумПубличный разделВопросыКак собрать ключи учитывая знаки препинания и регистр

Как собрать ключи учитывая знаки препинания и регистр

15 октября 2015, 23:16
Зарегистрирован: 27 июня 2013, 06:25
Подскажите как собрать ключи учитывая знаки препинания и регистр? Когда работаю через «Обработка текстов» —> «Подбор ключевых слов», ключи собираются как из портянки. Например, в тексте есть список:
Материал: Сатин
Состав: Хлопок

Он выдает ключи: материал сатин состав, сатин состав хлопок, состав хлопок и т.д.

Мне данные ключи нужны для их последующей замены, а таким образом я ничего заменить не смогу. Как использовать продуктивно Зеброид для выполнения моей задачи?

16 октября 2015, 00:52
Зарегистрирован: 10 апреля 2012, 00:00
Как использовать продуктивно Зеброид для выполнения моей задачи?
Зеброид убирает знаки препинания почему? Потому что он ищет часто употребляемые словосочетания, если не убирать знаки — то количество совпадений будет меньшим. То, как программа работает и есть «продуктивно», а то как вы хотите чтобы она работала — называется «индивидуальный случай». Для вашего случае в программе ничего не предусмотрено.

16 октября 2015, 00:54
Зарегистрирован: 10 апреля 2012, 00:00
В дополнение:

а таким образом я ничего заменить не смогу

Не вижу абсолютно никакой проблемы, тот же случай которой вы приводили в качестве примера: заменяем пробелы на что-то типа [\s,\.!\?:\-]+ и получаем вполне рабочие регулярки, которые отлично будут находить совпадения со знаками препинания или без.

Комментарий отредактирован 1 раз(а). Последний раз редактировал admin 16 октября 2015, 00:55.
16 октября 2015, 00:57
Зарегистрирован: 27 июня 2013, 06:25

admin в своем сообщении писал(а):В дополнение:

а таким образом я ничего заменить не смогу

Не вижу абсолютно никакой проблемы, тот же случай которой вы приводили в качестве примера: заменяем пробелы на что-то типа [\s,\.!\?:\-]+ и получаем вполне рабочие регулярки, которые отлично будут находить совпадения со знаками препинания или без.


Могли бы подробнее про такую регулярку? И еще, что делать с регистром?

Комментарий отредактирован 1 раз(а). Последний раз редактировал in-touch 16 октября 2015, 01:00.
17 октября 2015, 13:13
Зарегистрирован: 10 апреля 2012, 00:00
Регулярка вида
материал[\s,\.!\?:\-]+сатин[\s,\.!\?:\-]+состав
Будет срабатывать на такие конструкции:
Материал: Сатин
Состав
И на такие:
материал сатин, состав
И т.д.

По умолчанию регулярные выражения в Зеброиде игнорируют регистр.

17 октября 2015, 22:29
Зарегистрирован: 27 июня 2013, 06:25

admin в своем сообщении писал(а):Регулярка вида

материал[\s,\.!\?:\-]+сатин[\s,\.!\?:\-]+состав
Будет срабатывать на такие конструкции:
Материал: Сатин
Состав
И на такие:
материал сатин, состав
И т.д.

По умолчанию регулярные выражения в Зеброиде игнорируют регистр.


К сожалению слова с большой буквы заменяются на маленькую, но есть инструменты, чтобы привести текст в порядок, например, чтобы все предложения начинались с заглавной. Поэтому воспользуюсь предложенной регуляркой. Большое спасибо за помощь!