ZebroidФорумПубличный разделПредложенияАрхивФильтры для обработки контента

Фильтры для обработки контента

22 октября 2009, 10:56
Зарегистрирован: 11 июля 2009, 11:46
А можно ли сделать такой фильтр что бы вылавливать статьи на английском языке?

И по возможности указывать при каком проценте слов считать статью англоязычной.+

Я давно уже просил сделать фильтр по поиску статей в которых присутствуют теги,слова которые самому можно указывать и переносить такие статьи в другую папку либо сразу удалять. Вообще нужно отлавливать статьи в которых содержится http:// но бывает нужно просто почистить от статей в которых содержится определённое слово или фраза. И был бы идеальный вариант это возможность сохранять слова в фильтре для последующего их использования.

Если это не сложно реализуемо то сделайте пожалуйста в следующем обновлении такие фильтры мне кажется они очень облегчат очистку контента.



24 октября 2009, 13:46
Зарегистрирован: 11 июля 2009, 11:46
У меня появилась одна идея, возможно получится прикрутить что-то типа голосовалки за предложения прямо из программы, и уже по результатам голосования выбирать что делать в следующем апдейте


Да интересная идея, а как туда будут попадать предложения? прямо из программы можно будет добавить или с форума переносится?

Если будет возможность отправлять из программы, то сразу сделать возможность отправлять сообщения об ошибках хоть их и не много но иногда бывает и удобно было их отправлять прям из программы.



24 октября 2009, 14:08
Зарегистрирован: 10 апреля 2012, 00:00
[quote="admin":roxr6zzx]У меня появилась одна идея, возможно получится прикрутить что-то типа голосовалки за предложения прямо из программы, и уже по результатам голосования выбирать что делать в следующем апдейте


Да интересная идея, а как туда будут попадать предложения? прямо из программы можно будет добавить или с форума переносится?

Если будет возможность отправлять из программы, то сразу сделать возможность отправлять сообщения об ошибках хоть их и не много но иногда бывает и удобно было их отправлять прям из программы.[/quote:roxr6zzx]

Предложения будут браться с этой ветки (правда новые будут поступать с некоторой задержкой, назовем её премодерация).

По поводу ошибок, всё же лучше через форум и аську, в 70% случаев конкретного описания места с ошибкой я не получаю, и приходится выяснять уже во время диалога. Да и разработчик так ближе к народу :D



29 октября 2009, 16:54
Зарегистрирован: 11 августа 2009, 17:54
Всё это можно просто сделать

необходимо лиш добавить функцию "Удалить или переместить посты" содержащие regexp

и к этому делу настраиваемые пресеты.. чтобы составив regexp один раз потом уже его запускать в пару кликов мыши.

Наличие пресетов также будет очень полезно и в меню поиск и замена (часто для вычистки текста приходится копипастить один и тотже regexp) Возможность указывать в одном пересете списка regexp для последовательной обработки

Теоретически для удаления всех eng достаточно будет

прописать чтото вроде

[a-z]{5,} - удаляться все посты содержащие 5 и более eng букв подряд

ну или [a-z]*\s[a-z]* - содержащие 2 eng слова



31 октября 2009, 12:32
Зарегистрирован: 25 июля 2009, 11:00


Наличие пресетов также будет очень полезно и в меню поиск и замена (часто для вычистки текста приходится копипастить один и тотже regexp) Возможность указывать в одном пересете списка regexp для последовательной обработки



Это +пицот!!!!!!!

У меня всегда стандартная обработка любого текста. 5 поисков и замен, которые делаю 100%, очень было бы здорово добавить сохраняемые шаблончики для таких списков (списки смешанные и regexpы и обычные search and replace)

короче говоря, типа:

1. "<p> </p>" заменить на "" - обычный search and replace

2. ([\n\r]{2})[\n\r]+ - regexp

Ну и так далее.



01 ноября 2009, 10:46
Зарегистрирован: 11 июля 2009, 11:46
Всё это можно просто сделать

необходимо лиш добавить функцию "Удалить или переместить посты" содержащие regexp

и к этому делу настраиваемые пресеты.. чтобы составив regexp один раз потом уже его запускать в пару кликов мыши.

Наличие пресетов также будет очень полезно и в меню поиск и замена (часто для вычистки текста приходится копипастить один и тотже regexp) Возможность указывать в одном пересете списка regexp для последовательной обработки

Теоретически для удаления всех eng достаточно будет

прописать чтото вроде

[a-z]{5,} - удаляться все посты содержащие 5 и более eng букв подряд

ну или [a-z]*\s[a-z]* - содержащие 2 eng слова


Только их сейчас после поиска удалить нельзя или я ошибаюсь?

И всё таки идея с словарём стоп слов мне больше нравится + если туда добавить регулярные выражения, то думаю все будут довольны.



08 ноября 2009, 11:37
Зарегистрирован: 28 октября 2009, 06:36
Поддерживаю.

Мне лично гораздо проще высказаться в асе по поводу дополнений, ибо мысли идут одна за другой и создавать по 10 разных тем мне просто неохота и нету на это времени



11 декабря 2009, 05:48
Зарегистрирован: 09 декабря 2009, 17:48
Хотелось бы увидеть фильтр для обработки не только текста и заголовка, но и меток. В частности:

Инструменты – Чистка заголовков/статей – добавить возможность очистить метки от мусора, затесавшейся html-разметки (<p>, <b> и так далее, если метки создавались вручную или копировались, а не создавались Зеброидом автоматически), сделать их с маленькой буквы и так далее.



11 декабря 2009, 09:37
Зарегистрирован: 19 ноября 2009, 17:51
Это +пицот!!!!!!!

У меня всегда стандартная обработка любого текста. 5 поисков и замен, которые делаю 100%, очень было бы здорово добавить сохраняемые шаблончики для таких списков (списки смешанные и regexpы и обычные search and replace)

короче говоря, типа:

1. "<p> </p>" заменить на "" - обычный search and replace

2. ([\n\r]{2})[\n\r]+ - regexp

Ну и так далее.


Это как раз то, что я собирался предложить-поддерживаю.

Возможность создавать и сохранять шаблоны. Например шаблон, для обработки скана и т. д.

Плюс прямо в проге небольшой словарик фильтров из этой темы, который бы постоянно обновлялся.



11 декабря 2009, 16:19
Зарегистрирован: 10 апреля 2012, 00:00
Плюс прямо в проге небольшой словарик фильтров из этой темы, который бы постоянно обновлялся.


Что имеется ввиду под словариком?