ZebroidФорумПубличный разделПредложенияАрхивУдаление дублей по названию

Удаление дублей по названию

29 октября 2010, 04:06
Зарегистрирован: 26 апреля 2010, 01:51
Сейчас есть функция удаления дублей по тексту статей.

Для больших проектов (несколько десятков тысяч статей) она работает очень медленно (от часа и более).

Иногда дешевле выкинуть дубли по менее сложному алгоритму.

Поэтому предлагаю:

1. Сделать аналогичную функцию для названий статей.

2. Сделать опцию "из статей с одинаковым названием оставлять более длинную".