ZebroidФорумПубличный разделПредложенияАрхивУдаление дублей по совпадению названий/статей

Удаление дублей по совпадению названий/статей

05 ноября 2011, 16:22
Зарегистрирован: 26 апреля 2010, 01:51
Уже несколько раз просил:

1. Cделать удаление дублирующих статей по совпадению названий без анализа статей.

2. По полному совпадению статей без шинглов и так далее.

Реально очень медленно работает поиск дублей, толку на больших проектах от него никакого, поэтому нужен вариант тупого отбора по названиям.



05 ноября 2011, 17:25
Зарегистрирован: 26 апреля 2010, 01:51
4 с лишним часа ушли на поиск дублей из 2000 статей, проект 100 мегов.

Хотя нужно было всего лишь тупо удалить статьи с одинаковыми названиями.

То есть работы максимум на минуту запрос select distinct.

Может я чего-то не понимаю, и можно намного быстрее сделать при имеюшемся функционале?



14 ноября 2011, 08:29
Зарегистрирован: 10 апреля 2012, 00:00
viewtopic.php?f=16&t=1568