На данный момент зеброид считает два текста одинаковыми только если они совпадают слово в слово.
На практике в 100 раз чаще встречаються дубли содержащие до 50% отличий
Например копируем пост меняем в нём всего одно слово - копией это зеброид уже не считает
или разделяем один большой текст на 3 маленьких, каждый из которых является абсолютной копией части большого текста - зеброид также несчитает это дублями.
Проблемма в том что поисковики так несчитают :(
Необходимо ввести проверку на дубликат посредством шинглов, желательно с настройками длины шингла и максимально допустимого процента схожести. html код также недолжен при этом учитываться.
- О программе
- Новости
- Помощь
- Форум
- Обратная связь
- Купить программу
- Вход и регистрация