ZebroidФорумПубличный разделБаги / ОшибкиАрхивЯндекс.Шинглы: один сплошной баг

Яндекс.Шинглы: один сплошной баг

23 апреля 2012, 17:47
Зарегистрирован: 06 января 2012, 14:16
Собственно проблемы в том, что 1) Яндекс.Шинглы работает крайне медленно (Etxt Антиплагиат за тот же промежуток времени проверяет раза в три больше статей) и, самое главное 2) не определяет уникальности статьи.

Текст, приведенный ниже, Яндекс.Шинглы проверяет почти 10 секунд и объявляет полностью уникальным. В тоже время, Etxt Антиплагиат уже через пару секунд объявляет, что этот текст - 100% дубликат. В обоих случаях размер шингла - 5.

Может Вам стоит договориться с разработчиками Etxt Антиплагиат об использовании их алгоритма в "Зеброид"?



Ремонт квартиры и воплощение дизайнерского проекта в жизнь нередко наводит на мысли о перепланировки пространства. Если снести стену, помещение будет выглядеть значительно больше, появится необходимый «воздух» и пространство. Перепланировку следует заверить в соответствующих инстанциях, только после утверждения проекта можно приступать к монтажу. Поскольку эта тема довольно трудная, о ней лучше говорить отдельно. Мы же рассмотрим общие вопросы, возникающие вместе с идеей построить или убрать стену в квартире.

Для начала необходимо определиться, что вы хотите от будущих стен. Возможно, вам подойдет обычная гипсокартонная перегородка, а может, без кирпичной кладки нельзя будет обойтись.

Главная проблема так называемых «угловых» квартир – холод, идущий от стен. Чтобы исправить это недоразумение, стену можно утеплить. В роли утеплительного материала чаще всего выступает стекловата или пенополистерол. После прокладки материала, стены обивают гипсокартонными листами.

Вокруг стекловаты ходит много слухов, так некоторые считают этот материал крайне вредным. Следует помнить, что вред здоровью могут нанести неизолированные участки утеплительного материала, а точнее его частицы. Стекловата не является горючим материалом, а пенополистерол поддерживает горение. Разумно выбрать специальные составы, снижающие горючесть и обработать ими материал.

Принцип звукоизоляции стен похож на принцип теплоизоляции, с той лишь разницей, что в первом случае материалы стараются чередовать (слой с большей плотностью, слой с меньшей), обивать стены рекомендуется гипсоволоконными листами. И так и другая изоляция требует сократить пространство комнаты, примерно на 6 сантиметров с каждой стороны.

Для создания углублений и ниш используют перегородки из разных материалов: гипсокартонных листов, кирпича, пенобетонных блоков, гипсовых плит. Гипсокартонные листы просты в резке, прекрасно смотрятся и позволяют моделировать пространство, их главным минусом является невозможность выдерживать большой вес, то есть к таким стенам нельзя подвесить тяжелые предметы.

Кирпичные перегородки – практически классический вариант возведения дополнительной стены, они позволяют устанавливать тяжелые предметы (например, двери из благородных пород дерева), но сам процесс монтажа занимает много времени.

Пенобетонные блоки устанавливаются быстро, но после возведения их обязательно нужно штукатурить.

Гипсовые плиты – универсальный материал, позволяющий возводить стену в максимально короткий срок, сразу готовы к эксплуатации и не требуют дополнительной обработки.

Все эти материалы не являются горючими, позволяют в большей или меньшей мере моделировать пространство, защищают помещение от холода и шума.





24 апреля 2012, 10:11
Зарегистрирован: 10 апреля 2012, 00:00
1) Яндекс.Шинглы работает крайне медленно (Etxt Антиплагиат за тот же промежуток времени проверяет раза в три больше статей)


Яндекс.Шинглы работают по том же принципу, что Etxt Антиплагиат и скорость проверки - дело случая

самое главное 2) не определяет уникальности статьи.


Во-первых, шанс определить копию статьи 100% нету ни у одной из программ, чтобы знать почему так происходит нужно понимать принцип по которому они работают, во-вторых, с помощью предоставленной вами статьи был выявлен баг, который приводил к тому, что программа не верно определяла кодировку на некоторых сайтах, но не на всех, чтобы можно было такое заявить.

Текст, приведенный ниже, Яндекс.Шинглы проверяет почти 10 секунд и объявляет полностью уникальным. В тоже время, Etxt Антиплагиат уже через пару секунд объявляет, что этот текст - 100% дубликат. В обоих случаях размер шингла - 5.


Хм.., а у меня ситуация абсолютно противоположная:

[youtube:25urv5qd]n6-hjf-sXK8[/youtube:25urv5qd]

Видео снято после того как баг с кодировкой исправлен, но он не влиял на скорость работы, только на результат.

По этому видео прекрасно видно, что скорость работы первой программы (даже без учета времени на ввод каптчи) около 25 сек, тем временем как Зеброид справился сам за 5 сек.



24 апреля 2012, 10:51
Зарегистрирован: 10 апреля 2012, 00:00
Приношу свои извинения, был не прав: я детально изучил работу инструмента на разных текстах и пришел к выводу, что инструмент действительно можно считать не рабочим (4 из 5 запусков программа считает текст уникальным, а это крайне плохой реззультат). Оказывается недавно Яндекс изменил некоторые ключевые механизмы работы, на которых основывался Зеброид тем самым очень сильно ухудшил шансы успешного поиска.

Проанализировав ситуацию я пришел к выводу, что симбион с существующими инструментами поиска дубликатов наиболее приемлемый вариант, потому я начал переговоры с программистом Etxt Антиплагиат в надежде на сотрудничество.



30 мая 2012, 11:08
Зарегистрирован: 28 апреля 2012, 20:44


Проанализировав ситуацию я пришел к выводу, что симбион с существующими инструментами поиска дубликатов наиболее приемлемый вариант, потому я начал переговоры с программистом Etxt Антиплагиат в надежде на сотрудничество.


Надеюсь на успех, архиважная вещь



30 мая 2012, 11:45
Зарегистрирован: 10 апреля 2012, 00:00
К сожалению автор Etxt Антиплагиат отказался сотрудничать :(. Буду искать другие варианты



11 августа 2012, 10:48
Зарегистрирован: 10 апреля 2012, 00:00
Перешел на использование Advego Plagiatus: http://zebroid.com.ua/page/yandex-shingly



Тема закрыта