ZebroidФорумПубличный разделПредложенияАрхивчистка/закрытие незакрытых тегов

чистка/закрытие незакрытых тегов

05 июля 2011, 23:57
Зарегистрирован: 12 ноября 2010, 13:31
хотелось бы чтоб можно было как то чистить от незакрытых тегов или наоборот встречается лишний закрывающий тег допустим </div> и диз ползти начинает, какой-нибудь валидатор-чистильщик бы в идеале придумать но это уже не мелкое предложение вроде как...



06 июля 2011, 03:39
Зарегистрирован: 10 апреля 2012, 00:00
Пример. У вас есть такой текст:



<div style="text-align:center;"><div style="font-weight: bold;">Бла бла бла</div> и <div style="font-weight: italic;">бла бла бла</div>



И какой из них лишний? Убрать хотя бы один из них и вывод сильно поменяется, как программе определять какой убирать?



06 июля 2011, 04:09
Зарегистрирован: 12 ноября 2010, 13:31
в таком случае закрывающий поставить в конце...

в случае:

Бла бла бла</div> и <div style="font-weight: italic;">бла бла бла</div></div>

открывающий в начале статьи

в случае:

Бла бла бла</div>

удаление

тут уже не суть важно как оно будет в статье выглядеть главное что дизайн общий не поползет никуда...



15 июля 2011, 16:33
Зарегистрирован: 21 сентября 2010, 01:15
Я согласен, что программа не сможет найти точно, где внести изменения.

Можно, чтобы зебройд просто отмечал статьи в которых не хватает парного тега.

В сортировку добавить: сортировать материалы с ошибкой в коде.

Дальше в ручную смотреть, если ошибка однотипная, то через поиск и замену.

Интересуют именно теги, которые могут поломать дизайн

<div>

<span>

<table>

<td>

<tr>

В раздел настроек можно вывести эту опцию и поле с тегами, на которые проверять.



17 июля 2011, 12:09
Зарегистрирован: 10 апреля 2012, 00:00
Сделал так, как предложил [user:1o3c16ry]bork75[/user:1o3c16ry]



02 августа 2011, 16:15
Зарегистрирован: 21 сентября 2010, 01:15
Залил две статьи через excel с незакрытым <div> и ничего не увидел.

Как работать с инструментом?



02 августа 2011, 16:59
Зарегистрирован: 10 апреля 2012, 00:00
Запускаете чистка и программа отмечает статьи с незакрытым тегом



13 ноября 2011, 14:41
Зарегистрирован: 07 апреля 2010, 20:40
У меня тоже проблема с незакрытыми тегами. Тяну сайты из вебархива, там полно мусора, а также незакрытых тегов. Пример с <div> конечно правильный, но на моих проектах допустим раз 20 на странице <p> и всего раз 5 </p>. То же самое с <b>.

По-моему, алгоритм для регулярки может быть таким:

  • ищем вхождение <p> (к примеру)


  • ищем следующее вхождение <p>


  • смотрим, есть ли между ними </p>


  • если есть, идем дальше


  • если нет, меняем второе вхождение <p> на </p><p>
  • <\ul>

    То же самое с <b> и т.д.

    Но написание такой регулярки находится далеко за пределами моего понимания.

    Еще способ: нашел скрипт для автозакрытия тегов, вроде рабочий: здесь и здесь.

    Может, можно на его основе что-то подобное вставить в Зеброид? Типа, нажимаешь на кнопочку, и он закрывает все теги на странице / во всем проекте. Можно допустим <div> исключить.



13 ноября 2011, 16:10
Зарегистрирован: 10 апреля 2012, 00:00
Для современных браузеров уже давно не нужно закрывающего тега </p> и вроде как даже валидатор такое пропустит (не уверен на 100%, но когда-то мне говорили, что закрывающий тег для <p> не обязателен). Что касается <b> и других подобных тегов - имхо лучше их вообще удалить из текста, чем получить из такого:



Кто такой <b>Винни Пух, знают все. Этот мультфильм производства компании <b>Уолта Диснея основан на оригинальных иллюстрациях четырехтомного собрания о <b>Винни Пухе Эрнеста Шепарда. Познакомьтесь с <b>Винни Пухом, каким его видят англоязычные ценители и который, конечно, отличается от русской версии <b>Бориса Заходера.



Вот такое:

Кто такой <b>Винни Пух, знают все. Этот мультфильм производства компании </b><b>Уолта Диснея основан на оригинальных иллюстрациях четырехтомного собрания о </b><b>Винни Пухе Эрнеста Шепарда. Познакомьтесь с </b><b>Винни Пухом, каким его видят англоязычные ценители и который, конечно, отличается от русской версии </b><b>Бориса Заходера.


Если не понятно - вставьте исходный код последнего варианта и посмотрите как это будет выглядеть в браузере. Говорить, что второй вариант смотрится лучше чем первый не получится, так зачем тратить время на разработку заведомо не нужно инструмента?

Что же касается ссылок на скрипты автозакрытия тегов - пока не придуман искусственный интеллект, давать более-менее нормальные результаты такие скрипты не будут. Да и задача у них защитится от неумелых писателей новостей, которые могут напихать теги из-за которых поедет дизайн сайта.