ZebroidФорумПубличный разделВопросыОчистка текста от тега H2

Очистка текста от тега H2

06 октября 2011, 02:40
Зарегистрирован: 24 декабря 2010, 23:53
Добрый день. Подскажите пожалуйста.

Столкнулся с проблемой- после парсинга текстов получился текст вида:

H1 название /H1

текст статьи

Н2 вопросы и ответы /H2

H3 .... /H3

текст...

Вопрос такого плана . Можно ли как то средствами программы удалить все начиная от H2 ?

то есть оставив заголовок и текст.



06 октября 2011, 07:13
Зарегистрирован: 29 января 2010, 16:28
Обработка текстов - > Поиск и замена:

Режим: Регулярные выражения

Найти:

<h1>(.+?)</h1>

Заменить на:

\1

Найти:

<h2>(.+?)</h2>

Заменить на:

\1

Найти:

<h3>(.+?)</h3>

Заменить на:

\1



06 октября 2011, 07:17
Зарегистрирован: 29 января 2010, 16:28
Если что не так, то давай пример текста:

Что было -->> что должно стать



06 октября 2011, 07:25
Зарегистрирован: 24 декабря 2010, 23:53
немного не то...

необходимо удалить все поле H2 т.е. теги (их удалить легко) и ТЕКСТ.

текст если так регулякой взять, то удалится текст основной. -вот это проблема.

Пример:

##Ситуация На Рынке Недвижимости Казани

@@title=Ситуация На Рынке Недвижимости Казани

@@description=Не смотря на финансовые трудности, спрос на рынке недвижимости растет с каждым днем. Люди покупают и продают квартиры, снимают и сдают. Иногда просто вкладывают деньги в недвижимость, так как

@@keywords=недвижимость,казань,недвижимость в казани,продам квартиру казань,объвления недвижимость казань

<h1>Ситуация На Рынке Недвижимости Казани</h1>

<p>Не смотря на финансовые трудности, спрос на рынке недвижимости растет с каждым днем. Люди покупают и продают квартиры, снимают и сдают. Иногда просто вкладывают деньги в недвижимость, так как это самое выгодное вложение средств на сегодняшний день, цены на рынке жилья как никогда стабильны.</p>

// После нужно удалить....

<h2>Вопросы и Ответы</h2>

<h3> недвижимость</h3>,

<h3> казань</h3>,

<h3> недвижимость в казани</h3>,

<h3> продам квартиру казань</h3>,

<h3> объвления недвижимость казань</h3>

<h2>Статьи по теме</h2>

<h2>Последние Недвижимость Статьи</h2>

<h2>Подробнее о Gordon</h2>

<p>Казань - это уникальный и очень красивый город, который является столицей Республики Татарстан Тысячелетняя история создала неповторимый образ, в котором прекрасно уживаются старый и новый город.</p>



06 октября 2011, 07:30
Зарегистрирован: 29 января 2010, 16:28
Найти:

</p>(.*)

Заменить на:

</p>



06 октября 2011, 07:40
Зарегистрирован: 24 декабря 2010, 23:53
не подходит :?

потому как пример я привел для сокращения с одной строкой, на самом деле строк больше. И получиться что после первой строки все обрежется..



06 октября 2011, 07:48
Зарегистрирован: 29 января 2010, 16:28
Если что не так, то давай пример текста:

Что было -->> что должно стать


Аттач прикрепи, я не телепат.



06 октября 2011, 08:01
Зарегистрирован: 24 декабря 2010, 23:53
komyak Спасибо большое. не злись :roll: . логику я понял разберусь дальше сам.

Привет с нулледа.



06 октября 2011, 12:00
Зарегистрирован: 24 декабря 2010, 23:53
Странно, но выражения вида как то -не работают

<h2>Вопросы и Ответы</h2>(.*)

то есть по идее должно выделять все начиная от <h2> и далее, а выделяет только внутри <h2>Вопросы и Ответы</h2>

Что не так? подскажите... Это баг?

В других местах такое выражение работает...



07 октября 2011, 02:31
Зарегистрирован: 29 января 2010, 16:28
Привет с нулледа.


=))

то есть по идее должно выделять все начиная от <h2> и далее


На твоём примере работает. Может есть пробелы лишние или буквы?

Попробуй так:

<h2>Вопрос(.*)тветы</h2>(.*)