ZebroidФорумПубличный разделПредложенияАрхивПроблема с интерпретацией кодировок

Проблема с интерпретацией кодировок

09 сентября 2016, 21:21
Зарегистрирован: 02 сентября 2016, 16:26
Зеброид v. 5.6.0 build 11000
Две страницы одного сайта:
1. 4pda.ru/2016/09/09/322978/
в браузере:

Спойлер


после RSS-граббинга:

Спойлер


2. 4pda.ru/2016/09/09/322901/
в браузере:

Спойлер


после RSS-граббинга:

Спойлер


на обеих страницах:
<meta charset="windows-1251"/>
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251"/>

Помогите, пожалуйста разобраться с проблемой.

11 сентября 2016, 14:13
Зарегистрирован: 10 апреля 2012, 00:00
В исходном коде первой страницы есть такой текст:



Из-за чего программа предполагает, что текст в неверной кодировке и перебразовует его в UTF-8.

Честно говоря, что делать в такой ситуации не знаю: слепо верить «meta charset» тоже нельзя, так как он не всегда соответствует действительности.

11 сентября 2016, 15:39
Зарегистрирован: 02 сентября 2016, 16:26
Ну, может быть использовать обычную практику и предложить пользователю переход в ручной режим с выбором кодировки «втупую»? По крайней мере obgrabber при включении ручного режима с подобными проблемами справляется, хотя у него своих нерешенностей полно.

12 сентября 2016, 03:48
Зарегистрирован: 02 сентября 2016, 16:26
Отлично заработало… по крайней мере пока) Спасибо!

12 сентября 2016, 19:00
Зарегистрирован: 10 апреля 2012, 00:00

parsec в своем сообщении писал(а):Отлично заработало… по крайней мере пока) Спасибо!


Пока я делал опцию выбора кодировки они удалили этот комментарий из кода статьи и теперь даже с автоопределением нормально работает

12 сентября 2016, 23:12
Зарегистрирован: 02 сентября 2016, 16:26
Не совсем так. У них в каждом разделе свой админ и лепят они, порой такое, что диву даешься. В любом случае, возможность ручного управления кодировкой — очень полезная опция. Еще раз спасибо.