→ Форум → Публичный раздел → Предложения → Архив → Проблема с интерпретацией кодировок

Проблема с интерпретацией кодировок

09 сентября 2016, 21:21

parsec Зарегистрирован: 02 сентября 2016, 16:26

Зеброид v. 5.6.0 build 11000
Две страницы одного сайта:
1. 4pda.ru/2016/09/09/322978/
в браузере:

Спойлер

после RSS-граббинга:

Спойлер

2. 4pda.ru/2016/09/09/322901/
в браузере:

Спойлер

после RSS-граббинга:

Спойлер

на обеих страницах:

<meta charset="windows-1251"/>
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251"/>

Помогите, пожалуйста разобраться с проблемой.

11 сентября 2016, 14:13

admin Зарегистрирован: 10 апреля 2012, 00:00

В исходном коде первой страницы есть такой текст:

Из-за чего программа предполагает, что текст в неверной кодировке и перебразовует его в UTF-8.

Честно говоря, что делать в такой ситуации не знаю: слепо верить «meta charset» тоже нельзя, так как он не всегда соответствует действительности.

11 сентября 2016, 15:39

parsec Зарегистрирован: 02 сентября 2016, 16:26

Ну, может быть использовать обычную практику и предложить пользователю переход в ручной режим с выбором кодировки «втупую»? По крайней мере obgrabber при включении ручного режима с подобными проблемами справляется, хотя у него своих нерешенностей полно.

12 сентября 2016, 03:48
parsec Зарегистрирован: 02 сентября 2016, 16:26	Отлично заработало… по крайней мере пока) Спасибо!

12 сентября 2016, 19:00
admin Зарегистрирован: 10 апреля 2012, 00:00	parsec в своем сообщении писал(а):Отлично заработало… по крайней мере пока) Спасибо! Пока я делал опцию выбора кодировки они удалили этот комментарий из кода статьи и теперь даже с автоопределением нормально работает

12 сентября 2016, 23:12
parsec Зарегистрирован: 02 сентября 2016, 16:26	Не совсем так. У них в каждом разделе свой админ и лепят они, порой такое, что диву даешься. В любом случае, возможность ручного управления кодировкой — очень полезная опция. Еще раз спасибо.

Логин
Пароль
	Забыли пароль?

Вход /

Регистрация

Проблема с интерпретацией кодировок

Спойлер

Спойлер

Спойлер

Спойлер