ZebroidФорумПубличный разделВопросыИмпорт html

Импорт html

02 октября 2015, 19:11
Зарегистрирован: 17 февраля 2014, 03:44
Имеется большое количество документов html со структурой:

Заголовок
Описание
Категория
Тег
Произвольное поле 1
Произвольное поле 2
Произвольное поле 3
Контент

Надо импортировать данный материал в зеброид согласно строк, как из CSV (указав за что каждая стока отвечает). В CSV как я понял есть недостаток, 36000 символов в ячейке, а у меня больше, поэтому теряется много информации? поэтому использовать надо HTML(TXT).

Возможно ли это реализовать.

Комментарий отредактирован 3 раз(а). Последний раз редактировал QCrime 02 октября 2015, 19:12.
04 октября 2015, 15:51
Зарегистрирован: 10 апреля 2012, 00:00
Нет, разве что у вас есть возможно каждый сделать файлы подобной структуры:
<h1>Категория</h1>
<h2>Заголовок</h2>
[description]Описание[/description]
[tags]Тег[/tags]
[cutom_field_name_1]Произвольное поле 1[/cutom_field_name_1]
[cutom_field_name_2]Произвольное поле 2[/cutom_field_name_2]
[cutom_field_name_3]Произвольное поле 3[/cutom_field_name_3]
Контент

Тогда можно будет существующим функционалом разобрать файл.

В CSV как я понял есть недостаток, 36000 символов в ячейке, а у меня больше
CSV парсер у меня самописный и подобных ограничений в нем нету. Ради интереса только что проверил — успешно импортировал файл в котором количество символов в ячейке превышает 50 тыс. Скорее всего у вас файл не валидный.