ZebroidФорумПубличный разделПредложенияАрхивАвтоназвания

Автоназвания

15 июля 2009, 14:20
Зарегистрирован: 06 июля 2009, 17:29
Ещё идейка неплохая - автоназвания.

Если сайт создаётся из скана, то весь текст в довольно случайном порядке разивается на куски по количеству символов. названия придумываются почти что с потолка. Соответственно, появляется идея автоматизировать процесс.

Как реализовать?

Всё просто. Задаём промежуток, например, 1500-2000 символов. Программа ищет конец абзаца в этом интервале (тег </p>) и обозначает всё, что дальше как новую статью, выставляя е название и рубрику случайным образом из списка.

+ почти полная автоматизация процесса создания сайта из скана

+ минимум времени на работу

- смысла может быть не много, но ведь сателлиты делают не ради него?;)



17 июля 2009, 05:02
Зарегистрирован: 13 июля 2009, 22:41
Хотел тоже самое предложить, опередили)

На самом деле эта функция очень полезна. Софта чтобы реализовать такое например для зебрума не встречал, разве что кто-то продавал простенький скрипт за 10$.

Помоему названия должны составлятся случайным образом из частоупотребляемых в статье слов. А насчет рубрик надо подумать, можно из задавать вручную, либо также автоматом.

Будет отлично если данный функционал будет реализован.



17 июля 2009, 07:52
Зарегистрирован: 06 июля 2009, 17:29
Как реализовать названия (осмысленные) из слов текста не знаю, а вот задать программе список - это элементарно и ничуть не сложнее авторасстановки рубрик. Но в любом случае, тогда программа превратится в сателлит-комбайн.)



17 июля 2009, 08:15
Зарегистрирован: 13 июля 2009, 22:41
В том то и дело что для ГС из скана, разбитого на статьи таким образом осмысленные названия и ненужны.

Да, действительно получится софт для полной автоматизации подготовки контента :shock:



27 июля 2009, 04:07
Зарегистрирован: 10 апреля 2012, 00:00
При импорте есть возможность задавать названия статей по регулярным выражениям, т.е. по своей сути выходят те же автоназвания. Если нужно - помогу составить регулярку (пишите в закрытой ветке)



27 июля 2009, 05:40
Зарегистрирован: 13 июля 2009, 22:41
Отлично! Это как я понял для импорта когда в одном файле одна статья! А если есть сплошной текст не разбитый на файлы, есть ли возможность чтобы текст автоматически разбивался на статьи, или как это можно осуществить? :roll:



27 июля 2009, 06:03
Зарегистрирован: 10 апреля 2012, 00:00
Отлично! Это как я понял для импорта когда в одном файле одна статья! А если есть сплошной текст не разбитый на файлы, есть ли возможность чтобы текст автоматически разбивался на статьи, или как это можно осуществить? :roll:


Нужно подумать, а какие есть варианты кроме разбивать по количеству символов/абзацев/слов?



28 июля 2009, 16:27
Зарегистрирован: 13 июля 2009, 22:41
Нужно подумать, а какие есть варианты кроме разбивать по количеству символов/абзацев/слов?


Эмм.. у меня нету больше вариантов( :roll: Мне представляется это так: задается число символов на одну статью, можно задать диапазон например 1500-2000 и чтобы деление было рандомно по колву символов из диапазона. Может кто ещё чего предложит? Должен же быть ещё какой-нибудь вариант :shock:

Очень жду этой возможности :roll:



29 июля 2009, 14:44
Зарегистрирован: 10 апреля 2012, 00:00
[quote="admin":j7qu3ib7]Нужно подумать, а какие есть варианты кроме разбивать по количеству символов/абзацев/слов?


Эмм.. у меня нету больше вариантов( :roll: Мне представляется это так: задается число символов на одну статью, можно задать диапазон например 1500-2000 и чтобы деление было рандомно по колву символов из диапазона. Может кто ещё чего предложит? Должен же быть ещё какой-нибудь вариант :shock:

Очень жду этой возможности :roll:[/quote:j7qu3ib7]

Не сомневайтесь будет. Может вы не заметили, но желания тех, кто уже купил для меня приоритетны :)

З.Ы. Думаю 1-2 обновления и появится это опция :)



15 августа 2009, 05:44
Зарегистрирован: 11 августа 2009, 21:49
Поддерживаю, авторазбитие больших файлов на статьи очень нужная функция. Например у меня много файлов в которых находятся по 200-500 статей, они разделены между собой 3-5 enter'ами. Если у кого-ито такая же ситуация то это можно реализовать в проге вот так...

Первая строка название статьи (разумеется в саму статью она попадать не должна), дальше идет текст статьи, как только появляется больше 3 enter'ов программа понимает что статья закончилась и следующая строчка будет название новой статьи (разумеется в саму статью она попадать не должна) дальше идет статья, потом опять enter'ы, статья заканчивается и так до конца пока файл не будет полностью обработан.

Но это вариант для кучи статей, а не скана, но если будет реализовано буду очень благодарен