Форум » Книжница » Православные книги со stsl.ru » Ответить

Православные книги со stsl.ru

rasergiy: Все тут конечно же знают уникальный ресурс http://www.stsl.ru/ Никто не хочет поучавствовать в переводе безценных книг выложенных там в нормальный электронный вид? Делаю первый шаг. Кириллова книга.: http://www.stsl.ru/manuscripts/staropechatnye-knigi/682 Формат: DeJavu с содержанием (в виде иерархического меню закладок). Качество сжатия без заметных потерь. Качать здесь: http://rutracker.org/forum/viewtopic.php?t=3889174

Ответов - 51, стр: 1 2 All

Виталий Вараюнь: Сергие (или еще кто), не можешь еще раз рассказать как книжки с сайта Лавры скачивать? Помню, что через download master, а вот как именно не помню.

САП: http://www.liveinternet.ru/users/1160909/post94299291#BlCom503498720

Administrator2: Ставишь прогу Download Master открываешь последнюю страницу рукописи, которую хочешь скачать, в свойствах картинки копируешь прямую ссылку картинки, а дальше в меню Довнлоуд матсера заходишь во вкладку "Закачки", выбираешь "Добавить группу закачек". К примеру хочешь скачать: http://www.stsl.ru/manuscripts/173.II/011/medium/011-0141.jpg Добавляешь ссылку в группу закачек, то 1. цифры "141" заменяешь на символ "$" в количестве трёх штук, тогда твоя ссылка приобретёт вид "http://www.stsl.ru/manuscripts/173....um/011-0$$$.jpg" потом, обязательно в окошечке под №3 указать "1", а в окошечке под №4 указать "141", а далее нажать ок, потом сформировать список закачек (это делается автоматически), указать место в куда скачивать.


rasergiy: Можно скачивать в линуксе штатными средствами. Получаем имя файла, например http://www.stsl.ru/manuscripts/173.II/011/big/011-0022.jpg и узнаем число страниц (в данном примере 139), затем: lastpage=139; for ((i=1; i <= $lastpage; i++));do; wget `printf "http://www.stsl.ru/manuscripts/173.II/011/big/011-%04d.jpg" $i`; done

rasergiy: Качать/пережимать/выкладывать могу я. Если что кому надо конкретное со stsl вопрошайте. Ваша помощь может быть например в наборе содержания.

Maximus: Предлагаю свое участие.А также предлагаю организовать нормальную библиотеку цс текстов. Нужно развороты разрезать , делать из них нормальные странички, инерактивные оглавления итд. Чтоб на айпаде и прочем читать можно было.

Administrator2: rasergiy Maximus rasergiy пишет: Ваша помощь может быть например в наборе содержания. Старопечатные книги московской печати выложить бы в удобочитаемом виде: http://www.stsl.ru/manuscripts/oldprint

Maximus: Administrator2 пишет: Старопечатные книги московской печати выложить бы в удобочитаемом виде: http://www.stsl.ru/manuscripts/oldprint Кто бы взялся помогать?

Administrator2: Maximus пишет: Кто бы взялся помогать? Скажи чем? Люди найдутся. Можно тут расписать порядок действий, разбить книги по группам и последовательно все сделать.

Михайло: Непременно найдутся. Только надо координатора, да и может какой начальный курс провести по набору ЦС текстов.

Administrator2: Михайло пишет: по набору ЦС текстов А зачем их набирать? Maximus пишет: Нужно развороты разрезать , делать из них нормальные странички, инерактивные оглавления итд. Чтоб на айпаде и прочем читать можно было.

Михайло: Administrator2 пишет: А зачем их набирать? для меньшего объема получаемого файла + дальнейшего использования для печати. Минус этого - много работы и могут украсть готовый результат. Если только резать картинки, то работы становится на порядок меньше (нужен только широкий канал инета), но и использование полученного файла мобильных устройствах тогда усложняется (хотя для современных планшетов-айфонов это уже не проблема).

rasergiy: Резать развороты, и обрабатывать сканы можно довольно просто и быстро, чуть позже на конкретном примере пошагово опишу все действия, как это делать в совершенно автоматическом режиме с вариантом получения на выходе djvu/pdf. Михайло Набирать ЦС тексты это объем работы в тысячи раз более затратный. чем выкладывание скана в pdf/djvu (последний предпочтительнее для электронных книг). Мобильные устройства это не то на что надо ориентироваться. Вряд ли кто будет всерьез использовать такие книги на телефоне, да?

rasergiy: Думаю вот с этого начать: http://www.stsl.ru/manuscripts/staropechatnye-knigi/322

Administrator2: rasergiy пишет: Думаю вот с этого начать: http://www.stsl.ru/manuscripts/staropechatnye-knigi/322 Он выложен: http://sobornik.ru/text/theophilact/theophilact.htm rasergiy пишет: Резать развороты, и обрабатывать сканы можно довольно просто и быстро, чуть позже на конкретном примере пошагово опишу все действия, как это делать в совершенно автоматическом режиме с вариантом получения на выходе djvu/pdf.

вячеслав: Обратите внимание -когда сохраняете последнюю страницу-если делаете это с версией для печати то страница весит 2-3 м а вся книга (например сборник для почитания икон) более 1 гб а обычный вариант 54м Ну кому что нравится и у кого какие возможности

Administrator2: вячеслав пишет: Ну кому что нравится и у кого какие возможности Это не проблема, нужно разрезать разворот по страницам и перекинуть в pdf/djvu тогда они станут легкими и удобными для чтения.

вячеслав: Нравится Picasa 3.-посмотрел -увеличил -рассмотрел --вернул обратно-пролистал далее. Ранее, конвертировал JPG to PDF , сейчас не вижу необходимости, как и в резании .

Maximus: Всех с Рожеством Христовым! Сейчас действительно имеет смысл переводить книги в формат, удобный для чтения на мобильном устройстве. Поскольку это не мода, а необходимость. К примеру, после двух-трех часового сидения за компом начинает болеть спина, огромный 22" экран, утомляотся глаза. Читать тяжело. Чтение воспринимается как работа. В-общем, не почитаешь ничего. А перекидываешь книгу на айпад или амазон киндл 10" и спокойно читаешь, в метро, в лесу, на пастбище (это про себя говорю). Можно вникнуть в текст, что особенно важно при чтении сложных текстов на цс.

Maximus: Что я предлагаю. 1. Берем цс. книги с stsl.ru или с rsl.ru 2. Пишем в эту тему кто какую книгу взял, чтобы не было повторов. 3. Режем все ненужное -- поля, развороты. 4. В пакетном режиме уменьшаем размер файлов. (так из 120 мб я делал 25) 5. Собирем в пдф. Делаем обязательно оглавление. проставляеим метаданные. 6. Предлагаю выкладывать на Вечное.Инфо. Файл пдф автоматически конвертируется в swf, поэтому пдф можно сразу просмотреть на сайте, и скачать (пример -- http://www.vechnoe.info/library/heritage/slugba-pashe.pdf/view ). Места предостаточно, если будет мало -- можно добавить еще дисков)) Относительно перевода цс книг в текстовый формат -- скажу, что это нужно, но очень долго, думаю, лучше сначала сделать нормальную библиотеку сканов. А в текстовый формат переводить что-то особенно важное, например, Острожскую Библию (что мы и делаем). Кстати нам нужны участники

Maximus: Мы сейчас делаем Лествицу Иоанна Лествичника http://dlib.rsl.ru/view.php?path=/rsl01002000000/rsl01002412000/rsl01002412242/rsl01002412242.pdf (обработали 200 стр. из 700) Ее делать не нужно.

rasergiy: Благовестник Феофилакта готов. Но это только часть вторая, похоже что его печатали двумя томами, здесь только Евангелие от Луки и Иоанна http://txt.trans-komplekt.ru/feofilakt-blagovestnik-1649.djvu 220Мб, +содержание до уровня зачал Пошагово, как оно было сделано в весьма автоматическом режиме. Что понадобится: linux с установленными пакетами ruby, djvu-libre, wget, ImageMagick, а также этот скрипт: http://txt.trans-komplekt.ru/stsl.rb (4кб) Далее создаем файл конфигурации, например feofilakt.txt, для начала там будет только одна строчка - адрес нужной книги http://www.stsl.ru/manuscripts/staropechatnye-knigi/322 1) запускаем загрузку: ./stsl/rb down feofilakt.txt Скрипт загружает книгу в jpeg'ах в папку files_manuscripts_oldprint_1649-III-0322/jpeg Получилось 589 файлов весом 1.5Гб. 2) Далее берем страницу из середины книги, например 300-й лист: files_manuscripts_oldprint_1649-III-0322/jpeg/322-0300.jpg и замеряем (в Gimp, photoshop итд) область которую нужно вырезать. Пишем эти данные второй строчкой в файл конфигурации в таком виде: x,y,w,h; x,y,w,h / 300 где X: смещение по оси Х, Y:смещение по оси У, W:ширина, H: высота вырезаемой области. Вырезаемые области указываются через точку с запятой, их количество может быть любым от 1 и до скольки угодно... теперь указываем замеренные координаты обрезания для всего диапазона страниц: Теперь файл конфигурации выглядит так: http://www.stsl.ru/manuscripts/staropechatnye-knigi/322 450, 150, 1050, 1650; 1600, 150, 1050, 1650 / 1-589 3) Запускаем скрипт ./stsl/rb test feofilakt.txt Это создаст превью обрезания страниц в папке files_manuscripts_oldprint_1649-III-0322/test с направляющей сеткой с шагом в 50 пикселов (для удобства коррекции). Выглядит оно примерно так: 4) Теперь нужно просмотреть все эти превьюхи с первой и по последнюю, убрать в файле конффигурации ненужные области (чистые листы), скорректировать обрезание страниц, там где текст влезает в выделенную область и пр. Для этой книги у меня получился такой файл конфигурации: http://txt.trans-komplekt.ru/feofilakt.txt Всего 77 строчек,можно и меньше :) После коррекции можно удалить все из папки test и заново запустить ./stsl/rb test feofilakt.txt Внимание. 1) Страницы не указанные в конфигурации обрезания вообще не будут включены в книгу 2) Список обрезания обрабатывается последовательно, так что например 2 следующие строчки в таком порядке 425, 150, 1050, 1650; 1600, 150, 1050, 1650 / 467-489 525, 150, 1050, 1650; 1700, 150, 1050, 1650 / 472 Вначале сделают обрезание диапазона страниц 467-489, а затем еще раз по другому обрежет страницу 472 5) Теперь собственно режем файлы: ./stsl/rb crop feofilakt.txt. Это создаст промежуточные файлы в папке files_manuscripts_oldprint_1649-III-0322/temp. С этими файлами теперь можно делать все что угодно перед сборкой конечного файл. Я ничего не делал Осталось только собрать конечный djvu. ./stsl/rb djvu feofilakt.txt Называться он будет feofilakt.txt.djvu Теперь самое сложное, что заняло больше всего сил - набрать интерактивное содержание. Выглядит оно так: http://txt.trans-komplekt.ru/feofilakt-toc.txt Осталось только приклеить его к файлу: djvused feofilakt.txt.djvu -s -e 'set-outline feofilakt-toc.txt' -- По сути с этим скриптом вся работа заключается в создании небольшого файла конфигурации того как обрезать книгу, и файла содержания... Всё... Несравнимо менее трудозатратно, чем резать мышкой вручную))) Для получения такого же файла: http://txt.trans-komplekt.ru/feofilakt-blagovestnik-1649.djvu Нужно взять скрипт ()http://txt.trans-komplekt.ru/stsl.rb, файл конфигурации (http://txt.trans-komplekt.ru/feofilakt.txt), файл содержания (http://txt.trans-komplekt.ru/feofilakt-toc.txt) и выполнить скрипт так: ./stsl.rb down feofilakt.txt; ./stsl.rb crop feofilakt.txt; ./stsl.rb djvu feofilakt.txt; djvused feofilakt.txt.djvu -s -e 'set-outline feofilakt-toc.txt'

rasergiy: Maximus PDF в данном случае решение не верное. PDF это не конкурент DJVU потому как они совершенно различны по своему предназначению. PDF - В первую чередь векторный формат предназначенный для печати. PDF показывает символы, используя шрифты. Это подразумевает OCR. А для церковнославянских текстов OCR в принципе не существует. С растровыми же изобр. он работает хуже DJVU DJVU - формат изначально нацеленный как формат для электронных книг собранных из сканов. DJVU не рендерит символы с помощью шрифтов. Алгоритмы сжатия картинки в Djvu заточены на оптимальное сжатие растровых символов на однотонном фоне. Для сканов без OCR (А это как минимум все ц.сл. тексты) - Djvu самое адекватное решение. Качество сжатия для djvu можно настраивать от сжатия совсем без потерь, до очень сильного сжатия. А вобще наверное лучше всего сразу делать pdf и djvu

rasergiy: Administrator2 пишет: Он выложен: http://sobornik.ru/text/theophilact/theophilact.htm Там выложен 1) репринт 2) в не самом адекватном виде и качестве. Так что... Следующим возьмусь за: http://stsl.ru/manuscripts/staropechatnye-knigi/9-1

Administrator2: rasergiy пишет: Следующим возьмусь за: http://stsl.ru/manuscripts/staropechatnye-knigi/9-1 В djvu, правда репринт, Кормчая есть: http://files.mail.ru/DWQ1AV

rasergiy: Полный список дониконовских печатных книг из раздела "Старопечатные книги" на stsl: http://txt.drevle.com/doraskolnye_pechatnye_knigi.html

Administrator2: Спаси Господи и помилуй

Cocpucm: rasergiy, Вы бы всё-таки называли книги так, как их называли до раскола: на "псалтирь", а "Псалтырь"; не "октоих", а "Октай"; не "трефологион", а "трефолой" и пр.

rasergiy: Cocpucm сделаю в ближайшее время. Простите Христа ради.

Cocpucm: ... также "Потребник" вместо "требника", и Николая православные называют Николой

Administrator2: http://www.stsl.ru/manuscripts/173.III?page=1 http://www.stsl.ru/manuscripts/173.IV?page=5 http://www.stsl.ru/manuscripts/MDA.prochie?page=1

rasergiy: Устав. Око церковное, 1610г. djvu, без содержания, (если кто наберет - вставлю): http://txt.drevle.com/lib/ustav-1610.html не стал по страницам резать, потому как все таки видеть разворот для таких книг мне кажется естественней И Часослов. — Киев, 1617, djvu http://txt.drevle.com/lib/chasoslov-1617.html

Федор фон Бок: Хороший сайт, там много чего дониконовского есть, причем такого, что пока еще не опубликовано. Рекомендую там познакомиться со "Сборниками"

mihail: rasergiy , спаси Христос! Кстати, Часословы вообще пропали из продажи! В Москве не найти.

Cocpucm: rasergiy, спаси Господи. Однако, как недавно утверждалось в теме про крещение, Устав 1610 г. был запрещен патр. Филаретом.

rasergiy: Cocpucm спаси Христос! Я даже как то по недоумию и не сообразил поискать информацию про это издание. Сделал к оному уставу замечание: http://txt.drevle.com/lib/ustav-1610.html . Наверное надо каждую книгу снабжать подробной информацией об издании. Сегодня соберу устав 1633г. и выложу как будет возможность

rasergiy: Добавлены в djvu: + Евангелие учительное 1633г.: http://txt.drevle.com/lib/evangelie_uchitelnoe-1633.html (содержание книги взял на sobornik.ru, за что ему благодарность) + Устав. Око церковное, 1633г.: http://txt.drevle.com/lib/ustav-1633.html + Потребник, 1647г.: http://txt.drevle.com/lib/potrebnik-1647.html и еще никоновская Скрижаль. 1656г. http://txt.drevle.com/lib/skrizhal-1656.html Нужно бы ее почитать каждому новообрядцу, вкупе с соборным деянием 1667г., ведь согласно деянию БМС1666/7 и разъяснению тамже соборно утвержденной книжицы Скрижаль сегодня все новообрядцы прокляты ибо вкладывают "несторианскую ересь" в свое трехперстие и против апостольского предания придают смысл "праздным перстам". Удивительная книжица :)

rasergiy: + Маргарит Иоанна Златоустаго. 1641 г. http://txt.drevle.com/lib/ioann_zlatoust-margarit-1641.html

САП: Поморский памянник http://www.stsl.ru/node/79?fnum=4

Глаголъ: Кто-нибудь знает, как в Linux автоматически разрезать пополам страницы рукописи? Если можно, напишите пожалуйста подробное описание как это делается.

Sergiy R.: Глаголъ готовых решений нет. я сделал для себя автоматическое решение на основе Imagemagick + Ruby. Там нужно написать конфиг под разрезаемую книгу. определяются координаты основного разреза, и запускается первая фаза, она рисует на страницах сетку 50x50 пикселей и полупрозрачное выделение обрезаемых страниц (ну их может быть любое число от 1 и более, то есть можно просто и как обрезчик полей использовать). Затем страницы просматриваются и там где в обрез страницы не влазят, в конфиг вносятся изменения для этих страниц. Потом можно опять запустить первую фазу и проверить на ошибки, потом вторую фазу, она уже реально обрезает и создает DJVU документ. Очень удобно и быстро. плюс можно сделать правки и в любой момент на основе конфига пересобрать документ Конфиг в конечном итоге выглядит так: # X-ширина, X-смещение, Y-ширина, Y-смещение / диапазон страниц # Евангелие учительное, 1633 # http://stsl.ru/manuscripts/staropechatnye-knigi/189 # files_manuscripts_oldprint_1633-III-0189 800, 0, 1365, 2016 / 1 840, 0 / 608 350, 100, 2200, 1650 / 2 550, 150 / 500, 594-604 500, 150 / 501-593, 431-466, 468-499 500, 200 / 467 450, 150 / 391-430 500, 200 / 363-390 450, 200 / 325-362 400, 200 / 289-324 400, 150 / 120-288 350, 150 / 87-119 425, 200 / 3-9 425, 150 / 10-86

Sergiy R.: Собственно скрипт тут лежит: https://github.com/RaSergiy/pagecut Хотя конечно он не в пригодном для публичного релиза виде, так как писал чисто для себя. и нет никаких объяснений )

Глаголъ: Sergiy R. пишет: Собственно скрипт тут лежит: https://github.com/RaSergiy/pagecut Хотя конечно он не в пригодном для публичного релиза виде, так как писал чисто для себя. и нет никаких объяснений ) Благодарю, обязательно погоняю этот скрипт, а то руками резать дело долгое и не благодарное.

rasergiy: Глаголъ Я обещаю в свободное время довести скрипт до ума, чтоб им можно было пользоваться :)

Пожарник: Sergiy R. пишет: Собственно скрипт тут лежит: https://github.com/RaSergiy/pagecut Хотя конечно он не в пригодном для публичного релиза виде, так как писал чисто для себя. и нет никаких объяснений ) А как конкретно им пользоваться? Я например не смог им порезать рукописи. Сделал папку 8 в своей домашней папке. В ней сделал две папки jpeg и test. В папку test закинул сканы рукописей. Файлы имеют вид 0001.jpg Далее закинул в папку 8 файлы скрипта и файл конфига. Запустил скрипт, а в ответ выползли ошибки. Вот что выкинуло. Если не ошибаюсь у меня стоит Руби без рельсов. Volodimer@Empire:~/8$ ./pagecut.rb test conf pagecut.rb rm: невозможно удалить «test/*.jpg»: Нет такого файла или каталога page 1/1 ./pagecut.rb:70:in `block in page_make': undefined method `+' for nil:NilClass (NoMethodError) from ./pagecut.rb:48:in `each_index' from ./pagecut.rb:48:in `page_make' from ./pagecut.rb:94:in `block (3 levels) in <main>' from ./pagecut.rb:94:in `upto' from ./pagecut.rb:94:in `block (2 levels) in <main>' from ./pagecut.rb:92:in `each' from ./pagecut.rb:92:in `block in <main>' from ./pagecut.rb:88:in `each' from ./pagecut.rb:88:in `<main>'

Пожарник: Команда crop (./pagecut.rb crop conf) работает, но режет у меня только правую часть рукописи. Тоесть создает в папке temp под первым и последующими отрезанными страницами только правые части файлов рукописи. Как сделать так, чтобы резалась и левая и правая часть? Размер изображения: Ширина - 2182, а высота - 1514. Все 309 файлов скана рукописи одинакового разрешения. Я в конфиге указал: 1091, 0, 1514, 0 / 1-309 Хочу порезать пока ровно пополам. Как это сделать?

rasergiy: предположим конфиг лежит тут: ~/somebook/config В папке конфига должно присутствовать (все создается вручную) ~/somebook/jpeg/* - файлы книги ~/somebook/test/ - директория куда будут сложены тестовые файлы ~/somebook/temp/ - директория куда будут сложены временные файлы при обрезке ну и потом: ~/somebook $ ./pagecut.rb crop config В конфиге области указываются через точку с запятой: X, Y, ШИРИНА, ВЫСОТА; X, Y, ШИРИНА, ВЫСОТА / страницы в вашем случае например, для разрезки ровно пополам, нужно указать: 0, 0, 1091, 1514; 1091, 0, 1091, 1514 / 1-309

Пожарник: rasergiy пишет: в вашем случае например, для разрезки ровно пополам, нужно указать: 0, 0, 1091, 1514; 1091, 0, 1091, 1514 / 1-309 Благодарю, все порезал как надо. Пришлось корректировать некоторые страницы через конфиг, но это уже мелочь.

Alexey Kutalo: Я нарезал развороты по страницам, но пользовался другими программами и скриптами на Линуксе. Так как моя цель была распечатывать, сделал книги на белом фоне. Все залито здесь: https://harbin.lv/staropechatnye-knigi Уже есть большинство книг. Можете присылать пожелания или недостающие книги мне на обработку через форму связи на "Харбине".

Severo: Alexey Kutalo пишет: Я нарезал развороты по страницам, но пользовался другими программами и скриптами на Линуксе. Так как моя цель была распечатывать, сделал книги на белом фоне. Спаси Христос. А я вот на днях как раз все с Вашего сайта скачал))

savotkinaa: Взял на заметочку вашу ссылку, помогу с переводом, последнее время заинтересовали подобного рода книги, пришлось заказать парочку в различных интернет-магазинах. один только помню, созвучно со святцы, что-то в этом родн. ждем-с



полная версия страницы