Pokaż stronęPoprzednie wersjeOdnośnikiDo góry Ta strona jest tylko do odczytu. Możesz wyświetlić źródła tej strony ale nie możesz ich zmienić. ====== Rozwiązania dot. dokumentów tekstowych w HTML (XHTML itp.) ====== ===== Dzielenie i łączenie wielkich plików na mniejsze wg nagłówków ===== [[http://txt2tags.wordpress.com/2006/08/31/split-html-in-multiple-pages/| strona z opisem sposobu]]\\ Używa się do tego programu [[https://www.msweet.org/projects.php?Z1|HTMLDOC]] <code> $> mkdir output-folder $> htmldoc -t htmlsep --charset utf-8 -o output-folder file.html </code> Ta komenda wyszuka w pliku //file.html// wszystkie znaczniki nagłówków (//<h1><h2>//itd.) i potnie plik wg nich dodając odpowiednie sekcje <header>, doda linki //<prev>// i //<next>//, utworzy plik główny //index.html// oraz plik spisu treści //toc.html//. A co zrobić, jeżeli chcemy regulować "głębokość" cięcia? A może i dodać "Spis treści" jako tytuł spisu treści? <code> $> htmldoc -t htmlsep -d output-folder \\ --no-title --toclevels 2 --toctitle "Spis treści" \\ file.html </code> === UMGAGA!!! Zapewnienie obsługi UTF-8 w htmldoc === ALE!!! Pełne wsparcie dla UTF-8 będzie dostępne od wersji 1.9, a na razie jest wersja 1.8.x. Zatem przedtem należy odpalić [[http://txt2tags.wordpress.com/2008/06/27/python-script-to-use-htmldoc-with-utf-8-files/|skrypt, jak podano na tej stronie]]. Przetworzony plik/pliki można poddać procedurze na 3 sposoby: <code> $> cat myfile.html | fix-htmldoc-utf8 > myfile-ok.html abo $> fix-htmldoc-utf8 myfile.html > myfile-ok.html abo $> fix-htmldoc-utf8 -w myfile.html </code> Czyli najlepiej jest zrobić to tak: <code> $> for i in `ls output-folder`; do \\ fix-htmldoc-utf8 -w output-folder/$i && echo "$i naprawione!"; \\ done </code> txt/html.txt ostatnio zmienione: 2022/05/22 10:38przez 127.0.0.1