txt:html

Rozwiązania dot. dokumentów tekstowych w HTML (XHTML itp.)

strona z opisem sposobu
Używa się do tego programu HTMLDOC

$> mkdir output-folder
$> htmldoc -t htmlsep --charset utf-8 -o output-folder file.html

Ta komenda wyszuka w pliku file.html wszystkie znaczniki nagłówków (<h1><h2>itd.) i potnie plik wg nich dodając odpowiednie sekcje <header>, doda linki <prev> i <next>, utworzy plik główny index.html oraz plik spisu treści toc.html.

A co zrobić, jeżeli chcemy regulować „głębokość” cięcia? A może i dodać „Spis treści” jako tytuł spisu treści?

$> htmldoc -t htmlsep -d output-folder \\
	--no-title --toclevels 2 --toctitle "Spis treści" \\
	file.html 

UMGAGA!!! Zapewnienie obsługi UTF-8 w htmldoc

ALE!!! Pełne wsparcie dla UTF-8 będzie dostępne od wersji 1.9, a na razie jest wersja 1.8.x. Zatem przedtem należy odpalić skrypt, jak podano na tej stronie.

Przetworzony plik/pliki można poddać procedurze na 3 sposoby:

$> cat myfile.html | fix-htmldoc-utf8 > myfile-ok.html
abo
$> fix-htmldoc-utf8 myfile.html > myfile-ok.html
abo
$> fix-htmldoc-utf8 -w myfile.html

Czyli najlepiej jest zrobić to tak:

$> for i in `ls output-folder`; do \\ 
fix-htmldoc-utf8 -w output-folder/$i && echo "$i naprawione!"; \\
done
  • txt/html.txt
  • ostatnio zmienione: 2022/05/22 10:38
  • przez 127.0.0.1