txt:txt2tags

txt2tags

Tu będą notatki nt. fenomenalnego programiczku txt2tags, który pozwala na konwersję z prostej metody zapisu w pliku tekstowym na HTML, LaTeX oraz wiele innych.

Tytuł dokumentu
Autora Imię i Nazwisko
Data modyfikacji: %%mtime(%A %B %d, %Y)
%!encoding: utf-8
%!style(tex): polski
%%%%%%% Footnotes (przypisy to potrójny nawias!!! %%%%%%%
%%%% For manage Footnotes in LaTeX
%!postproc(tex): \(\(\((.*?) \\footnote{\1
%!postproc(tex): \)\)\) }
%%%% For manage Footnotes in HTML
%!postproc(html): \(\(\( <small>(
%!postproc(html): \)\)\) )</small>

Przypisy czyli footnotes

%%%%%%% Footnotes (przypisy to potrójny nawias!!! %%%%%%%
%%%% For manage Footnotes in LaTeX
%!postproc(tex): \(\(\((.*?) \\footnote{\1
%!postproc(tex): \)\)\) }
%%%% For manage Footnotes in HTML
%!postproc(html): \(\(\( <small>(
%!postproc(html): \)\)\) )</small>

wstawianie dowolnych tagów LaTeXa

Należy umieścić to w polu konfiguracji pliku t2t

%%% wstawianie tagów LaTeX
%!preproc(tex): \\ SSS
%!preproc(tex): { BBB
%!preproc(tex): } ZZZ
%!postproc(tex): SSS \\
%!postproc(tex): BBB {
%!postproc(tex): ZZZ }

I można używać składni LaTeXa do wstawiania dowolnego prostego znacznika, np. przypisy:

Blala ba blabla\footnote{to nie o to chodzi} bla brum.

Zmiana documentclass LaTeX

Wygląda na to, że txt2tags ma jakiś błąd w interpretacji tytulariów, więc najlepiej od razu zmienić deklarację documentclass na polską i wyższej ligi niż „article”…

%!postproc(tex): documentclass[11pt,a4paper]{article} documentclass[10pt,a4paper]{mwrep}

Podobnym postprocem można zmieniać inne tagi LaTeXa.

Poprawianie znaków typograficznych

Jak powiedziałem wyżej, postprocem można wyszukiwać i zmieniać znaki, których nie przetworzył txt2tags:

%%%%% Przetwarzanie znaków typograficznych
%%% cudzysłów
%!postproc(html): ,, „
%!postproc(html): \'\' ”
%%% półpauza i myślnik (wg notacji LaTeX)
%!postproc(html): --- &mdash;
%!postproc(html): -- &ndash;
%!postproc(txt): --- —
%!postproc(txt): -- –

Inkludowanie dotyczyć może tylko obszaru body. Próby wklejenia ustawień pliku (czyli obszaru header) nie powiodą się.

%!include: intro.t2t
%!include: chapter1.t2t
%!include: chapter2.t2t

Więcej strzegółów tutaj.

To się przydawać może, kiedy chcę zrobić np. kopię tekstu z jakiejś strony WWW i wrzucić sobie tutaj (zrobiłem tak np. z tą stronką). Albowiem wtedy muszę użyć:

## wget http://strona.pl/strona.htm
## html2txt2tags strona.htm > strona.t2t
## txt2tags -t doku strona.t2t

Zainstalować najsampierw html-wikiconverter i curl.

# sudo apt-get install libhtml-wikiconverter-perl curl

I dalej:

# cpan install HTML::WikiConverter::Txt2tags 

W wypadku porażki, trzeba to zrobić ręcznie, tj. ze strony http://www.cpan.org/authors/id/E/EF/EFORGEOT/ wejść do HTML-WikiConverter-Txt2tags pobrać plyk tar.gz i…:

# tar -zxvf HTML-WikiConverter-Txt2tags-0.04.tar.gz
# cd HTML-WikiConverter-Txt2tags-0.04
# perl Makefile.PL
# make
# make test
# make install

Można też dobrać się do html2txt2tags i skopiować go sobie gdzieś do $PATH.

… Spróbować jeszcze tego:

(sam interface)
% perl -MCPAN -e 'install HTML::WikiConverter'
(dialekty)
% perl -MCPAN -e 'install Bundle::HTMLWikiConverter'
(indywidualne instalacje dialektów)
% perl -MCPAN -e 'install HTML::WikiConverter::MediaWiki'
% perl -MCPAN -e 'install HTML::WikiConverter::Txt2tags'

Coś zadziała, musi. SZCZEGÓLNIE, KIEDY WSPOMOŻEMY SIĘ UPRAWNIENIAMI ROOTA CZYLI SUDO!!!

  Headers           First 3 lines of the source file
  Title             = words =
  Numbered title    + words +
  Comment           % comments
  Separator line    -----------------------...
  Strong line       =======================...
  Image             [filename.jpg]
  Link              [label url]
  
  Bold              **words**
  Italic            //words//
  Underline         __words__
  Strike            --words--
  Monospaced        ``words``
  Raw               ""words""
  Tagged            ''words''
  
  Paragraph         words
  Quote             <TAB>words
  List              - words
  Numbered list     + words
  Definition list   : words
  Table             | cell1 | cell2 | cell3...
  
  Verbatim line     ``` words
  Raw line          """ words
  Tagged line       ''' words
  
  Verbatim block    ```
                    lines
                    ```
  Raw block         """
                    lines
                    """
  Tagged block      '''
                    lines
                    '''
  • txt/txt2tags.txt
  • ostatnio zmienione: 2022/05/22 10:38
  • przez 127.0.0.1