Zur Hauptseite der Uni Mainz Zur Hauptseite des

Fachbereiches Zur Hauptseite der

Computeranlagen Zur Hauptseite der Vorlesung

Telekommunikation

Anhang C1: RTFtoHTML-Konvertierer 3.0
[1]

Frank Krüger, M.A.
Fachbereich 23, Johannes Gutenberg-Universität Mainz
Sprechstunde: Donnerstags 11-12 Uhr
e-mail: krueger@nfask2.fask.uni-mainz.de

Inhalt

  1. Word-Dokumentvorlagen
  2. Optionen des Konvertierprogrammes
  3. Tips und Tricks für die Konvertierung
  4. Fazit: Für welche Zwecke eignet sich das Konvertierprogramm
  5. Webseiten Schritt-für-Schritt mit RTFtoHTML-Konverter

siehe auch:


Konvertierung von WORD/RTF nach HTML

Vorbemerkungen

Eine der Möglichkeiten für die komfortable Erstellung von Web-Seiten ist die Bearbeitung der Seiten mit der gewohnten Textverarbeitung (am FASK bevorzugt Word 6.0 für Windows oder Macintosh) und die anschließende Konvertierung in eine HTML-Datei.
Auf diese Weise kann die Erstellung von (gedruckten) Texten und ihre Formatierung für das WWW in einem Arbeitsgang erledigt werden, da zusätzlich zu der elektronischen Version eine ansprechend formatierte "Papierausgabe" erstellt werden kann.
So stehen am Fachbereich für die Arbeit mit dem Konvertierungsprogramm und Word für Windows/Macintosh 6.0 folgende zwei Dokumentvorlagen zur Verfügung:

* FASK_WWW.dot enthält alle notwendigen Formatvorlagen, einige Makros und die wichtigsten Formatvorlagen als Symbole in zwei speziellen Symbolleisten.

* FASK_Druc.dot definiert einige der Formatvorlagen so um, daß sich der Dokumentinhalt in einer ansprechenden Form ausdrucken läßt (vgl. dieses Skript) und erlaubt Text bzw. Elemente mit aufzunehmen, die nicht in der elektronischen Version erscheinen sollen (vgl. Bemerkungen zu Graphiken unter Abschnitt 4, Tips und Tricks).

1 Word-Dokumentvorlage WWW_FASK.DOT

1.1 Zeichenformate

(# = Zahl, Optional = Zusatzspezifikation für Netscape, siehe auch nachfolgende !)

Hinweis zur ersten Spalte: Hinter der tatsächlichen Formatierung steht in Klammern die Formatvorlage. Die Symbole sind im Abschnitt C zusammengefaßt.

Eine Formatierung als ..

erzeugt eine Auszeichnung als ...
HTML-Markup und Parameter
im Graphikbrowser dargestellt als

1.1.1 Hypertext/Verweise



doppelt unterstrichen/ verborgen (link)
Verweiseintrag (Verknüpfung)
<A href ="Text">
unsichtbar
doppelt unterstrichen/ nicht verborgen (linkmark)
Textanker (Aktiver Text)
.... </A>
Farbig/unterstrichen

roter Text (neu mit 3.0, URL)



Verweis mit genau diesem Text



<a href= "URL"> URL </a>



Kombination der beiden vorherigen


verborgen/ Konturschrift bzw. Hochstellung (linkname)
Verknüpfungsziel (Name)
<a name ="Text">
unsichtbar

(sog. Inline-Grafik)*


eingebette Grafik



<img src = "Name#. ext" ALT="Text">



entsprechendes Bild eingebett im Text


(andere Grafiken) *
Verweis auf Grafik
<a href="Name#. ext">, wobei Name=Datei, #= lfd. Nr., ext=Typ
Bild erscheint als eigenes Dokument, wobei GIF für Zeich-nungen und JPEG für Fotos geeignet ist.
*Hinweis: Die Grafiken sind aus technischen Gründen am besten mit der Formatvorlage Print formatieren, die bewirkt, daß diese Elemente (und etwaig begleitender Text) bei der Konvertierung wegfallen. So können die Grafiken manuell angelegt, bearbeitet und aussagekräftig benannt werden.

Eine Formatierung als ..

erzeugt eine Auszeichnung als ...
HTML-Markup und Parameter
im Graphikbrowser dargestellt als

1.1.2 logische Auszeichnung



Courier oder Monaco
Schreibmaschinenschrift
<tt> bzw.
Courier 12
Konturschrift/schattiert (em)
Betonung
<em>
Fett
fett/schattiert (strong)
starke Betonung
<strong>
fett, größer
kursiv/ unterstrichen (cite)
Zitat
<cite>

fett/einfach| doppelt etc. unterstrichen
Def.begriff versch. Ebenen im Text link zu Glossar
<dfn>, in Glossar als DT

Courier/Kursiv (samp)
Beispiel
<samp>
Courier
Courier/Unterstr (kbd)
Tastatureingabe
<kbd>
Courier
Courier/Fett (var)
Variable
<var>
Courier

1.1.3 physikalische, direkte Auszeichnung



verborgen/schattiert(Code)
unveränderter HTML-Code
(literal)
entsprechender HTML-Markup
fett
fett
<b>
fett
kursiv/n.unterstrichen
Kursiv
<i>
kursiv
hochgestellt
Hochstellung
<sup>
Hochgestellt

1.2 Absatzformatvorlagen

1.2.1 Allgemein



Überschrift #
(Ü1, Ü2, U3)

Überschriftsebenen
<h#>
Größer, fett
Address
Autorenangaben mit Institution
<address>
Courier (üblicherweise am Textende)
Pre (pre)
In Schreibmaschinenschrift (z.B. Tabellen)
<pre>
Courier
Eine Formatierung als ..
erzeugt eine Auszeichnung als ...
HTML-Markup und Parameter
im Graphikbrowser dargestellt als
hr (hr)
Waagerechte Linie (horizontal ruler)

<hr>


waagerechte Linie (vgl. Netscape-Erweiterungen)
blockquote (quote)
längeres Zitat
<blockquote>
eingerückt, Courier
html (html)
nicht umgesetze Zeilen
(_literal)
entsprechender Markup

1.2.2 Schachtelbare Formatvorlagen



bullet list, #
(#="" u. 1-2, Symbol
*)

Unnumerierte Liste der #.ten Ebene
Aufzählungszeichen plus Tab wird in Vorlage entfernt!)
<ul>

TYPE = disc |circle | square


Eingerückt, mit versch. Zeichen (
* etc.)
numbered list, #
(#="" u. 1-2; Symbol 1)
Numerierte Liste der #.ten Ebene
Nummer plus Tab in Vorlage wird entfernt!
<ol>

TYPE = a|A|I|i|1, START = #


Eingerückt, mit Numerierung
Term, Term1, Term2
Termini zur Beschreibung
<dl><dt>
Aufzählung
Def, Def1, Def2
Beschreibungen
<dd>
Aufzählung
glossary, glossary 1-2 (Glossary)
Glossare (Teile getrennt durch Tabulator)
<dl>
eingerückt
menu, menu1, menu2
Menüs (ein Eintrag pro Zeile)
<menu>
untereinander
dir, dir1,dir2
Verzeichnisse (sehr kurze Einträge)
<dir>
untereinander

1.3 Sonstiges

1.3.1 Zusätzliche Umsetzungen



Tabellen mit oder ohne Rand
Umformatierung von Tabellarischem Text

<Table> plus entsprechende Untermarkierung


Tabellen mit bzw. ohne Rand
Fußnotentext


verknüpfte Datei



weitere (optionale) verknüpfte Dateien:

* Inhaltsverzeichnis und Index:
Dazu jeweilige Optionen im Konvertierprogramm (Prefs.) aktivieren!

1.3.2 Symbolleisten

Für die Dokumentvorlagen WWW_FASK und WWW_Druc sind folgende beiden Symbolleisten mit Symbolen für die am häufigsten verwendeten Formatvorlagen definiert:

Alle anderen, nicht in den Symbolleisten enthaltenen Formatvorlagen könnn über das Pull-Down-Menü Formatvorlagen in der Formatierungs-Symbolleiste abgerufen werden

1.3.3 Makros und Textbausteine

Neben Formatvorlagen und Symbolleisten sind in den beiden Dokumentvorlagen auch Makros definiert, die bestimmte Befehlsfolgen zusammenfassen:
www
dem WWW-Team </a> (Frank Kr&uuml;ger, Felix Henrich, Daniel Klumpp und M. Kurowska)
kurs
Frank Kr&uuml;ger</a> im Rahmen des <a href="../komm-planung.html">Kommunikationskurses</a> von <a href="../../user/krueger/krueger.html">Frank Kr&uuml;ger</a> im Sommersemester 1996
image
<img src="Bild.gif" ALT="Text" ALIGN=CENTER>
Hinweis: alle Beispiele sind mit der Dokumentvorlage HTMLformatiert!

2 Optionen für die Konvertierung

Die meisten Optionen für das Konvertierprogramm können vor dem Ablauf der Konvertierung in den verschiedenen Konfigurationsdateien eingestellt werden. Auf diese soll hier nicht näher eingegangen werden, da diese - für Spezialisten - ausreichend in der Originialdokument beschrieben sind.

Für den einzelnen Ablauf der Konvertierung können folgende Einstellungen verändert werden (Macintosh: Menü Edit Preferences, andere Versionen: Optionen der Befehlszeile beim Programmaufruf):

3 Tips und Tricks für die Konvertierung

Die folgende Liste ist eine (ungeordnete) und bei weitem nicht vollständige Aufzählung von bekannten Problemen bei der Erstellung von Seiten und speziell mit diesem Konvertierprogramm:

4 Fazit: Für welche Zwecke eignet sich das Konvertierprogramm ambesten?

Das Konvertierungsprogramm RTFtoHTML bietet gegenüber den Editoren grundsätzlich den Vorteil, bestehende und ggf. veränderliche "Druck"-Dokumente, die also eigentlich für eine Papierform bestimmt sind, gleichzeitig in elektronischer Form für das WWW umwandeln zu können. Durch die paralle Dokumentvorlage WWW_Druc lassen sich dabei beide Versionen in einer Datei eingeben und einheitlich pflegen, aber durch geänderte Zuweisung der Dokumentvorlage in der jeweils gewünschten Form ausgeben.

Ferner lassen sich mit dem Konvertierprogramm Inhaltsverzeichnis und Index (falls eingestellt bzw. wenn entsprechende Einträge vorgegeben sind) automatisch erstellen und verweisen. Auch Fußnoten werden von dem Konvertierungsprogramm erkannt und als Verweise umgesetzt.

In der Version 3.0 hat das Konvertierungsprogramm zusätzlich den Vorteil, längere Dokumente durch entsprechende Einstellungen in dem "Preferences"-Menü (Mac) bzw. durch Angabe von Parametern (DOS/Unix) in kleinere, webgerechte Hypertextdokumente aufsplitten zu können und untereinander durch eine graphische Symbolleiste zu verknüpfen.

Ein Nachteil der "Konvertierungsmethode" ist allerdings der gegenüber Editoren erhöhte Aufwand, da die Dokumente nicht direkt im WYSIWYG-Modus (What you see is what you get) bearbeitet werden können, sondern das wirkliche Ergebnis immer erst nach der Konvertierung sichtbar ist. Entsprechend müssen Dateistruktur und -inhalte vorher gut überlegt sein (ggf. an einer kleinen Testdatei ausprobieren...). Allerdings kann das Aussehen in Word weitgehend "simuliert" werden, indem die Formatvorlagen an das Aussehen in Netscape als graphischem Browser angepaßt werden.

Auf der anderen Seite ist damit dieses System für den didaktischen Einsatz im Unterricht besonders geeignet, da es so zu einer systematischen Beschäftigung mit HTML und dem Design von WWW-Seiten anregt.

Und auch die Erweiterbarkeit für zukünftige Markierungen und Attribute in HTML - das ja schneller fortentwickelt wird, als Unterlagen wie diese hier geschrieben werden können - ist grenzenlos, da alle Elemente im Zweifelsfall als "reine" HTML-Markierungen (sog.literal text) eingegeben und formatiert werden können.

5 Webseiten Schritt-für-Schritt mit dem RTFtoHTML-Konverter Version 3.0 (Mac, Windows, Unix)

  1. In Word für Windows oder Macintosh 6.0 das Menü Datei/Neu öffnen und eine der Dokumentvorlagen WWW_FAS(K).dot bzw. WWW_Druc.dot auswählen (Zum Unterschied vgl. Vorbemerkungen; zu anderen Programmen Abschnitt 3).
  2. Der Text kann nun mit Hilfe der Symbolleisten und/oder der Liste der "Formatvorlagen" bearbeitet werden. Neben einer Anpassung an die Konventionen der Web-Seiten (z.B. Aufzählungen und Listen, Tabellen) gehört dazu v.a. die Ergänzung um Verweise verschiedener "Reichweite" und Typen.
  3. Das Dokument im sog. Rich Text Format (in der Liste unter Datei/Speichern unter/Dateiformat auswählen) abspeichern.
    Die enthaltenen Grafiken müssen in eines der Internet-Grafikformate GIF oder JPEG konvertiert werden und können bei dieser Gelegenheit auch nachbearbeitet werden (z.B. transparent, um sich dem Hintergrund anzupassen oder ergänzt um die Bildbeschriftung).
  4. Die RTF-Datei wird mit dem Programm RTFtoHTML auf dem Macintosh (Pfad: NFASK2/PROG:PMAC/Kommunikation/.../RTFtoHTML3.0c), unter DOS/Windows (G:/p/doskomm/rtftohtm/rtftohtm.exe)oder UNIX (auf Anfrage) in HTML umgewandelt. Fußnoten werden in eigene Dateien geschrieben bzw. an das Ende der Datei gesetzt (vgl. Tips in Abschnitt 2).
  5. Die in den vorherigen Schritten erzeugten HTML--Dateien (sowie etwaige Grafik-, Ton- und Videodateien) werden mit einem FTP-Programm (z.B. Fetch auf dem Macintosh, FTP unter Windows) auf den Web-Server in das entsprechende Unterverzeichnis übertragen.

Zur Hauptseite der Uni

Mainz Zur Hauptseite des Fachbereiches Zur Hauptseite der

Computeranlagen Zur Hauptseite der Vorlesung

Telekommunikation Zur

Inhaltsübersicht

Die URL-Adresse dieser Seite ist: http://www.fask.uni-mainz.de/cafl/kurse/komm/komm-c1.html

Letzte Bearbeitung: 16.11.96

Erstellt und bearbeitet von F. Krüger im Rahmen der Vorlesung Telekommunikation.

[1] : Dieses Dokument ist auch in anderen Dateiformaten verfügbar!