HTML5: Dateiendungen
Wir bereits kurz erwähnt:
Damit HTML-Dokumente in der Praxis bei üblichen Betriebssystemen auch als solche verstanden werden können, benötigen die Dateinamen eine zugehörige Endung, welche in der Regel .xhtml, .htm oder .html lautet.
.xhtml wird für die XHTML-Variante mit XML-Notation verwendet, die anderen beiden für die Markierungssuppen-Variante.
Auf dem lokalen Rechner oder in einem Archiv (gzip, zip etc) kann die Dateiendung darüber entscheiden, wie das Dokument interpretiert wird. Dies hängt vom Dateisystem des Betriebssystems ab. Die meisten raten aufgrund von internen Listen anhand der Dateiendung, mit welchem Programm eine Datei wie präsentiert werden soll. Bei der Verknüpfung mit einem Darstellungsprogramm für (X)HTML, SVG etc, kann die Dateiendung ferner auch darüber entscheiden, wie und womit das Dokument interpretiert wird, sofern keine andere Instanz dem Darstellungsprogramm Informationen dazu liefert.
Wird das Dokument hingegen von einem Dienstrechner ausgeliefert, kann es von dessen Konfiguration abhängen, als was ein Dokument ausgeliefert wird, was dessen Dienstprogramm für HTTP(S) indessen wiederum auch an der Dateiendung festmachen kann, aber nicht muß. Wird eine Ausgabe etwa mit PHP erzeugt, kann es notwendig und sinnvoll sein, den Inhalttyp zuvor als Kopfinformation zu senden. Damit das Dienstprogramm erkennen kann, daß ein PHP-Skript vorliegt, ist bei diesem die Dateiendung typisch '.php', von daher ist per Konfiguration allgemein festgelegt oder pro Dokument jeweils als Kopfinformation anzugeben, um was für einen Inhaltstyp es sich handelt.
Der Inhaltstyp für die XHTML-Variante mit XML-Notation ist: application/xhtml+xml
Wird dieser Inhaltstyp gesendet, finden bei der Interpretation die relativ einfachen Regeln für XML Anwendung.
Sofern oben im Dokument nicht anders angegebenen, wird die Kodierung UTF-8 angenommen.
Der Inhaltstyp für die Markierungssuppen-Variante ist: text/html
Wird dieser Inhaltstyp gesendet, ist die Interpretation eingeschränkt auf spezielle Programme, die Markierungsuppen interpretieren, die Interpretation erfolgt nach relativ komplexen und umfangreichen Regeln, mit denen nur relativ wenige Programme gut vertraut sind.
Häufig ist dieser Inhaltstyp bei PHP voreingestellt.
Sofern nicht anders oben im Dokument angegeben, wird die Kodierung ASCII angenommen (einige Programme verwenden eventuell auch ISO-8859-1).
Von daher ist es also relevant, darauf zu achten, daß bei statischen Seiten die gewünschte Dateiendung verwendet wurde, zudem der Dienstrechner die Dateiendung oder sonstige Konfiguration wie gewünscht vorliegen hat, um darauf basierend den korrekten Inhaltstyp an das Darstellungsprogramm zu senden.
Bei dynamisch erzeugten Inhalten ist ähnlich darauf zu achten, daß der Dienstrechner den passenden Inhaltstyp sendet, gegebenenfalls ebenfalls passende Angaben zur Kodierung.
Entscheidend für die Interpretation ist letztlich der Inhaltstyp, welcher dem Darstellungsprogramm zur Kenntnis gebracht wird, nicht die Dateiendung.
Hinweise zu Dateinamen, gute Praxis
[Bearbeiten]- Die erstellten Dokumente werden oft nicht nur auf dem eigenen Rechner betrachtet, sondern auch im Netz veröffentlicht. Bei Adressen (URI/IRI) wird bei Verzeichnis- und Dateinamen zwischen Groß- und Kleinschreibung unterschieden und einige Zeichen haben eine spezielle Bedeutung (zum Beispiel @, #, ?, &, /, :). Ein Großteil der Rechner, auf denen Dokumente im Netz veröffentlich werden, laufen unter Betriebssystemen der Unix-Familie, insbesondere Linux.
- Unix-Systeme unterscheiden im Gegensatz zu Microsoft-Betriebssystemen bei Dateinamen zwischen der Klein- und Großschreibung. Ferner sind unter Unix mehr Zeichen in einem Dateinamen erlaubt als unter Microsoft-Betriebssystemen oder haben eine andere Bedeutung, etwa der umgekehrte Schrägstrich \ oder der Punkt.
- Um Verwirrung und Komplikationen zu vermeiden, empfiehlt sich daher bei Verzeichnis- und Dateinamen die Beschränkung auf einen eingeschränkten Zeichenvorrat und eine einheitliche Verwendung von Klein- und Großschreibung. Die Datei- und Verzeichnisnamen sollten keine Leerzeichen enthalten. Als Ersatz kann ein Unterstrich dienen. Die Namen sollen aus Buchstaben (A-Z, a-z) ohne Sonderzeichen (wie Umlaute und ß-Ligatur) bestehen. Zahlen sind erlaubt, ebenso '-', '_' und '.'.
- Den Nutzern von Microsoft-Betriebssystemen empfiehlt sich außerdem, alle Datei- und Verzeichnisnamen konsequent entweder klein- oder großzuschreiben, falls diese einmal im Internet veröffentlicht oder sonstwie anderen Personen zugänglich gemacht werden sollen.
- Dateien sollten immer passende Namen haben. Wie zum Beispiel ein Bild "wikibooks.png" nennen statt "123456789.png".