Diskussion:Websiteentwicklung: XHTML: Syntax

Sonderzeichen-Tabelle

Letzter Kommentar: vor 13 Jahren3 Kommentare2 Personen sind an der Diskussion beteiligt

Ich meine, die andere Seite mit den Sonderzeichen im jetzigen Zustand zu löschen, kann schon in Ordnung sein. Hier stehen allerdings nur die XML-Sonderzeichen drin. Was im Buch dann wiederum fehlt, ist ein praktischer Hinweis, wie man Zeichen notiert, die man nicht auf der Tastatur findet - Hilfsprogramme, numerische Notation von Zeichen. Dann ist es natürlich aber auch so, daß (X)HTML viele Entitäten selbst definiert - gänzlich verschweigen kann man das auch nicht, einschließlich der Probleme die sich ergeben, wenn Darstellungsprogramme sich einer Interpretation dieser verweigern, weil sie die DTD ignorieren oder zwar (X)HTML erkennen und interpretieren, nicht aber die bekanntermaßen ebenfalls dazugehörigen vordefinierten Entitäten. Da dies natürlich nicht in einem Abschnitt über XML-Sonderzeichen gehört, aber schon zum praktischen Alltag, wird es wohl notwendig sein, da irgendwo ein Kapitel oder eine Seite (unter Vertiefung) mit der Information bereitzustellen und über Möglichkeiten und Probleme zu berichten, denn für HTML verwenden viele Leute die vordefinierten Entitäten, stellt sich also die dort zu beantwortende Frage, warum in XHTML besser nicht.

Der andere lustige Aspekt der Tabelle - was haben die Sonderzeichen mit java zu tun? - hatte mich auf der ursprünglichen Seite schon verblüfft ;o) Doktorchen 12:45, 8. Nov. 2011 (CET)Beantworten

zu "Tabelle als Java-Quellcode": Das hat nichts mit Java zu tun – aber das Et-Zeichen und das Semikolon werden in diesem Fall so schön hervorgehoben. Ich hatte es auch erst auf XML geändert, dann aber doch aus ebendiesem Grund bei Java belassen.

zu "Sonderzeichen, HTML-Entities": XHTML ist ein XML-Dialekt und wird daher üblicherweise in UTF-8 notiert. Wir sollten im Jahr 2011/2012m die Leser dazu ermutigen, ausschließlich UTF-8 als Zeichensatz zu verwenden. In diesem Sinne kann man die Überschrift "Sonderzeichen" schlicht in "Entitäten" abändern, das würde dann immer noch ins Kapitel Syntax passen. Auf die benannten HTML-Entities würde ich auf Grund diverser Kompatibilitätsprobleme gar nicht eingehen, sondern nur aufzeigen, wie aus dem numerischen Kennwert (dec oder hex) eines UTF-8-Zeichens eine Entität gebaut werden kann. Dafür müsste einfach der erste Absatz aus dem entsprechenden Abschnitt im Wikipedia-Artikel übersetzt werden.

Eine entsprechende Übersicht aller UTF-8 Zeichen kann dann wieder verlinkt werden. Dies ist nicht Bestandteil von XHTML, sondern beruht auf einer eigenen Spezifikation.

zu "Sonderzeichen, wie notieren": Das Wissen, wie Sonderzeichen eingegeben werden, gehört nicht in ein Lehrbuch zu XHTML, sondern ist eine der Grundlagen in der Bedienung des Betriebssystems. Entsprechend sollte hier höchstens auf ein entsprechende(s) Buch/Kapitel/Übersicht zur Eingabe von Sonderzeichen mit den jeweiligen Betriebssystemen verlinkt werden. (æ¢ø…)

Gut, Ausnahmen bestätigen die Regel – das geschützte Leerzeichen ( ) sowie das soft hyphen () sollten erwähnt werden (auch wenn letzteres auch nicht überall funktioniert).

UPDATE: w:Zeichenreferenz

P.S. dein Beitrag hätte gut in die Löschdiskussion gepasst… --Feeela 20:23, 8. Nov. 2011 (CET)Beantworten

Ich denke auch nicht, daß man die (X)HTML-Entitäten komplett listen muß, zumindest nicht unter Grundlagen, könnte in einen Anhang passen wie andere eher bedenkliche Konstruktionen. Bei den DTDs für XHTML stehen sie ja auch drin, sind also von daher auch für alle Versionen von XHTML aktuell.

Ob es üblich ist, UTF-8 zu verwenden, kann ich nicht sagen, aus historischen Gründen verwende ich eigentlich durchgehend eine ISO-Kodierung - wenn ich da jetzt bei vorhandenen tausenden von Dokumenten mit was anderem anfangen würde, gäbe das nur ein übles durcheinander, von daher ist UTF-8 für mich zumindest einige Jahre zu spät gekommen - wer heute mit internet-Projekten beginnt, der kann sich mit UTF-8 natürlich eine Menge Ärger ersparen.

Und auch wenn man UTF-8 verwendet, auf einer deutschen Tastatur sind nunmal viele Zeichen nicht drauf, die man ab und an braucht. Da kann man nun umständlich nach einem Programm oder Beispiel suchen, wo man es dann herauskopiert oder eben nach der Unicode-Nummer und die notieren. Gerade für Anfänger sind das natürlich ganz praktische Probleme, wo es sich gerade bei einem Lehrbuch lohnt, drauf einzugehen - auch UTF-8 deckt ja nicht alle Zeichen ab. Ich habe zumindest kein durchgehendes Konzept, wo ich die Zeichen herbekomme, meist gucke ich in einer Tabelle nach oder eben in einem Programm, welches eine solche Tabelle bereitstellt - ich vermute mal, solch ein Programm gibt es auch für windows, denn die Unicode-Nummern kann man ja unmöglich alle im Kopf behalten, ein großer Nachteil etwa gegenüber den vordefinierten Entitäten, die man sich deutlich besser merken kann, die aber leider aufgrund der Interpretations- und Implementierungsprobleme bei XHTML anders als bei HTML problematisch sind - eine Katastrophe auch für die praktische Nutzbarkeit von MathML übrigens, wo es auch viele solcher vordefinierter Entitäten gibt. Die Regelung mit der optionalen Kenntnis der DTDs in XML ist natürlich extrem unsinnig für Autoren - entweder die Entitäten gehören zum Sprachumfang oder nicht - man könnte sie ja auch als Prosa in der Spezifikation definieren. Obgleich das Eingeben von Zeichen nicht unmittelbar mit XHTML zu tun hat, wird ja unter erste Seite auch lang und breit erklärt, wie man ein erstes Dokument hinbekommt. Die Grundidee ist ja schon, davon auszugehen, daß der Leser nicht allzuviel weiß - und wenn man nicht davon ausgeht, daß der weiß, wie man ein allgemeines XML-Dokument anlegt, so wird man auch nicht davon ausgehen können, daß bekannt ist, wo man Zeichen herbekommt, die nicht direkt auf der Tastatur stehen ;o)

Für die numerische Notation ist ein Verweis auf (normative?) Listen für die Zuordnung sicher nützlich. Für feste Leerzeichen (gibt ja verschiedene Breiten) und den optionalen Trennstrich gibt es ja auch hübsche Unicode-Nummern, die mir leider immer wieder entfallen, das unterscheidet sich also nicht von dem Problem anderer Zeichen, die man nicht auf der Tastatur finden kann.

Löschantrag - ja, das sind so Diskussionen, die nicht so sehr eilen. Ich habe auch was Redundantes provisorisch aus dem Inhaltsverzeichnis auskommentiert, muß man auch nicht gleich löschen, bevor die Struktur des Buches sich wieder stabilisiert hat. Aber wenn es Spaß macht, kann man ja erstmal löschen, was derzeit belanglos ist und wenn dann später jemand Zeit und Lust hat, das Thema ordentlich und für den Leser hilfreich zu behandeln, kann ja wieder eine Seite neu angelegt werden, ist Geschmacksache und eine Frage des Arbeitsaufwandes für die Administratoren. Und solange da in den zu löschenden Dateien kein relevanter, nicht redundanter Inhalt ist, ist es mir ziemlich egal ;o)

Java-Quelltext - wird bei der XML-Dekoration nicht die gesamte Entität in schmuddeligem Gelb dargestellt? Ist doch auch auffällig ;o) So wird ja auch nur etwas verwendet, weil es gerade hübsch wirkt, nicht weil es inhaltlich sinnvoll ist. Und class="java source-java" ist glaube ich keine sehr sinnvolle Klassenzuweisung für XHTML-Quelltext im Sinne eines guten XHTML-Stils, wobei man da ja bei wikibooks ohnehin Kompromisse eingehen muß ... Doktorchen 11:20, 9. Nov. 2011 (CET)Beantworten