Montag, 1. Dezember 2003
XML - die standardisierte Datenfreiheit
1.) Allgemeines
2.) Aufbau
3.) Verwendung

1.) Allgemeines zu XML

Die Fachpresse hat XML (Extensible Markup Language - zu deutsch: Erweiterbare Auszeichnungssprache) gefeiert, als sei damit ein völlig neues EDV-Zeitalter angebrochen. Nicht ganz zu Unrecht, denn zweifellos hat XML das Zeug, der EDV neue, entscheidende Impulse zu geben. Allerdings sollte man fairerweise hinzufügen, dass XML nichts Neues ist, sondern eine Untermenge von SGML, das seit 1986 international standardisiert ist.

Derzeit sieht es gar nicht schlecht für die weitere Ausbreitung von XML aus. Konzerne wie Microsoft und die damit verfeindete Unix-Welt sind sich weitgehend einig, dass XML die Zukunft gehört, was die einheitliche Speicherung von Daten betrifft.
xml ist eine universell verwendbare und durch die Erweiterungsfähigkeit sehr mächtige markup-Sprache. Erwähnt werden sollen beispielsweise Anwendungen in der Chemie (CML = "Chemical-Markup-Language") oder in der Mathematik (MathML). xml läßt sich - wegen der übersichtlichen Datenstruktur - sehr gut mit beliebigen Anwendungsprogrammen verbinden.

XML ist für viele Anwender deshalb etwas schwer "greifbar", weil es eigentlich nicht viel tut. Seine Leistung besteht darin, dass man mit den Konzepten und Regeln, die es bereitstellt, eigene Auszeichnungssprachen definieren kann, die ähnlich funktionieren wie HTML. All diese Sprachen bestehen immer wieder aus Elementen, markiert durch Tags, deren Verschachtelungsregeln, und aus Attributen mit erlaubten Wertzuweisungen. Daneben gibt es Regeln, wie man solche Sprachen - in XML auch Namensräume genannt - in andere Sprachen importieren und somit eine Sprache innerhalb einer anderen Sprache benutzen kann.

2.) Aufbau von XML

Bestandteile einer XML-Datei:

  • dtd-Datei (logische Struktur)
  • css- bzw. xsl-Datei (Präsentation und Kommunikation mit anderen Anwendungen.)
  • xml-Datei (Inhalt)
DTD: Die Regeln für erlaubte Elemente, Attribute und Verschachtelungsmöglichkeiten einer XML-gerechten Auszeichnungssprache werden unabhängig von den eigentlichen Daten definiert. Die Daten mit den Definitionen stellen eine so genannte Dokumenttyp-Definition (engl. document type definition, Abkürzung DTD) dar. XML-fähige Software sollte idealerweise in der Lage sein, solche DTDs auszulesen und Daten, die auf diese DTD Bezug nehmen, nach den Regeln der DTD beurteilen zu können. Dabei kann die interpretierende Software feststellen, ob innerhalb der XML-Daten, die sich auf eine bestimmte DTD beziehen, ungültige Notationen vorkommen. Ungültige Notationen sind z.B. Element- oder Attributnamen, die in der DTD nicht definiert werden, oder Elemente an Stellen, an denen sie aufgrund der DTD-Regeln nicht erlaubt sind.
Beispiel für eine DTD: Beispiel

CSS oder XSL: Die XML Daten sind völlig unabhängig vom Ausgabemedium (etwa Bildschirm, Display, Lautsprecher, Drucker), und sie enthalten keinerlei Angaben zur Formatierung (Schriftart, Schriftgröße, Farben usw.). Im Gegensatz zu HTML-Daten, für deren Darstellung ein Browser Default-Werte benutzt, hat er bei XML-Daten keine Anhaltspunkte, wie diese darzustellen sind.

Für die Formatierung zwei Formatsprachen zur Verfügung: CSS und XSL. CSS (Cascading Stylesheets), auch für HTML eingesetzt. Sie genügt, um etwa einem Web-Browser mitzuteilen, wie er die Elemente einer XML-Datei darstellen soll.
XSL ist dagegen wesentlich mächtiger und enger an den Konzepten von XML orientiert. Ganz besonders wichtig ist die so genannte Transformations-Komponente XSLT. Mit Hilfe von XSLT können Sie beispielsweise XML-Daten in HTML transformieren - und zwar, bevor der Browser überhaupt etwas davon mitbekommt, also server-seitig! Das hat den Vorteil, dass XML in Verbindung mit XSL auch mit älteren Browsern funktioniert, die gar kein XML kennen.
Ein entscheidender Vorteil von XSL ist außerdem, dass es keine eigene, vom Auszeichnungssprachenschema abweichende Syntax benutzt, so wie CSS. Stattdessen ist XSL selbst eine mit Hilfe von XML definierte Auszeichnungssprache! Eine Style-Sheet-Datei, die mit XSL erstellt ist, ist also selber eine XML-gerechte Datei. So sind Software-Tools, die für XML entwickelt wurden, auch für XSL anwendbar.
Beispiel für eine css-Datei: Beispiel

XML-Datei: Die XML-Datei selbst enthält jetzt die gespeicherten Daten nach den Regeln der DTD.
Wenn einige einfache Bedungungen (streng) erfüllt sind, bezeichnet man dieses Dokument dann als "wohlgeformt".
Diese Forderungen sind:

  • Der xml Prolog muss vorhanden sein
  • Anfangs- und Endtag müssen vorhanden sein
  • xml ist case-sensitive
  • Die Schachtelung muss korrekt sein
  • Attributwerte müssen unter Anführungszeichen stehen
Beispiel für eine XML-Datei: Beispiel

3. Verwendung von XML

Einige Anwendungsgebiete von XML:

  • Langfristige strukturierte Informationsspeicherung:
    Ein wohlgeformtes xml-Dokument ist sowohl von einem Menschen (mit einem beliebigen Texteditor) als auch plattform- und betriebssystemunabhängig von einem Rechner lesbar. Wenn man dauerhafte Speichermedien verwendet, kann eine Informationsspeicherung über Jahrtausende sichergestellt werden.
    Gegenüber der Speicherung als reiner Text ist die Speicherung als xml-File wegen der leichteren Rekonstruierbarkeit im physischen Fehlerfall besser. Durch die verbindliche Verwendung von symmetrischen Anfangs- und Ende-Tags für jedes Element (die in html nicht so scharf überprüft wird) ist es auch bei physischen Beschädigungen des Datenträgers wahrscheinlich, dass einer der beiden Tags erhalten bleibt. Dann kann man den fehlenden Tag bei der Rekonstruktion ergänzen. Nur die vor oder nach dem fehlenden Tag fehlenden Zeichen sind wirklich verloren.
  • Datenaustausch zwischen Anwendungsprogrammen:
    xml bietet die Möglichkeit zur gezielten Datenstrukturierung. Damit können in xml formulierte Dokumente (Mengen von Datensätzen) zwischen beliebigen Anwendungen auf beliebigen Plattformen und unter beliebigen Betriebssystemen zum Datenaustausch eingesetzt werden. Beide Anwendungen müssen diese Dokumente nur "verstehen". Die dazu notwendige Information steht in formaler und prüfbarer Weise in der dtd zur Verfügung. Ob diese dtd bei den verschiedenen Anwendungen als externes File interpretiert wird, oder ob sie in die jeweilige Programlogik integriert ist, ist zweitrangig, solange das "Referenzdokument" dtd eingehalten wird.
  • Geräteunabhängige Kommunikation mit dem Menschen:
    Für die Kommunikation mit dem Menschen bietet xml gegenüber html wesentliche Vorteile. Zunächst erlaubt xml eine saubere Trennung zwischen Inhalt (xml), Struktur (dtd) und Präsentation (css oder xsl).
    Man kann durch Austausch der css- (xsl-) Files eine optimale Anpassung an die Bedürfnisse der Nutzer und an die Möglichkeiten der Ein- und Ausgabegeräte erzielen, ohne dass die beiden anderen Files geändert werden müssen.

Links dazu:
Story von Christian Ziegler: CMS und XML
XML in 10 Schritten
W3C Standard

Quellen: Einstieg in XML von Helmut Vonhoegen
VL Hypertext und WWW von V. Risak auf der CoWi Salzburg

... comment

 
Hans.Mittendorfer.Uni-Linz, Dienstag, 9. Dezember 2003, 00:40
ein wertvoller Beitrag
vielleicht bringen Sie dort und da Kommentare unter, wo Sie auf Ihren Beitrag verweisen. XML ist ein zentraler Begriff des kooperativen Publizierens, wie wir spätestens im Vorgrag von Dr. Franz Hoffmann erfahren haben.

H. Mittendorfer

... link  


... comment
 
olga.alekseev.berlin, Freitag, 12. Dezember 2003, 15:54
XML-Ergänzung: XFrames
Hiermit möchte ich einen Artikel aus dem Magazin für professionelle Informationstechnik IX
als eine Ergänzung zum Thema XML zusammenfassen.

Im Artikel "Rahmenrichtlinie, Frames in kommendem X(HT)ML" von Michael Jendryschik
geht es um die neue Richtung in XML - XFrames.
Xframes als Begriff riecht förmlich nach XML. Und tatsächlich handelt es sich um die aus HTML
bekannten Frames, vorbereitet für XML-Dialekte. Noch befinden sie sich im Status eines Entwurfs,
aber sie werden anders aussehen als die bislang bekannten.
XHTML 1.0 verfügt als Neuformulierung von HTML in XML zwar ebenfalls über eine Frameset-DTD,
aber im aktuellen Entwurf für die nächste Generation, XHTML 2.0 gehören sie nicht mehr zum
offiziellen Sprachumfang.
Stattdessen arbeitet W3C (World Wide Web Consortium) an einer neuen Technik: XFrames, eine separate XML-Applikation,
die HTML-Frames nach und nach ersetzen dürfte.
XFrames sollen die Vorteile von HTML-Frames bewahren und deren Nachteile beseitigen, vor allem
dadurch, dass der Inhalt der einzelnen Frames im URI des Framesets adressierbar wird.

Struktur eines Framesets

XFrames erarbeitet die W3C HTML Working Group, die bisher nur einen ersten Entwurf (Working Draft)
veröffentlicht hat. Daher existieren noch keine Implementierungen. Das Konzept, das hinter den neuen Teilfenstern
steckt, ist dennoch schon erkennbar. Es enthält nur eine Hand voll Elemente.
Das Element "frames" bildet den Container für die zusammengefügten Dokumente und ist das Wurzel-Element eines
XFrame-Dokuments. Das Inhaltsmodell erlaubt die Kind-Elemente "head"sowie "row", "column" oder mehrfach "frame"
"head" ist optional und beinhaltet die Elemente "title" und "style". Letzteres enthält Aussagen über die
Präsentation des XFrame-Dokumentes, beispielweise in Form von CSS-Regelsätzen.

Einen Frameset mit Daten füllen

Es soll möglich sein, ein XFrame-Dokument durch einen URI in der Form www.examole.org/document.xfm#frames
(id1=uri1,id2=uri2,...)anzusprechen. Jedes Attribut "id" kennzeichnet im URI ein Element "frame" innerhalb
des Dokuments mit einem Attribut "id", das diesen Wert enthält. Daraufhin ist jeder zugehörigeURI deisem
Frame zugewiesen.

Fazit

Einige Nachteile von HTML-Frames lösen
XFrames zumindest ansatzweise, allerdings werfen sie selber neue auf.
Dem URI des Framesets kommt eine besondere Bedeutung zu, da sich an ihm ablegsen lässt, wie der Frameset
gefüllt ist. An sich eine löbliche Entwicklung und schließlich das Kernkonzept von XFrames, da die Tatsache,
dass sich ein Set von Dokumenten innerhalb eines Framesets nicht direkt verlinken lässt, somit korriegiert wären.
Nicht wirklich lösen XFrames das Suchmaschinenproblem. Suchmaschinen können prinzipiell URIs zu einem
XFrames-Dokument anbieten, aber was passiert, wenn der Benutzeragent XFrames nicht unterstützt? In deisem Fall
müsste eine serverseitige Lösung gefunden und ein alternatives Dokument ausgeliefert werden. Wie aber sollen
Suchmaschinen überhaupt den richtigen XFrames-Link bestimmen?
Wie man sieht, erfordert der W3C-Entwurf noch eine Menge Arbeit, aber es ist ohnehin erst in einigen Jahren
damit zu rechnen, XFrames wirklich praxistauglich einsetzen zu können, denn die Browser müssen mit dem
Ergebnis schließlich umgehen können.

Literatur:
Steven Pemberton; XFrames; W3C-Entwurf vom 6. August 2002; www.w3.org/TR/xframes/;
auf Deutsch: jendryschik.de/TR/xframes/

... link  


... comment

 
Online for 7697 days
Last update: 2004.01.29, 16:40
You're not logged in ... login
 
Dezember 2003
Mo
Di
Mi
Do
Fr
Sa
So
 2 
 3 
 4 
 5 
 6 
 7 
 8 
 9 
10
11
12
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
 
 
 
 
 
Hallo Michael, du hast...
Hallo Michael, du hast sicher recht, dass sich seit...
by tobias.sporer.salzburg (2004.01.29, 16:40)
Hy Tobias!
Habe deinen Link auf meinem Blog schon länger...
by michael.baumgaertner.salzburg (2004.01.24, 12:54)
Die Theorie der langen...
1. Einleitung 2. Die Theorie von Kondratieff 3. Was...
by tobias.sporer.salzburg (2004.01.19, 13:02)
Die Kondratieff-Zyklen
Nikolai Dmitrievich Kondratieff stellt die Theorie...
by tobias.sporer.salzburg (2004.01.17, 12:15)
Frohe Weihnachten
ich wünsche allen Teilnehmern frohe Weihnachten...
by tobias.sporer.salzburg (2003.12.24, 11:06)

xml version of this page

made with antville
powered by
helma object publisher