AroMaXT ARoMaXT

Applied Research on Mail and XML Technologies








Semantisch erweiterter Zugang zu wichtigen durch RFCs beschriebene Standards

Einleitung

Das Internet basiert auf einer Vielfalt an Protokollen und Vereinbarungen, die technische Prozesse einhalten müssen (sollten). Die meisten der derartigen Übereinkünfte werden durch die IETF RFCs abgebildet. Zahlreiche Initiativen wurden gestartet diese Daten einer besseren Repräsentation zuzuführen. Am weitesten war die Bond University (AU) mit einem XTM Projekt, das aber nie aus dem "planned" Status hinausgekommen ist.

Das stellt die Frage, worin die Schwierigkeit mit dem Umgang mit RFCs liegt. Werden diese nicht beachtet, oder ist es deren Aufbereitung zu schwer? Das Parsing, ist nicht das Problem, ein technischer Prozess kann diese aufgreifen. Ich habe das vor Jahren schon exemplarisch gemacht und gute Ergebnisse erzielt. Eine gewöhnliche "statische", vernetzte/verlinkte Site ließe sich also problemlos gestalten.

Doch würde das reichen? Nur wenige wissen mit der Zahl 2822 oder 2616 etwas anzufangen, obwohl diese (und die zugehörigen RFCs) die Grunddienste im Internet darstellen Es mag daran liegen, daß es keinen semantischen Zugang zu diesen Informationen gibt. Keinen Zugang für Profis, die schnell etwas nachschauen wollen, keinen für "Anfänger", die einen Überblick haben wollen, keinen für "Ausbildner", die wissen (sollten), welchen Umfang sie beachten sollten. Es gibt die Nummer und das Nachschlagen auf den entsprechenden Seiten, die die RFCs anbieten.

Ich sehe meine Aufgabe nicht darin der IETF eine Aufgabe abzunehmen, sondern darüber "etwas" zu setzen, ich will es nicht Web2 nennen, ich will mit diesem Projekt herausfinden, was notwendig ist, bzw. was nötig sein könnte. IANA RFCs (Request for Comments) sind eine wesentliche Quellen von Informationen für Internet Programmierer und Berater. Sämtliche gängige Protokolle, sofern diese nicht herstellerspezifisch uminterpriertert wurden, wurden in RFCs gegossen.

Das Projekt

Die Basis stellt die Aufbereitung der RFCs dar, vorerst ein ausgewähltes Spektrum und nicht die "historischen" Inhalte. Die extrahierten strukturierten Daten werden in eine Datenbank gefüttert. Soweit die Ausgangssituation.

Das Projekt würde dann darin bestehen, daß ein, zwei Tools aufgesetzt werden, die eine semantische Verarbeitung (und Ergänzung dieser Daten) erlauben würden. Denkbar sind dazu XTM Tools, Erweiterungen zu Wikis oder anderer Open Source Werkzeuge. Es ist angestrebt, daß diese Werkzeuge im Rahmen des Projekts ausgewählt und erweitert werden.

Ein weiterer wesentlicher Bestandteil des Projekts ist die Nutzung. Die Projektdaten, i.e. die statischen Seiten, die semantischen Zugänge und die Tools werden von Anfang an öffentlich zur Verfügung stehen. Die Tools werden ebenfalls nach der Phase I zur Verfügung stehen. Was erreicht werden soll, ist:

  • Friendly User sollen die Werkzeuge testen und die Ontologien (Thesaurii, Taxonomien) mitentwickeln
  • "gewöhnliche" Internetuser sind beteiligt
  • ich selber werde mich um mein Lieblingsthema kümmern (Internet Mail)

Daraus soll ein Erfahrungskatalog entstehen, dokumentiert in den entsprechenden Foren und im Wiki, die den Umgang mit den Werkzeugen beschreibt. Letztlich geht es um Collaborate Ontology Engineering und eine entsprechende Erfahrung im How To.




© ARoMaXT 2001-2008 Markus Hasleder

Suchmaschinenoptimierung mit Ranking-Hits

Valid XHTML 1.0 Strict