Stage-oe-small.jpg

Prüfung/Seminare/WS2013/SMW

Aus Aifbportal
Wechseln zu:Navigation, Suche

Seminar Anwendungen von Semantic MediaWiki

Details zur Lehrveranstaltung
Dozent(en) Rudi StuderBasil EllBenedikt KämpgenMichael FärberPatrick Philipp
Übungsleiter Rudi StuderBasil EllBenedikt KämpgenMichael FärberPatrick Philipp
Fach (Gebiet)
Leistungspunkte ECTS
Erfolgskontrolle
Semester WS


Aktuelle und ergänzende Informationen, sowie Zeiten und Räume der Lehrveranstaltung finden Sie im Vorlesungsverzeichnis der Universität.
Link zum Vorlesungsverzeichnis
Link zum Studierendenportal


Forschungsgruppe


Inhalt

Im Seminar können innovative Anwendungen von Semantic MediaWiki (https://semantic-mediawiki.org/) entworfen und entwickelt werden. Semantic MediaWiki (kurz SMW) ist eine viel genutzte Erweiterung zur MediaWiki-Software, der Basis für Wikipedia. Diese Erweiterung ermöglicht Bearbeitern, bestimmte Fakten für Maschinen (Programme) zugänglich zu machen, was es wiederum einfacher für Menschen macht, in den Informationen zu suchen oder sie weiter zu verwenden. Im Rahmen des Seminars werden die Möglichkeiten von SMW als Plattform für Anwendungen im Semantic Web untersucht.

Die Art der Anwendung und die Zielgruppe können entweder selbst vorgeschlagen werden oder aus einem der vielen Projekte hergenommen werden, in denen SMW eingesetzt wird: Wikidata zur Erstellung einer freien Wissensdatenbank, SyncTech zur Produktinnovationssuche, SFB/Transregio 125 zur Wissens- und modellbasierten Chirurgie, SMW-CorA für eine Virtuelle Forschungsumgebung in der Historischen Bildungsforschung etc.

Ziel des Seminars ist es innovative Anwendung zu realisieren und zu präsentieren.


Ablauf

Einzeln oder in kleinen Teams - jedem Studenten bzw. jedem Team wird dabei ein fester Betreuer zugeordnet - sind innovative Anwendungen von SMW zu konzipieren, realisieren und präsentieren. Hierzu kann es notwendig sein Erweiterungen in PHP zu entwickeln. Vorkenntnisse in PHP-Programmierung, Semantische Web-Technologien und Wissensmanagement sind hier von Vorteil aber nicht zwingend Voraussetzung.

  • Eine Gruppenbildung kann während des Kick-Offs (22.10.2013 von 14:00 Uhr bis 15:30 Uhr im Raum 221) und bis zum 15.11.2013 stattfinden.
  • Zu Beginn des Semesters präsentieren die Gruppen ihre Ideen.
  • In einer Zwischenpräsentation werden Ideen und erste Resultate präsentiert und Erfahrungen können ausgetauscht werden.
  • Das Seminar schließt mit den Abschlusspräsentationen der realisierten Anwendungen.


Termine und Anmeldung
  • Das erste Seminartreffen findet am 22.10.2013 von 14:00 Uhr bis 15:30 Uhr im Raum 221 am Institut AIFB (Gebäude 11.40, Dachgeschoss) statt. Die anderen Termine finden als Blockseminar statt. Eine Zulassung zum Seminar ist in Ausnahmefällen auch ohne Anwesenheit beim ersten Seminartreffen möglich.
  • Die Wahl der Themen erfolgt bis zum 15.11.2013 und wird dann mit dem jeweiligen Betreuer besprochen.
  • Die Zwischenpräsentation findet am ? (wird noch bekannt gegeben) statt.
  • Die Abschlusspräsentation findet am 29.01.2014 10:00 Uhr statt.

Die Anmeldung erfolgt per eMail an Basil Ell. Es gibt noch Seminarplätze. (Stand: 2013-10-07)

Bei Fragen oder Problemen, wenden Sie sich bitte an Basil Ell.


Literatur
Vorkenntnisse in Semantische Technologien sind nützlich, aber nicht notwendig. Bei Interesse: Foundations of Semantic Web Technologies.


Anmerkungen
  • Studierende können sich in der "Semantic MediaWiki" Mendeley-Gruppe mit den Betreuern und anderen Teilnehmern austauschen [1]
  • Am 28. bis 30. Oktober findet die halbjährige Benutzer- und Entwicklerkonferenz von Semantic MediaWiki - SMWCon 2013 - in Berlin statt. Für Studenten ist der Beitrag sehr günstig, es werden unter anderem Tutorien in MediaWiki und Semantic MediaWiki angeboten.


Themen
  • Weitere Themen werden noch bekannt gegeben. Bei Interesse einfach beim jeweiligen Betreuer melden.

Themen zu Surgipedia

Surgipedia [2] ist ein Semantic MediaWiki, das im Forschungsprojekt Cognition-guided Surgery [3] zur Speicherung von medizinischem Wissen eingesetzt wird.

  • Liversurgipedia und prozentuale Angabe zum Ausfüllen eines Formulars: In Liversurgipedia werden beispielhaft Patientendaten annotiert. In diesem Thema sollen Möglichkeiten untersucht werden, um Medizinern deutlich zu machen, wieviele Informationen bis zum vollständigen Ausfüllen eines Patienten noch fehlen. (Betreuer: Benedikt Kämpgen)
  • Die Interkonnektivität und den Beitrag zur Wissensbasis von Projekten mittels Surgipedia visualisieren: Gibt es eine Möglichkeit, um aus der Wissensbasis ein Maß für die Interkonnektivität zwischen Projekten bzw. für die Wissensbeiträge von Projekten zu visualisieren? Dazu kann zum Beispiel eine Statistik über die Nutzung einzelner Wissensbeiträge (Triples) erstellt werden und diese in einem Graphen visualisiert werden. (Betreuer: Patrick Philipp)
  • Wiederverwenden von Ontologien in Surgipedia. Es gibt zwei Möglichkeiten, um Ontologien in einem SMW wiederzuverwenden: Import vocabulary [4] und equivalent URI [5]. Beide Male müssen zur Wiederverwendung zunächst entsprechende Seiten mühsam angelegt werden. Hier soll ein Skript geschrieben werden, um eine Ontologie wie z.B. die Radiologie-Ontologie Radlex [6] (in OWL/RDF verfügbar) automatisch in Surgipedia verfügbar für die Wiederverwendung zu machen.

Themen zum Semantic Web Browser

Der Semantic Web Browser [7] ist ein in Semantic MediaWiki integrierter Web Browser zum Explorieren von Daten, die im Wiki sowie im Semantic Web enthalten sind.

  • Wiederverwenden von Ontologien im Semantic MediaWiki durch den Semantic Web Browser: JavaScript-Nutzerschnittstelle zum Vereinfachten importieren von Kategorien (rdf:Class), Attributen (rdf:Property) und Instanzen (?instance rdf:type ?class). (Betreuer: Benedikt Kämpgen)
  • Caching im Semantic Web Browser: Anbindung eines Triple Stores zur Verbesserung der Geschwindigkeit (caching) sowie ausführlicher Auflistung von eingehenden Links. (Betreuer: Benedikt Kämpgen)

Themen zum Semantic Text Annotator

Im vergangenden SMW-Seminar wurde eine Erweiterung entwickelt, mit der sich Textstellen in Wiki-Seiten komfortabel semantisch annotieren lassen. Ziel ist es nun, diese Annotationen in Formaten exportieren zu können, die von gängigen Annotationstools wie z.B. [www.maxqda.com/‎ MAXQDA] und [www.atlasti.com/ Atlas.ti] importiert werden können. Zudem sollen mit diesen Tools annotiertes Material und vorgenommene Annotationen in SMW importiert werden können. (Betreuer: Basil Ell)


Datenanalyse und -visualisierung

SMW wird auch im Rahmen von Forschungsprojekten, wie z.B. SMW-CorA, als Grundbaustein von sogenannten Virtuellen Forschungsumgebungen eingesetzt. Hier führen Wissenschaftler kollaborativ Forschungsprozesse durch, die u.A. zur Erstellung von Metadaten führen. Diese Metadaten lassen sich nicht immer einfach innerhalb von SMW auswerten - besser eignen sich hier Werkzeuge wie R oder MATLAB. Ziel dieser Arbeit soll nun sein, eine Anbindung an eines dieser Werkzeuge zu realisieren. Die Beschreibung dessen was das Werkzeug durchführen soll, also die Programmierung, soll im Wiki gespeichert sein. Bei der Einbindung des Werkzeuges sind Daten und Programmierung an das Werkzeug zu übertragen. Die erzeugten Ergebnisse, z.B. Visualisierungen, sind im Wiki anzuzeigen. (Betreuer: Basil Ell)


Visualisierung eines multimedialen Korpus

Es liege eine Menge von Ressourcen (Video-, Audio-, Bild- und Textdateien) vor, die thematisch und zeitlich zusammenhängen können. Z.B. kann eine Situation von verschiedenen Standpunkten aus auf verschiedenen Medien aufgezeichnet werden. Zusammenhänge sollen in einem semantischen Wiki erschließbar werden. Z.B. soll zu einem konkreten Ereignis in einem Video angezeigt werden, welche Bilder das selbe Ereignis zeigen. (Betreuer: Basil Ell)


Automatische Anreicherung

In einem Forschungswiki werden historische Personen untersucht. Zu diesen Personen existieren semantische Informationen in der Datenbank der Deutschen Nationalbibliothek (DNB). Zu einer im Wiki repräsentierten Person sind die ähnlichsten Personen in der DNB zu identifizieren. In einem Interaktionsschritt soll der Forscher die passenden (=äquivalenten) Personen auswählen und in einem weiteren Schritt entscheiden welche deren Daten wie zu importieren sind. Dadurch wird das Forschungswiki angereichert und die Forscher können diese Daten in ihre Analysen einbeziehen. Der zu entwickelnde Ansatz soll generisch sein, um also auch auf andere Anreicherungsanwendungsfälle übertragbar zu sein. (Betreuer: Basil Ell)


Literaturexploration

Bei der Durchführung einer systematischen Übersichtsarbeit, ist eine Menge von Publikationen zu einem Thema zu erschließen. Hierzu werden, u.A., zu Beginn Inklusions- und Exklusionskriterien festgelegt um entscheiden zu können ob eine Publikation nun relevant oder nicht relevant für die Fragestellung der Übersichtsarbeit ist. Wird eine Publikation als relevant befunden und damit inkludiert, so sind alle in dieser Publikation referenzierten Publikationen ebenfalls zu prüfen. Um eine Übersicht zu behalten über inkludierte und exkludierte Publikationen, sowie über noch nicht analysierte Publikationen soll SMW verwendet werden. Metadaten zu Publikationen sollen, soweit verfügbar, von externen Quellen importiert werden. (Betreuer: Basil Ell)


Referenzsuche und -grapherstellung

Um einen Überblick über einen Forschungsbereich zu erhalten, ist die Sichtung von Fachliteratur unerlässlich. Interessant ist hier insbesondere, welche Publikationen andere Publikationen zitieren, d.h. welchen "impact" Publikationen haben und wie sie möglicherweise in unterschiedlichen communities verankert sind. In einem SMW sind daher besonders relevante Publikationen als Wiki-Seiten (mittels einer Vorlage) gespeichert. Die Aufgabe besteht darin, die Referenzen aus dem damit verlinkten Publikationens-PDF zu extrahieren und auf diese Weise entweder auf schon im Wiki vorhandene andere Publikationens-Wiki-Seiten zu verlinken oder entspr. Publikationens-Wiki-Seiten anzulegen, falls diese noch nicht existieren. Darauf aufbauend kann ein Referenzgraph erstellt werden, der die Referenzstruktur widerspiegelt. (Betreuer: Michael Färber)


Argumentationswerkzeug

Mit Hilfe von SMW soll ein Werkzeug realisiert werden, welches Benutzer beim Aufbau von Argumentationen unterstützt. Dabei setzen sich Argumentationen aus Bausteinen zusammen, wie sie sich z.B. in der SALT-Ontologie finden. SMW soll nun die Entwicklung von Argumenten dadurch unterstützen, dass es auf komfortable Weise das Anlegen und Verknüpfen dieser Bausteine unterstützt. Dadurch entsteht ein Netz von Bausteinen, das sich als Netzwerk visualisiert erschließen lässt. (Betreuer: Basil Ell)


Forschungsaufgabenmanagement

In virtuellen Forschungsumgebungen, wie z.B. SMW-CorA, bearbeiten Forscher große Mengen von Daten. So versehen sie z.B. große Mengen von Texten mit semantischen Annotationen. Durch die große Menge und dadurch, dass Forscher gemeinsam Forschungsprozesse durchführen, wäre es praktisch, wenn die Forscher eine Aufgabe formulieren könnten (z.B. "Markiere im Text jede erwähnte Person") die für eine bestimmte Menge von Entitäten (z.B. alle Texte der historischen Lexika vor 1950) durchzuführen ist. Bei jeder Entität sollten die Forscher auf komfortable Weise angeben können, ob sie diese Aufgabe bereits erledigt haben. Diese Funktionalität ermöglicht den Forschern Übersicht zu behalten wo welche Tätigkeiten bereits abgeschlossen sind und wie weit sie in ihrer Arbeit fortgeschritten sind. (Betreuer: Basil Ell)


Datengetriebene Forschung

Im Rahmen eines Forschungsprozesses stellt man Hypothesen auf und entscheidet sich für weitere Forschungsaktivitäten je nachdem ob die Hypothese verifiziert oder falsifiziert wurde. Diese Hypothesen können mit konkreten in einem semantischen Wiki gespeicherten Daten zusammenhängen. Da die Daten in einem Wiki dynamisch sind, können einmal getroffene und auf diesen Daten beruhende Entscheidungen bei veränderter Datenlage erneut zu überdenken sein. Ziel ist es also, Hypothesen und Entscheidungen so zu dokumentieren, dass automatisch erkannt werden kann, ob eine bereits getroffene Entscheidung zu überdenken ist. (Betreuer: Basil Ell)


Schemaevolution

Mit SMW ist es sehr einfach neue Schema-Elemente wie Attribute oder Kategorien anzulegen. Der Vorteil ist, dass das Schema dadurch leicht erweitert werden kann. Will man allerdings das bestehende Schema anpassen, z.B. wenn man den Namen einer Kategorie ändern möchte, so bietet SMW hierfür keine Unterstützung. Derzeit ist jede Seite, auf der diese Kategorie verwendet wird, manuell zu editieren. Im Rahmen des Seminars sind Konzepte zu entwickeln und umzusetzen, die diese Problematik angehen. (Betreuer: Basil Ell)


OpenSeaMap

Ziel des Projekts OpenSeaMap ist es, für Wassersportler (Segler, Taucher, Kajakfahrer, Surfer Fischer, etc) interessante nautische und touristische Information in die freie Weltkarte OpenStreetMap einzutragen und in ansprechender Weise darzustellen. Dazu gehören Leuchtfeuer, Tonnen und andere Seezeichen, Hafen-Informationen, Reparaturwerkstätten, Schiffszubehör und vieles mehr, aber auch Einkaufsmöglichkeiten, Restaurants und Sehenswürdigkeiten. Ziel ist es nun, den Endanwendern eine leicht zu bedienende SMW-basierte Oberfläche zu bieten, über die sie neue Objekte (Häfen, Tauchspots, Wildwasserstrecken, Fischgründe) in der Karte hinzufügen und editieren, und im Wiki frei beschreiben können. (Betreuer: Basil Ell)


Patent-SMW: Monitoring und Mining von Patenten in einem Unternehmen

Insbesondere für technologische Firmen sind Patente eine wichtige Informationsquelle, um etwa erkennen zu können, welche Technologien bzw. Technologiebereiche derzeit "angesagt" sind. Dieser Prozess des Monitorings und Trend Detection soll mit Hilfe von SMW abgedeckt werden, indem für die Firma relevante Patente und deren Meta-Informationen in ein Wiki gespeichert werden können. Hierfür ist eine entspr. extension zu entwickeln, wobei als Datenquelle ein Web Service der europ. Patentdatenbank benutzt werden kann. Neben dem Import von Patenten soll eine interne sowie externe Suche ermöglicht werden. Die interne Suche ermöglicht eine aggregierte Bewertung in Form von visualisierten Statistiken. Ausgehend von diesen Statistik-Seiten oder auch von einzelnen Patent-Wiki-Seiten soll eine externe Suche auf der Patentdatenbank angestoßen und die Ergebnisse im Wiki angezeigt werden. Auf der Trefferliste ausgewählten Patente sollen inkl. Metainformationen in das Wiki gespeichert werden können. (Betreuer: Michael Färber)


Referenzierung: Speichern aller Quellen von Attributwerten

Oft ist es wichtig und interessant zu wissen, woher im Wiki abgelegtes Wissen "kommt", da das Alter oder die Vertraulichkeit der Quelle entscheidend sein kann. Es ist daher eine Erweiterung zu entwickeln, die auf Attributebene die jeweilige Quelle mitspeichert und benutzerfreundlich im Wiki anzeigt. Neben der Anzeige soll auch die Erweiterung Semantic Forms so angepasst werden, dass die Quelle benutzerfreundlich mitgespeichert werden kann. Mithilfe strukturierter Abfragen können Statistiken über die Quellen gestellt und visualisiert werden. Besonders beliebte oder gerade popular gewordene Quellen - etwa zu bestimmten Themen (modelliert durch Wiki-Kategorien) - können derart detektiert und über die Zeit gemonitort werden. (Betreuer: Michael Färber)


Browser-Integration

Wichtige Informationen stehen oft zunächst auf Webseiten, so dass es für Benutzer mühsam ist, diese Informationen in das Wiki zu importieren. Diesem Problem soll mithilfe eines Browser-Add-ons Abhilfe geschaffen werden. Im Browser markierte Textbereiche können über das Kontextmenü leicht in das Wiki übertragen werden, indem Vorschläge zur Wiki-Seite und des passenden Attributs gemacht werden und alternativ die Bezeichnung selbst eingegeben werden kann. (Betreuer: Michael Färber)


Linked Data Cubes Explorer Integration

Der Linked Data Cubes Explorer (LDCX) ist eine JavaScript-Anwendung zur Analyse von Statistikdaten, die im Web veröffentlicht wurden [8].

Stichworte: Datenanalyse, OLAP, Business Intelligence

Hier soll eine kleine Parsererweiterung für MediaWiki und Semantic Forms entwickelt werden, die den Linked Data Cubes Explorer einbindet. (Betreuer: Benedikt Kämpgen)


Twitter und SMW

Twitter bietet als vielgenutzte Microblogging Plattform sehr gute Voraussetzungen, um aktuelle Informationen zu finden. Es ist demnach sehr interessant den dort generierten Inhalt zu untersuchen. Maschinelle Lernverfahren eignen sich, um unter anderem Texte zu analysieren und könnten hier zum Einsatz kommen. Da Tweets jedoch stark von gängigen Texten, wie beispielsweise Artikeln, abweichen, treten hier neue Problemstellungen auf. Tweets sind sehr kurz und weisen eine sehr umgangssprachliche Sprachgestaltung auf.

  • Setze ein SMW auf und füttere es mit aktuellen Themen, die du auf Twitter durch ein passendes maschinelles Lernverfahren findest. (Betreuer: Patrick Philipp)
  • Visualisiere Informationen (Themen, Benutzer, ... ) in einem SMW, die du auf Twitter durch ein passendes maschinelles Lernverfahren oder durch Linkanalyse findest. (Betreuer: Patrick Philipp)




Anmerkungen

Weitere Informationen im SMW des Seminars: http://km.aifb.kit.edu/teach/smw-seminar/wiki/SMW-Seminar_WS13/14