Thema3866: Unterschied zwischen den Versionen
He9318 (Diskussion | Beiträge) |
He9318 (Diskussion | Beiträge) |
||
(3 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt) | |||
Zeile 1: | Zeile 1: | ||
{{Abschlussarbeit | {{Abschlussarbeit | ||
− | |Titel= | + | |Titel=Maschinelles Lernen zur Erkennung von neuen Produkten in Texten (wie Nachrichten oder Webseiten) |
− | |Abschlussarbeitstyp= | + | |Abschlussarbeitstyp=Master, Diplom |
|Betreuer=Michael Färber | |Betreuer=Michael Färber | ||
|Forschungsgruppe=Wissensmanagement | |Forschungsgruppe=Wissensmanagement | ||
− | + | |Ausschreibung=Abschlussarbeit AIFB EntitySeries v2.pdf, | |
− | |Ausschreibung=Abschlussarbeit AIFB EntitySeries.pdf | + | |Beschreibung DE=Ziel ist es, Dinge wie Produkte, die noch nicht in Wikipedia sind, aber für das Textdokument zentral sind, in einem gegebenen Text erstmalig zu erkennen. Als zentral werden dabei diejenigen Entitäten (Dinge) betrachtet, die als Nachfolger von bekannten Entitäten stehen (Entitätenreihe), etwa bei Produkten das Windows 10 in der Reihe der Windows-Betriebssysteme (z.B. Windows 95,…, Windows 8.1). |
− | |Beschreibung DE=Ziel ist es, | ||
Der Fokus der Arbeit liegt darin, zunächst die „Entitätenketten“ automatisch zu erlernen und/oder aus einer Wissensbasis zu extrahieren. In einem zweiten Schritt kann dann ein Ansatz entwickelt werden, der die Nachfolger in diesen „Entitätenketten“ in einem gegebenen Text findet, ohne den Namen bzw. das Label der Entität vorher zu kennen (z.B. „Windows 10“). Die Erkennung soll dabei nicht auf Versionszahlen beschränkt sein, sondern es soll ein generischer Ansatz entwickelt werden. Hierzu können zwei Ansätze verglichen werden: Das Ausnutzen gleicher oder ähnlicher Attribute (also einer Wissensbasis) und das Ausnutzen des gleichen historischen Hintergrundes (also des Kontextes in den Dokumenten mittels Annotationen). Details des Ansatzes werden im persönlichen Gespräch erläutert. | Der Fokus der Arbeit liegt darin, zunächst die „Entitätenketten“ automatisch zu erlernen und/oder aus einer Wissensbasis zu extrahieren. In einem zweiten Schritt kann dann ein Ansatz entwickelt werden, der die Nachfolger in diesen „Entitätenketten“ in einem gegebenen Text findet, ohne den Namen bzw. das Label der Entität vorher zu kennen (z.B. „Windows 10“). Die Erkennung soll dabei nicht auf Versionszahlen beschränkt sein, sondern es soll ein generischer Ansatz entwickelt werden. Hierzu können zwei Ansätze verglichen werden: Das Ausnutzen gleicher oder ähnlicher Attribute (also einer Wissensbasis) und das Ausnutzen des gleichen historischen Hintergrundes (also des Kontextes in den Dokumenten mittels Annotationen). Details des Ansatzes werden im persönlichen Gespräch erläutert. |
Aktuelle Version vom 18. Mai 2017, 10:11 Uhr
Abschlussarbeitstyp: Master, Diplom
Betreuer: Michael Färber
Forschungsgruppe: Wissensmanagement
Archivierungsnummer: 3866
Abschlussarbeitsstatus: unbekannt
Beginn: unbekannt
Abgabe: unbekannt
Ziel ist es, Dinge wie Produkte, die noch nicht in Wikipedia sind, aber für das Textdokument zentral sind, in einem gegebenen Text erstmalig zu erkennen. Als zentral werden dabei diejenigen Entitäten (Dinge) betrachtet, die als Nachfolger von bekannten Entitäten stehen (Entitätenreihe), etwa bei Produkten das Windows 10 in der Reihe der Windows-Betriebssysteme (z.B. Windows 95,…, Windows 8.1).
Der Fokus der Arbeit liegt darin, zunächst die „Entitätenketten“ automatisch zu erlernen und/oder aus einer Wissensbasis zu extrahieren. In einem zweiten Schritt kann dann ein Ansatz entwickelt werden, der die Nachfolger in diesen „Entitätenketten“ in einem gegebenen Text findet, ohne den Namen bzw. das Label der Entität vorher zu kennen (z.B. „Windows 10“). Die Erkennung soll dabei nicht auf Versionszahlen beschränkt sein, sondern es soll ein generischer Ansatz entwickelt werden. Hierzu können zwei Ansätze verglichen werden: Das Ausnutzen gleicher oder ähnlicher Attribute (also einer Wissensbasis) und das Ausnutzen des gleichen historischen Hintergrundes (also des Kontextes in den Dokumenten mittels Annotationen). Details des Ansatzes werden im persönlichen Gespräch erläutert. Als Wissensbasis kann Wikipedia bzw. DBpedia verwendet werden. Zur Textannotation werden adaptierte Varianten des Wikipedia Miner zur Verfügung gestellt.
Ausschreibung: Download (pdf)