Stage-oe-small.jpg

Thema3928

Aus Aifbportal
Version vom 18. Mai 2017, 10:10 Uhr von He9318 (Diskussion | Beiträge)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu:Navigation, Suche



Trend Detection: Vorhersage der Entstehung von Wikipedia-Artikeln




Informationen zur Arbeit

Abschlussarbeitstyp: Bachelor
Betreuer: Michael Färber
Forschungsgruppe: Wissensmanagement

Archivierungsnummer: 3928
Abschlussarbeitsstatus: unbekannt
Beginn: unbekannt
Abgabe: unbekannt

Weitere Informationen

Trend Detection: Vorhersage der Entstehung von Wikipedia-Artikeln

Wann werden Entitäten (Dinge wie „Edward Snowden“) als Seiten in Wikipedia ange-legt? Diese Frage soll in dieser Abschlussarbeit geklärt werden. Dazu werden Nach-richtentexte über einen bestimmten Zeitraum (z.B. ein Jahr) analysiert und der Zeit-punkt des Hinzufügens zu Wikipedia (evtl. auch weiterer Edits) betrachtet. Aufbauend auf diesen Daten sollen menschenverständliche Regeln automatisch erlernt werden (etwa: Wenn die Entität in den vergangenen X Tagen Y Mal von der Nachrichtenquelle Z in der Überschrift vorkam, wird sie zu W% Wahrscheinlichkeit in den nächsten 24h zu Wikipedia hinzugefügt). Zweiter Teil der Abschlussarbeit ist es, die erlernten Regeln auf neue Nachrichtentexte anzuwenden und so die Entstehung von Wikipedia-Seiten vorherzusagen. Die Nachrichtentexte werden im Rahmen der Arbeit zur Verfügung gestellt.


Trend Detection: Predicting the emergence of Wikipedia articles

When are entities (things like "Edward Snowden") added as pages to Wikipedia? This question will be adressed in this thesis. News texts as well as the Wikipedia edit history is analyzed in order to come up with human-readable rules like "If the entity occurs in the past X days Y times in tht title, it will be added with a probability of Z as page to Wikipedia in the next 24h. The second part of the thesis is to apply the learned rules for new news articles in order to predict the emergence of Wikipedia pages live.


Ausschreibung: Download (pdf)