Um den akademischen Grad des Diplom-Wirtschaftsinformatikers zu erhalten, schreibt die Prüfungsordnung vor, dass ich eine Diplomarbeit verfasse, um meine Fähigkeiten des wissenschaftlichen Arbeitens unter Beweis zu stellen.
Das gewählte Thema ist bereits oben aufgeführt. Etwas vereinfacht ausgedrückt, versuche ich Zusammenhänge (quasi Data Mining) in sozialen Netzwerken (à la studiVz und Facebook) zu finden. Die Daten dazu liegen standardisiert vor - was den semantischen Teil entspricht.
Diplomarbeit von Hannes Müller (1,86 MByte)
Anhang zur Diplomarbeit (3,46 MByte)
Konkret vergleiche ich drei Methoden, die aus den Daten Informationen extrahieren zu versuchen. Als Datengrundlage nutzte ich die Beachvolleyball Datenbank des Sächsischen Volleyballverbands.
Zum einen greife ich auf einen visuellen Ansatz zurück. Dabei werden mithilfe eines Algorithmus die Knoten eines Graphs möglichst übersichtlich dargestellt. Dabei entsprechen die Knoten den Turnierteilnehmern. Durch Einfärbung anhand ihrer zugrunde liegenden Profilinformationen, lässt sich eine klare Abgrenzung zwischen männlichen und weiblichen Spielern erkennen.
Die zweite Methode baut auf ein Abstandsmaß zwischen den Knoten im Netzwerk auf. Daraus lassen sich die Ähnlichkeiten der Knoten ableiten und somit mittels eines Dendrogramms in Gruppen unterteilen.
Die dritte und letzte Methode stand im Mittelpunkt meiner Diplomarbeit. Eine wichtige Vorarbeit haben hierfür A. Maedche und V. Zacharias von der Karlsruher Universität gemacht. Sie entwickelten ein Ähnlichkeitsmaß für semantische Daten. Mit dessen Hilfe können Objekte entsprechend ihrer Ähnlichkeit gruppiert werden. Ich habe dieses Konzept auf soziale Netzwerke übertragen und kritisch die Vor- und Nachteile gegenüber den beiden anderen Methoden herausgearbeitet.
Ich wünsche dem interessierten Leser viel Spaß bei dieser Lektüre.