von · 0 Kommentare

Data Mining in semantisch annotierten sozialen Netzwerken

Um den akademischen Grad des Diplom-Wirtschaftsinformatikers zu erhalten, schreibt die Prüfungsordnung vor, dass ich eine Diplomarbeit verfasse, um meine Fähigkeiten des wissenschaftlichen Arbeitens unter Beweis zu stellen.

Das gewählte Thema ist bereits oben aufgeführt. Etwas vereinfacht ausgedrückt, versuche ich Zusammenhänge (quasi Data Mining) in sozialen Netzwerken (à la studiVz und Facebook) zu finden. Die Daten dazu liegen standardisiert vor - was den semantischen Teil entspricht.

PDF-Datei  Diplomarbeit von Hannes Müller (1,86 MByte)

ZIP-Datei Anhang zur Diplomarbeit (3,46 MByte)

Konkret vergleiche ich drei Methoden, die aus den Daten Informationen extrahieren zu versuchen. Als Datengrundlage nutzte ich die Beachvolleyball Datenbank des Sächsischen Volleyballverbands.

Visuelle Analyse eines sozialen NetzwerksZum einen greife ich auf einen visuellen Ansatz zurück. Dabei werden mithilfe eines Algorithmus die Knoten eines Graphs möglichst übersichtlich dargestellt. Dabei entsprechen die Knoten den Turnierteilnehmern. Durch Einfärbung anhand ihrer zugrunde liegenden Profilinformationen, lässt sich eine klare Abgrenzung zwischen männlichen und weiblichen Spielern erkennen.

Beispiel eines DendrogrammsDie zweite Methode baut auf ein Abstandsmaß zwischen den Knoten im Netzwerk auf. Daraus lassen sich die Ähnlichkeiten der Knoten ableiten und somit mittels eines Dendrogramms in Gruppen unterteilen.

Die dritte und letzte Methode stand im Mittelpunkt meiner Diplomarbeit. Eine wichtige Vorarbeit haben hierfür A. Maedche und V. Zacharias von der Karlsruher Universität gemacht. Sie entwickelten ein Ähnlichkeitsmaß für semantische Daten. Mit dessen Hilfe können Objekte entsprechend ihrer Ähnlichkeit gruppiert werden. Ich habe dieses Konzept auf soziale Netzwerke übertragen und kritisch die Vor- und Nachteile gegenüber den beiden anderen Methoden herausgearbeitet.

Ich wünsche dem interessierten Leser viel Spaß bei dieser Lektüre.

Tags: data mining, diplomarbeit, semantik, soziale netzwerke


Kommentare

Derzeit sind noch keine Kommentare gespeichert. Wollen Sie der Erste sein?


Neuen Kommentar schreiben


Die E-Mail Adresse wird nicht veröffentlicht. Sie wird lediglich für die Anzeige des Gravatars verwendet.

Für das erfolgreiche Speichern des Kommentars ist es notwendig, dass alle fettgedruckten Felder ausgefüllt sind.