Die vorliegende Arbeit zeigt die Anwendbarkeit von Netzwerkanalysen als leistungsfähiges Werkzeug zur Identifikation aussagekräftiger Cluster in Sammlungen von Leserezensionen. Die Datenbasis für diese Studie bildet das AbsORB-Korpus, in dem 1025 Rezensionen von Goodreads manuell auf Vorkommnis von Absorption anhand der Story
World Absorption Scale (SWAS) annotiert wurden.
Die Untersuchung konzentriert sich auf ein Subkorpus bestehend aus 199 Leserezensionen für 49 Bücher aus den Genres Fantasy, Romance, Horror/Thriller, Mystery und Science Fiction. Die Daten werden in ein Netzwerk integriert, das auf Textähnlichkeit basiert
und mithilfe des TF-IDF-Verfahrens berechnet wird. Anschließend werden sie mit dem
Louvain-Algorithmus zu Clustern zusammengefasst. Die nachfolgende qualitative Analyse erfolgt anhand der Untersuchung von Keywords und Konkordanzen.
Erste Versuche der Netzwerkkonstruktion zeigten, dass Fantasy-Rezensionen die Gesamtklassifizierung der Genres verfälschten. Daher wurden diese Rezensionen aus dem
Korpus ausgeschlossen. Obwohl Genre nicht der primäre Klassifizierungsfaktor ist, differenzieren sich Mystery- und Romance-Rezensionen im Vergleich zu den anderen Genres
deutlicher. Darüber hinaus stellen die verwendeten Formulierungen in Absorption Aussagen ein wichtiges Unterscheidungsmerkmal des Clustering-Prozesses dar, da sie sich
häufig in den Keywords der jeweiligen Cluster wiederfinden. Darüber hinaus bilden Rezensionen, die von dem Verteilungsmuster von Absorption in ihrem Genre im Allgemeinen abweichen, tendenziell separate Cluster.
This research demonstrates the value of network analysis as a powerful tool for identifying meaningful clusters within collections of reader reviews. The data basis for this study
is the AbsORB corpus, where 1025 reviews from Goodreads were manually annotated for
instances of absorption using the Story World Absorption Scale (SWAS).
The investigation focuses on a subcorpus consisting of 199 reading reviews for 49 books
across the genres of Fantasy, Romance, Horror/Thriller, Mystery, and Science Fiction. The
data is incorporated into a network based on text-similarity as measured by TF-IDF and
clustered using the Louvain algorithm. The subsequent qualitative analysis is guided by
the examination of keywords and concordances.
Initial attempts at network construction revealed that Fantasy reviews introduced noise
into the overall classification of genres. Consequently, these reviews were excluded from
the corpus. Although genre is not the primary discriminating factor, Mystery and Romance reviews exhibit greater distinctiveness compared to the other genres. Additionally, the language employed in absorption statements proves to be a significant discriminator during the clustering process, as they are frequently reflected in the keywords associated with each cluster. Furthermore, reviews that deviated from the absorption patterns of the genre in general tend to form separate clusters.