HyperGraphDis: Εκμετάλλευση των υπεργραφημάτων για ανίχνευση παραπληροφόρησης

Νίκος Σαλαμάνος, Παντελίτσα Λεωνίδου, Νικόλαος Λαουτάρης, Μιχαήλ Συριβιανός, Μαρία Άσπρη, Marius Paraschiv. «HyperGraphDis: Leveraging Hypergraphs for Contextual and Social-Based Disinformation Detection» 18th International AAAI Conference on Web and Social Media (ICWSM’24) (Υπό έκδοση). Διατίθεται προεκτύπωση στη διεύθυνση http://arxiv.org/abs/2310.01113

Στο πλαίσιο της εργασίας «HyperGraphDis: Leveraging Hypergraphs for Contextual and Social-Based Disinformation Detection», οι ερευνητές του MedDMO κατόρθωσαν να βελτιώσουν την ακρίβεια ανίχνευσης παραπληροφόρησης και την υπολογιστική αποτελεσματικότητα στα μέσα κοινωνικής δικτύωσης, εισάγοντας το HyperGraphDis, μια νέα προσέγγιση για τον εντοπισμό παραπληροφόρησης στο Twitter.

Η μέθοδος χρησιμοποιεί μια αναπαράσταση που βασίζεται σε υπεργράφημα για να συλλάβει (i) τις περίπλοκες κοινωνικές δομές που προκύπτουν από retweet, (ii) σχεσιακά χαρακτηριστικά μεταξύ των χρηστών και (iii) σημασιολογικές και τοπικές αποχρώσεις στις σχέσεις αυτές.

Στην αρχική φάση της κατασκευής υπεργραφήματος, εφαρμόζουμε έναν αλγόριθμο κατάτμησης γραφήματος στο κοινωνικό δίκτυο Twitter, όπου οι κόμβοι αντιπροσωπεύουν τους χρήστες και οι ακμές αντιπροσωπεύουν τις κοινωνικές συνδέσεις. Με τον εντοπισμό αυτών των ομάδων χρηστών, μετατρέπουμε κάθε χρήστη σε μια λίστα συμπλεγμάτων στο Twitter, στις οποίες έχει συμμετάσχει. Αυτός ο μετασχηματισμός αναδιαμορφώνει εγγενώς το πρόβλημα: μετατρέπει το πολύπλοκο έργο της ταξινόμησης παραπληροφόρησης στο Twitter από ένα περίπλοκο πρόβλημα πολλαπλών μεταβλητών σε ένα πιο απλό πρόβλημα ταξινόμησης κόμβων εντός του υπεργραφήματος. Παρακάτω, παρουσιάζουμε ένα παράδειγμα κατασκευής του υπεργράφου.

Αξιολογούμε την προσέγγισή μας σε τέσσερα σύνολα δεδομένων: (i) ένα εκτενές σύνολο δεδομένων για τις προεδρικές εκλογές των ΗΠΑ το 2016 (ii) μια σημαντική συλλογή από tweets που σχετίζονται με την πανδημία COVID-19 και (iii) τα σύνολα δεδομένων Health Release και Health Story.

Το HyperGraphDis παρουσιάζει εξαιρετική απόδοση. Αξιολογώντας το με MM-COVID επιτυγχάνεται μια εντυπωσιακή βαθμολογία F1 που ανέρχεται περίπου στο 89,5%. Έχει καλύτερη απόδοση από τη μέθοδο Meta-graph κατά περίπου 4% και από την Cluster-GCN κατά 33%. Επιπλέον, το HyperGraphDis υπερτερεί του HyperGraph for Fake News Detection (HGFND) κατά 6,4%.

Επιπλέον, παρατηρούνται αξιοσημείωτες βελτιώσεις στον υπολογιστικό χρόνο που απαιτείται για την εκπαίδευση μοντέλων. Ο χρόνος ολοκλήρωσης επιταχύνεται σημαντικά, και κυμαίνεται από 2,3 φορές έως 7,6 φορές γρηγορότερα, συγκρινόμενος με τη δεύτερη καλύτερη μέθοδο ανά σύνολο δεδομένων (όσον αφορά τη βαθμολογία F1).

Χρηματοδότηση από:
MedDMO (Grant Agreement no. 101083756)

INCOGNITO (Grant Agreement no. 824015)