March 4, 2024

Οι ερευνητές δείχνουν πόσο εύκολο είναι να νικήσεις τα υδατογραφήματα AI

εικόνα τύπου υδατογραφήματος

James Marshall/Getty Images

Ο Soheil Feizi θεωρεί τον εαυτό του αισιόδοξο άτομο. Αλλά ο καθηγητής επιστήμης υπολογιστών του Πανεπιστημίου του Μέριλαντ είναι ωμά όταν συνοψίζει την τρέχουσα κατάσταση των εικόνων τεχνητής νοημοσύνης με υδατοσήμανση. «Δεν έχουμε αξιόπιστα υδατογραφήματα αυτή τη στιγμή», λέει. «Τους σπάσαμε όλους».

Για έναν από τους δύο τύπους υδατογραφημάτων τεχνητής νοημοσύνης που δοκίμασε για μια νέα μελέτη (υδατογραφήματα «χαμηλής διαταραχής», τα οποία είναι αόρατα με γυμνό μάτι), είναι ακόμη πιο ωμά: «Δεν υπάρχει ελπίδα».

Ο Φεΐζη και οι συνεργάτες του ανέλυσαν πόσο εύκολο είναι για τους κακούς ηθοποιούς να αποφύγουν τις προσπάθειες υδατογραφήματος. (Το αποκαλεί «ξέπλυμα» του υδατογραφήματος.) Εκτός από την επίδειξη του τρόπου με τον οποίο οι εισβολείς μπορούν να αφαιρέσουν τα υδατογραφήματα, η μελέτη δείχνει πώς είναι δυνατόν να προστεθούν υδατογραφήματα σε εικόνες που δημιουργούνται από τον άνθρωπο, οδηγώντας σε ψευδώς θετικά αποτελέσματα. Δημοσιεύτηκε στο Διαδίκτυο αυτήν την εβδομάδα, το προεκτυπωμένο άρθρο δεν έχει ακόμη αξιολογηθεί από ομοτίμους. Η Feizi υπήρξε ηγετική φυσιογνωμία στην εξέταση του τρόπου με τον οποίο μπορεί να λειτουργήσει η ανίχνευση AI, επομένως αξίζει να δοθεί προσοχή στην έρευνα, ακόμη και σε αυτό το πρώιμο στάδιο.

Είναι μια έγκαιρη έρευνα. Η υδατογράφηση έχει γίνει μια από τις πιο ελπιδοφόρες στρατηγικές για τον εντοπισμό εικόνων και κειμένου που δημιουργούνται από AI. Ακριβώς όπως τα φυσικά υδατογραφήματα ενσωματώνονται σε τραπεζογραμμάτια και γραμματόσημα για να αποδείξουν την αυθεντικότητά τους, τα ψηφιακά υδατογραφήματα προορίζονται για τον εντοπισμό της προέλευσης εικόνων και κειμένων στο διαδίκτυο, βοηθώντας τους ανθρώπους να εντοπίζουν πλαστά βίντεο και βιβλία γραμμένα από ρομπότ. Με τις προεδρικές εκλογές των ΗΠΑ στον ορίζοντα του 2024, οι ανησυχίες σχετικά με τη χειραγώγηση των μέσων ενημέρωσης είναι υψηλές και μερικοί άνθρωποι έχουν ήδη πέσει πάνω τους. Ο πρώην πρόεδρος των ΗΠΑ Ντόναλντ Τραμπ, για παράδειγμα, μοιράστηκε ένα ψεύτικο βίντεο του Άντερσον Κούπερ στην κοινωνική του πλατφόρμα Truth Social. Η φωνή του Κούπερ είχε κλωνοποιηθεί από την AI.

Αυτό το καλοκαίρι, οι OpenAI, Alphabet, Meta, Amazon και αρκετοί άλλοι σημαντικοί παίκτες τεχνητής νοημοσύνης υποσχέθηκαν να αναπτύξουν τεχνολογία υδατογραφήματος για την καταπολέμηση της παραπληροφόρησης. Στα τέλη Αυγούστου, το DeepMind της Google κυκλοφόρησε μια έκδοση beta του νέου εργαλείου υδατογράφησης SynthID. Η ελπίδα είναι ότι αυτά τα εργαλεία θα επισημάνουν το περιεχόμενο AI καθώς δημιουργείται, με τον ίδιο τρόπο που τα φυσικά υδατογραφήματα ελέγχουν την ταυτότητα των δολαρίων καθώς εκτυπώνονται.

Είναι μια σταθερή και απλή στρατηγική, αλλά μπορεί να μην είναι κερδοφόρα. Αυτή η μελέτη δεν είναι η μόνη εργασία που επισημαίνει τις κύριες ελλείψεις των υδατογραφημάτων. «Είναι καλά αποδεδειγμένο ότι τα υδατογραφήματα μπορεί να είναι ευάλωτα σε επιθέσεις», λέει ο Hany Farid, καθηγητής στο UC Berkeley’s School of Information.

Τον Αύγουστο του τρέχοντος έτους, ερευνητές στο Πανεπιστήμιο της Καλιφόρνια, Santa Barbara και ο Carnegie Mellon συνέγραψαν μια άλλη εργασία που περιγράφει παρόμοια ευρήματα, αφού πραγματοποίησαν τις δικές τους πειραματικές επιθέσεις. «Όλα τα αόρατα υδατογραφήματα είναι ευάλωτα», αναφέρει. Αυτή η νέα μελέτη προχωρά ακόμη παραπέρα. Ενώ ορισμένοι ερευνητές έχουν εκφράσει την ελπίδα ότι μπορούν να αναπτυχθούν ορατά («υψηλής διαταραχής») υδατογραφήματα για να αντισταθούν στις επιθέσεις, ο Feizi και οι συνεργάτες του λένε ότι ακόμη και αυτός ο πιο πολλά υποσχόμενος τύπος μπορεί να χειραγωγηθεί.

Οι δυσλειτουργίες της υδατοσήμανσης δεν έχουν αποτρέψει τους τεχνολογικούς γίγαντες να το προσφέρουν ως λύση, αλλά οι άνθρωποι που εργάζονται στον χώρο ανίχνευσης AI είναι προσεκτικοί. «Στην αρχή, τα υδατογραφήματα φαίνονται σαν μια ευγενής και πολλά υποσχόμενη λύση, αλλά οι εφαρμογές τους στον πραγματικό κόσμο αποτυγχάνουν από την αρχή όταν μπορούν εύκολα να πλαστογραφηθούν, να διαγραφούν ή να αγνοηθούν», λέει ο Ben Colman, Διευθύνων Σύμβουλος της startup ανίχνευσης AI Reality Defender.

«Τα υδατογραφήματα δεν είναι αποτελεσματικά», προσθέτει ο Bars Juhasz, συνιδρυτής της Undetectable, μιας startup αφιερωμένης στο να βοηθά τους ανθρώπους να αποφύγουν τους ανιχνευτές AI. «Ολόκληρες βιομηχανίες, όπως η δική μας, έχουν αναδυθεί για να βεβαιωθούμε ότι δεν είναι αποτελεσματική». Σύμφωνα με τον Juhasz, εταιρείες σαν τη δική του είναι ήδη σε θέση να προσφέρουν υπηρεσίες γρήγορης αφαίρεσης υδατογραφήματος.

Άλλοι πιστεύουν ότι η υδατοσήμανση έχει μια θέση στον εντοπισμό τεχνητής νοημοσύνης, αρκεί να κατανοήσουμε τους περιορισμούς της. «Είναι σημαντικό να καταλάβουμε ότι κανείς δεν πιστεύει ότι μόνο το υδατογράφημα θα είναι αρκετό», λέει ο Farid. «Αλλά νομίζω ότι τα ισχυρά υδατογραφήματα είναι μέρος της λύσης». Πιστεύει ότι η βελτίωση των υδατογραφημάτων και στη συνέχεια η χρήση τους σε συνδυασμό με άλλες τεχνολογίες θα δυσκολέψει τους κακούς ηθοποιούς να δημιουργήσουν πειστικά ψεύτικα.

Μερικοί από τους συναδέλφους του Feizi πιστεύουν ότι τα υδατογραφήματα έχουν επίσης τη θέση τους. “Το αν αυτό είναι ένα πλήγμα για τα υδατογραφήματα εξαρτάται σε μεγάλο βαθμό από τις υποθέσεις και τις ελπίδες που δίνονται στα υδατογραφήματα ως λύση”, λέει ο Yuxin Wen, διδακτορικός φοιτητής στο Πανεπιστήμιο του Maryland και συν-συγγραφέας μιας πρόσφατης εργασίας που προτείνει μια νέα τεχνική υδατογραφήματος. Για τον Wen και τους συν-συγγραφείς του, συμπεριλαμβανομένου του καθηγητή επιστήμης υπολογιστών Tom Goldstein, αυτή η μελέτη είναι μια ευκαιρία να επανεξεταστούν οι προσδοκίες που τίθενται για τα υδατογραφήματα, παρά ένας λόγος για να απορριφθεί η χρήση τους ως ένα εργαλείο ελέγχου ταυτότητας μεταξύ πολλών.

«Πάντα θα υπάρχουν εξελιγμένοι ηθοποιοί που θα είναι σε θέση να αποφύγουν τον εντοπισμό», λέει ο Goldstein. «Είναι εντάξει να έχουμε ένα σύστημα που μπορεί να ανιχνεύσει μόνο κάποια πράγματα». Βλέπει το υδατογράφημα ως μια μορφή μείωσης της βλάβης και αξίζει τον κόπο για τον εντοπισμό προσπαθειών πλαστογράφησης τεχνητής νοημοσύνης χαμηλότερου επιπέδου, ακόμα κι αν δεν μπορούν να αποτρέψουν επιθέσεις υψηλού επιπέδου.

Αυτή η συγκράτηση των προσδοκιών μπορεί ήδη να συμβαίνει. Στην ανάρτησή της στο blog που ανακοινώνει το SynthID, η DeepMind φροντίζει να αντισταθμίζει τα στοιχήματά της, σημειώνοντας ότι το εργαλείο “δεν είναι αλάνθαστο” και “δεν είναι τέλειο”.

Η Feizi είναι πολύ δύσπιστη ότι η υδατογράφηση είναι μια καλή χρήση πόρων για εταιρείες όπως η Google. «Ίσως θα έπρεπε να συνηθίσουμε στο γεγονός ότι δεν θα είμαστε σε θέση να επισημαίνουμε αξιόπιστα τις εικόνες που δημιουργούνται από AI», λέει.

Ωστόσο, το άρθρο του είναι λίγο πιο εύθυμο στα συμπεράσματά του. «Σύμφωνα με τα αποτελέσματά μας, ο σχεδιασμός ενός ισχυρού υδατογραφήματος είναι μια πρόκληση, αλλά όχι απαραίτητα αδύνατο», αναφέρει.

Αυτή η ιστορία εμφανίστηκε αρχικά στο wired.com.

Leave a Reply

Your email address will not be published. Required fields are marked *