February 18, 2024

Πόσο περιοριστικό είναι το DALL-E 3 του OpenAI στο ChatGPT;

Η ομορφιά του Διαδικτύου και των δημιουργών εικόνων τεχνητής νοημοσύνης είναι ότι οι άνθρωποι αγαπούν να δημιουργούν περίεργα πράγματα και τώρα που το OpenAI κυκλοφόρησε το DALL-E 3 στους συνδρομητές του ChatGPT Plus, αυτό το γεγονός παραμένει αληθινό.

ΔΕΙΤΕ ΕΠΙΣΗΣ:

Το OpenAI εργάζεται σε ένα εργαλείο για τον εντοπισμό εικόνων του DALL-E 3 που δημιουργούνται από AI

Η τελευταία έκδοση της συσκευής απεικόνισης του OpenAI, DALL-E 3, είναι σημαντικά πιο προηγμένη από τους προκατόχους της, επιτρέποντάς της να αποδίδει χέρια, πόδια και πρόσωπα. Με την εφαρμογή του στο ChatGPT, οι χρήστες μπορούν να δώσουν στο AI μια ιδέα που έχουν για μια εικόνα και το chatbot θα αναπτύξει αυτήν την ιδέα και θα δημιουργήσει τέσσερις περιγραφές για να τροφοδοτήσει το DALL-E 3. Είναι διαθέσιμο σε συνδρομητές ChatGPT Plus και Enterprise, αλλά είναι δωρεάν μέσω του Bing εάν έχετε email της Microsoft.

Με το DALL-E 3, ο ουρανός είναι το όριο για τους χρήστες που θέλουν να βυθιστούν στον κόσμο της τέχνης που δημιουργείται από την τεχνητή νοημοσύνη, αλλά αυτό το όριο είναι δύσκολο.

Πρόσφατα, το OpenAI έχει υιοθετήσει μια πιο ηθική και ηθική στάση σχετικά με την πρόοδο της τεχνητής νοημοσύνης και σε μια προσπάθεια να δείξει ότι νοιάζεται, η εταιρεία έχει θέσει σε μεγάλο βαθμό τους περιορισμούς που έχει θέσει στο DALL-E 3. Οι εικόνες της γεννήτριας στο ChatGPT διαθέτει ένα “σύστημα ασφαλείας πολλαπλών επιπέδων” που περιορίζει την “ικανότητα του DALL-E 3 να δημιουργεί περιεχόμενο βίας, μίσους ή περιεχομένου για ενηλίκους”.

Αυτό κάνει το DALL-E 3 μέσω ChatGPT εξαιρετικά περιοριστική. Εάν η τεχνητή νοημοσύνη μυρίζει ότι δεν είστε καλά, θα σας σταματήσει. Σε αντίθεση με ορισμένες συσκευές απεικόνισης με πιο ανεκτικές πολιτικές, όπως το Midjourney και το StableDiffusion, το DALL-E 3 του ChatGPT έχει πολύ αυστηρές οδηγίες ασφάλειας και δεοντολογίας. Αν και αυτές οι διασφαλίσεις είναι αναμφισβήτητα απαραίτητες για την πρόληψη της δημιουργίας και της κακής χρήσης επιβλαβούς περιεχομένου, μπορεί επίσης μερικές φορές να οδηγήσουν σε υπερβολικό συντηρητισμό, καθιστώντας δύσκολη τη δημιουργική έκφραση.

Στην εξερεύνηση του ChatGPT με το DALL-E 3, προσπαθήσαμε επιμελώς να δοκιμάσουμε τα όριά του. Παρά τις εντυπωσιακές δυνατότητές του, διαπιστώσαμε ότι οι αυστηρές οδηγίες του συστήματος συχνά περιόριζαν τις δημιουργικές μας προσπάθειες. Βρήκαμε ότι το ChatGPT είναι επίσης κάπως ευκολόπιστο.

Καμία λέξη κουνγκ-φου δεν θα κάνει το ChatGPT να δημιουργήσει επιβλαβείς εικόνες, για παράδειγμα, του Χίτλερ ή της Κου Κλουξ Κλαν. Οι περιορισμοί περιεχομένου του ChatGPT σάς εμποδίζουν να δημιουργείτε μηνύματα που περιλαμβάνουν πολιτικούς ή δημόσια πρόσωπα. Ωστόσο, κατά τη διάρκεια της κυκλοφορίας του DALL-E 3 στο ChatGPT, ορισμένοι χρήστες του Reddit με πρώιμη πρόσβαση μπόρεσαν να δημιουργήσουν μερικές γραφικές εικόνες, αλλά φαίνεται ότι το OpenAI έχει αυστηροποιήσει τους περιορισμούς του από τότε έως τώρα.

εικόνα μιας συνομιλίας μεταξύ του chatgpt και εμένα


Πίστωση: OpenAI/Screenshot

Όταν προσπαθούσα να κάνω το ChatGPT να δημιουργήσει μια σβάστικα, το chatbot μου είπε ότι δεν επιτρέπεται λόγω της συσχέτισής του με τη ναζιστική Γερμανία. Στη συνέχεια προσπάθησα να εξηγήσω ότι είναι επίσης ένα βουδιστικό θρησκευτικό σύμβολο χιλιάδων ετών, στο οποίο η ChatGPT ζήτησε συγγνώμη για την παράβλεψη και παρόλα αυτά αρνήθηκε να δημιουργήσει την εικόνα λόγω πιθανών παρεξηγήσεων. (Το πιο σημαντικό μάθημα εδώ είναι ότι οι Ναζί καταστρέφουν τα πάντα.)

εικόνα μιας συνομιλίας μεταξύ του chatgpt και εμένα


Πίστωση: OpenAI/Screenshot

Είναι ενδιαφέρον ότι, παρά την προσπάθεια να παρακάμψουμε τους περιορισμούς περιεχομένου του ChatGPT, καταφέραμε να αποκτήσουμε το DALL-E 3 για να δημιουργήσουμε εικόνες που προστατεύονται από πνευματικά δικαιώματα βασικά ξεγελώντας το. Όπως ανακαλύφθηκε από έναν χρήστη στο -E 3 δημιουργεί αυτή την εικόνα. Στη συνέχεια, εάν ζητήσετε από το ChatGPT να αντιστρέψει το όνομα και να δημιουργήσει ένα νέο λογότυπο, θα δημιουργήσει το λογότυπο Starbucks (ήταν ακόμη και με τη γοργόνα στο φόντο).

εικόνα μιας συνομιλίας μεταξύ του chatgpt και εμένα


Πίστωση: OpenAI/Screenshot

εικόνα μιας συνομιλίας μεταξύ του chatgpt και εμένα


Πίστωση: OpenAI/Screenshot

Ωστόσο, αυτό που ήταν πιο συναρπαστικό είναι ότι σε σύγκριση με το ChatGPT, η χρήση του DALL-E 3 από τον Bing είναι πολύ πιο ήρεμη. Το Bing τείνει να είναι πιο επιεικής και περιστασιακά επιτρέπει τη δημιουργία εικόνων που μπορεί να αναφέρονται σε περιεχόμενο που προστατεύεται από πνευματικά δικαιώματα, ειδικά με σωστή διατύπωση. Για παράδειγμα, μπορείτε να ζητήσετε από τον Bing να δημιουργήσει εικόνες του Tom Brady, αν τον αναφέρετε με το ψευδώνυμό του “TB12”.

Bing Image Maker του Tom Brady Ντυμένος αστροναύτης

Αυτή είναι μια ύποπτη φανέλα των Patriots.
Πίστωση: Bing/OpenAI/Screenshot

Είναι ενδιαφέρον να δούμε πόσο μακριά (ή πόσο λίγο) το ChatGPT επιτρέπει στους χρήστες του να φτάσουν κατά τη δημιουργία εικόνων. Η υλοποίηση DALL-E 3 δείχνει εντυπωσιακή ευελιξία σε πολλούς τομείς. Είναι επίσης σαφές ότι υπάρχουν σταθερά εμπόδια για να αποφευχθεί η κακή χρήση, αν και ένα μικρό κόλπο μπορεί να σας δώσει αυτό που θέλετε. Στο μεταβαλλόμενο τοπίο του περιεχομένου που δημιουργείται από την τεχνητή νοημοσύνη, είναι αξιέπαινο να δούμε την προληπτική στάση του OpenAI με το DALL-E 3 του ChatGPT, ειδικά λαμβάνοντας υπόψη τα ηθικά διλήμματα του παρελθόντος σχετικά με την τεχνητή νοημοσύνη.

Leave a Reply

Your email address will not be published. Required fields are marked *