Γράφουν οι δρ. Σάββας Χατζηχριστοφής, Αντιπρύτανης Έρευνας και Καινοτομίας, καθηγητής Τεχνητής Νοημοσύνης, Πανεπιστήμιο Νεάπολις Πάφος και Χρίστος Χριστοδούλου, MSC Επιστήμη και Μηχανική Δεδομένων, Software Engineer στην εταιρεία Factory 39

Η υψηλή υπολογιστική δύναμη και η τεχνητή νοημοσύνη καθιστούν τις μηχανές ισχυρές και στις πλείστες των περιπτώσεων, αποδοτικότερες από τον άνθρωπο. Σήμερα οι υπολογιστές μπορούν να ανταπεξέλθουν σε αισθητά μικρότερο χρόνο και με σαφέστατα μεγαλύτερη ακρίβεια σε πλήθος διεργασιών, εκτοπίζοντας τον άνθρωπο από πολλές θέσεις εργασίας. Τα σενάρια επιστημονικής φαντασίας περί κυριαρχίας των μηχανών αρχίζουν να μετατρέπονται σε χειροπιαστές ανησυχίες και πολέμιοι της τεχνολογίας αποκτούν βήμα και επιχειρήματα. Στην εξίσωση όμως εισέρχονται και άλλοι παράγοντες. Είναι προφανές ότι ο άνθρωπος δεν χαρακτηρίζεται μόνο από την ικανότητα του να αντεπεξέρχεται σε εργασίες και προβλήματα. Η ανθρώπινη φύση δεν κατάφερε να επιβιώσει μόνο γιατί μετέτρεψε την πέτρα σε εργαλείο, και τη σπίθα σε φωτιά. Ο άνθρωπος, μέσα από τη δημιουργικότητα του, γέννησε τις τέχνες, και έδωσε χρώμα στη ζωή. Πως θα ήταν η ανθρωπότητα χωρίς την ένατη συμφωνία του Μπετόβεν; Θα είχε το ίδιο νόημα ο έρωτας αν ο Σαίξπηρ δεν τον υμνούσε στον Ρωμαίο και την Ιουλιέτα; Πως θα ορίζαμε το πρότυπο της ομορφιάς αν ο Λεονάρντο ντα Βίντσι δεν ζωγράφιζε τη Μόνα Λίζα; Θα ήταν το ίδιο όμορφο το Παρίσι χωρίς τον Πύργο του Άιφελ; Μπορεί οι μηχανές να καταφέρνουν να ξεπερνούν την ανθρώπινη φύση στον τρόπο που επιλύονται μαθηματικά προβλήματα αλλά σε καμία περίπτωση δεν μπορούν να αντιληφθούν την πηγή ενεργοποίησής συναισθημάτων, και το διάλογο με τη ψυχή. Ή μήπως μπορούν;

Μπορεί κάποιος άραγε να ορίζει το τι είναι τέχνη; Σύμφωνα με ειδικούς, ως τέχνη περιγράφεται η εφαρμογή της ανθρώπινης δημιουργικής ικανότητας, συνήθως σε οπτική ή ακουστική μορφή, με σκοπό την παραγωγή έργων που εκτιμώνται κυρίως για την ομορφιά ή τη συναισθηματική τους δύναμη. Πηγή της τέχνης, αναντίλεκτα είναι η δημιουργικότητα.

Θα χρειαστεί να ανατρέξουμε σε λεξικά για να επιχειρήσουμε να χαρτογραφήσουμε τους παράγοντες που ορίζουν τη δημιουργικότητα. Σύμφωνα με το λεξικό της Οξφόρδης, η δημιουργικότητα ορίζεται ως «Η χρήση της ικανότητας και της φαντασίας για την παραγωγή νέου περιεχομένου». Κλειδί στον ορισμό είναι οι λέξεις «ικανότητα», «φαντασία» και «νέο». Προκειμένου λοιπόν να δούμε αν ο υπολογιστής και η τεχνητή νοημοσύνη μπορούν να παράγουν τέχνη, αρκεί να αναγνωρίσουμε την ύπαρξη των όρων αυτών στις δράσεις τους.

Η ΓΕΝΝΗΣΗ ΤΗΣ ΔΗΜΙΟΥΡΓΙΚΟΤΗΤΑΣ

Πρώτος σταθμός στο ταξίδι της αναζήτησης της καλλιτεχνικής φύσης των υπολογιστών η ιστοσελίδα «This Person Does Not Exist». Στα τέλη του 2020, η συγκεκριμένη ιστοσελίδα παρουσίασε ένα αλγόριθμο τεχνητής νοημοσύνης ο οποίος μπορούσε να παράγει ρεαλιστικές εικόνες προσώπων που δεν υπάρχουν στην πραγματικότητα. Το εντυπωσιακό είναι ότι σε σχετική έρευνα που διεξήχθη, το 90% των ερωτηθέντων δεν μπόρεσε να αναγνωρίσει ότι πρόκειται για μη πραγματικά πρόσωπα. Στην έρευνα μάλιστα συμμετείχαν και επαγγελματίες φωτογράφοι οι οποίο σε ποσοστό 50% δεν αναγνώρισαν ότι ο εικόνες που κλήθηκαν να δουν είναι αποτέλεσμα αλγορίθμου τεχνητής νοημοσύνης. Σε αυτήν την περίπτωση, ο υπολογιστής παρουσιάζει και την ικανότητα, και τη φαντασία για να παράγει νέο υλικό. Άρα, ακολουθώντας αυστηρά τον ορισμό, το πρόσωπο που προκύπτει μπορεί να θεωρηθεί τέχνη. Η «ικανότητά» του τροφοδοτείται από τεχνητό νευρωνικό δίκτυο και την υπολογιστική ισχύ, η «φαντασία» του αναπτύχθηκε μελετώντας πραγματικά πρόσωπα, ενώ το «νέο» αποκαλύπτεται μέσα από την εικόνα που παράγεται.

Το πρόσωπο που παρουσιάζεται στην εικόνα δεν αντιστοιχεί σε κάποιον άνθρωπο αλλά είναι το αποτέλεσμα που προκύπτει από αλγόριθμο τεχνητής νοημοσύνης

ΓΡΑΦΟΝΤΑΣ ΙΣΤΟΡΙΑ

Αναντίλεκτα, ο λόγος, είτε στη γραπτή του μορφή είτε στην προφορική, έχει την ιδιότητα να ενεργοποιεί εικόνες. Από τα πρώτα χρόνια της ζωής μας, οι άνθρωποι αναπτύσσουμε τη δεξιότητα να αφομοιώνουμε χιλιάδες λέξεις τις οποίες χρησιμοποιούμε για την επικοινωνία μας, τη μόρφωσή μας, ακόμα και για την αλληλεπίδρασή μας. Ελάχιστοι όμως μπορούμε να δομήσουμε τις λέξεις αυτές προκειμένου να διαμορφώσουμε ένα πνευματικό έργο το οποίο ενεργοποιεί συναισθήματα. Ακόμα και στον προφορικό λόγο, η ευφράδεια και η σωστή επιλογή λέξεων, παράγει επιχειρήματα τα οποία αλλάζουν πεποιθήσεις και απόψεις. Μπορεί άραγε η μηχανή να παράγει πρωτότυπο κείμενο; Κι αν ναι, πόσο καλά μπορεί να το κάνει;

Επόμενος σταθμός, οι εφαρμογές DeepStory, SassBook AI Writer και TalkToTransformer. Οι εφαρμογές αυτές υποστηρίζονται από αλγορίθμους τεχνητής νοημοσύνης και είναι σε θέση να παράγουν πρωτότυπο και ρεαλιστικό κείμενο σε πραγματικό χρόνο. Αυτό που χρειάζεται, είναι να τις τροφοδοτήσουμε με ένα μικρό κείμενο, το οποίο περιγράφει το αντικείμενο για το οποίο επιθυμούμε αποτέλεσμα. Σε πολλές περιπτώσεις μια απλή πρόταση αρκεί. Το κείμενο που ακολουθεί έχει παραχθεί από την εφαρμογή TalkToTransformer. Ως είσοδο, τροφοδοτήσαμε τη φράση «Ήταν βράδυ. Περπατούσα στο δρόμο όταν ένιωσα ότι κάποιος με ακολουθούσε»

«Ήταν βράδυ. Περπατούσα στο δρόμο όταν ένιωσα ότι κάποιος με ακολουθούσε. Φοβήθηκα, γι’ αυτό άρχισα να τρέχω και κοίταξα πίσω από τον ώμο μου. Άρχισε να φωνάζει και να απειλεί ότι θα σκοτώσει την οικογένειά μου και εμένα. Γύρισα και έτρεξα στο διαμέρισμά μου. Με κυνήγησε και χτύπησε την πόρτα και εγώ ούρλιαξα. Είδε σε τι κατάσταση ήμουν και έφυγε. Δεν κοιμήθηκα για μέρες. Το ίδιο συνέβη και στη συγκάτοικό μου

Παρατηρώντας το κείμενο χωρίς προκαταλήψεις, εύκολα μπορεί κανείς να αντιληφθεί ότι η μηχανή αναγνώρισε τη θεματική που έκρυβε η πρόταση η οποία δόθηκε ως «είσοδος», και επέστρεψε ένα αποτέλεσμα το οποίο δύσκολα μπορεί κάποιος να αναγνωρίσει ως αποτέλεσμα αλγορίθμου και όχι ανθρώπου. Ο τρόπος με τον οποίο η τεχνητή νοημοσύνη χειρίζεται το λόγο είναι απόλυτα συμβατός με την ανθρώπινη αντίληψη, ενώ σημασιολογικά, ό,τι αναφέρεται στο κείμενο έχει νόημα. Να σημειωθεί ότι η εφαρμογή έχει τη δυνατότητα για συνεχή επέκταση του κειμένου, λαμβάνοντας κάθε φορά ως «είσοδο» το κείμενο που έχει παραχθεί. Σε κάθε περίπτωση, και στην παραγωγή κειμένου, ο υπολογιστής παρουσιάζει την «ικανότητα» και τη «φαντασία» για να παράγει «νέο» περιεχόμενο. Άρα, εύλογα μπορούμε να θεωρήσουμε ότι είναι σε θέση να παρουσιάσει καλλιτεχνικό έργο.

ΣΥΝΘΕΤΟΝΤΑΣ ΜΟΥΣΙΚΗ

Τους τελευταίους δύο αιώνες, συνθέτες, ακαδημαϊκοί και φίλοι της κλασικής μουσικής αναρωτιούνται γιατί ο Σούμπερτ εγκατέλειψε την «Όγδοη Συμφωνία» το 1822, έξι ολόκληρα χρόνια πριν από το θάνατό του. Και αν την είχε ολοκληρωθεί, πώς θα ακούγονταν; Η μουσική ως τέχνη παρουσιάζει πολλαπλές ιδιαιτερότητες. Η δημιουργία μουσικών κομματιών είναι ένα δύσκολο πρόβλημα, καθώς η μουσική περιέχει δομή σε πολλαπλές χρονικές κλίμακες, από χιλιοστά του δευτερολέπτου μέχρι μοτίβα, φράσεις και επαναλήψεις ολόκληρων τμημάτων. Μπορεί άραγε η τεχνητή νοημοσύνη να συνθέσει μουσική η οποία να είναι αρεστή στον άνθρωπο;

Πρώτη στάση η εφαρμογή Magenta από την Google. Η εν λόγω εφαρμογή έχει την ιδιότητα, αφού μελετήσει έναν καλλιτέχνη, να παραγάγει μικρά τμήματα μουσικής (συμπεριλαμβανομένων και των στίχων) τα οποία θα μπορούσε να είχαν παραχθεί από το συγκεκριμένο τραγουδιστή ή συγκρότημα. Ο αλγόριθμος εντοπίζει την τεχνοτροπία και το ύφος του καλλιτέχνη και είναι σε θέση να δώσει μουσικά μοτίβα τα οποία, με την κατάλληλη σύνθεση, να διαμορφώσουν τραγούδια. Χαρακτηριστικό παράδειγμα το έργο «The Lost Tapes of the 27 Club», το οποίο με τη συγκεκριμένη τεχνική μάς παρουσιάζει νέα τραγούδια από τους Nirvana, Jimi Hendrix και Amy Winehouse, οι οποίοι έχασαν τη ζωή τους στα 27 του χρόνια. Αναζητήστε στο YouTube το κομμάτι «Drowned in The Sun» και απολαύστε το πώς η τεχνητή νοημοσύνη εκτιμά ότι θα ακουγόταν το νέο κομμάτι των Nirvana, αν ο Kurt Cobain ήταν ακόμα ζωντανός. Το αποτέλεσμα, απλά εντυπωσιακό, και στα αυτιά ενός λάτρη των Nirvana, απόλυτα συμβατό με τα όσα το συγκρότημα μας είχε συνηθίσει.

Επόμενος σταθμός το OpenAI Jukebox του Elon Musk, του οποίου το αποτέλεσμα είναι ακόμα πιο εντυπωσιακό. Η συγκεκριμένη εφαρμογή έχει την ικανότητα, μελετώντας ένα μουσικό κομμάτι, να το επεκτείνει. Αναλύοντας τους «δρόμους» του κομματιού, το ύφος και τους στίχους, η εφαρμογή παράγει απόλυτα συμβατά μουσικά τμήματα τα οποία δένουν σε τέτοιο βαθμό με τα υπάρχοντα, όπου πολλές φορές δυσκολευόμαστε να αναγνωρίσουμε ποιο κομμάτι προέρχεται από τον καλλιτέχνη και ποιο από τη μηχανή. Επιτέλους μπορούμε να ακούσουμε ολοκληρωμένη την Όγδοη Συμφωνία αλλά και να μάθουμε αν τελικά, εκείνη τη «βραδιά στο Λούκι», έγινε η γνωριμία του Χάρη με την άγνωστη κοπέλα που… «δεν του έδινε καμία, μα καμία σημασία».

Και σε αυτήν την περίπτωση η μηχανή έχει την «ικανότητα» παραγωγής «νέου» καλλιτεχνικού έργου, με τη «φαντασία» του να προκύπτει από την έμπνευση των ίδιων των καλλιτεχνών. Άρα μπορεί η μηχανή να θεωρηθεί καλλιτέχνης;

ΣΧΕΔΙΑΖΟΝΤΑΣ ΤΟ ΠΕΡΙΕΧΟΜΕΝΟ ΤΗΣ ΦΑΝΤΑΣΙΑΣ ΜΑΣ

Η τέχνη της ζωγραφικής και η φαντασία είναι αλληλένδετα συστατικά της κοινωνικής και ανθρώπινης φύσης. Η μέχρι πρότινος πηγές εμπλουτισμού της φαντασίας και της δημιουργίας διάφορων τεχνουργημάτων ήταν οι εμπειρίες μας, τα βιβλία, οι ταινίες, η μουσική και άλλα αναλογικά μέσα. Μια σκέψη και ένας διάλογος που δειλά δειλά εμφανίζεται, σχετίζεται με το κατά πόσο μπορεί η πηγή φαντασίας του ανθρώπου να εμπλουτιστεί διαμέσου νέων εργαλείων όπως ένα μοντέλο τεχνητής νοημοσύνης; Η φαντασία μας εσωκλείει την ικανότητά μας ως λογικά όντα να συλλαμβάνουμε εικόνες και ιδέες πέραν από την εμπειρική πραγματικότητα. Ακόμα, αποτελεί ένα από τα ουσιαστικότερα συστατικά της τεχνολογικής προόδου. Μπορεί η τεχνητή νοημοσύνη να διεγείρει και να ωθήσει τη φαντασία του ανθρώπου δημιουργώντας και παράγοντας πίνακες ζωγραφικής; Μπορούμε να σχεδιάσουμε με εργαλεία της τεχνητής νοημοσύνης το περιεχόμενο της φαντασίας μας;

Σήμερα υπάρχουν διαθέσιμα αρκετά εργαλεία και μοντέλα παραγωγής οπτικών μέσων τέχνης. Μερικά από αυτά είναι το Midjourney, το Deep Dream Generator της Google, το NightCafe και άλλα μοντέλα ανοικτού κώδικα όπως το DALLE-2 και DALLE-2 mini. Με αυτά τα εργαλεία στη διάθεσή μας έχουμε την ικανότητα να παράγουμε τέχνη και ρεαλιστικές εικόνες μέσω μιας περιγραφής που δίδεται σε κειμενική μορφή. Στα παραδείγματα που παρατίθενται, ζητήθηκε από την εφαρμογή Midjourney να μας παρουσιάζει πώς οι Salvador Dalí και Leonardo da Vinci φαντάζονται την Αθήνα. Η τεχνητή νοημοσύνη αναγνώρισε αφενός σημασιολογικά την ερώτηση, αφετέρου αντιλήφθηκε ότι η ερώτησή μας απαιτούσε την υιοθέτηση της τεχνοτροπίας που ο κάθε ζωγράφος ακολουθούσε. Οι εικόνες που έχουν παραχθεί αποδεικνύουν ότι ο υπολογιστής έχει και την «ικανότητα» αλλά και τη «φαντασία» να παράγει «νέο» υλικό, το οποίο ανταποκρίνεται στο ερώτημά μας. Το σύστημα θεώρησε από μόνο του ότι ο Παρθενώνας είναι το σημείο αναφοράς της Αθήνας, ενώ η αισθητική των δύο εικόνων, παρόλο που απεικονίζουν το ίδιο περιεχόμενο, είναι εντελώς διαφορετική, ανταποκρινόμενη στην αισθητική του κάθε καλλιτέχνη.

 

 

Οι εικόνες που παρουσιάζονται έχουν παραχθεί από το σύστημα Midjourney ως απάντηση στο ερώτημα πώς φαντάζονται οι Salvador Dalí και Leonardo da Vinci την Αθήνα

ΕΙΝΑΙ ΟΙ ΤΕΧΝΕΣ ΤΟ ΤΕΛΕΥΤΑΙΟ ΠΡΟΠΥΡΓΙΟ ΤΗΣ ΑΝΘΡΩΠΟΤΗΤΑΣ;

Έχοντας στη διάθεσή μας εργαλεία που δημιουργούν διάφορα τεχνουργήματα όπως μουσική, εικόνες αλλά και κείμενο μπορούμε να ενδυναμώσουμε αλλά και να ενισχύσουμε τη φαντασία μας, να την καλλιεργήσουμε αλλά και να αποτυπώσουμε σκέψεις του ανθρώπινου εγκεφάλου με ένα διαφορετικό τρόπο. Με τα διάφορα εργαλεία που έχουμε σήμερα στη φαρέτρα μας, μπορούμε εύκολα να σκεφτούμε τη δύναμη τεχνητής νοημοσύνης ως εργαλείο το οποίο διεγείρει τη φαντασία μας, η οποία με τη σειρά της αποτελεί κινητήριο δύναμη για τεχνολογική πρόοδο, αλλά και οικονομική ανάπτυξη. Το φανταστικό της τεχνητής νοημοσύνης είναι ότι ενώ στο μυαλό μας διάφορες εικόνες, λέξεις, φράσεις μπορεί να τις έχουμε αποτυπωμένες με συγκεκριμένο τρόπο, να τις δούμε από διαφορετικές οπτικές που δεν είχαμε σκεφτεί.

Ένα χαρακτηριστικό παράδειγμα είναι η πιο κάτω εικόνα η οποία έχει δημιουργηθεί με το εργαλείο Midjourney με τη φράση «O κόσμος στο μέλλον». H εικόνα αυτή αποτυπώνει τη δύναμη της τεχνητής νοημοσύνης στην αποτύπωση και την ικανότητα να δούμε αλλά και να αναδείξουμε διαφορετικές πτυχές της φαντασίας μας. Το χαρακτηριστικό στην εικόνα είναι το ιπτάμενο μέσο το οποίο μπορεί κανείς να φανταστεί είτε ως ιπτάμενο μέσο μαζικής μεταφοράς, το μελλοντικό αεροπλάνο, το μελλοντικό σπίτι το οποίο αιωρείται στον αέρα, ή οπωσδήποτε θέλει ο κάθε ένας από εμάς. Προφανώς, ο καθένας από εμάς μπορεί να ερμηνεύσει και να φανταστεί το κείμενο «ο κόσμος στο μέλλον» διαφορετικά, ωστόσο, ένα εργαλείο τεχνητής νοημοσύνης μπορεί να αποτυπώσει εικονικά μια φράση ή σκέψη δίδοντάς της σάρκα και οστά. Επομένως, μπορούμε τελικά να σχεδιάσουμε το περιεχόμενο της φαντασίας μας; Φυσικά και μπορούμε.

Η εικόνα έχει παραχθεί από την εφαρμογή Midjourney ως απάντηση στο ερώτημα «O κόσμος στο μέλλον»

Όπως όλα τα παραδείγματα προδίδουν, οι υπολογιστές και η τεχνητή νοημοσύνη είναι σε θέση σήμερα να παράγουν υλικό με καλλιτεχνικές προεκτάσεις. Είναι όμως αυτό αρκετό για να θεωρήσουμε ότι οι υπολογιστές έχουν καλλιτεχνικές ανησυχίες; Η απάντηση προφανώς είναι όχι. Οι υπολογιστές παράγουν τέχνη διεκπεραιωτικά. Μπορεί τα αποτελέσματά τους να είναι εντυπωσιακά, στερούνται όμως του κινήτρου. Οι άνθρωποι παράγουν τέχνη για να επικοινωνήσουν με τον κόσμο, για να ενεργοποιήσουν συναισθήματα και να μιλήσουν στις ψυχές τους. Ακόμα και όταν εκτελούν τέχνη κατά παραγγελία, ενσωματώνουν παραμέτρους του ίδιου του εαυτού τους. Οι μηχανές παράγουν τέχνη γιατί απλά κάποιος τους ζήτησε να το κάνουν. Η μελέτη των καλλιτεχνικών τους πονημάτων δεν αποκαλύπτει μηνύματα και προσωπικά βιώματα. Η ανθρωπότητα έχει το δικαίωμα να παραμένει περήφανη για τις καλλιτεχνικές της ιδιότητες και τη δημιουργική ικανότητά της, και δεν υπάρχει λόγος να νιώθει απειλή. Κάθε φορά που μας εντυπωσιάζει το έργο που ένας υπολογιστής παράγει, ας θυμόμαστε ότι αυτό είναι αποτέλεσμα της δικής μας φαντασίας και ευφυΐας.