Μερικές ημέρες πριν, στις 11 Νοεμβρίου 2025 συγκεκριμένα, η ElevenLabs ανακοίνωσε ότι ο Μάθιου ΜακΚόναχι —ένας από τους πιο γνωστούς Αμερικανούς ηθοποιούς— είναι εδώ και καιρό επενδυτής της και πλέον γίνεται και πελάτης της. Τα παραπάνω δεν αποτελούν απλώς μια ακόμη είδηση από τον χώρο των διασημοτήτων ή των επενδύσεων. Είναι μια απτή ένδειξη ότι περνάμε σε μια νέα εποχή, όπου η ανθρώπινη φωνή —ένα από τα πιο προσωπικά αποτυπώματα της ταυτότητάς μας— μετατρέπεται σε ψηφιακό περιουσιακό στοιχείο με διάρκεια ζωής που θα υπερβαίνει εκείνη του φυσικού προσώπου. Και το ακόμη πιο εντυπωσιακό: κάποιοι δημιουργοί όχι μόνο δεν ανησυχούν, αλλά αγκαλιάζουν αυτή την εξέλιξη.
Ποια είναι η ElevenLabs;
Η ElevenLabs, αμερικανική εταιρεία που ιδρύθηκε το 2022, έχει εξελιχθεί σε έναν από τους κορυφαίους παρόχους συνθετικής ομιλίας. Αναπτύσσει εργαλεία που παράγουν φυσικές, εκφραστικές και ρεαλιστικές φωνές, επιτρέποντας τόσο τη δημιουργία νέων όσο και την κλωνοποίηση ήδη υπαρχουσών.
Χρησιμοποιώντας την τεχνολογία της εταιρείας, ο ΜακΚόναχι θα προσφέρει στους ακολούθους του το newsletter Lyrics of Livin’ όχι μόνο στα αγγλικά —όπου το αφηγείται ο ίδιος— αλλά και στα ισπανικά, μέσω μιας συνθετικά δημιουργημένης φωνής που μιμείται απόλυτα τη δική του, διατηρώντας τον ιδιαίτερα χαρακτηριστικό τόνο και ρυθμό της. Σαν έναν ισπανόφωνο «κλώνο» της, δηλαδή.
Σε ανακοίνωσή του, ο ΜακΚόναχι ξεκαθάρισε ότι η χρήση της φωνής του γίνεται αποκλειστικά με τη δική του άδεια και δεν παραχωρείται σε τρίτους. Στόχος του, όπως τόνισε, είναι να μοιραστεί τις σκέψεις, τις συμβουλές και τις εμπνεύσεις του με ακόμη περισσότερους ανθρώπους.
Παράλληλα, η ElevenLabs ανακοίνωσε συνεργασία με τον Sir Michael Caine, ο οποίος διαθέτει την επίσης διάσημη φωνή του —και την ίσως ακόμη πιο διάσημη cockney προφορά του— μέσω του νέου «Iconic Voice Marketplace» για χρήση από άλλους δημιουργούς.
Στο βίντεο που ανακοινώνει τη συνεργασία, ο Caine θέτει ένα θεμελιώδες ερώτημα:
«Τι κάνει μια φωνή εμβληματική; Είναι ο τόνος, η προφορά, η ισορροπία;» και απαντά:
«Η απάντηση είναι, πολύ απλά, το μήνυμα» προσθέτοντας ότι:
«Τώρα, μέσα από την τεχνητή νοημοσύνη, έχουμε μετατρέψει τον ήχο σε κάτι περισσότερο — μια σύνδεση χωρίς περιορισμούς.»
Η φωνή, όπως υποστηρίζει, υπερβαίνει τον ήχο· είναι φορέας δύναμης, διαμαρτυρίας, προσευχής και χαράς. Αναγνωρίζει ότι κάθε νέα τεχνολογική πρόοδος συνοδεύεται από επιφυλάξεις «και δικαίως», αλλά υπενθυμίζει πως διαχρονικά «το πάθος, η τέχνη και η ανθρώπινη δημιουργικότητα» είναι εκείνα που υπερισχύουν.
Η καταληκτική του φράση, «Είμαι ενθουσιασμένος που η φωνή μου εντάσσεται στην ElevenLabs», συνοψίζει μια αισιόδοξη τοποθέτηση - η τεχνολογία είναι απλώς το μέσο μια της ενησχημενης ανθρωπινης έκφρασης.
Με τη φράση «Είμαι ενθουσιασμένος που η φωνή μου εντάσσεται στην ElevenLabs», εκφράζει μια ξεκάθαρα θετική στάση, υποστηρίζοντας ότι η τεχνολογία λειτουργεί ως εργαλείο ενίσχυσης — και όχι αντικατάστασης — της ανθρώπινης έκφρασης.
Ένα όφελος αυτής της δραματικής εξέλιξης στη συνθετική φωνή —είτε πρωτότυπης είτε κλωνοποιημένης— είναι η δημιουργία ενός νέου δημιουργικού και καλλιτεχνικού μέσου. Ένας καλλιτέχνης, συγγραφέας ή δημοσιογράφος μπορεί πλέον να αξιοποιήσει διάσημες ή ιστορικές φωνές ως μέρος της δημιουργικής του διαδικασίας. Ένας εκπαιδευτικός μπορεί να παράγει πολύγλωσσο υλικό με φυσικό και οικείο ύφος. Η παγκοσμιοποίηση του περιεχομένου γίνεται υπόθεση λεπτών, ενώ η δυνατότητα διατήρησης φωνών ακόμη και μετά θάνατον ανοίγει νέους δρόμους για την πολιτισμική μνήμη.
Όμως δεν είναι όλοι ενθουσιασμένοι. Δημιουργοί στο Χόλιγουντ αντιδρούν έντονα στη χρήση της τεχνητής νοημοσύνης, με προσωπικότητες όπως ο Γκιγέρμο ντελ Τόρο, η Έμα Τόμσον και ο Νίκολας Κέιτζ να καταδικάζουν την τεχνολογία ως απειλή για την καλλιτεχνική ακεραιότητα και την ανθρώπινη δημιουργία.
Γιατί πράγματι, η νέα αυτή πραγματικότητα δεν στερείται κινδύνων. Η φωνή παραμένει βαθιά προσωπικό στοιχείο: μεταφέρει συναίσθημα, χαρακτήρα, προσωπικότητα. Η ανεξέλεγκτη χρήση της εγείρει ζητήματα δεοντολογίας, ιδιωτικότητας και αξιοπιστίας. Η πολιτική παραπληροφόρηση μέσω συνθετικών φωνών θεωρείται πλέον μια πραγματική απειλή. Παράλληλα, για τους επαγγελματίες του χώρου, η τεχνολογία αυτή απειλεί να υπονομεύσει τη μοναδικότητα της ανθρώπινης ερμηνείας, δημιουργώντας ανάγκη για νέα συμβόλαια, κανόνες και προστασία.
Τα νομοθετικά πλαίσια διεθνώς κινούνται με αργούς ρυθμούς. Ζητήματα συναίνεσης, πνευματικών δικαιωμάτων, εμπορικής χρήσης, μεταθανάτιας αξιοποίησης και υποχρέωσης διαφάνειας αναμένεται να μας απασχολήσουν έντονα τα επόμενα χρόνια. Το πιθανότερο είναι ότι θα απαιτηθούν νέοι κανόνες, αντίστοιχοι με εκείνους που διαμόρφωσαν την ψηφιακή εποχή του κινηματογράφου και της μουσικής.
Η συζήτηση δεν αφορά μόνο διάσημους ηθοποιούς. Αφορά κάθε πολίτη. Η φωνητική κλωνοποίηση μπορεί να γίνει εργαλείο δημιουργίας, αλλά και εργαλείο εξαπάτησης. Η κοινωνία καλείται να διαμορφώσει ένα νέο «κοινωνικό συμβόλαιο» γύρω από την ανθρώπινη φωνή.
Μέσα σε αυτή τη νέα πραγματικότητα, μία φράση φαίνεται να συνοψίζει την εμπειρία της συνθετικής ομιλίας καλύτερα από κάθε ανάλυση:
“Listening is believing — or not?”
Για όποιον θέλει να διαπιστώσει πόσο κοντά έχει φτάσει η τεχνολογία στην αληθινή ανθρώπινη φωνή, αρκεί να δει και να ακούσει το βίντεο της ανακοίνωσης της συνεργασίας του Michael Caine.
Και αν, ακούγοντάς το, βρεθείτε να αναρωτιέστε «είναι ο Michael Caine ή το ψηφιακό του αντίγραφο;», τότε αυτή ακριβώς η αμφιβολία θα αποτελέσει την πιο αδιάψευστη απόδειξη της επανάστασης που βιώνουμε.
ΥΓ: Η μουσική δεν μένει πίσω
Καθώς γράφονταν αυτές οι γραμμές, το Walk My Walk, ένα country τραγούδι δημιουργημένο με τη βοήθεια τεχνητής νοημοσύνης, από το μυστηριώδες συγκρότημα Breaking Rust, ανέβηκε στην κορυφή του ψηφιακού chart της Billboard.
Ένα ακόμη σημάδι ότι η τεχνητή νοημοσύνη δεν μετασχηματίζει μόνο τον τρόπο που μιλάμε — αλλά μάλλον και τον τρόπο που ακούμε.
* Ο Θάνος Παπαδημητρίου διδάσκει επιχειρηματικότητα στο NYU Stern της Νέας Υόρκης και εφοδιαστική αλυσίδα στο SDA Bocconi της Μουμπάι. Είναι συνιδρυτής της τεχνολογικής startup, Moveo AI.