Dragon Dictation & Dragon Search: Εφαρμογές αναγνώρισης ομιλίας που υποστηρίζουν την ελληνική

Από την προηγούμενη Τετάρτη, όσοι έχουν iPhone, iPad ή iPod Touch μπορούν πλέον να χρησιμοποιούν πολύ λιγότερο το εικονικό πληκτρολόγιο της συσκευής τους για να γράφουν μηνύματα ή για τις ιντερνετικές τους αναζητήσεις. Και αυτό γιατί η αμερικανική εταιρεία Nuance Communications κυκλοφόρησε στη χώρα μας τις Dragon Dictation και Dragon Search, δύο εφαρμογές αναγνώρισης ομιλίας που υποστηρίζουν και την ελληνική γλώσσα, ενώ διατίθενται δωρεάν για τις «έξυπνες» συσκευές της Apple.

Ετσι, όποιος «κατεβάσει» το Dragon Search στο iPhone του, αρκεί να πει τη φράση αναζήτησης (π.χ. «ελληνικές εκλογές») και η εφαρμογή θα την πληκτρολογήσει αυτόματα στο «ψαχτήρι» ή στην άλλη πηγή που έχει αυτός επιλέξει (Google, Bing, Wikipedia, YouTube), εμφανίζοντας τα σχετικά αποτελέσματα. Tο Dragon Dictation, πάλι, μετατρέπει σε γραπτό κείμενο τις προτάσεις που υπαγορεύει ο χρήστης, κείμενο που στη συνέχεια μπορεί αυτός να στείλει μέσω e-mail και sms ή να αναρτήσει στο Facebook και το Twitter.

Η μόνη προϋπόθεση είναι η συσκευή να συνδέεται στο Ιντερνετ, αφού οι εφαρμογές διαβιβάζουν τα φωνητικά δεδομένα στους server της εταιρείας, όπου ειδικοί αλγόριθμοι αναλαμβάνουν να τα «μεταφράσουν» σε λέξεις. Στην επίσημη παρουσίαση που έκανε η Nuance στην Αθήνα, πριν από 15 ημέρες, ο Reimund Schmald, διευθυντής μάρκετινγκ της Nuance στην Ευρώπη, υποστήριξε πως όλη η διαδικασία γίνεται εξαιρετικά γρήγορα. Και στο δεκαήμερο που είχαμε τη δυνατότητα να δοκιμάσουμε τις Dragon Dictation και Dragon Search (αφού η Nuance διέθεσε πιλοτικές εκδόσεις σε εκπροσώπους του Τύπου), διαπιστώσαμε από πρώτο χέρι ότι είχε απόλυτο δίκιο.

Διαπιστώσαμε, επιπλέον, ότι οι δύο εφαρμογές είναι εντυπωσιακά αξιόπιστες, καθώς τις περισσότερες φορές «καταλαβαίνουν» τις σωστές λέξεις – π.χ. από τα συμφραζόμενα, ξεχωρίζουν ακόμη και πότε, λέγοντας «κόμμα», εννοεί κανείς το σημείο στίξης, κάποιο πολιτικό κόμμα («το κόμμα της Αριστεράς») ή την κωματώδη κατάσταση («ο άρρωστος έπεσε σε κώμα»). Οπως είναι όμως φυσικό, δεν λείπουν τα λάθη, τα οποία μάλιστα αυξάνονται όσο μεγαλύτερος είναι ο εξωτερικός θόρυβος.

Αστοχίες που με την πάροδο του χρόνου θα περιοριστούν: «Οσο περισσότεροι χρήστες επιλέγουν να κάνουν διορθώσεις εκφωνώντας πάλι τις λανθασμένες λέξεις, τόσο περισσότερο οι εφαρμογές θα “εκπαιδεύονται ”, ώστε να γίνονται καλύτερες», μας είχε πει ο κ. Schmald, στη συνέντευξη που παραχώρησε στην «Κ» στο περιθώριο της παρουσίασης. Ο κ. Schmald δήλωσε επίσης πως η Nuance διαθέτει επ’ αμοιβή την τεχνολογία αναγνώρισης ομιλίας σε οποιονδήποτε προγραμματιστή θα ήθελε να την ενσωματώσει στις εφαρμογές του.

«Για παράδειγμα, θα μπορούσε κάλλιστα μία εταιρεία πληροφορικής στη χώρα σας να αναπτύξει ένα πρόγραμμα επεξεργασίας κειμένου για iPhone και iPad, που θα επιτρέπει την υπαγόρευση στα ελληνικά», σημείωσε χαρακτηριστικά. Μάλιστα, αποκάλυψε πως σε 2–3 μήνες η τεχνολογία θα είναι συμβατή και με τα τηλέφωνα Windows Phone 7, αλλά και με τα smartphones και tablets PC με λειτουργικό Android, ώστε προγραμματιστές να μπορούν να δημιουργήσουν και γι’ αυτές τις συσκευές παραλλαγές των Dragon Dictation και Dragon Search, που να υποστηρίζουν την ελληνική γλώσσα. Οσον αφορά τις συσκευές της Apple, τα ελληνικά είναι η πιο πρόσφατη προσθήκη στις 30 και πλέον γλώσσες που υποστήριζαν ήδη οι Dragon Dictation και Dragon Search, με τον αριθμό αυτό να αυξάνεται σύντομα ακόμη περισσότερο.

Σύμφωνα με τον εκπρόσωπο της Nuance, αυτό οφείλεται στο ότι η… γλωσσομάθεια των αλγορίθμων που «τρέχουν» στους σέρβερ της Nuance έχει βελτιωθεί δραστικά τα τελευταία χρόνια. «Αν, λ.χ., πριν από μια πενταετία θα χρειάζονταν 8 μήνες και 100 άνθρωποι που μιλούν ελληνικά για να “μάθουν” στο λογισμικό τη γλώσσα σας, τώρα για την ίδια δουλειά χρειάστηκαν μόλις 4 άνθρωποι και 4 μήνες». Από την άλλη μεριά, η εταιρεία διαβεβαιώνει ότι τα δεδομένα που διαβιβάζονται στους σέρβερ της αποθηκεύονται ανώνυμα, για να διασφαλίζεται το ιδιωτικό απόρρητο των χρηστών – ακόμη και αν κάποιος συναινέσει στο να «ανέβουν» στους σέρβερ οι επαφές του, ώστε οι Dragon Dictation και Dragon Search να αναγνωρίζουν και κύρια ονόματα, οι εφαρμογές θα στείλουν μόνο τα ονοματεπώνυμα από τον τηλεφωνικό κατάλογο, χωρίς τους αριθμούς. «Αλλωστε, σε 12 μήνες, οι “έξυπνες” συσκευές θα έχουν εξελιχθεί τόσο πολύ που το λογισμικό θα μπορούσε να εγκατασταθεί σε αυτές και να λειτουργήσει χωρίς καν σύνδεση στο Ιντερνετ», συμπλήρωσε.

Δωρεάν εγκατάσταση


Η Nuance Communications διαθέτει τις εφαρμογές για τα smartphones και τα tablets PC δωρεάν, επειδή θεωρεί ότι αποτελούν έναν απτό τρόπο για να επιδείξει την τεχνολογία της στους χρήστες.

«Πείθοντας τους καταναλωτές ότι η τεχνολογία λειτουργεί με ακρίβεια, ουσιαστικά πείθουμε τους κατασκευαστές να ενσωματώσουν την αναγνώριση φωνής σε νέες συσκευές», ανέφερε στην «Κ» ο διευθυντής της μάρκετινγκ κ. Schmald, «και από αυτές τις συνεργασίες προέρχονται τα έσοδά μας».

Οσον αφορά την ελληνική γλώσσα, τέτοια παραδείγματα είναι ακόμη σχετικώς περιορισμένα: βάσει της τεχνολογίας της Nuance, «καταλαβαίνουν» ελληνικά τα τηλεφωνικά κέντρα ορισμένων επιχειρήσεων, οι τελευταίες «έξυπνες» τηλεοράσεις της Samsung και οι συσκευές πλοήγησης της MLS.

Με βάση όμως το σύνολο των γλωσσών που υποστηρίζει η πλατφόρμα της Nuance, αυτή χρησιμοποιείται επίσης σε τηλεοράσεις της LG και της Panasonic, όπως και από αρκετές αυτοκινητοβιομηχανίες – έτσι, σε 70 εκατομμύρια αυτοκίνητα, ο οδηγός ενεργοποιεί το GPS και ρυθμίζει το σύστημα ψυχαγωγίας μέσω φωνητικών εντολών.

Για όσους πάντως διαθέτουν Windows PC και θέλουν να απαλλαγούν από την πληκτρολόγηση, υπάρχει ο Ηλεκτρονικός Λογογράφος 4.0 της Voice–In, εταιρείας–τεχνοβλαστού του Ινστιτούτου Επεξεργασίας του Λόγου. Το πρόγραμμα κοστίζει 90 ευρώ, είναι συμβατό με το Word της Microsoft και υπόσχεται ακρίβεια 98% στη μετατροπή της ομιλίας σε κείμενο. Η Voice–In κυκλοφορεί επίσης εκδόσεις του Λογογράφου ειδικά για νομικούς και γιατρούς, όπως επίσης και μία έκδοση που υποστηρίζει και αγγλικά, εκτός από ελληνικά.

Η ΚΑΘΗΜΕΡΙΝΗ
Πηγή: skai.gr