Το μοντέλο AI μπορεί να μαντέψει τα συναισθήματα αναλύοντας τον τόνο της φωνής μας
Πιστώσεις εικόνας: Curto Ειδήσεις/Bing AI

Το μοντέλο AI μπορεί να μαντέψει τα συναισθήματα αναλύοντας τον τόνο της φωνής μας

Η φωνή είναι κάτι περισσότερο από ένα απλό μέσο επικοινωνίας. Είναι ένα αποκαλυπτικό κανάλι για τα πιο οικεία μας συναισθήματα. Εάν η αποκρυπτογράφηση των φωνητικών τόνων είναι φυσική για εμάς τους ανθρώπους, μπορεί επίσης η τεχνητή νοημοσύνη (AI) να κάνει το ίδιο;

Μια πρωτοποριακή μελέτη από Γερμανούς ερευνητές απαντά σε αυτό το ερώτημα με ένα ηχηρό «ναι». Χρησιμοποιώντας τρία μοντέλα μάθηση μηχανής, οι επιστήμονες μπόρεσαν να αναγνωρίσουν με ακρίβεια διάφορα συναισθήματα σε δείγματα ήχου μόλις 1,5 δευτερολέπτου.

ΔΙΑΦΗΜΙΣΗ

The Journey to Uncover the Secrets of the Voice

Δημοσιεύτηκε στο περιοδικό Frontiers in Psychology, η μελέτη ανέλυσε ανόητες προτάσεις που εξήχθησαν από δύο σύνολα δεδομένων: ένα καναδικό και ένα γερμανικό. Αυτή η στρατηγική επιλογή εξάλειψε την επιρροή της γλώσσας και των πολιτισμικών αποχρώσεων, εστιάζοντας αποκλειστικά στον τόνο της φωνής.

Κάθε ηχητικό απόσπασμα περικόπηκε προσεκτικά σε 1,5 δευτερόλεπτο, την ελάχιστη διάρκεια που απαιτείται για να αναγνωρίσουν οι άνθρωποι τα συναισθήματα στην ομιλία. Αυτή η χρονική ακρίβεια διασφαλίζει ότι κάθε κομμάτι αντιπροσωπεύει ένα μόνο συναίσθημα, αποφεύγοντας τις επικαλύψεις και τις ασάφειες.

Συναισθήματα στο επίκεντρο

Η μελέτη επικεντρώθηκε σε έξι βασικά συναισθήματα: χαρά, raiva, θλίψη, φόβος, αηδία και ουδετερότητα. Μέσα από τεχνικές του μάθηση μηχανής, τα μοντέλα εκπαιδεύτηκαν να αναγνωρίζουν τα συγκεκριμένα ηχητικά μοτίβα που σχετίζονται με κάθε συναισθηματική κατάσταση.

ΔΙΑΦΗΜΙΣΗ

Τρία μοντέλα, τρεις προσεγγίσεις

Για να αποκαλύψουν τα μυστικά της φωνής, οι ερευνητές χρησιμοποίησαν τρία διαφορετικά μοντέλα φωνής. μάθηση μηχανής:

  • Βαθιά νευρωνικά δίκτυα (DNN): Λειτουργούν σαν πολύπλοκα φίλτρα, αναλύοντας στοιχεία ήχου όπως η συχνότητα και ο τόνος. Για παράδειγμα, ένας αυξημένος τόνος φωνής μπορεί να υποδεικνύει raiva ή απογοήτευση.
  • Συνελικτικά νευρωνικά δίκτυα (CNN): Αναζητούν οπτικά μοτίβα στις γραφικές αναπαραστάσεις των ηχητικών κυμάτων, παρόμοια με τον τρόπο που αναγνωρίζουμε τα συναισθήματα στο ρυθμό και την υφή της φωνής.
  • Υβριδικό μοντέλο (C-DNN): Συνδυάζει τις δύο προηγούμενες τεχνικές, χρησιμοποιώντας τόσο την ακουστική όσο και την οπτική αναπαράστασή του για να αποκτήσει μια πιο ακριβή πρόβλεψη των συναισθημάτων.

Ελπιδοφόρα αποτελέσματα και προκλήσεις που πρέπει να ξεπεραστούν

Τα αποτελέσματα της μελέτης ήταν ενθαρρυντικά. Τα μοντέλα του μάθηση μηχανής Κατάφεραν να προσδιορίσουν τα συναισθήματα με ακρίβεια παρόμοια με αυτή των ανθρώπων, ακόμη και σε προτάσεις χωρίς νόημα χωρίς πλαίσιο.

Ωστόσο, οι συγγραφείς αναγνωρίζουν ορισμένους περιορισμούς. Οι σύντομες προτάσεις που χρησιμοποιούνται ενδέχεται να μην καταγράφουν όλο το φάσμα των αποχρώσεων και των αμφισημιών που υπάρχουν στα πραγματικά συναισθήματα. Επιπλέον, απαιτείται μελλοντική έρευνα για τον προσδιορισμό της βέλτιστης διάρκειας ήχου για την ακριβή αναγνώριση συναισθημάτων.

ΔΙΑΦΗΜΙΣΗ

Το μέλλον της αλληλεπίδρασης ανθρώπου-μηχανής

Η ικανότητα αναγνώρισης συναισθημάτων μέσω της φωνής ανοίγει μια σειρά από δυνατότητες για το μέλλον της αλληλεπίδρασης ανθρώπου-μηχανής. Φανταστείτε ένα μέλλον όπου οι έξυπνες συσκευές και οι εικονικοί βοηθοί μπορούν να κατανοήσουν και να ανταποκριθούν στις συναισθηματικές σας ανάγκες.

Αυτή η μελέτη αντιπροσωπεύει ένα σημαντικό βήμα προς αυτή την κατεύθυνση, καταδεικνύοντας τις δυνατότητες του τεχνητή inteligência να αποκωδικοποιήσει τα μυστικά της ανθρώπινης φωνής και να δημιουργήσει πιο ενσυναίσθητες και εξανθρωπισμένες διεπαφές.

Διαβάστε επίσης:

* Το κείμενο αυτού του άρθρου δημιουργήθηκε εν μέρει από εργαλεία τεχνητής νοημοσύνης, γλωσσικά μοντέλα τελευταίας τεχνολογίας που βοηθούν στην προετοιμασία, την αναθεώρηση, τη μετάφραση και τη σύνοψη κειμένων. Οι καταχωρήσεις κειμένου δημιουργήθηκαν από το Curto Οι ειδήσεις και οι απαντήσεις από εργαλεία τεχνητής νοημοσύνης χρησιμοποιήθηκαν για τη βελτίωση του τελικού περιεχομένου.
Είναι σημαντικό να τονιστεί ότι τα εργαλεία τεχνητής νοημοσύνης είναι απλώς εργαλεία και η τελική ευθύνη για το δημοσιευμένο περιεχόμενο ανήκει στον Curto Νέα. Χρησιμοποιώντας αυτά τα εργαλεία υπεύθυνα και ηθικά, στόχος μας είναι να επεκτείνουμε τις δυνατότητες επικοινωνίας και να εκδημοκρατίσουμε την πρόσβαση σε ποιοτικές πληροφορίες.
🤖

ΔΙΑΦΗΜΙΣΗ

Αναζητάτε ένα εργαλείο Τεχνητής Νοημοσύνης για να κάνετε τη ζωή σας πιο εύκολη; Σε αυτόν τον οδηγό, περιηγείστε σε έναν κατάλογο ρομπότ που λειτουργούν με AI και μαθαίνετε για τις λειτουργίες τους. Δείτε την αξιολόγηση που τους έδωσε η ομάδα των δημοσιογράφων μας!

μετακινηθείτε προς τα επάνω