Επεξεργασία Ομιλίας και Ήχου

Μοντελοποίηση του μηχανισμού παραγωγής ομιλίας: Μηχανισμός παραγωγής ομιλίας, Ήχοι ομιλίας. Ψηφιακή προεπεξεργασία κειμένου ομιλίας: Επιλογή της συχνότητας δειγματοληψίας, Ψηφιοποίηση, Βραχύχρονη ανάλυση σήματος ομιλίας, Επιλογή μήκους πλαισίου, Προέμφαση, Επιλογή φίλτρου “παραθύρου”, Ρυθμός μετακίνησης πλαισίων. Ακουστικές παράμετροι: Εξαγωγή παραμέτρων, Ακουστικές πληροφορίες διάκρισης ομιλητών, Ενέργεια και μηδενικές διελεύσεις, Θεμελιώδης συχνότητα, Μέθοδοι υπολογισμού τονικότητας, Φασματογράφημα, Συντονισμοί φωνητικού καναλιού (FORMANTS), Συντελεστές γραμμικής πρόγνωσης (LPC), τράπεζα φίλτρων, συντελεστές ανάκλασης, Cepstral Συντελεστές. Βασικές Τεχνικές Επεξεργασίας ομιλίας. Κρυμμένα Μοντέλα Μarkov: Ορισμός και θεμελιώδεις αλγόριθμοι. Συστήματα αναγνώρισης/κατανόησης ομιλίας, Συστήματα Αναγνώρισης Ομιλητή. Σύνθεση ομιλίας. Ψηφιακές τεχνικές αφαίρεσης θορύβου.
Code Hours Type eClass Semester
ΗΥ730 4 Κατεύθυνση Α.Ε. e-Class 8

Βιβλιογραφία:

  • “Ψηφιακή επεξεργασία σήματος, Antoniou A.”eudoxus link
  • “Ψηφιακή Επεξεργασία Φωνής: Θεωρία και Εφαρμογές, Rabiner L.”eudoxus link