Phonetische Transkription für ein multilinguales Sprachsynthesesystem
Autoren
Mehr zum Buch
In der vorliegenden Dissertation wird ein Verfahren zur Bestimmung der phonetischen Transkription für das multilinguale Sprachsynthesesystem PAPAGENO beschrieben. Es handelt sich dabei um ein mehrstufiges Verfahren, das auf der einen Seite zwei neuronale Netze und auf der anderen Seite ein speziell aufbereitetes Lexikon verwendet. Die Aufbereitung der Trainingsdaten und das Training der neuronalen Netze erfolgen vollautomatisch. Durch den hybriden Ansatz werden die sichere Information der Aussprachelexika mit der Flexibilität der neuronalen Netze verbunden. Die neuronalen Netze werden gezielt durch Pruningverfahren optimiert. Außerdem wird während des Trainings eine implizite Bewertung der Eingabeinformation durchgeführt, wodurch sich die Ergebnisse verbessern und die zum Training erforderliche Zeit deutlich verringert. Das vollkommen datengetriebene Verfahren wurde in dieser arbeit erfolgreich auf drei Sprachen angewendet. Horst-Udo Hain, geboren 1971, studierte von 1990 bis 1996 Elektrotechnik und Informationstechnik an der TU Dresden. Seit 1997 arbeitet er in der Zentralabteilung Technik (Corporate Technology) der Siemens AG in München und ist verantwortlich für die Textaufbereitung des dort entwickelten Sprachsynthesesystems. In diesem Rahmen entstand die Vorliegende Dissertation. Die Sprachenunabhängigkeit des beschriebenen Verfahrens wurde durch die Anwendung auf vier weitere Sprachen bestätigt.