This article presents the speech understanding and dialog system EVAR and concentrates on the linguistic processing of the system. The task of EVAR is to lead an information retrieval dialogue about the German InterCity train system. The linguistic knowledge is uniformly represented in a semantic network structure. The knowledge base is well structured following the layered linguistic model. Interface to the speech recognition is the level of word hypotheses. The control algorithm is independent of the application and allows to alternate dynamically between the two fundamental control strategies top-down and bottom-up. The linguistic knowledge represented in the system is used to control the recognition phase and for the understanding phase. The system can handle defect input due to recognition errors. Results are presented for speaker-dependent and multi-speaker versions of the recognition module.
Titelaufnahme
- TitelEVAR: ein sprachverstehendes Dialogsystem
- Verfasser
- Herausgeber
- Erschienen
- SpracheDeutsch
- DokumenttypAufsatz in einem Sammelwerk
- Schlagwörter
- ISBN3-540-55959-0
- URN
- Das Dokument ist frei verfügbar
- Social MediaShare
- NachweisKein Nachweis verfügbar
- IIIF
Dieser Artikel befaßt sich mit dem sprachverstehenden Dialogsystem EVAR, insbesondere mit der linguistischen Verarbeitung des Systems. Aufgabe von EVAR ist die Führung eines informationsabfragenden Dialogs über das deutsche InterCity-Zugsystem. Das linguistische Wissen ist einheitlich in einem semantischen Netz repräsentiert. Die Wissensbasis ist gemäß einem geschichteten linguistischen Modell strukturiert. Schnittstelle zur Spracherkennung ist die Worthypothesen-Ebene. Der Kontrollalgorithmus ist anwendungsunabhängig formuliert und erlaubt das dynamische Umschalten zwischen den beiden grundlegenden Analysestrategien top-down und bottom-up. Das im System repräsentierte Wissen wird sowohl zur Steuerung der Erkennungsphase als auch in der Verstehensphase benutzt. Das System ist in der Lage, Anfragen trotz fehlerhafter Erkennungsergebnisse zu bearbeiten. Ergebnisse für eine sprecherabhängige- und eine Mehrsprecher-Version der Erkennung werden vorgestellt.
- Das PDF-Dokument wurde 4 mal heruntergeladen.