Data Sampling and Dimensionality Reduction Approaches for Reranking ASR Outputs Using Discriminative Language Models

Erinç Dikici ,Murat Saraçlar ,Murat Semerci ,Ethem Alpaydın

doi:10.5072/zenodo.29848

Data Sampling and Dimensionality Reduction Approaches for Reranking ASR Outputs Using Discriminative Language Models

Erinç Dikici , Murat Saraçlar + Show 2 more

https://doi.org/10.5072/zenodo.29848

Copy DOI

Publication Date: Jan 1, 2011

Citations: 10

Affiliation: Boğaziçi University

#Discriminative Models #Discriminative Language Models + Show 8 more

Abstract
Full-Text PDF
Similar Papers

Abstract

This paper investigates various approaches to data sampling and dimensionality reduction for discriminative language models (DLM). Being a feature based language modeling approach, the aim of DLM is to rerank the ASR output with discriminatively trained feature parameters. Using a Turkish morphology based feature set, we examine the use of online Principal Component Analysis (PCA) as a dimensionality reduction method. We exploit ranking perceptron and ranking SVM as two alternative discriminative modeling techniques, and apply data sampling to improve their efficiency. We obtain a reduction in word error rate (WER) of 0.4%, significant at p < 0.001 over the baseline perceptron result.

Full Text