Back-off method for n-gram smoothing based on binomial posteriori distribution

T Kawabata,M Tamoto

doi:10.1109/icassp.1996.540323

Back-off method for n-gram smoothing based on binomial posteriori distribution

T Kawabata, M Tamoto

https://doi.org/10.1109/icassp.1996.540323

Copy DOI

Publication Date: May 7, 1996

Citations: 12

Affiliation: NTT Basic Research Laboratories

#Back-off Method #Turing's Formula + Show 8 more

Abstract
Full-Text PDF
Similar Papers

Abstract

The n-gram language model is powerful for treating natural spoken language, however it requires large amounts of spoken language corpus to estimate reliable model parameters. To estimate n-gram probabilities from sparse data, Katz's (1987) back-off smoothing method is promising. However, this approach is sometimes unstable because it uses singleton heuristics based on Turing's formula. This paper proposes a new back-off method based on binomial posteriori distribution of n-gram probabilities, which achieves stable and more effective n-gram smoothing using a sophisticated calculation formula with no heuristics.

Full Text