Abstract

This paper considers the actual problem of calculating the percentage of similarity of recorded audio signals for the analysis and classification of audio data. The description of the algorithm for obtaining a special digital fingerprint of an audio recording (audio file) is given. The technique of forming a vector of features and a comparison procedure have been tested, which allows comparing the recordings of sound signals from similar sources and establishing their identity with an accuracy of 61% –65%, as well as correctly identifying obviously different sound signals. A comparative analysis of the calculated bit sequences obtained using the CREPE pitch tracker, which is a trained neural network, has been performed. In the case of audio signals, for the extraction of features from the recorded signals, it is taken into account that the signals reflect not only the features of the control object, but also distortions, random processes of various nature and other interfering factors.

Highlights

  • Бул эмгекте аудио маалыматтарды талдоо жана классификациялоо үчүн жазылган аудио сигналдардын окшоштук пайызын эсептөөнүн актуалдуу көйгөйү каралган

  • This paper considers the actual problem of calculating the percentage of similarity of recorded audio signals for the analysis and classification of audio data

  • The technique of forming a vector of features and a comparison procedure have been tested, which allows comparing the recordings of sound signals from similar sources and establishing their identity with an accuracy of 61% –65%, as well as correctly identifying obviously different sound signals

Read more

Summary

IDENTIFICATION OF RECORDINGS OF SOUND SIGNALS USING NEURAL NETWORKS

Бул эмгекте аудио маалыматтарды талдоо жана классификациялоо үчүн жазылган аудио сигналдардын окшоштук пайызын эсептөөнүн актуалдуу көйгөйү каралган. В данной работе рассматривается актуальная проблема расчета в процентном соотношении сходства записанных звуковых сигналов для задач анализа и классификации аудиоданных. Апробирована методика формирования вектора признаков и процедура сравнения, которая позволяет производить сопоставление записей звуковых сигналов схожих источников и устанавливать их идентичность с точностью 61%–65%, а также корректно идентифицировать заведомо разные звуковые сигналы. В случае аудиосигналов для извлечения из регистрируемых сигналов признаков учитывается, что сигналы отражают не только особенности объекта контроля, но и искажения, случайные процессы различной природы и другие мешающие факторы. Для визуализации записи звуковых сигналов в данной работе использованы хромаграммы. Сирены скорой помощи Хромаграммы сигналов WAV_1 и WAV_2 (длительность 3 секунды) представлены на рис.3a, 3b: Процент сходства битовых отпечатков составил 65,57%. Результаты работы могут быть использованы для идентификации записей акустических сигналов различной физической природы, в том числе применены к задачам голосовой биометрии. Они могут также использоваться при построении автоматизированных экспертных систем для сравнения различных аудиоданных между собой

Список литературы
Findings
Science and Artificial
Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.