Accurate Clinical and Biomedical Named Entity Recognition at Scale

Veysel Kocaman,David Talby

doi:10.1016/j.simpa.2022.100373

Accurate Clinical and Biomedical Named Entity Recognition at Scale

Veysel Kocaman, David Talby

Open Access

https://doi.org/10.1016/j.simpa.2022.100373

Copy DOI

Journal: Software Impacts	Publication Date: Aug 1, 2022
Citations: 16	License type: cc-by

Affiliation: John Snow (United States)

#Biomedical Named Entity Recognition #Named Entity Recognition + Show 8 more

Abstract
Full-Text PDF
Similar Papers

Abstract

We introduce an agile, production-grade clinical and biomedical Named entity recognition (NER) algorithm based on a modified BiLSTM-CNN-Char DL architecture built on top of Apache Spark. Our NER implementation establishes new state-of-the-art accuracy on 7 of 8 well-known biomedical NER benchmarks and 3 clinical concept extraction challenges: 2010 i2b2/VA clinical concept extraction, 2014 n2c2 de-identification, and 2018 n2c2 medication extraction. Moreover, clinical NER models trained using this implementation outperform the accuracy of commercial entity extraction solutions, AWS Medical Comprehend and Google Cloud Healthcare API by a large margin (8.9% and 6.7% respectively), without using memory-intensive language models.

Full Text