As palavras e os tokens

Rodrigo Bragio Bonaldo

doi:10.5216/rth.v27i1.79370

Abstract

Este artigo explora a semântica dos tempos históricos usando Processamento de Linguagem Natural (PLN). Desenvolvemos a família de modelos Woke (Word Embedding and Knowledge Model), utilizando algoritmos de vetorização de palavras como o Word2Vec, treinados em um corpus de teses e dissertações da Universidade Federal de Santa Catarina (2003-2024). Os modelos Woke-HST e Woke-CFH foram treinados especificamente em História e Ciências Humanas. Já os modelos Woke-UFSC foram expostos a 96,25% dos dados nativo digitais disponíveis no repositório de nossa universidade. O desenvolvimento envolveu coleta, pré-processamento, treinamento e validação dos dados, usando aprendizados micro-diacrônico, temporal e incremental para capturar variações semânticas ao longo do tempo. Os resultados preliminares mostram mudanças na estabilidade dos significados de conceitos como “raça”, “gênero” e “classe”. Apresentamos também SKINNER, um componente de IA explicável (XAI) que rastreia contextos linguísticos específicos, contribuindo para a transparência dos resultados. Concluímos que a captura completa de “espaços de experiência” requer modelos mais complexos e um corpus de dados mais amplo. O próximo passo do projeto é escalar os dados e usar modelos baseados na arquitetura Transformer para uma representação mais precisa dos conceitos históricos. Este trabalho é parte de um projeto interdisciplinar que busca contribuir para uma história digital teoricamente orientada que integre abordagens quantitativas e qualitativas, aliando erudição e análise de big data.

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

R Discovery Prime

R Discovery Prime

As palavras e os tokens

Abstract

Talk to us

Similar Papers

More From: Revista de Teoria da História

Lead the way for us

Journal: Revista de Teoria da História	Publication Date: Aug 4, 2024
License type: CC BY-NC-ND 4.0

Similar Papers

Decolonizar a história digital
Yan Soares Santos
Revista de Teoria da História | VOL. 27
Yan Soares SantosYan Soares Santos
04 Aug 2024
Revista de Teoria da História | VOL. 27

O ensaio como diário de luto em Georges Bataille
Douglas Attila Marcelino
Revista de Teoria da História | VOL. 27
Douglas Attila MarcelinoDouglas Attila Marcelino
04 Aug 2024
Revista de Teoria da História | VOL. 27

Multidirectional Memory
Sabrina Costa Braga
Revista de Teoria da História | VOL. 27
Sabrina Costa BragaSabrina Costa Braga
04 Aug 2024
Revista de Teoria da História | VOL. 27

A caminho do sistema binário
Wolfgang Ernst
Revista de Teoria da História | VOL. 27
Wolfgang ErnstWolfgang Ernst
04 Aug 2024
Revista de Teoria da História | VOL. 27

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

As palavras e os tokens

Abstract

Talk to us

Similar Papers

More From: Revista de Teoria da História