본 연구는 최근 25년간 실어증 연구의 주제 구조와 동향을 분석하기 위해 자연어처리(Natural Language Processing, NLP) 기반 텍스트마이닝 기법을 적용하였다. 분석 대상은 2000년부터 2024년까지 Aphasiology 저널에 게재된 총 1,748편의 논문 초록이며, Word2Vec 키워드 임베딩, N-gram 공출현 분석, LDA(Latent Dirichlet Allocation) 토픽모델링을 활용하여 분석을 수행하였다. 분석 결과, ‘aphasia’, ‘language’, ‘therapy’, ‘stroke’ 등의 고빈도 및 중심 키워드는 실어증의 병리적 메커니즘과 언어 중재에 대한 지속적인 관심을 반영하였다. 최근 등장한 ‘intervention’, ‘recovery’, ‘conversation’등의 키워드는 기능 회복과 환자 중심 접근에 대한 관심이 확대되고 있음을 시사한다. LDA 분석을 통해 도출된 6개 주요 토픽은 실어증 평가 및 인지, 신경학적 손상, 의미 및 음운 장애, 치료 전략, 사회적 상호작용과 삶의 질, 문법 및 구문 구조로 나타났다. 시기별 토픽 비율 변화는 진단 중심 연구에서 실용적·심리사회적 주제로의 전환을 보여준다. 본 연구는 실어증 연구의 지식 구조를 체계적으로 조망하고, 향후 연구 기획, 평가도구 개발, 중재 설계에 활용될 수 있는 통찰을 제공한다. NLP 기반 기법을 통해 연구 동향을 분석하고 임상 실천을 지원하는 데이터 기반 접근의 유효성을 입증하였다.
This study applied a Natural Language Processing (NLP)-based text mining approach to examine topic structures and trends in aphasia research over the past 25 years. A total of 1,748 abstracts published in Aphasiology from 2000 to 2024 were analyzed using Word2Vec keyword embedding, N-gram co-occurrence analysis, and Latent Dirichlet Allocation (LDA) topic modeling. High-frequency and central keywords such as “aphasia,” “language,” “therapy,” and “stroke” reflect ongoing interest in neurological mechanisms and language intervention. Recently emerging terms like “intervention,” “recovery,” and “conversation” suggest increased focus on functional improvement and patient-centered care. The LDA analysis identified six main topic areas: aphasia assessment and cognition, neurological damage, semantic and phonological impairments, treatment strategies, social interaction and quality of life, and grammar and syntactic structure. Temporal changes in topic proportions indicate a shift from diagnosis-centered research to practical and psychosocial approaches. This study provides a structural overview of aphasia research and offers insight for future research planning, clinical tool development, and intervention design. By leveraging NLP-based techniques, the study demonstrates the effectiveness of data-driven approaches in understanding research trends and guiding clinical practice in speech-language pathology.