메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

송영길 (강원대학교, 강원대학교 대학원)

지도교수
김학수
발행연도
2016
저작권
강원대학교 논문은 저작권에 의해 보호받습니다.

이용수0

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
개체명은 다양한 자연어처리 연구 및 서비스에 중요한 정보로 이용된다. 개체명 인식기의 개발을 위해서 개체명 자원(개체명 사전, 개체명 부착 말뭉치)은 필수적이다. 그러나 개체명 자원을 구축하는 것은 매우 시간 소모적이고, 인력 소모적인 작업이다. 이를 완화하기 위해서 본 논문에서는 개체명 자원을 반자동으로 구축하는 방법을 제안한다. 제안 방법은 개체명 사전구축, 개체명 사전의 다국어 확장, 개체명 부착 말뭉치 구축으로 구성된다. 개체명 사전 구축 시스템은 능동 학습을 이용하여 위키피디아 분류정보로 구성된 가상 문서를 개체명 범주 당 하나씩 생성한다. 그리고 잘 알려진 정보검색 모델인 BM25를 이용하여 위키피디아 엔트리와 가상문서 사이의 유사도를 계산한다. 마지막으로 유사도를 바탕으로 각 위키피디아 엔트리를 개체명 범주로 분류한다. 서로 다른 3종류의 개체명 범주 집합에서 실험한 결과, 제안 시스템은 매크로 평균 F1-점수 0.9028, 마이크로 평균 F1-점수 0.9554이라는 높은 성능을 보였다. 이렇게 구축된 개체명 사전은 위키피디아의 특성에 의해 쉽게 다국어로 확장이 가능하다. 본 논문에서는 앞서 구축된 한국어 개체명 사전으로부터 영어 개체명 사전을 자동으로 구축하는 실험을 하였다. 그 결과 매크로 평균 F1-점수 0.8789, 마이크로 평균 F1-점수 0.9036의 결과를 얻을 수 있었다. 구축된 개체명 사전을 이용하여 원거리 감독법과 간단한 휴리스틱으로 개체명 부착 말뭉치를 구축할 수 있다. 일반적인 자질을 이용한 개체명 인식기를 구현하여 실험한 결과 F1-점수 0.7317의 성능을 보이는 개체명 인식기를 구현할 수 있었다.

목차

I. 서론 1
II. 연구배경 2
1. 인공지능 응용프로그램 2
2. 지식 구축 방법 3
3. 개체명과 지식 구축 5
4. 개체명 범주 6
5. 개체명 인식 연구의 어려움 8
III. 관련연구 9
IV. 개체명 사전 구축 18
1. 초기 가상문서 구축 19
2. 가상문서 확장 20
3. 개체명 사전 구축 22
V. 다국어 확장 23
VI. 개체명 부착 말뭉치 구축 27
1. 개체명 범주 부착 말뭉치 생성 28
2. 개체명 인식 모델 학습 29
VII. 실험 및 분석 31
1. 개체명 사전 구축 실험 31
1) 실험 데이터 31
2) 실험 결과 34
(1) 가상문서 확장 실험 34
(2) 개체명 사전 구축 실험 36
(3) 오류 분석 38
2. 다국어 확장 실험 43
3. 개체명 부착 말뭉치 구축의 유용성 실험 45
VIII. 결론 47
References 48
부록. 개체명 범주 예 51

최근 본 자료

전체보기

댓글(0)

0