메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

송찬우 (국민대학교, 국민대학교 비즈니스IT전문대학원)

지도교수
안현철
발행연도
2023
저작권
국민대학교 논문은 저작권에 의해 보호받습니다.

이용수6

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
Tag2Vec 기반의 지능형 불법 도박 사이트 탐지 모형 개발 오늘날 온라인 도박 사이트를 통한 불법 도박이 큰 사회문제가 되고 있다. 인터넷 기술의 발전과 스마트폰 보급으로 시공간의 제약이 사라지고 불법 온라인 도박을 누구나 쉽게 접근할 수 있게 되었기 때문이다. 이를 막기 위해 국내에서는 자체 모 니터 요원의 탐지, ‘누리캅스’와 같은 제보 시스템 등을 활용해 불법 사이트를 탐지 하고 있지만 이러한 수동적인 프로세스로는 인력부족 같은 한계로 모든 불법 사이 트를 탐지하기 어려운 실정이다. 이에 여러 학자들이 인공지능 기반의 자동 불법 도박 사이트 탐지 기술을 연구해왔다. Xu et al. (2019)은 가짜 사이트들의 HTML Tag 구조에는 차별적인 특징 이 있다는 점을 발견하였다. 이는 HTML Tag 구조가 불법 사이트를 탐지하는데 주요한 특징정보가 될 수 있음을 시사하지만, 불법 사이 트 탐지 모델에 HTML Tag 구조를 반영하여 모형의 성능을 제고하고자 하는 연구 는 지금까지 거의 시도 되지 않았다. 이러한 배경에서 본 연구는 HTML Tag 구조 를 특징화하여 모형의 성능을 향상시키고자 하였고, HTML Tag 구조를 적절하게 벡터화하기 위한 방법론으로 Doc2Vec을 변형한 Tag2Vec을 제안한다. Tag2Vec 기반 모델의 효과를 검증하기 위해 ‘더 치트’의 유해 사이트 목록과 Google 검색을 통한 정상 사이트 목록을 데이터 세트로 활용하여 실증분석을 수행하였다. 그 결과 비교 모델로 설정된 URL 기반 탐지 모델보다 본 연구에서 제안하는 Tag2Vec 기 반 탐지 모델이 분류 정확도, Recall, F1_Score에서 모두 향상된 성능을 보임을 확 인할 수 있었다. 이러한 본 연구의 제안모델은 향후 지능형 기술을 통해 우리 사회 의 건강도를 제고하는데 효과적으로 활용될 수 있을 것으로 기대된다. 주제어 : 불법 도박 사이트 탐지, Tag2Vec, URL, HTML, Doc2Vec

목차

제1장. 서론 1
제2장. 이론적 배경 4
2.1. 불법 사이트 탐지 4
2.2. 기존 불법 사이트 탐지 연구들 5
2.2.1 콘텐츠 기반 탐지 5
2.2.2 URL 기반 탐지 6
2.2.3 하이브리드 기반 탐지 6
2.3. Word2Vec과 Doc2Vec 7
2.3.1 Word2Vec 7
2.3.2 Doc2Vec 9
제3장. 연구모델 12
3.1 URL 특징 정보 12
3.2 Tag 특징 정보: Tag2Vec 14
제4장. 실증 분석 16
4.1. 실험 데이터 16
4.2. 실험 모델 16
4.3. 실험 결과 17
제5장. 결론 21
본인의 이전 저작물 활용 고지 24
참고문헌 25
Abstract 28

최근 본 자료

전체보기

댓글(0)

0