농업에는 농업 생산성에 악영향을 미치는 다양한 종류의 잡초가 있다. 이는 외부 구조와 대게 비슷한 형태를 띄어 구분하기 어려운 이유로, 농경지의 잡초에 대한 지식을 갖추고 그 위험성을 이해하는 것이 중요하다. 이를 위해서, 스마트 농업 시스템의 자동 기기에 정확하고 실시간에 가까운 잡초 분류 접근법이 필요하다. 본 논문에서는 심층 신경망의 다중모델 간 융합을 이용하여 새로운 분류 방법을 개발하고, 식물 모종 데이터 세트와 전남대학교 외래잡초 데이터 세트의 잡초 종에 적용 하였다. 잡초의 특정 질감과 특징을 학습하기 위하여 심층 신경망은 이러한 관점을 수집하여 더 나은 분류를 한다. 전남대학교 외래잡초 데이터 세트의 원시 이미지는 큰 배경을 담고 있고, 해당 이미지들은 목표 잡초에 집중되지 않고 때로는 다른 잡초가 포함될 수 있으므로, 전처리 단계가 적용됨에 따라 훈련 중 잡음(노이즈) 또는 분류 오류와 같은 문제의 악영향을 줄인다. 심층 신경망은 NASNet, Resnet, Inception-Resnet, Mobilenet 및 VGG 모델을 채택 하였고, 이러한 모델은 ImageNet 데이터 세트에 대해 고성능을 달성하고 심층 신경망을 구축 할 때 서로 다른 5가지의 관념론을 대표한다. NASNet은 신경망 구조 탐색에서 작은 데이터 세트가 큰 데이터 세트로 전이되어 사용 되고, Resnet은 빠른 연결(shortcut connection)의 아이디어를 사용하고, Inception-Resnet은 깊이와 폭 증가를 위해 인셉션 모듈을 사용하고, Resnet과 Mobilenet의 빠른 연결(shortcut)의 개념은 매개변수를 줄이기 위해 채널별(Depthwise), 점별(Pointwise) 합성곱이 적용되고, VGG 구조는 신경망의 많은 층을 쌓는다. 잡초 이미지 I 가 주어지면 심층 신경망은 확률 벡터를 반환하고, 이 벡터의 각 요소는 확률 I 가 해당 클래스에 속하는 것을 보여 준다. 무조건부 결합 확률 측정의 개념을 기반으로 내적과 합계 규칙을 번갈아 적용하여 벡터의 후기 융합에 적용했다. 정확도, 정밀도, 재현율 및 F1 점수의 모델 내 검증집합, 가중 선형 조합 또는 가중 제곱을 사용한 융합 사용 방법을 제안하여 우선순위 가중치를 결정했다. 그래서 더 나은 모델을 융합 할 때 이점을 얻었거나 자동으로 가중치를 정의하기 위해 확률 벡터 (엔트로피 또는 최대 차이로 결정)의 신뢰도를 기반으로 다중 계층 퍼셉트론 모델을 구축했다. 결과는 본 방법이 외래잡초 데이터 세트에 대해 정확도는 98.77%를 달성 할 수 있고 5개의 심층 신경망의 융합 구조로 식물 묘목 데이터 세트에서 97.65%를 달성 할 수 있다. 다중 모델의 융합 구조를 사용하는 것이 단일 모델을 사용하는 것보다 결과가 향상되었음을 보여준다. 그러나 융합 모델이 많을수록 정확도가 느려진다. 시간 실행의 의미에서, 다중 계층 퍼셉트론 이외의 접근 방식을 사용하는 본 방법은 GPU에서 런타임 처리를 수행하고 CPU에서 실행할 때 거의 실시간으로 처리 할 수 있다.
In agriculture, there are many types of weeds that have bad impacts on agricultural productivity. Having knowledge of weeds and understanding of their threats on farmlands is a major challenge because many of them are quite similar to the external structure, which makes it difficult to classify. To do that, a highly accurate and quick processing weeds classification approach is required for automatic devices in smart agricultural systems. In this thesis, I developed a novel classification method by using the late fusion of the Multi-model Deep Neural Network (DNN) and applied it to weeds species on the Plant seedlings dataset and Chonnam National University (CNU) weeds dataset because I expect each DNN to learn specific textures and features of weeds, gather those perspectives may lead to better classification. Raw images of CNU weeds dataset capture large background and images are not well-focus on the target weeds, sometimes it may contain another weeds, so preprocessing steps are applied to reduce bad affect caused by those problems, such as noise during training, or misclassification. I adopted 5 DNN models, which were NASNet, Resnet, Inception-Resnet, Mobilenet, and VGG because those models achieve high performance on the ImageNet dataset and represent for 5 different ideology of building DNN models, such as NASNet is a model constructed using Neural Architecture Search on a small dataset an can be transfer to larger dataset, Resnet using the idea of shortcut connection, Inception-Resnet use Inception to increase the depth and width, and the idea shortcut connection from Resnet, Mobilenet apply depthwise and pointwise convolution to reduce parameters, and VGG architecture is stacking many CNN layers. Given a weeds image I, DNNs return probability vectors, in which each element in that vector shows the probability I belong to the corresponding class. I applied late fusion of those vectors by alternating Product rule and Sum rule based on the idea of unconditional measurement joint probability, or determined priority weights by proposing a method, using the value of accuracy, precision, recall, and F1 score of models in the validate set and fuse by using the Weighted linear combination or Weighted power multiplication so that better models had advantages when fused it, or built a Multi-Layer Perceptron model based on the confidence of probability vectors (determined by Entropy or Maximum difference) to define weights automatically. The result shows that my methods can achieve 98.77% on accuracy in CNU and 97.65% on Plant seedlings dataset by a late fusion of 5 DNNs model and using late fusion of multi models is better than using a single model. However, the more fuse models, the slowly of increasing accuracy. In the meaning of time execution, using non-MLP approach, the method can achieve run-time processing on GPU and nearly real-time when running on CPU.