Implementation of an Intelligent Video Detection System using Deep Learning in the Manufacturing Process of Tungsten Hexafluoride

Seung-Yong Son; Young Mok Kim; Doo-Hyun Choi

doi:10.3740/MRSK.2021.31.12.719

Preview

Korean Journal of Materials Research. December 2021. 719-726
https://doi.org/10.3740/MRSK.2021.31.12.719

Implementation of an Intelligent Video Detection System using Deep Learning in the Manufacturing Process of Tungsten Hexafluoride

딥러닝을 이용한 육불화텅스텐(WF₆) 제조 공정의 지능형 영상 감지 시스템 구현

Seung-Yong Son¹

Young Mok Kim²

Doo-Hyun Choi³^†

손 승용¹

김 영목²

최 두현³^†

¹Graduate School of Industry, Kyungpook National University, Daegu 41566, Republic of Korea

²Defense Agency for Technology and Quality, Daejeon 34327, Republic of Korea

³School of Electronics Engineering, Kyungpook National University, Daegu 41566, Republic of Korea

¹경북대학교 산업대학원

²국방기술품질원

³경북대학교 전자공학부

^†Corresponding author E-Mail : dhc@ee.knu.ac.kr (D. H. Choi, Kyungpook Nat’l Univ.)

License (open-access, http://creativecommons.org/licenses/by-nc/3.0/):

This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

ABSTRACT

Through the process of chemical vapor deposition, Tungsten Hexafluoride (WF₆) is widely used by the semiconductor industry to form tungsten films. Tungsten Hexafluoride (WF₆) is produced through manufacturing processes such as pulverization, wet smelting, calcination and reduction of tungsten ores. The manufacturing process of Tungsten Hexafluoride (WF₆) is required thorough quality control to improve productivity. In this paper, a real-time detection system for oxidation defects that occur in the manufacturing process of Tungsten Hexafluoride (WF₆) is proposed. The proposed system is implemented by applying YOLOv5 based on Convolutional Neural Network (CNN); it is expected to enable more stable management than existing management, which relies on skilled workers. The implementation method of the proposed system and the results of performance comparison are presented to prove the feasibility of the method for improving the efficiency of the WF₆ manufacturing process in this paper. The proposed system applying YOLOv5s, which is the most suitable material in the actual production environment, demonstrates high accuracy (mAP@0.5 99.4 %) and real-time detection speed (FPS 46).

Keywords

object detection

you only look once (YOLO)

tungsten hexafluoride (WF₆)

reduction

defect detection

MAIN

1. 서 론

반도체 8대 공정 중 금속 배선 공정(metallization)에는 텅스텐(tungsten, W) 또는 알루미늄(aluminum, Al)이 주 로 사용된다. 특히, 반도체 기술의 고도화, 3D 낸드플래 시메모리(NAND)의 고단화 과정에서 텅스텐 박막(CVDW, chemical vapor deposition of tungsten) 공정의 적 용이 확대되고 있다. 이에 따라, CVD-W 공정의 핵심 소재인 육불화텅스텐(tungsten hexafluoride, WF₆)의 수요 가 증가하고 있다.¹⁾ WF₆ 제조 공정의 중간 산물인 텅 스텐 분말(tungsten powder)은 톤 단위로 생산되며, 생 산 과정에서 소량의 산화 분말(oxidation powder)이 혼 입될 경우 전량 폐기 처분하거나 재처리 공정을 거쳐야 한다. 즉, 산화 분말의 혼입은 WF₆ 제조 공정의 효율 을 저해하는 치명적인 요인이며, 경제적으로 큰 손실을 초래할 수 있다.

WF₆ 제조 공정에서 산화 분말의 혼입을 방지하기 위 하여, 기존에는 숙련된 작업자를 작업 현장에 24시간 배 치하여 관리하였다. 이러한 방식의 공정관리는 숙련된 작 업자의 경험과 판단에 의존하게 된다. 즉, 작업자의 검 출 속도와 정확도가 생산 수율, 제품의 품질에 큰 영향 을 미치게 되고 실제로 숙련된 작업자의 노동력을 활용 하여 24시간 일정 수준 이상의 품질을 유지하는 것 역 시 어려운 일이다. 이처럼 숙련된 작업자의 경험과 판 단에 의존한 기존 공정관리는 한계가 있다. 따라서 WF₆ 제조 공정의 생산성 향상을 위하여, 더 높은 정확도와 검출속도를 갖추고 일정한 수준 이상의 품질관리가 가 능한 자동화 검사 시스템의 도입이 필요한 상황이다.

본 논문에서는 합성곱 신경망(convolutional neural network, CNN)²⁾ 기반의 YOLOv5 (you only look once v5)를 적용하여 WF₆ 제조 공정 중 산화 분말의 혼입을 실시간으로 검출하는 지능형 영상 감지 시스템을 제안 하였다. 제안하는 시스템의 구현 방안 및 성능 비교 분 석 결과를 제시하여, WF₆ 제조 공정의 효율화 방안에 대한 타당성을 입증하였다.

본 논문의 구성은 다음과 같다. 2장에서는 객체 탐지 알고리즘에 대한 관련 연구와 육불화텅스텐(WF₆)의 제 조 공정을 기술한다. 3장에서는 제안하는 시스템의 구현 방안을 포함한 실험방법을 설명하고, 4장에서 실험 결과 를 정리한다. 5장에서는 결론 및 향후 연구계획을 제시 한다.

2. 이 론

2.1. 객체 탐지 알고리즘 관련 연구

최근 하드웨어 성능의 발전에 따라 그래픽스 처리 장 치(graphics processing unit, GPU)의 성능이 향상되었으 며, 영상 데이터의 처리 과정에 CNN이 적용되기 시작하 였다. 객체 탐지(object detection) 분야에 CNN을 적용한 대표적인 모델은 R-CNN (Region with CNN features) 이다. R-CNN3)은 2단계 검출기(two stage detector)로, 물체의 위치를 찾는 임무(region proposal)와 물체를 분류 하는 임무(region classification)를 단계적으로 구분하여 수 행한다. R-CNN은 입력 이미지를 받아서 selective search 알고리즘에 의해 생성된 region proposal 2,000개에 대 하여 합성곱 연산을 수행한다. 이러한 과정의 한계로 인 하여 계산 속도가 매우 느리다는 단점이 있다. Fast RCNN ⁴⁾은 R-CNN의 단점을 개선하기 위하여 제안되었고, ROI pooling 기법을 적용하여 CNN 연산 횟수를 줄이고 계산 속도를 증가시켰다. Faster R-CNN⁵⁾은 합성곱 특징맵 (convolution feature map)으로부터 region proposal을 직 접 생성할 수 있는 RPN (region proposal network)을 제 안하여, region proposal 과정에서 발생할 수 있는 병목 현상(bottleneck)을 개선하였다. R-CNN 계열의 알고리즘 은 개선과정에서 계산속도를 향상시켰지만, 실시간 객체 탐지(real-time object detection) 측면에서 한계점을 드러 냈다.

이러한 문제점을 해결하기 위한 대안으로 제시된 것이 YOLO(you only look once)다. YOLO⁶⁾는 1단계 검출 기(one stage detector)로서, 객체 검출의 개별 요소(객 체 탐지, 객체 분류)를 단일 신경망으로 통합한 모델이 다. YOLO는 많은 양의 이미지에 대하여 객체 탐지와 분류를 동시에 처리함으로써, 실시간 객체 탐지를 가능 하게 한다. YOLO는 이러한 설계적 특성으로 기존의 객 체 탐지 알고리즘보다 FPS (frame per second)가 우수 하며, mAP (mean average precision) 측면에서는 유사 한 수준의 성능을 보여준다.

YOLO는 이미지 내에 어떤 물체가 존재하고 어느 위 치에 있는지를 나타내기 위하여, 이미지 픽셀(pixel)로 부 터 경계 박스(bounding box)의 좌표(coordinates), 클래스 확률(class probability)을 구하기까지의 일련의 절차를 단 일 회귀 문제(single regression problem)로 재구성한다. YOLO의 단계별 과정은 아래와 같고, 이를 도식화한 것 이 Fig. 1이다.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_F1.jpg

Fig. 1

YOLO model.

1) 입력 이미지를 S × S g r id c ell로 분할한다.
2) 각각의 g r id c ell은 객체 위치의 B개의 경계 박스와 각 경계 박스에 대한 확률점수(confidence score)를 예측 한다. 확률점수(confidence score)는 해당 box에 물체가 있 는지 없는지에 대한 점수와 예측 박스(prediction box)와 정답 박스(ground truth box)의 IoU (Intersection over Union) 값의 곱을 의미하며, 식 (1)과 같이 표현된다.
(1)
$Pr (Object) * {IOU}_{pre}^{truth}$

3) 각 grid cell은 conditional class probability (C)를 계산하며, Pr(Classi|Object)로 표현한다.
4) 각 경계 박스는 중심점인 (x, y)와 width와 height 값 (w, h), 확률점수(confidence score, C)를 포함한 5가 지 (x, y, w, h, C)로 구성된다.
5) 전체 이미지 격자로 나뉘게 되고, S × S × (B × 5 + C)개의 값을 예측한다.
6) YOLO 손실 함수는 식 (2)와 같다.

(2)

\begin{array}{l} λ_{coord} \sum_{i = 0}^{S^{2}} \sum_{j = 0}^{B} 1_{ij}^{obj} [{(x_{i} - \hat{x_{1}})}^{2} + {(y_{i} - \hat{y_{1}})}^{2}] \\ + λ_{coord} \sum_{i = 0}^{S^{2}} \sum_{j = 0}^{B} 1_{ij}^{obj} [{(\sqrt{(wi]} - \sqrt{\hat{w} i})}^{2} + {(\sqrt{hi} - \sqrt{\hat{h} i})}^{2}] \\ + \sum_{i = 0}^{S^{2}} \sum_{j = 0}^{B} 1_{ij}^{obj} {(C_{i} - \hat{C_{1}})}^{2} \\ + λ_{noobj} \sum_{i = 0}^{S^{2}} \sum_{j = 0}^{B} 1_{ij}^{noobj} {(C_{i} - \hat{C_{1}})}^{2} \\ + \sum_{i = 0}^{S^{2}} 1_{i}^{obj} \sum_{c \in classes} {(Pi (c) - \hat{P} i (c))}^{2} \end{array}

S: grid cell 크기
B: S 셀의 경계 박스
x, y: 경계 박스의 중심점
w, h: 경계 박스 width, height (이미지 전체의 width, height : 1)
C: Confidence Class Probability

YOLOv2⁷⁾는 9,000개의 서로 다른 이미지를 탐지 및 분 류한다. 19개의 계층으로 이루어진 Darknet–19를 특징 추 출기(feature extractor)로 사용하며, YOLOv1의 dropout 을 배치 정규화(batch normalization)로 대체하면서 과적 합(overfitting)을 예방하였다. 그리고 초기 학습 안정화를 위해 앵커 박스(anchor box)를 도입하였으며, 경계 박스 의 예측을 완전 연결 계층(fully connected layer) 대신 앵커 박스에서 수행하여 예측 성능을 향상시켰다.

YOLOv3⁸⁾는 Darknet-53을 특징 추출기(feature extractor) 로 사용하였고, 성능 향상을 위해 로지스틱 회귀(logistic regression)를 적용하여 각각의 경계 박스마다 객체의 유 무를 산출하는 객관성 점수(objectness score)를 예측하였 다. Fig. 2와 같이 앵커 박스와 ground truth box 사이 의 IOU가 가장 높은 박스를 예측 결과로 선택하고, 이 외의 박스들은 무시한다.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_F2.jpg

Fig. 2

Bounding box prediction.

YOLOv4⁹⁾는 빠른 실행 속도와 병렬 연산 최적화를 목표로 최신 기법을 조합하여 제안하였다. YOLOv4의 Backbone은 CSP-Darknet53, Neck은 SPP¹⁰⁾ (Spatial Pyramid Pooling), PA-Net¹¹⁾ (Path Aggregation Network), Head는 YOLOv3를 적용하였다. 특히, Fig. 3과 같이 데이 터 증강 기법으로 전혀 다른 4개의 이미지를 하나의 이미 지로 결합하는 모자이크 증강 기법(mosaic augmentation)¹²⁾ 을 적용하였다.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_F3.jpg

Fig. 3

Mosaic Augmentation.

YOLOv5¹³⁾는 Backbone-Neck-Head의 아키텍처로 구 성되어 있다. Backbone은 입력된 이미지에서 특징을 추 출하기 위하여 CSPDarknet¹⁴⁾을 사용하고, 총 4가지 모 델 ‘s, m, l, x’이 있으며 각각 small, medium, large, x-large를 뜻한다. 계산이 가장 빠르지만, 정확도가 상 대적으로 낮은 ‘s’부터 계산은 느리지만, 정확도가 가장 높은 ‘x'로 구분할 수 있다. 각각의 모델은 2가지 변수 (depth_multiple, width_multiple)에 의하여 결정된다. depth_multiple 값을 크게 할수록 BottleneckCSP¹⁴⁾의 반복 횟수가 증가하게 되면서 더 깊은 모델이 되고, width_multiple 값을 크게 할수록 Layer의 합성곱 필 터 수가 증가하게 된다. YOLOv5 Backbone 관련 변수 설정은 Table 1과 같다. Neck은 PA-Net을 사용하며, feature pyramids network을 생성한다. Head는 YOLO v3 및 v4와 동일하며, 추출된 특징맵을 바탕으로 물체 의 위치를 찾는 역할을 담당한다. PA-Net을 이용해 얻 은 서로 다른 크기의 특징 맵에서 각각 3개의 앵커 박 스를 이용해 객체를 탐지한다.

Table 1

Variable setting of YOLOv5 Backbone models.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_T1.jpg

COCO dataset¹⁵⁾을 활용하여 YOLOv5 모델별 성능을 비교하면 Fig. 4와 같다. YOLOv5 모든 모델은 속도와 정확도 측면에서 EfficientDet¹⁶⁾보다 우수한 성능을 나타 냈다. 그리고 YOLOv5 모델의 layer 개수가 증가할수록 속도는 느려지지만, 정확도가 향상됨을 확인할 수 있다.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_F4.jpg

Fig. 4

Performance comparison of YOLOv5 models.

2.2. 육불화텅스텐(WF₆) 제조 공정

육불화텅스텐(tungsten hexafluoride, WF₆)의 제조 공 정은 크게 6단계로 구성되며, 이를 도식화하면 Fig. 5 와 같다.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_F5.jpg

Fig. 5

Manufacturing process of WF₆.

광물 형태의 텅스텐(tungsten ore)인 철망간중석[(Fe, Mn)WO₄]을 분쇄(pulverization)하고, 이온 교환, 용매 추 출, 농축 및 결정화 등의 습식제련(wet smelting)공정을 거쳐서 파라텅스텐산 암모늄(ammonium paratungstate, APT)을 생성한다. APT를 약 500 °C에서 식 (3)과 같이 하 소(calcination)하여 삼산화텅스텐(trioxide tungsten, WO₃)을 제조한다.

(3)

\begin{array}{l} {({NH}_{4})}_{10} (H_{2} W_{12} O_{42}) \cdot 4 H_{2} O \to \\ {12WO}_{3} + 10 {HN}_{3} + 11 H_{2} O \end{array}

WO₃는 약 500 ~ 1,300 °C 조건에서 식 (4)와 같이 수소(H₂)와 환원 반응(reduction)을 통하여 텅스텐 분말 (tungsten powder, W)을 제조한다.¹⁷⁾

(4)

{WO}_{3} + 3 H_{2} + Heat \to W + 3 H_{2} O

이 과정에서 식 (5)와 같이 산화 반응(oxidation reaction) 이 발생하는 경우, oxide가 포함된 텅스텐 분말(impure tungsten powder, WO_x) 형태의 결함이 발생하게 되며, 이를 본 논문에서는 oxidation이라고 한다.

(5)

2W + 3 O_{2} \to 2 {WO}_{3}

WF₆ 제조 공정에서 발생한 oxidation은 작업자가 결 함으로 분류하여, 환원(reduction) 공정을 다시 거치도록 재처리(reprocessing)한다. 정상으로 분류된 텅스텐 분말 (tungsten powder, W)은 불소(fluoride, F₂) 또는 삼불화 질소(nitrogen trifluoride, NF₃)와 함께 유동성 반응기 (fluidized bed reactor)에서 각각 식 (6), (7)과 같이 접 촉반응을 거쳐 육불화텅스텐(tungsten hexafluoride, WF₆) 으로 제조된다.¹⁸⁾

(6)

W + 3 F_{2} \to {WF}_{6}

(7)

W + 2 {NF}_{3} \to {WF}_{6} + N_{2}

3. 실험 방법

WF₆ 제조 공정의 중간 산물인 WO₃가 실제 작업 환 경에서 환원 공정을 거치면서 생성되는 텅스텐 분말 (tungsten powder, W)과 oxidation을 나타내면 Fig. 6과 같다. 각각의 산물은 육안으로 구분이 가능하며, 영상 데 이터 분석을 통한 검출 시스템의 자동화가 가능할 것으 로 판단하였다.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_F6.jpg

Fig. 6

Classification of Tungsten Powder (W) and Oxidation (WO_x).

본 논문에서는 환원 반응 공정 후 생성된 텅스텐 분 말을 담은 트레이(tray)가 컨베이어벨트를 통해 이동하는 과정에서, 영상 데이터를 실시간으로 입력받아 oxidation 을 검출하는 지능형 영상 감지 시스템을 구현하고자 한 다. 30 W LED 조명은 컨베이어벨트로부터 2 m 높이에 설치되어 있으며, 카메라는 컨베이어벨트를 30°의 각도 에서 촬영한다. 제안하는 시스템의 개념도는 Fig. 7과 같 고, 하드웨어 적용 사양은 Table 2와 같다.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_F7.jpg

Fig. 7

A block diagram of the intelligent video detection system.

Table 2

Hardware specification of the proposed system.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_T2.jpg

제안하는 시스템은 Google Colaboratory 활용하여 학 습을 진행하였고, 적용 환경은 Table 3과 같다.

Table 3

Learning environment of the proposed system.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_T3.jpg

3,024×3,024 크기의 영상 데이터를 1,248개 획득한 후, 정상으로 판단되는 텅스텐 분말(W) 트레이와 결함 으로 판단되는 oxidation (WO_x) 트레이로 분류하였다. 이 렇게 사전 분류된 1,248개의 영상 데이터를 8:2의 비율 로 나누어, 998개의 영상 데이터를 학습 과정, 250개의 영상 데이터를 테스트 과정에 사용하였다. 그리고 실제 WF₆ 제조 공정 라인에서 수집한 영상 데이터에 대하 여 모자이크 증강 기법을 적용하였고, 그 결과는 Fig. 8과 같다. 모자이크 증강 기법을 통하여 Batch 수가 증 가하는 효과와 신경망 학습 안정성을 향상시켰다. 또 한, 영상 데이터를 c r op된 상태에서 학습함으로써 작은 객체에 대한 인식률도 함께 향상시켰다.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_F8.jpg

Fig. 8

Storage capacity used in the implementation of YOLOv3 and YOLOv5 series.

객체 검출 알고리즘에서 주로 사용되는 분류성능 평가 지표는 정밀도(precision)와 재현율(recall)이며, 각각의 정 의는 다음과 같다.

Precision은 식 (8)과 같이 모델이 ‘True’라고 판단한 것 중에서 실제 ‘True’인 것의 비율을 의미한다.

(8)

Precision = \frac{TP}{TP+FP}

Recall은 식 (9)와 같이 실제로 ‘True’라고 판단한 것 중에서 실제 ‘ Tr ue’라고 예측한 비율을 의미한다.

(9)

Recall = \frac{TP}{TP+FN}

Precision과 Recall을 산출할 때, 활용되는 오차 행렬을 정리하면 Table 4와 같다.

Table 4

Confusion matrix.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_T4.jpg

4. 결과 및 고찰

준비된 데이터셋을 기반으로 이미지 크기는 416 × 416, batch size 16, epochs 100의 동일 조건에서 YOLOv3, YOLOv3 Tiny, YOLOv5의 4가지 모델(v5s, v5m, v5l, v5x)을 활용하여 학습하였다. 각각의 모델에 대하여 precision, recall, mAP (mean average precision), FPS (frame per second)를 계산하여 Table 5에 정리하였고, 각 모델의 구현 과정에 사용되는 모델의 용량은 Fig. 9 와 같다.

Table 5

Performance comparison of YOLOv3 and YOLOv5 series models.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_T5.jpg

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_F9.jpg

Fig. 9

Precision-Recall Curve.

각 모델에 대한 실험 결과를 살펴보면, YOLOv5 계 열 모델이 YOLOv3보다 속도 및 정확도 측면에서 우수 함을 확인하였다. 그리고 YOLOv5 모델의 구현 과정에 서 활용된 스토리지 용량을 고려하였을 때, 지능형 영 상 감지 시스템에서 YOLOv5s의 적용이 타당한 것으로 판단하였다. 이러한 검토 결과를 바탕으로 실제 공정 영 상 데이터에 대하여 YOLOv5s를 적용한 결과는 Fig. 10 과 같다.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_F10.jpg

Fig. 10

Results of applying mosaic augmentation technique using actual video data.

제안하는 시스템을 활용하여 텅스텐 분말(W)과 oxidation을 검출한 결과를 Fig. 11과 같이 Precision-Recall 곡선과 Table 6과 같이 tungsten powder 99.6%, oxidation 99.2 %, all classes 99.4 %의 높은 정확도와 FPS 46의 빠른 검출 속도를 확인하였다.

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_F11.jpg

Fig. 11

Results of applying YOLOv5s using actual image data.

Table 6

Detection accuracy of Tungsten powder and Oxidation

https://cdn.apub.kr/journalsite/sites/mrsk/2021-031-12/N0340311210/images/MRSK-31-12-719_T6.jpg

5. 결 론

본 논문에서는 WF₆의 제조 공정에서 발생하는 oxidation 결함을 실시간으로 검출하는 지능형 영상 감지 시 스템을 제안하였고, YOLOv5를 적용하여 구현되었다.

제안하는 시스템이 생산 현장에 적용되면, 안정적인 품 질 관리와 효율적인 공정 관리에 기여할 것으로 기대된 다. WF₆ 제조 공정에서 수집한 영상 데이터를 기반으로 데이터셋을 구축한 다음, YOLOv3 계열(v3, v3 Tiny), YOLOv5 계열(v5s, v5m, v5l, v5x)의 알고리즘을 활용 하여 학습 및 성능 평가를 수행하였다. 총 6개 모델에 대하여 성능을 비교 평가한 결과, YOLOv5 계열 모델 이 YOLOv3 계열보다 속도 및 정확도 측면에서 우수함 을 확인하였다. 그리고 YOLOv5 모델의 구현 과정에서 활용된 스토리지 용량을 고려하였을 때, 지능형 영상 감 지 시스템에서 YOLOv5s의 적용이 타당한 것으로 판단 하였다. YOLOv5s로 구현된 시스템을 실제 공정 영상에 적용하여 텅스텐 분말 99.6 %, oxidation 99.2 %, all classes 99.4 %의 높은 정확도와 FPS 40의 빠른 검출 속도를 확인하였다.

제안하는 시스템에서 텅스텐 분말(정상 판단)이 검출되 면 후속 공정을 진행하고, oxidation(결함 판단)이 검출 되면 후속 공정 대신 reprocessing 공정을 자동으로 진 행시키는 스마트 제어 시스템에 대한 후속 연구를 진행 할 예정이다.

<저자소개>

손승용

경북대학교 산업대학원 제어및계측공학전공 학생(석사과정)

김영목

국방기술품질원 선임연구원

최두현

경북대학교 전자공학부 교수

References

H. W. Jung, J. Ind. Eng. Chem., 70, 99 (2019). 10.1016/j.jiec.2018.10.024

Y. L ecun, L. B ottou, Y . Bengio a nd P . Haffner, P roc. IEEE, 86, 2278 (1998). 10.1109/5.726791

J. Redmon, S. Divvala, R. Girshick and A. Farhadi, in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (Las Vegas, NV, USA, Jun 2016), p.779 (2016).

R. Girshick, J. Donahue, T. Darrell and J. Malik, in Proceedings of the Conference on Computer Vision and Pattern Recognition (Columbus, OH, USA, Jun 2014), p. 580 (2014).

R. Girshick, in Proceedings of the IEEE International Conference on Computer Vision (Santiago, Chile), p.1440 (2015).

S. Ren, K. He, R. Girshick and J. Sun, IEEE Trans. Pattern. Anal. Mach. Intell., 39, 1137 (2017). 10.1109/TPAMI.2016.257703127295650

J. Redmon and A. Farhadi, in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (Honolulu, HI, USA, Jul 2017), p.7263 (2017).

J. Redmon and A. Farhadi, YOLOv3: An Incremental Improvement, Retrieved Apr 8, 2018 from https://arxiv.org/abs/1804.02767 .

A. Bochkovskiy, C. Y. Wang and H. Y. M. Liao, YOLOv4: Optimal Speed and Accuracy of Object Detection, Retrieved Apr 23, 2020 from https://arxiv.org/abs/2004.10934 .

10.

K. He, X. Zhang, S. Ren and J. Sun, IEEE Trans. Pattern. Anal. Mach. Intell., 37, 1904 (2015). 10.1109/TPAMI.2015.238982426353135

11.

S. Liu, L. Qi, H. Qin, J. Shi and J. Jia, in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (Salt Lake City, UT, USA, Jun 2018), p.8759 (2018).

12.

W. Hao and S. Zhili, J. Phys. : Conf. Ser., 1684, 012094, (2020). 10.1088/1742-6596/1684/1/012094

13.

J. Glenn, YOLO v5, Retrieved May 18, 2020 from https://github.com/ultralytics/yolov5

14.

C. Y. Wang, H. Y. M. Liao, Y. H. Wu, P. Y. Chen, J. W. Hsieh and I. H. Yeh, in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (Honolulu, HI, USA, Jul 2017), p.1571 (2020).

15.

T. Y. Lin, M. Maire, S. Belongie, J. Hays, P. Perona, D. Ramanan, P. Dollar, and C. L. Zitnick, in Proceedings of the European Conference on Computer Vision, LNCS, 8693, p.740 (2014).

16.

M. Tan, R. Pang, Q. V. Le, in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (Seattle, WA, USA, Jun 2020), p.10778 (2020).

17.

C. M. Song, G. H. Zhang, K. C. Chou and B. Yan, JOM, 72, 379 (2020). 10.1007/s11837-019-03749-5

18.

W. Xie, P. C. Lemaire and G. N. Parsons, ACS Appl. Mater. Interfaces, 10, 9147 (2018). 10.1021/acsami.7b1902429461793

Korean Journal of Materials Research ISSN:1225-0562(Print) 2287-7258(Online) 한국재료학회지

Preview

Implementation of an Intelligent Video Detection System using Deep Learning in the Manufacturing Process of Tungsten Hexafluoride

ABSTRACT

MAIN

Fig. 1

(1)

(2)

Fig. 2

Fig. 3

Table 1

Fig. 4

Fig. 5

(3)

(4)

(5)

(6)

(7)

Fig. 6

Fig. 7

Table 2

Table 3

Fig. 8

(8)

(9)

Table 4

Table 5

Fig. 9

Fig. 10

Fig. 11

Table 6

References