yolov7/data/hyp.scratch.p5.yaml

lr0: 0.01  # initial learning rate (SGD=1E-2, Adam=1E-3)   
lrf: 0.1  # final OneCycleLR learning rate (lr0 * lrf)
momentum: 0.937  # SGD momentum/Adam beta1
weight_decay: 0.0005  # optimizer weight decay 5e-4
warmup_epochs: 3.0  # warmup epochs (fractions ok)
warmup_momentum: 0.8  # warmup initial momentum
warmup_bias_lr: 0.1  # warmup initial bias lr
box: 0.05  # box loss gain
cls: 0.3  # cls loss gain
cls_pw: 1.0  # cls BCELoss positive_weight
obj: 0.7  # obj loss gain (scale with pixels)
obj_pw: 1.0  # obj BCELoss positive_weight
iou_t: 0.20  # IoU training threshold
anchor_t: 4.0  # anchor-multiple threshold
# anchors: 3  # anchors per output layer (0 to ignore)
fl_gamma: 0.0  # focal loss gamma (efficientDet default gamma=1.5)
hsv_h: 0.015  # image HSV-Hue augmentation (fraction)
hsv_s: 0.7  # image HSV-Saturation augmentation (fraction)
hsv_v: 0.4  # image HSV-Value augmentation (fraction)
degrees: 0.0  # image rotation (+/- deg)
translate: 0.2  # image translation (+/- fraction)
scale: 0.9  # image scale (+/- gain)
shear: 0.0  # image shear (+/- deg)
perspective: 0.0  # image perspective (+/- fraction), range 0-0.001
flipud: 0.0  # image flip up-down (probability)
fliplr: 0.5  # image flip left-right (probability)
mosaic: 1.0  # image mosaic (probability)
mixup: 0.15  # image mixup (probability)
copy_paste: 0.0  # image copy paste (probability)
paste_in: 0.15  # image copy paste (probability), use 0 for faster training
loss_ota: 1 # use ComputeLossOTA, use 0 for faster training

lr0	시작 learning rate
lrf	종료시점의 learning rate
momentum	gradient descent를 통해 global minimum을 찾기 위해 더해주는 값
weight_decay	가중치를 감쇠하여 과적합 방지
warmup_epochs	학습 속도를 선형적으로 증가시키는 epoch 수
warmup_momentum	모멘텀 파라미터를 점진적으로 증가시켜 전역최적점을 찾을 수 있도록 함
warmup_bias_lr	초반엔 작은 learning rate로 시작하여 초기 learning rate로 점진적으로 접근
box	GT의 중앙점이 위치하는 좌표를 표시하여 object loss를 구하고, GT의 너비와 높이를 grid에 맞게 정규화한 것으로 box loss를 구함
cls	실제 클래스와의 손실함수
cls_pw	양성 샘플에 더 큰 가중치를 둔 클래스 손실함수
obj	실제 객체와의 손실함수
obj_pw	양성 샘플에 더 큰 가중치를 둔 객체 손실함수
iou_t	IoU 임계값
anchor_t	anchor박스의 multiple 임계값
fl_gamma	클래스 불균형 문제를 해결하기 위해 어렵거나 쉽게 오분류되는 케이스에 더 큰 가중치를 부여하고, 쉬운 케이스에는 낮은 가중치를 부여 (efficientDet default gamma=1.5)
hsv_h, hsv_s, hsv_v	색상(Hue), 채도(Saturation), 명도(Value) augmentation
degrees	이미지를 회전하는 augmentation, 사진마다 epoch마다 랜덤으로 주어 학습
translate	이미지를 이동하여 학습, 사진마다 epoch마다 위치를 랜덤으로 주어 학습
scale	이미지의 크기를 변환하여 학습, 크기를 랜덤으로 주어 학습
shear	전단 변환; 이미지를 기울여서 학습, 기울임을 랜덤으로 주어 학습
perspective	원근변환
flipud, fliplr	상하(up-down), 좌우(left-right) 변환 augmentation
mosaic	4장의 이미지를 한 장으로 만드는 augmentation
mixup	두 이미지를 사용하여 중첩시켜 ratio로 레이블을 조정하는 augmentation
copy_paste	이미지 segment를 다른 사진에 붙여서 학습
paste_in
loss_ota

lrf : 모델이 훈련을 진행하다가 Local Minmum에 도달했을 때, lr이 작다면 빠져나가지를 못합니다. 우리의 목표는 모델 전체가 수렴이 되는 방향으로 학습을 진행하는 것이기 때문에 Global Minimum으로 향하도록 해야합니다. 따라서 LR을 순환하게 하여 적절한 타이밍마다 LR이 높아져 원하지 않는 최소 값에 빠지더라도 금방 빠져나와 계속해서 수렴되도록 할 수 있습니다.
warmup : 위에서 설명한 이야기와 비슷하게 LR을 낮은 값에서부터 서서히 높이는 것을 말합니다.
box, cls, obj loss : Yolo는 1-stage 모델로서 다양한 연산을 동시에 계산하되 독립적으로 구할 수 는 없습니다. 따라서 Loss를 계산 후에 다시받아오는 과정에서 Gain의 값을 변경하여 각 Loss에 가중치를 할당합니다. 예를 들어 일정 cell 안에 object가 존재하는지 존재하지 않는지를 판단하는 Loss인 obj loss는 Obj가 있는 것보다 없는 환경(배경)이 압도적으로 많기 떄문에 적절한 가중치를 주어 훈련에 사용하는 Loss의 비율을 적절하게 설정해야 합니다.
iou는 예측한 바운딩박스중에 정답 바운딩 박스와 겹치는 비율을 뜻한다. threshold를 상향함으로써 좀더 정밀한 객체인식을 할 수 있지만 단점으로는 인식되어야할 객체가 인식이 안될 수 있다.
IOU_t : iou 의 값의 임계값을 설정합니다. 임계값 이하의 BBox들은 모두 제거함으로써 훈련의 속도와 연산량을 줄이는 역할을 하게 합니다. 하지만 무작정 높이게 되면 예측하는 박스들 내부에 객체가 존재하는지 판단을 진행할수도 없기에 적절한 값 조절이 중요합니다.
mixup : 이미지 여러장을 하나의 Batch에 넣어서 훈련하는 것이 가능하도록 해줍니다. Cutmix와는 또 다르게 이미지들을 특정위치에서 자르지 않고, 원본이미지 그 자체를 사이즈말 조절하여 여러장을 붙여둡니다.
momentum : SGD 및 ADAM에서 사용하는 값입니다. 물리학에서 사용하는 모멘텀과 동일한 의미를 가졌으며, 운동량을 뜻합니다. 물체가 하나의 방향으로 지속적으로 이동하려는 특성을 의미합니다.
hsv : 색을 나타내는 표현을 의미합니다. 기존에 사용하던 방식인 RGB가 아니라 Hue, Saturation, value의 좌표를 사용하여 나타냅니다. 여기서는 해당 값을 어느정도로 변화하면서 이미지를 넣을지 정하는 것 같습니다. 실제로 사용된 증강 코드는 아래와 같습니다.
Flip : Augmentation 중 상하좌우로 이미지를 변환하는 증강작업을 의미합니다.