Notice
Recent Posts
Recent Comments
Link
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Archives
Today
Total
관리 메뉴

덕배의 블로그

인공지능(AI) 딥러닝 YOLO-NAS에 대해서 알아보자 본문

인공지능

인공지능(AI) 딥러닝 YOLO-NAS에 대해서 알아보자

김덕배_KDB 2023. 7. 8. 04:41
반응형

YOLO-NAS란?

mAP(평균 정밀도) 및 추론 대기 시간 측면에서 YOLOv6 및 YOLOv8 모델을 모두 능가하는 새로운 실시간 최첨단 객체 감지 모델 기존의 YOLO 모델들의 제한 사항인 적절하지 않은 양자화 지원 및 부족한 정확도-지연 시간 트레이드오프를 개선하여 실시간 객체 검출 능력의 경계를 확장.

yolo 모델 성능 지표
Yolo 모델 그래프 지표

Deci.ai 팀에서 개발한 YOLO-NAS는 프로덕션용으로 특별히 설계가 되었고 NVIDIA® TensorRT™ 와 같은 고성능 추론 엔진과 완벽하게 호환되며 전례 없는 런타임 성능을 위해 INT8 양자화를 지원한다.

 

 

Deci의 개선된 YOLO-NAS

1. NAS(Neural Architecture Search)

일단 전통적으로 신경망 아키텍처는 경험과 직관을 기반으로 인간 전문가가 수동으로 설계했다. 그러나 가능한 아키텍처의 방대한 디자인 공간을 탐색하는 이 프로세스는 항상 시간이 많이 걸리고 번거롭다.

 

반면에 NAS는 속도, 메모리 사용량 및 처리량과 같은 성능을 향상하기 위해 모델의 아키텍처를 자동으로 재설계한다. 일반적으로 계층 수, 계층 유형, 커널 크기 및 연결 패턴과 같은 가능한 아키텍처 선택 집합을 정의하는 검색 공간이 포함된다. 그런 다음 검색 알고리즘은 주어진 작업 및 데이터 세트에 대한 교육 및 평가를 통해 다양한 아키텍처를 평가한다. 이러한 평가를 기반으로 알고리즘은 아키텍처 공간을 반복적으로 탐색하고 개선하여 궁극적으로 최고의 성능을 내는 공간을 반환한다.

 

AutoNAC(Automated Neural Architecture Construction) 기술은 모든 하드웨어를 최대한 활용하는 알고리즘 최적화 엔진입니다. 여기에는 기본 정확도를 유지하면서 특정 대상 하드웨어에 대한 추론 성능(처리량, 대기 시간, 메모리 등)을 최적으로 개선하기 위해 주어진 훈련된 모델의 아키텍처를 재설계하는 신경망 아키텍처 검색(NAS) 구성 요소가 포함되어 있습니다. AutoNAC는 Deep Learning Acceleration Platform을 지원하는 Deci의 독점 기술이다.

 

2. 양자화

양자화는 신경망의 가중치, 바이어스 및 활성화를 부동 소수점 값에서 정수 값(INT-8)으로 변환하여 모델을 더 효율적으로 만드는 것을 말한다.

  • 모델은 재매개변수화와 INT-8 양자화의 장점을 결합한 양자화 친화적인 블록을 사용합니다. 이 블록은 Chu 등 이 제안한 방법론을 사용합니다. (2022) , 블록이 생성하는 가중치 및 활성화 분포가 양자화에 유리하도록 블록을 재설계한다.
  • 모델의 특정 레이어를 선택적으로 양자화하는 하이브리드 양자화 방법을 활용하여 정보 손실을 최소화하고 대기 시간과 정확도 간의 균형을 유지한다.
  • 이 새로운 방법론의 결과는 자명한다. 위에 그래프에서 볼 수 있듯이 양자화된 중간 크기 모델인 YOLO-NAS-INT8-M은 추론 대기 시간이 50% 향상되었으며 동시에 최신 모델에 비해 정확도가 1 mAP 증가.

nas 여러 모델
다양한 nas 모델

 

  • 세 가지 모델이 출시되었는데 S, M, L이 있다.
  • 당연하게도 양자화된 버전은 정밀도가 약간 떨어지지만 이러한 새로운 양자화 친화적 블록과 선택적 양자화의 사용으로 인해 이러한 정밀도 저하가 상대적으로 적다. 또한 추론 대기 시간에서 상당한 개선이 관찰되어 여기에서 장점이 단점보다 상당히 크다.

 

3. 사전 훈련 방식

YOLO-NAS는 또한 COCO, Objects365 및 Roboflow 100 데이터 세트에 대해 사전 훈련되어 있어 다운스트림 객체 감지 작업에 매우 적합.

사전 훈련 방식은 지식 증류라는 개념을 활용하여 모델이 성능을 개선하기 위해 외부의 레이블이 지정된 데이터에만 의존하지 않고 자체 예측에서 학습할 수 있도록 함.

이 패러다임에서 교사 모델은 교육 데이터에 대한 예측을 생성한 다음 학생 모델에 대한 지침(또는 소프트 타깃) 역할을 한다.

학생 모델은 원본 레이블 데이터와 교사 모델에서 생성된 소프트 타깃을 모두 사용하여 교육됩니다. 본질적으로 교사 모델의 예측을 모방하는 동시에 원래 레이블이 지정된 데이터와 일치하도록 매개변수를 조정한다.

전반적으로 이 접근 방식을 사용하면 모델이 더 잘 일반화되고, 과적합이 줄어들고, 특히 레이블이 지정된 데이터를 충분히 사용할 수 없을 때 더 높은 정확도를 달성할 수 있다.

 

 

4. 분포 초점 손실(DFL)

분포 초점 손실(DFL)의 통합을 통해 훈련 과정이 더욱 강화.

DFL은 분류하기 어려운 샘플에 더 높은 가중치를 할당하여 클래스 불균형 문제를 해결하는 초점 손실의 개념을 확장한 손실 함수이다.

객체 감지와 관련하여 DFL은 학습 상자 회귀를 분류 작업으로 학습 프로세스에 사용.

경계 상자 예측을 제한된 옵션으로 이산화 하고 이러한 옵션에 대한 분포를 예측.

그런 다음 가중 합계를 사용하여 이러한 분포를 결합하여 최종 예측을 얻고

클래스 분포를 고려하고 그에 따라 손실 함수를 조정함으로써 모델은 과소 대표된 클래스에 대한 탐지 정확도를 높일 수 있다.

Deci의 PyTorch 기반 컴퓨터 비전 라이브러리인 SuperGradientsSuperGradients에서 연구용으로 사용할 수 있는 사전 훈련된 가중치와 함께 오픈 소스 라이선스로 제공

 

아래 사이트를 이용하면 NAS에 대해 더 알 수 있다. 참고하면 좋을 거 같다

 

https://github.com/Deci-AI/super-gradients

 

GitHub - Deci-AI/super-gradients: Easily train or fine-tune SOTA computer vision models with one open source training library. T

Easily train or fine-tune SOTA computer vision models with one open source training library. The home of Yolo-NAS. - GitHub - Deci-AI/super-gradients: Easily train or fine-tune SOTA computer vision...

github.com