2019년, 페이스북 AI 연구소(FAIR)가 공개한 '디텍트론2(Detectron2)'는 연구 및 개발자들에게 맞춤형 모듈을 어떤 물체 탐지 시스템에도 연결할 수 있는 쉬운 경로를 제공한다.
여기에, 페이스북 리얼리티 랩스(FRL)의 모바일 비전 팀이 4일(현지시간) 디텍트론2를 기반으로 모바일 기기와 하드웨어에 효율적인 딥러닝 객체 탐지 모델을 학습하고 배포하기 위한 새로운 확장 플랫폼 '디텍트론2고(이하, D2Go)'를 오픈 소스로 공개했다.
D2Go는 디텍트론2, 파이토치 모바일(PyTorch Mobile)과 널리 사용되는 데이터 세트, 모델 아키텍처 및 컴퓨터 비전을 위한 일반적인 이미지 변환하는 토치비전(TorchVision- 다운) 기반으로 구축되었다. 이를 통해 연구 및 개발자들이 학습에서 모바일 배포에 이르기까지 머신러닝 모델을 온 디바이스에 쉽게 적용할 수 있도록 지원한다.
객체 탐지는 지연 시간(속도)과 정확도의 두 가지 핵심 요소에 의존한다. 예를 들어, 자율주행차의 안전대책을 고려하거나, 위험을 식별하기 위해 사용하거나, 인스타그램에 원활한 증강현실(AR) 경험을 만들 수도 있다. 이와 같은 경우 시스템은 객체를 정확하게 감지하고 식별할 수 있어야 할 뿐만 아니라 신속하게 식별할 수 있어야 한다.
그러나 많은 비전 시스템이 직면하고 있는 과제는 지연(대기)시간이다. 서버 또는 클라우드 기반 모델을 사용하는 디바이스가 데이터를 수집하고 처리하기 위해 클라우드로 보낸 다음 실행하는 데 시간이 걸린다. 그러나 모델이 기기 자체 내에서 실행할 수 있다면 이러한 대기 시간을 크게 단축할 수 있다.
D2Go의 개인 키포인트 추정 시연이미지
또한 온 디바이스 모델은 최종 사용자에게 추가적인 보안 및 개인 정보 보호 혜택을 제공한다. 음성 및 자연어 처리(NLP) 작업과 유사하게, 객체 인식은 사람들이 중요한 데이터(예: 개인 이미지)가 클라우드로 전송되는 것을 걱정한다는 의미에서 개인 정보 보호 문제를 수반한다. 이 플랫폼 D2Go는 모든 처리가 엣지에서 온 디바이스로 처리된다. [기사 더보기]
[출처 : 인공지능신문(http://www.aitimes.kr)]
[기자 : 최창현 기자(aitimes@naver.com)]