AI 세계 챔피언 결정전 "ImageNet"에서 중국팀이 상위 독점

중국 정부는 2030년까지 AI(인공 지능) 분야에서 세계 톱이 되기위해, 기업과 정부, 군대에 대한 대규모 투자를 할 것을 공표하고 있다. 올해는 세계적인 이미지 인식 경연 대회 인 "ImageNet"에서 전체 27개 팀 중 절반 이상을 중국 세력이 차지해 상위를 독점했다. 컴퓨터에 의한 화상 인식 정확도를 겨루는 ImageNet은 AI영역에서 세계 챔피언 결정전이라는 경연이다.

지난해에도 참가 84 팀 중, 중국 세력이 상위를 독점했었다. 구글은 2014년에 우승 한 이후 ImageNet에 참여하지 않고있다. 지난 2년의 성적을 본다면, 중국이 AI 분야에서 세계 리더로 군림 할 날도 머지않은 것 같다.

올해 ImageNet에서는, WMW라는 팀이 "squeeze and excitation"이라는 신기술을 개발하고, 이미지 확인 작업으로 전년 기록의 오류 비율 2.99%를 조금 웃도는 2.25%를 달성했다. WMW의 구성원은 베이징에 본사를 둔 자동 운전 신생 기업 "Momenta"의 연구자 인 Jie Hu와 Gang Sun 외에도 옥스포드 대학의 Li Shen이 포함되어 있다.

물체 감지 작업(컴퓨터가 물체를 인식하고, 이미지로 식별하는 작업)에서 DBAT라는 팀이 전년 기록의 정답률 66.3%를 크게 웃도는 73.1%를 달성하며 우승했다. DBAT는 난징 대학의 연구원 8명과 임페리얼 칼리지 런던의 연구자 2명으로 구성되어있다.

ImageNet(일명 Large Scale Visual Recognition Challenge)은 2010년에 시작하여 이후 AI 분야에서 가장 영향력있는 이벤트가 되었다. 특히 2012년 대회는 AI와 딥러닝에 큰 전환기를 맞이한 년도로 토론토 대학 박사 과정에 재학중인 Alex Krizhevsky가 이끄는 팀이 이미지 식별 오류 비율 15%를 달성해 전년 기록의 25%에서 크게 향상시켰다.

- 딥러닝의 최첨단 경쟁

그들이 개발 한 "AlexNet"이라는 모델은, 딥 러닝의 능력의 높이가 증명되었다. 딥 러닝은 1950년대부터 존재하고 있었지만, 그때까지 심각하게 다루어 오지 않았다.

"2012년은 AI에 큰 돌파구가 됨과 동시에 수십 년 전부터 존재 한 딥 러닝 모델의 개념 증명이 이루어진 해였다. 이 AI 시스템이 대규모 이미지 인식 작업에거 가장 먼저 입증됐다"고 프린스턴 대학 교수로 ImageNet의 주최자 인 Olga Russakovsky 씨는 말하고 있다.

그 후, 딥 러닝은 AI 커뮤니티에서 폭발적으로 보급되었다. 이 AI 시스템은, 인간의 뇌의 대부분인 뉴런과 시냅스를 통해 네트워크를 형성하도록 기능하고, 방대한 데이터를 학습해 패턴을 알아낼 수 있다.

2012년 이후, 구글, 마이크로 소프트 등 주요 IT 기업도 ImageNet에 참여하게되었다. 2014년에는 구글에서 "GoogLeNet"이라는 팀이 참가하여 물체 검출의 정답률로 전년 기록의 22.6%를 크게 웃도는 43.9%를 달성했다.

ImageNet은 신생 기업이 기술력을 어필 할 수 있는 좋은 장소이기도 하다. 2013년 현재 30세의 AI 연구자 Matthew Zeiler가 설립 한 "Clarifai"가 이미지 식별 작업에서 우승하며 Krizhevsky가 세운 오류률 15%를 웃도는 12%를 달성했다.

당초, ImageNet 주최자들은 2014년에 화상 인식 작업을 종료하고 물체 위치 추적 및 검색, 동영상 인식 등에 전념하려고 생각하고 있었지만, 기술 기업의 의도에 따라 종전의 작업을 계속 해왔다.

그러나 성능이 포화 상태에 이르고 있기 때문에, ImageNet은 종료하는 것으로 정해졌다. "더 이상 정밀도가 향상될 여지는 작다"고 ImageNet 주최로 노스캐롤라이나 대학교 채플 힐의 규수이기도 한 Alex Berg는 말한다.

- 심천에서 유력한 신생 기업이 등장

"ImageNet은 아직 큰 발전을 거듭하고 있지만, 다른 작업과 데이터 집합으로 마이그레이션 하는 것이 AI 지역 사회에 건전하다"고 Russakovsky도 말하고 있다. Russakovsky는 향후 ImageNet을 대신하는 AI 컨테스트로 COCO(Common Objects in Context)를 꼽는다.

Breg는 스마트폰 카메라로 촬영 한 현실 사회의 데이터를 이용한 화상 인식 경연 대회 개최를 검토하고 있다고 한다. 이 외에도 WebVision이라는 대회가 있다. 이것은 ImageNet이 레이블 데이터를 사용하는 것과 달리 레이블이 되지 않는 웹 이미지를 이용한 화상 인식 작업을 참가자들에게 부과하고 있다.

WebVision의 결과가 최근 발표되었지만, 우승자는 심천에 본사를 둔 AI 기업 Malong Technologies로 정답률은 94.78%였다. 회사는 비상장 기업이면서 심천시 정부의 지원을 받아 칭화대와 공동으로 AI 연구소를 설립했다. 심천 시내에서 일어 섰던 AI 프로젝트에 100만 달러의 지원을 실시하고 있다.

"AI는 경쟁이 격화되고 있으며, 획득 된 무기는 무엇이든지 획득 할 필요가 있다. 정부의 지원은 중국에서 AI 기업을 시작하는 큰 장점 중 하나가 되고있다"고 Malong Technologies의 공동 창업자 인 Matt Scott는 말했다. 이 회사는 전직 마이크로 소프트의 Scott과 칭화대학 출신의 Dinglong Huang 들이 2014년에 설립 한 기업이다.

저작자표시 비영리 변경금지 (새창열림)

막스무스

AI 세계 챔피언 결정전 "ImageNet"에서 중국팀이 상위 독점

티스토리툴바