“인공지능(AI)은 처음 본 이미지를 얼마나 정확하게 이해하고 설명할 수 있을까?”

LG AI연구원은 2월 1일부터 4월 말까지 전 세계 AI 연구자를 대상으로 ‘LG 글로벌 AI 챌린지’를 온라인으로 연다고 31일 밝혔다.

대회 주제는 ‘제로샷 이미지 캡셔닝’이다. AI가 처음 본 사물, 동물, 풍경 등이 포함된 이미지를 보고 기존 학습 데이터를 기반으로 스스로 이해하고 유추한 결과를 텍스트로 설명하는 기술이다.

이 기술이 고도화되면 이미지 인식 AI 기술의 정확성과 공정성이 높아져 인간의 실생활에 직접 도움을 줄 수 있다.

예를 들어 AI가 온라인상에 올라오는 방대한 분량의 이미지 데이터에 자동으로 캡션과 키워드를 생성해 검색 편의성과 정확도를 높인다.

AI가 의학 전문 데이터를 추가로 학습하면 의학 영상을 분석하는 ‘의학 전문가 AI’로도 활약할 수 있다.

LG AI연구원은 초거대 AI ‘엑사원’을 공동 연구 중인 서울대 AI대학원, 세계 최대 규모 이미지를 보유한 크리에이티브 플랫폼 셔터스톡과 함께 이번 대회를 연다.

셔터스톡은 편향성과 선정성 등에 대한 AI 윤리 검증을 끝낸 고품질 이미지-텍스트 데이터셋 2만6천개를 무료로 제공한다.

또 LG AI연구원은 올해 6월 캐나다 밴쿠버에서 열리는 컴퓨터 비전 분야 세계 최고 권위 학회 ‘CVPR 2023’에서 ‘제로샷 이미지 캡셔닝 평가의 새로운 개척자들’을 주제로 워크숍을 한다.

구글, 마이크로소프트 등에서 AI 연구를 하는 전문가와 글로벌 석학들이 이미지 캡셔닝 기술 연구의 방향성과 확장성, AI 윤리 문제 등을 논의한다.

‘LG 글로벌 AI 챌린지’ 최종 수상팀은 워크숍에서 성과를 발표할 기회를 얻는다.

이경무 서울대 AI대학원 석좌교수는 “이미지 캡셔닝은 영상에 나오는 객체들의 관계부터 상황과 문맥까지 이해해 인간의 언어로 표현하고 설명하게 하는 것으로, AI가 인간의 지능에 얼마나 가까워졌는지 보여주는 척도”라고 설명했다.

아울러 “LG AI연구원, 서울대 AI대학원, 셔터스톡이 세계 최초로 챌린지와 워크숍을 공동 진행하는 것은 우리나라 AI 역량이 이미 세계적인 수준에 도달했음을 의미하며 국제적 리더십을 더욱 높이는 계기가 될 것”이라고 기대했다.