카카오브레인은 한국어 특화 인공지능(AI) 언어모델 ‘KoGPT’를 오픈소스 커뮤니티 깃허브에 공개했다고 16일 밝혔다.

‘KoGPT’는 카카오브레인의 오픈 API(응용프로그램 인터페이스) 언어 모델 ‘GPT-3’의 한국어 특화 버전으로, 60억개 매개 변수와 2천억개 토큰의 한국어 정보로 구축됐다.

‘GPT-3’는 인간과 AI가 자연어 기반으로 소통할 수 있도록 감정 분석까지 갖춘 기술이다.

예를 들어 영화 평가 댓글을 보고 댓글이 영화에 대해 긍정적인지 부정적인지 판별할 수 있고, 글의 내용을 짧게 요약할 수 있다. 인과관계 추론도 가능하다.

‘KoGPT’는 한국어를 사전적, 문맥적으로 이해하며 문장의 긍정 부정 판단, 긴 문장 한 줄 요약, 결론 예측, 문맥을 이해해 질문에 답변 등 과제를 수행한다.

카카오브레인은 앞으로 영어, 일본어 모델도 준비해 오픈소스화할 예정이다.

김일두 카카오브레인 대표는 “앞으로 GPT 기술의 사이즈와 성능을 100배 규모로 키울 것”이라며 “GPT를 오픈소스로 개방해 일반 대학이나 스타트업 등의 기술 접근성을 높일 것”이라고 밝혔다.