멀티모달 방식으로 제작된 대규모 언어모델
텍스트와 음성 간 상호작용 분석해 감정 읽어

[서울와이어 천성윤 기자] 메타가 감정 상태를 반영하는 신규 인공지능(AI)를 선보인다.
20일 벤처비트 등 외신에 따르면 메타는 시각·청각 등 여러 유형의 데이터를 함께 활용하는 방식(멀티모달)으로 제작된 언어모델 ‘메타 스피릿 LM’을 깃허브(GitHub)를 통해 출시했다.
스피릿 LM은 텍스트와 음성 데이터를 함께 학습시켜 두 형태 사이의 상호작용을 분석해 사용자 감정을 읽어낸다.
이 프로그램은 70억개 매개변수 규모의 텍스트와 음성 데이터를 연계한 학습과정을 거쳤으며 스피릿 LM 베이스와 스피릿 LM 익스프레시브 2가지 모델로 제공된다.
스피릿 LM 베이스는 음성을 중심으로 데이터를 입력 받아 답변을 제공하며, 스피릿LM 익스프레시브는 추가로 음성의 높낮이 등을 인식해 화자의 감정 표현까지 인식해 제공한다.
분노, 놀라움, 기쁨 등의 감정 상태를 감지하고 이를 답변 등에 반영할 수 있어 가상 비서, 챗봇 등에서 보다 자연스러운 의사소통과 서비스를 제공할 수 있을 전망이다.
메타 측은 “보다 자연스럽고 표현력이 풍부한 AI 모델을 개발하고 오픈소스로 제공할 계획”이라며 “이를 통해 AI 커뮤니티에서 멀티모달 AI 애플리케이션에 대한 새로운 가능성을 열 수 있도록 지원할 것”이라고 밝혔다.
천성윤 기자
csy@seoulwire.com
