내용요약 음성을 텍스트로 변환해주는 ‘실시간 스트리밍’ 기능 추가
다국어 지원과 음성 어절 단위 텍스트 형성이 특징
네이버클라우드 로고 이미지./ 네이버클라우드 제공
네이버클라우드 로고 이미지./ 네이버클라우드 제공

[한스경제=김정연 기자] 네이버클라우드가 인공지능(AI) 기반으로 음성을 텍스트로 변환하는 서비스인 기업용 ‘클로바 스피치’에 실시간 방송 속 화자의 음성을 추출해 바로 자막을 생성하는 ‘실시간 스트리밍’ 기능을 출시했다고 2일 밝혔다.

음성-텍스트 변환(STT)기반 서비스인 클로바 스피치는 현재 네이버 뉴스의 자동 자막 생성 기능, 네이버 쇼핑라이브, 고객센터 통화 데이터 관리 등에 적용되고 있다.

신규 기능인 실시간 스트리밍은 라이브 방송과 같은 실시간 스트리밍 영상에서 화자가 말하는 내용을 즉시 텍스트로 추출해주는 기술이다. 한국어,영어,일본어 3개 국어를 지원하며 음성의 어절 단위로 텍스트가 형성된다.

이 기술을 활용하면 기존 방식의 속기사 타이핑 작업 없이 실시간으로 자막을 송출할 수 있다. 고객센터에서도 통화 내용을 즉각 텍스트화해 모니터링 할 수 있어 빠른 고객 대응이 가능해진다.

아울러 네이버클라우드는 실시간 스트리밍 출시에 맞춰 서비스 요금을 인하했다. 음성인식·화자인식 비용의 경우 기존보다 40% 비용을 낮추고, 단일 요금제로 제공하던 것을 음성인식, 화자인식, 이벤트 탐지 기능별로 요금을 세분화했다. 영어 발음의 정확도 판단 기능도 선택 옵션으로 추가했다.

김정연 기자

저작권자 © 한스경제 무단전재 및 재배포 금지