음성인식

  • HOME > 
  • 음성인식 > 
  • Selvy STT-Server

Selvy STT-Server

음성 검출, 특징 추출, 음향 모델, 탐색 및 후 처리로 이어지는 음성인식 전 과정의
핵심 구성 요소를 모두 독자 개발하였습니다.
우리말의 특성과 발성 습관을 반영하여 한국어에 대한 높은 인식률을 확보하였으며,
10년 이상의 연구 개발과 상용화 실적을 통한 수준 높은 컨설팅을 지원합니다.
  • 고립 명령어, 대용량 POI, 가변어, 연결어, 핵심어 인식 등 인식 단어 확장/변경 가능
  • H/W 스펙 및 적용 시나리오에 따라 적용 가능한 다양한 인식 엔진 보유
  • 사용자 발성의 신뢰도 점수 계산을 통해 재발성 유도 및 오인식 방지
  • 복수 음향 모델 적용을 통해 조용한 환경 뿐만 아니라 다양한 잡음 환경에서도 인식성능 보장
  • 간결한 API 구성을 통해 개발 효율화 및 개발 기간 단축 가능
  • 소량의 시스템 리소스로 구동 가능
  • 인식 엔진 라이브러리 모듈화를 통해 업그레이드 편의성 지원
  • 다채널 잡음 제거 기술 적용으로 소음에 강한 인식 성능 보유
  • GS(Good Software) 인증 획득을 통해 검증된 솔루션

Selvy STT-WiseTell

WiseTell은 음성 인식 콜센터 구축을 위한 다중 키워드 기반의 대화형 음성인식 솔루션입니다.
콜센터에 연속어 음성인식(STT) 기술을 적용, 고객이 문의사항을 단답형이 아닌 보다 자연스럽게 발화할 수 있도록 하여
대 고객 편의성을 향상하고 보다 신속한 처리가 가능하도록 지원합니다.
주요 응용사례  
콜센터 ARS시스템
ARS 시스템의 다양한 가변의 고객정보를 음성으로 검색하는 서비스에 적용
(은행, 증권, 보험, 카드, 교통, 항공, 날씨, 문화, 고객센터)
보이스포탈
Web 및 전화망에서 실시간 정보를 음성으로 검색하는 서비스에 음성인식 적용
음성인식 자동교환
무인 전화 자동안내 교환시스템에 음성으로 담당부서 또는 담당자명을 음성으로
검색하여 전화 연결하는 시스템에 적용
 

솔루션 특장점

제품사양 / 구분 Selvy STT-Server
리소스 ROM : 200MB
RAM : 기본 500MB, 20MB/CH (10만 어휘 기준)
기준 H/W사양 2.0GHz Xeon * 2EA (8코어) CPU
메모리 4GHz, DL380 G6
채널 용량 10만 단어 기준 : 최대 60채널
응답 속도 0.69초 (60채널 평균)
주) 1초 데이터 전송 및 인식결과 얻기까지
OS MS Windows (2000, XP, Server)
Linux Red Hat (7.X, 8.0, 9.0)
언어 Server-Client Stand-Alone
Sampling 8kHz DSR(8kHz,16kHz) 8kHz 16kHz
화자독립 Yes Yes Yes Yes
인식 어휘수 100,000 어휘 내외
연결어 인식 Yes Yes Yes Yes
가변어 인식 Yes Yes Yes Yes
응답속도 2초이내 2초이내 2초이내 2초이내
적용분야 CTI, VAD Mobile, Potal,
Robot
CTI Kiosk, Robot