-
annyang 음성인식 사용개발/개발관련 2020. 7. 15. 14:19반응형
0. 음성인식 사용 이유
전에 손동작을 이용해 이벤트를 발생시키려했지만 현재 개발에 적용하기엔 허들이 많이서 음성인식으로 변경.
음성인식은 전에 잠깐 javascript api가 있는 기억이 남.
1. 음성인식 종류
음성인식 할 수 있는 방법이 많음.
google stt, naver 음성인식, kakao 음성인식, annyang.js 등등.
각 장단점이 있다.
1. google stt
장점 : google이라는 이름값. 언어가 다양함. 스트리밍시 바로 자막 나옴.
단점 : 상업용으론 무료로 쓸 수 없음. 비상업용이어도 한도 넘어갈때 과금됨. 한글 인식 정확성이 naver, kakao보다 떨어짐. sdk, rest api로만 제공됨.2. naver 음성인식
장점 : kakao와는 다르게 ai적용 되어있음. 한국어 인식이 kakao보다 뛰어남.
단점 : 인식 가능 언어가 4개밖에 없음. 인식 가능 시간도 1분으로 google보단 짧음. 구글과 같이 한도가 있음. sdk, rest api로만 제공됨.기타 : 상업용으로 써도 한도까진 무료로 쓸 수 있는진 안나옴.
3. kakao 음성인식
장점 : google보다 한국어 인식이 좋음. 상업용으로 이용가능함(카카오 로고를 삽입해야함)
단점 : naver와 다르게 ai 적용 안되어있음. sdk, rest api로만 제공됨.4. annyang.js
장점 : javascript로 음성인식이 가능함.
단점 : javascript lib다보니 speech관련 기능이 부라우저에서도 제공이 되어야 사용가능. 현재 크롬과 엣지만 가능함.https://developer.mozilla.org/en-US/docs/Web/API/Web_Speech_API#Browser_compatibility
그래서 처음엔 간단하게 annyang.js로 해보고 내가 원하는 기능이 구현되지 않는다면 google stt를 이용하고, 한글이 생각보다 인식이 잘 안된다면 마지막엔 naver 음성인식으로 구현해보려함.
2. annyang.js
annyang.js 홈페이지에 나와있는데로 하면 되긴하는데 SpeechKITT은 제대로 작동이 안됨. 수정이 필요함.
SpeechKITT시작 위에 annyang관련된 부분을 유지해야함.
//commands 정의하는 부분~~ annyang.addCommands(commands); annyang.debug(); //입력된 음성을 크롬 console에 출력함 annyang.setLanguage('ko'); //언어를 한글로 SpeechKITT.annyang(); SpeechKITT.setStylesheet('//cdnjs.cloudflare.com/ajax/libs/SpeechKITT/0.3.0/themes/flat.css'); SpeechKITT.vroom();
위와 같은 마이크 이미지가 나오는데 마이크 클릭하고 말하면 됨.
그런데 음성 인식해서 출력까지 시간이 조금 걸리는 듯 함.
3. 수정사항
이젠 문장을 듣고 출력해서 그 안에 내가 원하는 단어들이 있는지에 따라 이벤트를 다르게 발생하게끔 구현해야함.
문장을 받아서 단어가 있는지 찾으면 될거같은데 될려나.
반응형'개발 > 개발관련' 카테고리의 다른 글
Threejs Texture marked for update but image is incomplete 경고 (0) 2020.08.25 Google STT 테스트 결과 (0) 2020.07.23 Google mediapipe 손동작 인식 (0) 2020.07.15 ie에서 forEach 못쓰는 경우 (1) 2020.04.06 단순 프로젝트 빌드 배포 서버에서 확인 (0) 2020.03.27 댓글