[7장 2] 음성으로 검색하다
1999년 음악 검색을 서비스를 제공할 목적으로 영국에서 샤잠 엔터테인먼트라는 회사를 설립한다. 샤잠은 약 150만 곡을 디지털화한 엔터테인먼트 UK와 제휴하여 음악에 대한 데이터베이스를 확보한다. 샤잠 엔터테인먼트는 음악 데이터베이스를 분석하여, 마이크가 내장된 기기를 통해서 음악의 일부분을 듣게 되면 그 노래의 정보를 보여주는 서비스를 출시한다. 2002년 영국에서만 서비스를 출시하였으며, 2580으로 전화를 걸어 음악을 들려주면 30초 후에 자동으로 통화를 종료하고 노래에 대한 정보를 SMS로 보내주는 서비스를 실시한다. 2004년에는 미국에 진출하여 뮤직폰(MP3폰)에서 음악을 검색할 수 있는 서비스를 출시하고 2006년에 유료화를 단행한다.
2008년 애플이 아이폰2를 출시하면서 앱스토어를 열자, 샤잠 엔터테인먼트사는 샤잠이라는 무료 음악 검색 앱을 출시한다. 스마트폰을 이용하여, 카페에 흘러나오는 음악 일부를 듣고 이 음악에 대한 제목, 가수 등의 정보를 보여주는 앱이었다. 샤잠은 검색된 음악을 구입할 수 있도록 지속적으로 개선했으며 10억 회 이상의 다운로드를 기록하며 가장 인기있는 앱 중에 하나가 된다. 뛰어난 음원 인식 기능을 인정받아 애플은 2017년 12월에 4억 달러에 샤잠 엔터테인먼트를 인수한다. 샤잠과 유사한 사운드 하운드 앱도 등장하고, 이후에는 이보다 기술이 진화하여 소리 자체를 인터페이스로 활용하여 음악을 작곡할 수 있는 험온(HumOn, 2016년)과 같은 앱이 출현하기도 한다.
샤잠의 음원 인식 기능은 음성 인식과는 데이터를 처리하는 방식 자체가 다르다. 그러나 소리라는 것을 통해 검색할 수 있는 새로운 인터페이스가 스마트폰에서 이용자들의 관심과 편의성을 증대시킨다는 점을 명확히 보여주었다. 이에 구글과 네이버, 다음 등 검색 포털들은 음성을 통해서 검색을 할 수 있는 기능을 개발하여 스마트폰 앱에 적용하기 시작한다. 2010년 구글과 다음은 스마트폰 앱에 한국어가 지원되는 음성 통합 검색 서비스를 출시하고 자연어를 이해하고 이를 검색 결과를 보여주기 시작한다.
음성 인식에 대한 기술은 오래 전 부터 연구가 되었으며, 영화에 AI와 음성으로 대화하는 장면이 많이 등장하기도 했다. 스마트폰이 등장하고 음성에 대한 데이터를 쉽게 축적할 수 있게 되면서 음성 인식은 새로운 전환점을 맞게 된다. 축적된 음성 빅데이터를 처리하고 AI를 통해서 분석하여 지능형 대화 인터페이스를 구성할 수 있을 정도로 발전을 한다. 멀티 터치 인터페이스가 제스쳐 등 인간의 행동을 모방하거나 최대한 직관적으로 UI를 구현하였다고 해도 음성처럼 인간에게 가장 친숙하고 편안한 인터페이스는 아니다. NUI(Natural User Interface)의 핵심 중 하나로 음성 인터페이스는 터치 인터페이스를 대체할 수 있는 최고의 인터페이스가 되기 위한 준비가 시작된 것이다.
애플이 시리를 출시하면서 음성 인터페이스는 단순한 인터페이스를 벗어나서 AI와의 결합을 통해 지능형 음성 인터페이스로 새로운 경쟁을 촉발한다. 이후 구글과 마이크로소프트는 이러한 지능형 음성 인터페이스를 이용한 개인 디지털 비서 앱과 스마트 스피커 분야로 경쟁의 범위가 점차 확대되기 시작한다. 아직까지 음성 인터페이스 기술 자체가 발전하고 있는 단계이며, AI를 통해서 가속화되고 있기는 하지만 터치 인터페이스를 완전히 대체할 수준에 이르지는 않았다. 또한 음성 인터페이스 자체만으로 모든 것은 대체한다고 보기는 어렵지만 이제 음성 인터페이스의 중요성에 대해서 간과하는 기업은 없을 것이다. (보다 자세한 내용은 다음 글에 포함되어 있습니다.)
인터페이스 혁신 이전글
7장 Siri, 오늘의 날씨는? : 음성 인터페이스와 AI
7장1.애니콜과 구글 411
6장 손가락이 지배하는 세상 : 터치 인터페이스 전성시대
6장1.PDA의 몰락과 아이폰
6장2.손가락이 혁신을 가져다 주다
6장3.아이패드의 연이은 성공
6장4.태블릿 PC의 귀환
6장5.매직 마우스와 매직 트랙패드
6장6.다시 연필로 돌아가다
2장 급격하게 몰락한 기업이나 기술의 공통점은 ? : 인터페이스 혁신 불감증-글모음
UI의 변화가
web => mobile => no ui ( 제스쳐, 음성 )
이렇게 흘러가는 거 같아요 ~ 아직은 다양하고 세밀한 컨트롤 까진 힘들지만 편한거 같아요
저같은 경우도 네이버 웨이브를 가지고 서
"셀리야 티비켜", "셀리야 날씨", "셀리야 뉴스", "셀리야 자장가 틀어줘 ..."
이런 식으로 쓰는데 좋네요 ~
네, 맞습니다. 이제 보이지 않는 인터페이스 시대가 도래할 거 같습니다.
아직은 기술이 발전하는 단계이기는 하지만,
경쟁이 워낙 치열해서 보다 빠른 시간에 이루어 질 것으로 보입니다.
시리나 스마트 스피커는 다음 글에서 다룰 예정입니다 ^^*
짱짱맨 호출에 출동했습니다!!
고팍스에서 MOC상장 에어드롭 이벤트를 진행합니다.
혜자스러운 고팍스!
https://steemit.com/kr/@gopaxkr/moc
출동 감사드립니다.
고팍스는 에어드랍 이벤트는 참고하도록 하겠습니다.
@joceo00님 글보고 들어오게 되었습니다. 상당히 좋은 컨텐츠네요. 좋은 책 나오길 기대합니다! 저도 책을 쓰고 싶긴 한데 정말 시간이 많이 드는 작업인 것 같아요. 혼자서 다하려면 어떻게 보면 부차적이지만 객관적인 자료 조사, 적절한 그림 같은 데에 정말 많은 시간이 들어가는 듯.
저도 @joceo00님 덕분에 보팅도 많이 받았습니다 ^^*
책쓰는 건 정말 힘들긴 합니다. 회사 다니면서 쓰면 주로 밤에 작업하게 되서,
수면 부족이 가정 큰 어려움이 되더군요.
그래도 한 번 시도해 보시면 굉장한 보람을 느끼실 수 있을 거예요~~~~
나중에 도움이 필요하시면 알려주세요~~~
나눔이벤트 참여 감사합니다!
보팅 꾹 누르고 갈게요!
네, 감사드립니다.
자주 들려주세요.
많은것을 배울수 있는 내용의 포스팅 감사드립니다!
좋게 봐주셔서 감사드립니다.
아직 연재할 내용이 많이 남아 있어요 ^^*
올해의 이슈 중 하나가 음성 ai 라는데 얼만큼 실생활에 유용하게 발전될지 기대가 됩니다.
아직 발전 중인 기술로 볼 수 있을 것 같습니다.
인식률이 획기적으로 높아지기는 했지만,
이에 맞는 서비스도 개발이 되어야 할 것 같습니다.
핫한 분야이니 만큼 선점 경쟁은 치열한 상황으로 보입니다.