50
AWS기반 AI/빅데이터 사례 발표 ~AI 서비스 기반의 이용 사례~ 김현민, Megazone 2018-02-27

AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

AWS기반 AI/빅데이터 사례 발표~AI 서비스 기반의 이용 사례~

김현민, Megazone

2018-02-27

Page 2: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

발표자 소개

• 김현민

• Software Engineer 5년

• 현재 메가존 SA팀에서 AWS Solutions Architect 업무

Page 3: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

발표순서

• Amazon AI 서비스 소개

• Polly

• Rekognition

• Lex

• Alexa

• Q&A

Page 4: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

아마존의 인공지능(AI) 서비스

• 수천명의 아마존 직원들이 수년간 AI, 머신 러닝에 집중

• 연구/검색 분야

• 주문 처리 및 배송

• 제품 개선

• 새로운 제품 영역 개발 – Alexa

• Amazon Machine Learning

Page 5: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

아마존의 인공지능(AI) 서비스

Search &

Discovery

Fulfilment &

Logistics

Existing

Products

New

Initiatives

Page 6: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

아마존의 인공지능(AI) 서비스

Amazon Dash

Amazon PrimeAirAmazon Robotics Amazon Echo

Amazon go Amazon Key

Page 7: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Polly

Page 8: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Polly

• 딥 러닝 기술을 이용해서 텍스트를 실제와 같은 음성으로 변환하는 서비스

• 텍스트를 실제 일상에서와 같은 음성으로 변환

• 완전 관리형 서비스

• 25개 언어, 52개의 실제와 같은 음성을 제공

• 개발자를 위한 낮은 응답시간 및 최적화

• 한국어 지원!! (2017년 11월 16일부터)

Page 9: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Polly 지원 언어유럽 지역

• Danish

• Dutch

• British English

• French

• German

• Icelandic

• Italian

• Norwegian

• Polish

• Portuguese

• Romanian

• Russian

• Spanish

• Swedish

• Turkish

• Welsh

• Welsh English

미주 지역

• Brazilian Portuguese

• Canadian French

• English (US)

• Spanish (US)

아시아태평양

• Australian English

• Indian English

• Japanese

• Korean

Page 10: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Polly, 딥 러닝 기반의 서비스

• 자동으로 정확한 텍스트 인식 및 음성 처리

Today in Las Vegas, NV it's 90°F.

“We live for the music" live from the Madison Square Garden.”

Page 11: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Polly, 딥 러닝 기반의 서비스

• 한국어 Polly 음성 지원

안녕하세요. 제 이름은 서연이예요.저는 이제 한국어로 말할 수 있습니다.길게도 말할 수 있고,짧게도 말할 수 있습니다.만나서 반갑습니다.

Page 12: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Polly 음성속도, 높이 및 크기 조정

• 일반적인 음성

This is how I speak normally.

• 높은 톤, 낮은 톤

I can speak in a higher pitched voice, or I can speak in a lower pitched voice.

• 느리게, 빠르게

I can speak really slowly, or I can speak really fast.

• 시끄럽게, 조용하게 말하기

안녕하세요. 전 서연이라고 해요. 저는 큰 소리로 말할수도 있고, 조용하게 말할수도 있어요.

• 속삭이듯 말하기

저는 속삭이듯 말할수도 있어요.

내가 사람으로 보이니?

Page 13: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

언어학습 어플리케이션 듀오링고에서 Polly 사용

• 듀오링고

“Amazon Polly를 사용해서 시장에서 구할 수 있는 가장 사실적인 텍스트 음성 표현의 혜택을 누려보십시요.”

Severin Hacker CTO, Duolingo

• 말하기가 중요한 언어 학습

• 정확한 발음 문제

• TTS 덕분에 반복 속도가 빨라짐

• 사람이 말하는 거 같이 자연스러움

• 다국어 지원

Page 14: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Polly 사용, 국내 업체 사례

• 국내 O모 고객사 사례

• 채용 웹사이트 기능 중 언어로 설명하는 기능 구현

• V모사 TTS 솔루션 (약 1000만원/1년) 도입 검토 중, Polly 한국어 지원 출시 소식 들음

• 경쟁사 대비 훨씬 자연스러운 음성

• 저렴한 도입 비용

• 비용이 발생하는 TTS 솔루션 대신 Polly로 변경하기로 결정함

Page 15: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Polly 비용

• Amazon Polly에서는 사용한 만큼만 비용을 지불합니다. 설정 비용 및 최소 비용이 없습니다.

• 프리티어 이용 가능*

• Amazon Polly 프리 티어에는 첫 번째 음성 요청을 시작으로

처음 12개월 동안 매월 500만 개의 음성 또는 인용 부호 요청에 대한 문자가 포함되어 있습니다.

• 사용량에 따라 음성 요청의 문자 1백만 개당 $4.00 지불(프리 티어를 초과한 경우).

• 사용량에 따라 인용 부호 요청의 문자 1백만 개당 $4.00 지불(프리 티어를 초과한 경우).

• 한 자당 $0.000004 (요청 1,000건, 요청당 문자 1,000개, 문자 100만개, ~23시간 8분 기준 $4.00)

• 일반적인 이메일 메시지 (~문자 3,100개, ~4분 기준 $0.02)

• 일반적인 신문 기사 (~문자 6,500개, 3페이지, ~9분 기준 $0.03)

• Adventures of Huckleberry Finn (허클베리핀의 모험) – 책 원문 전체에 대해서 약 $2.4

Page 16: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Rekognition

Page 17: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Rekognition

• 딥러닝 기반의 수백만 이미지 인식/분석 서비스

• 객체 및 장면 인식

• 얼굴 분석

• 얼굴 비교

• 얼굴 인식

• 유명인사 인식

• 이미지 조정 (부적절한 컨텐츠 필터링)

Page 18: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Rekognition: 객체 및 장면 탐지

Page 19: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

객체 및 장면 탐지 응용

• 사진 공유 어플리케이션 혹은 서비스

• 렌탈 관련 서비스의 경우 사진을 올리면 알아서 특징과 관련된 것을 탐지하여 쉽게 구현

• 여행 관련 서비스의 경우 다양한 사진으로부터 여행 관련 정보들을 구분하여 제공.

산, 바다, 도시 등등

Page 20: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Rekognition: 안면 분석

Page 21: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Rekognition: 안면 비교

Page 22: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Rekognition: 유명인사 인식

Page 23: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Rekognition: 안면 인식 응용

• IoT, 카메라 등을 활용하는 제조사나 업체는

안면 인식 인증(Verification)을 직접 제품이나 서비스 적용

• 공공 장소에서 특정 사람을 찾는 경우 응용

• 호텔의 경우 고객을 바로 인식하여 고객에 맞는

서비스 제공이나 VIP 전용 서비스 구현

• 대리 시험 방지. 온라인 시험의 경우 Webcam 을 통해 응시자 확인

Page 24: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Rekognition: Text in Image

Page 25: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Rekognition 국내 고객사 사례

• 오프라인/온라인 커머스 O모 고객사

• 오프라인 매장 방문 고객 관리가 안된다

• 매장 방문 고객 확인 및 VIP 확인용 기술로 검토

• 매장 내 제품에 대한 설명 인식 앱 개발 기획 중 (Image to Text 이용)

Page 26: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Lex

Page 27: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Lex

• 첨단 딥러닝 기술을 활용

• 음성을 텍스트로 변환하는 자동 음성 인식(ASR)

• 텍스트의 의도를 이해하는 자연어 처리(NLU)

• 현재 영어 지원

Page 28: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

음성 인식 자연어 처리 인식

Alexa 기술과 동일한 기술을 기반으로 구현

Page 29: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

쉬운 Chatbbot 서비스 구현

Amazon Lex

FacebookMessenger

Mobile

Authentication

Card Description

Option1

Option2

비쥬얼 정보지원

Page 30: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Lex – 응용 사례

• 다양한 정보 제공 Bot 구현

• Chatbot 을 통한 고객 서비스 제공

• 서비스 응용 Bot 구현

• 모바일 서비스의 인터페이스 구현

• 엔터프라이즈, 비지니스 응용 Bot 구현

• 효율적인 비지니스 관련 기능 환경 구현

• IoT 서비스 연계 Bot 구현

• 각종 IoT 디바이스와 커뮤니케이션 기능 구현

• 뉴스

• 날씨, 주식 기타 정보

• 지원 서비스

• 티켓팅

• 음식 주문

• 은행 업무 조회

• 물량, 수익 등 정보

• 마케팅 진행, 결과

• 인벤토리 정보

Page 31: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Lex를 이용한 정보 제공 Bot

Amazon Lex를 사용하여 최신 뉴스 업데이트, 경기 점수, 날씨 등

일상적인 고객 요청을 위한 챗봇을 개발

’환자 진료 시간 예약 Amazon Lex Bot 개발’

Page 32: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Lex를 이용한 애플리케이션 Bot

은행 계좌에 액세스하거나, 티켓을 예매하거나, 음식을 주문하거나,

택시를 부르는 등의 다양한 서비스 개발이 가능

‘Amazon Lex ChatBot을 통한 은행 정보 확인’

Page 33: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Lex를 이용한 엔터프라이즈 Bot

Amazon Lex를 통해 엔터프라이즈 챗봇을 개발하여 공통적인 작업 활동을

능률화하고 운영 효율성을 개선. 제품, 물량, 수익, 마케팅, 인벤토리 정보 등 활용

‘Amazon Lex Bot을 통한 마케팅 데이터 확인’

Page 34: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Lex 국내 고객사 사례

• O모 회사

• 2017년 상반기 신제품 관련 해외 오프라인 무인 매장 구축 PoC 진행

• 채팅으로 안내하는 제품 관련 문의 처리 및 예약 페이지

• 1단계 챗봇(진행완료)

• 2단계 음성 챗봇(Lex 에서는 이미 지원함!)

Page 35: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Alexa

Page 36: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Alexa

• 스마트 스피커 ECHO 를 활용

• 미국에서 가장 많은 사용자층 보유

• 음성인식 기반의 기술

• 현재 영어, 일본어 지원

• Amazon 및 다양한 기술과 연동 가능

Page 37: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda
Page 38: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Amazon Echo: The 1st Alexa-enabled Device

Amazon Echo sales up 9X compared to last year,

company says in holiday roundup of 2016 winter

sold “millions” of Echo devices.

Page 39: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda
Page 40: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Alexa Skills

Page 41: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Alexa Skills

Page 42: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Alexa

Voice

Service (AVS)

Alexa

Skills

Kit (ASK)

Alexa 음성 서비스 : 양방향 오픈 API

Page 43: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Alexa Skills Kit (ASK)

음성 혹은 오디오 파일로Skill로 받은 결과 전달

응답이 모바일 앱으로도함께 전달하여 표시

음성 인식자연어 인식(NLU)

음성 합성 (TTS)

머신러닝/딥러닝

텍스트로서 결과 전달

사용자 음성 요청AWS Lambda

AWS Cloud

오디오 스트리밍이Alexa 서비스로 전달

서비스 요청 및 앱 실행

Alexa 텍스트 포맷으로 요청 전달

ASK 는 Alexa 지원 기기에 맞춤형 음성 기반 앱을 만들 수 있는 API, 개발 도구, 문서 및 AWS 클라우드 연계 서비스를 지원 합니다.

Page 44: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Alexa Voice Service(AVS)

Skills

ASR NLU TTS

Learning

Your Product AVS 는 여러분이 직접 Alexa 지원 기기를 만들 수 있도록 도와 주는 서비스로서, 다양한 음성 인식 기기를 프로토타입으로 만들어 볼 수 있습니다.

Page 45: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Alexa Day 2018 in Kobe

Page 46: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Alexa Day 2018 in Kobe

Page 47: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Storyline – 코딩없이도 Alexa Skill 개발

Page 48: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

모든 개발자를 위한 AI 솔루션

Page 49: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

Q&A

Page 50: AWS기반 AI/빅데이터 사례 발표 · 음성인식 자연어인식(NLU) 음성합성(TTS) 머신러닝/딥러닝 텍스트로서결과전달 사용자 음성요청 AWSLambda

감사합니다