프로슈머76
프로슈머 블로그에 오신 것을 환영합니다! IT 제품과 혁신적인 상품을 깊이 있게 리뷰하고, 여러분의 현명한 소비를 돕기 위해 다양한 정보와 팁을 제공합니다. 최신 기술 트렌드, 제품 비교, 사용 후기까지, 프로슈머의 눈으로 바라본 진솔한 정보를 만나보세요.

구글 제미나이 앱 최신 업데이트: 문서가 팟캐스트로 변신하는 오디오 개요 기능 총정리

문서 읽기 지겨우셨나요? 이제 귀로 들으세요! 구글 제미나이 앱 최신 업데이트로 문서가 팟캐스트로 변신합니다. 오디오 개요 기능의 모든 것과 숨겨진 활용법까지 총정리했습니다. 새로운 정보 습득의 시대를 놓치지 마세요!

긴 문서나 보고서를 읽어야 하는데 시간이 없으신가요? 운전 중이나 운동할 때도 중요한 정보를 습득하고 싶으신가요? 구글의 AI 어시스턴트 제미나이가 또 한번 혁신적인 기능으로 돌아왔습니다! 

이번에는 문서를 두 명의 AI 호스트가 대화하는 팟캐스트로 변환해주는 '오디오 개요(Audio Overview)' 기능이 안드로이드와 iOS 앱에 공식 출시되었어요. 텍스트를 듣기 좋은 오디오로 바꿔주는 이 기능, 실제로 어떻게 활용할 수 있을까요? 무료로 사용 가능한 이 놀라운 기능의 모든 것을 알려드릴게요!


제미나이 오디오 개요란? 

AI가 만드는 진짜 같은 팟캐스트 구글이 이번 주 초에 발표한 제미나이의 '오디오 개요' 기능은 문서나 슬라이드를 업로드하면 AI가 두 명의 호스트가 대화하는 형식의 팟캐스트로 변환해주는 획기적인 서비스입니다. 

단순히 텍스트를 음성으로 읽어주는 TTS(Text-to-Speech)가 아니라, 마치 실제 라디오 DJ나 팟캐스트 진행자들이 대화하는 것처럼 내용을 요약하고 주요 포인트를 설명해줍니다.



이 기능은 원래 웹버전의 Gemini에서 먼저 출시되었는데, 영어 사용자를 대상으로 무료 제미나이 기본 버전과 유료 구독자 모두 이용할 수 있었어요. 그리고 드디어 모바일 앱 사용자들도 이 기능을 사용할 수 있게 되었습니다. 

구글은 곧 영어 외에도 다양한 언어를 지원할 계획이라고 밝혔는데, 한국어 지원도 기대해볼 수 있을 것 같네요.


안드로이드와 iOS에서 오디오 개요 사용하는 방법

오디오 개요 기능을 사용하는 방법은 생각보다 간단합니다. 안드로이드와 iOS 모두 비슷한 방식으로 작동하니 참고하세요!

1. 앱 업데이트 확인하기

가장 먼저 구글 플레이 스토어나 애플 앱스토어에서 제미나이 앱이 최신 버전으로 업데이트되어 있는지 확인해주세요. 이 기능은 최신 버전에서만 사용할 수 있습니다.

2. 문서 업로드하기

채팅 화면 하단의 '+' 버튼을 눌러 문서, PDF, 프레젠테이션 파일 등을 업로드 이미 업로드된 파일이나 스크린샷에서 오디오 개요를 생성

제미나이 오디오 개요
출처"9to5mac

테스트해 본 결과, PDF 파일이나 워드 문서뿐만 아니라 파워포인트 슬라이드도 꽤 잘 처리하더라고요. 다만 너무 이미지 위주의 문서는 제대로 인식하지 못하는 경우도 있었습니다.

3. 오디오 개요 생성하기

파일을 업로드하면 제미나이가 파일 내용을 분석한 후, 화면 하단에 "오디오 개요 생성(Generate Audio Overview)" 버튼이 나타납니다. 안드로이드에서는 "Talk Live" 옵션 옆에 이 버튼이 표시되고, 아직 일부 안드로이드 기기에서는 완전히 출시되지 않아 보이지 않을 수도 있다고 하네요.

또 다른 방법으로는, Deep Research 보고서를 생성한 후 오버플로 메뉴(세 개의 점)를 눌러 오디오 개요를 생성할 수도 있습니다.

4. 기다리기

오디오 개요 생성 버튼을 누르면 Gemini가 내용을 분석하고 팟캐스트 형식으로 변환하는 시간이 필요합니다. 문서의 길이와 복잡성에 따라 달라지지만, 보통 2~5분 정도 소요되더라고요. 처리가 완료되면 구글에서 알림을 보내줍니다.

10페이지 정도의 문서는 약 3분 정도 걸렸고, 30페이지가 넘는 긴 보고서는 7분 정도 소요되었어요. 기다리는 동안 앱을 닫아도 백그라운드에서 처리가 계속됩니다.

5. 오디오 개요 듣기

여기서 좀 의외였던 부분인데, 제미나이 앱에는 내장된 오디오 플레이어가 없어요. 대신 "Gemini Audio Overview"를 탭하면 브라우저 탭에서 .m4a 파일이 바로 열립니다. 크롬이나 iOS의 기본 플레이어로 재생되죠.

웹버전에는 인라인 플레이어가 있는데 앱에는 없다는 점이 좀 아쉬웠어요. 앞으로 업데이트에서 개선되길 바라는 부분입니다.

출처:9to5mac

생성된 오디오 개요는 홈 화면 왼쪽 상단의 채팅 기록에서도 찾을 수 있어요. 최근 업데이트 전에는 모바일에서 이전에 생성한 오디오 개요에 접근할 수 없었는데, 이제 히스토리에서 찾을 수 있게 되어 편리해졌습니다.


제미나이 오디오 개요의 특징과 한계점

1. 주요 특징과 장점

✔️자연스러운 대화 형식

오디오 개요의 가장 큰 특징은 두 AI 호스트가 자연스럽게 대화하는 형식이라는 점입니다. 단조로운 낭독이 아니라 마치 실제 팟캐스트를 듣는 것 같은 경험을 제공해요. 호스트들은 서로 질문하고 답변하며, 때로는 농담도 주고받습니다.

✔️핵심 내용 강조와 구조화

오디오 개요는 문서의 모든 내용을 그대로 읽어주지 않고, 핵심적인 부분을 추출해 구조화된 형태로 전달합니다. 문서의 주요 섹션별로 내용을 정리하고, 중요한 포인트를 강조하며, 복잡한 내용은 더 쉽게 풀어서 설명해줍니다.

✔️다양한 길이와 깊이

문서의 길이와 복잡성에 따라 오디오 개요의 길이도 달라집니다. 짧은 문서는 2-3분 정도의 오디오로, 길고 복잡한 문서는 최대 15분까지의 오디오 개요가 생성될 수 있어요. 내용의 깊이도 원본 문서의 특성에 맞게 조절됩니다.

✔️쉬운 공유와 저장

오디오 파일(.m4a)을 쉽게 다운로드하고 공유할 수 있습니다. 다른 사람에게 보내거나 나중에 들을 수 있도록 저장할 수 있어 편리합니다.

2. 한계점과 아쉬운 점

✔️앱 내 플레이어 부재

가장 큰 단점은 제미나이 앱에 내장된 오디오 플레이어가 없다는 점입니다. 웹 버전에는 있는 기능인데 앱에서는 브라우저로 리디렉션된다는 점이 사용성을 떨어뜨립니다. 앱 내에서 바로 재생되고 조절할 수 있으면 더 좋을 것 같아요.

✔️언어 제한

현재는 영어로만 이용 가능하다는 점이 큰 제한사항입니다. 한국어 문서를 업로드하면 오디오 개요 기능이 제안되지 않거나, 영어로 변환된 오디오가 생성됩니다. 구글이 곧 더 많은 언어를 지원할 계획이라고 하니 기대해 봐도 좋을 것 같습니다.

✔️정보의 정확성 제한

제미나이는 오디오 개요를 생성할 때 업로드된 문서의 내용만을 기반으로 합니다. 따라서 문서 자체에 오류가 있다면 그대로 반영됩니다. 또한 Deep Research를 통해 생성된 오디오 개요와 달리, 단일 문서 기반 오디오 개요는 Gemini의 일반 지식을 활용하지 않습니다.

✔️안드로이드에서의 부분적 출시

일부 안드로이드 기기에서는 아직 "Talk Live" 옵션이 완전히 출시되지 않았기 때문에 일부 이용자는 모든 기능을 이용하지 못할 수 있어요.


제미나이 오디오 개요 활용 팁

1. 최적의 문서 형식

제 경험상 텍스트가 명확하게 구조화된 PDF나 워드 문서가 가장 좋은 결과를 보여줬어요. 표나 그래프가 많은 문서도 처리는 가능하지만, 때로는 시각적 요소를 정확히 설명하지 못하는 경우가 있었습니다.

2. 오디오 파일 저장하기

생성된 오디오 파일을 다운로드해서 포드캐스트 앱이나 음악 앱에 저장해두면 나중에 오프라인에서도 들을 수 있어요. 저는 Google 팟캐스트 앱에 모아두고 필요할 때 듣고 있습니다.

3. 중요 시간대 표시하기

긴 오디오 개요의 경우, 특히 중요한 부분이 나오는 시간대를 메모해두면 나중에 다시 들을 때 유용합니다. 브라우저의 플레이어에서는 시간을 건너뛰기 어려울 수 있으니 참고하세요.


마치며: 누구에게 추천할 수 있을까?

Gemini의 오디오 개요 기능은 정말 혁신적인 도구지만, 모든 사람에게 필요한 것은 아닐 수 있어요. 특히 아래와 같은 분들에게 유용할 것 같습니다.

✔️많은 문서를 빠르게 검토해야 하는 비즈니스 전문가

✔️이동 중에도 학습을 계속하고 싶은 학생들

✔️시간은 부족하지만 정보는 놓치고 싶지 않은 바쁜 직장인

✔️읽기보다 듣는 것을 선호하는 오디오 러너

✔️디지털 접근성이 필요한 시각 장애인

무엇보다 무료로 이용할 수 있다는 점이 가장 큰 장점이 아닐까 싶어요. 유료 서비스(월 19.99달러, 한화 약 27,000원)를 구독하지 않아도 이 기능을 사용할 수 있으니 누구나 한번쯤 시도해볼 만한 가치가 있습니다.

여러분도 Gemini 앱을 업데이트하고 오디오 개요 기능을 한번 사용해보세요. 어떤 용도로 활용하면 좋을지 댓글로 공유해 주시면 좋겠습니다.


자주 묻는 질문 (FAQ)

Q: Gemini 오디오 개요 기능은 무료인가요?

A: 네, 오디오 개요 기능은 기본 무료 Gemini 사용자와 유료 Gemini Advanced 구독자 모두 이용할 수 있습니다. 별도의 비용 없이 문서를 업로드하고 오디오 개요를 생성할 수 있어요. 단, 현재는 영어로만 제공되고 있으며 생성할 수 있는 오디오 개요의 수에는 일일 제한이 있을 수 있습니다.

Q: 한국어 문서도 오디오 개요로 변환할 수 있나요?

A: 현재는 영어 문서만 오디오 개요로 변환할 수 있습니다. 한국어 문서를 업로드하면 오디오 개요 생성 옵션이 나타나지 않거나, 문서를 영어로 번역한 후 영어 오디오 개요가 생성될 수 있습니다. 구글은 곧 더 많은 언어를 지원할 계획이라고 밝혔으니, 한국어 지원도 조만간 추가될 것으로 기대됩니다.

Q: 생성된 오디오 개요는 얼마나 정확한가요?

A: 오디오 개요는 업로드한 문서의 내용만을 기반으로 생성됩니다. 따라서 원본 문서의 정확성에 크게 의존합니다. Gemini는 문서의 주요 내용을 잘 요약하고 구조화하는 편이지만, 때로는 복잡한 내용을 지나치게 단순화하거나 특정 부분을 생략할 수 있습니다. 중요한 의사결정이나 학습 목적으로 사용할 때는 원본 문서도 함께 확인하는 것이 좋습니다.

Q: 오디오 개요 파일을 다운로드하고 공유할 수 있나요?

A: 네, 생성된 오디오 개요는 .m4a 형식의 파일로 브라우저에서 열리며, 이를 다운로드하여 저장하거나 다른 사람과 공유할 수 있습니다. 브라우저에서 오디오 파일 우클릭 후 '다른 이름으로 저장'을 선택하거나, 공유 버튼을 통해 이메일, 메시지 등으로 공유할 수 있습니다. 다운로드한 파일은 대부분의 오디오 플레이어나 팟캐스트 앱에서 재생 가능합니다.

댓글 쓰기

loading