[개발] Gemini 1.5 Pro으로 문서 요약
요즘 로컬 LLM(Local Language Models)에 관심을 가지고 연구하고 있었고, 최근에는 Meta의 LLama3 에 많은 관심을 가지고 있었습니다. 하지만, 오늘 승우님이 작성한 글 "Gemini 1.5 Pro 성능 테스트 - 50분짜리 영상의 타임스탬프 추출하기"을 보고 Google의 Gemini에 다시 관심을 가지게 되었습니다.
현재는 Google Gemini 1.5 Pro (Preview) 모델을 무료로 사용할 수 있습니다.
그리고 Google Gemini 1.5 Pro는 최대 입력 토큰이 100만 개입니다. 출력 토큰은 8,000개로 조금 아쉽습니다.
하지만, 입력토큰이 크기 때문에 책 요약, 영상 요약 또는 RAG 시스템에 무료로 사용하기에는 정말 좋은 것 같습니다.
Google Gemini 1.5 Pro는 멀티모달 기능을 지원하여, 이미지, 비디오, 오디오 등 다양한 형태의 파일 업로드가 가능합니다.
저는 인터넷에 공개된 책 요약본을 수집하여 다시 요약하는 것을 테스트 해보겠습니다.
아래 글을 마크다운 형식의 파일로 다운로드 받아 요약&정리해보겠습니다.
문서 요약하기
프롬프트
응답결과
Congratulations, your post has been upvoted by @upex with a 0.20% upvote. We invite you to continue producing quality content and join our Discord community here. Keep up the good work! #upex
입력과 출력 토큰이 다른 것은 조금 아쉬움이 있을 것 같습니다.
그런데 요약이니 ^^
그리고 이전 글에 단 댓글 ^^
제 장비를 애플실리콘으로 넘어갈 이슈가 하나더 늘었네요 T.T
엔비디아 그래픽 카드는 다느냐 ^^
애플 실리콘으로 넘어 가느냐가 고민이었는데 ^^
애플 실리콘이 답인 것 같습니다. ^^
감사합니다.
가능하면 엔비디아 그래픽카드로 가는 것이 좋긴 하지만,
가격대비 맥북도 나쁘진 않습니다.
요즘은 라마3를 가지고 놀고 있는데, 재미납니다. ㅎㅎ