옵션
뉴스
Google은 Gemini를 공개합니다 : 새로운 AI 모델에 대한 주요 사실

Google은 Gemini를 공개합니다 : 새로운 AI 모델에 대한 주요 사실

2025년 4월 15일
160

Google은 Gemini를 공개합니다 : 새로운 AI 모델에 대한 주요 사실

구글 제미니는 구글과 그 모회사인 알파벳에서 개발한 최첨단 인공지능 모델입니다. 이 모델은 텍스트, 이미지, 비디오, 오디오 등 다양한 데이터 유형을 처리하고 이해할 수 있는 멀티모달 기능으로 두드러집니다. 수학, 물리학, 프로그래밍과 같은 분야에서 복잡한 작업을 처리하도록 설계되었으며, 다양한 언어로 고품질 코드를 생성합니다.

제미니는 이전에 구글 바드(Google Bard)로 알려졌던 제미니 챗봇을 통해 접근할 수 있으며, 일부 구글 픽셀 기기에도 통합되어 있습니다. 구글은 검색, 광고, 크롬 등 다양한 서비스에 제미니를 추가로 통합할 계획입니다. 2024년 구글 I/O 행사에서 '라이브' 모드와 프로젝트 아스트라(Project Astra)와의 통합과 같은 새로운 기능이 발표되며 제미니의 진화하는 역량을 보여주었습니다.

제미니의 개발은 구글 딥마인드(Google DeepMind)를 포함한 구글 전반에 걸친 광범위한 협업을 통해 이루어졌습니다. 구글 딥마인드의 CEO이자 공동 설립자인 데니스 하사비스(Dennis Hassabis)는 제미니가 처음부터 멀티모달로 구축되어 다양한 정보 유형을 원활하게 이해하고 작동할 수 있다고 강조했습니다.

다양한 요구와 기기를 충족하기 위해 제미니는 여러 버전으로 제공됩니다:

  • 제미니 나노 1.0: 구글 픽셀 8과 같은 스마트폰을 위해 설계되었으며, 기기 내 AI 작업을 효율적으로 수행합니다. 32,000 토큰 컨텍스트 윈도우를 제공합니다.
  • 제미니 플래시 1.5: 속도와 비용 효율성에 중점을 둔 경량 모델로, 백만 토큰 컨텍스트 윈도우를 제공하며, 1시간 분량의 비디오나 30,000줄 이상의 코드를 처리할 수 있습니다.
  • 제미니 프로 1.5: 제미니 어드밴스드 챗봇을 구동하며, 구글 데이터 센터에서 실행되며, 대규모 모델 중 가장 긴 200만 토큰 컨텍스트 윈도우를 제공합니다.
  • 제미니 울트라 1.0: 구글의 가장 강력한 모델로, 널리 사용되는 32개 학술 벤치마크 중 30개에서 뛰어난 성능을 발휘합니다. Vertex AI와 구글 AI 스튜디오를 통해 제미니 API로 이용 가능합니다.

제미니는 Gemini.Google.com을 방문하거나 안드로이드 기기, 제미니 모바일 앱, 구글 포토 등 통합된 구글 제품을 통해 상호작용할 수 있습니다. 개발자와 기업 사용자는 구글 AI 스튜디오와 구글 클라우드 Vertex AI에서 제미니 API를 통해 제미니 울트라에 접근할 수 있으며, 안드로이드 개발자는 AICore를 통해 제미니 나노를 활용할 수 있습니다.

GPT-4와 같은 다른 AI 모델과 비교했을 때, 제미니는 네이티브 멀티모달 처리와 긴 컨텍스트 윈도우로 주목받습니다. GPT-4가 주로 텍스트에 초점을 맞추고 다른 데이터 유형에 플러그인을 사용하는 반면, 제미니는 여러 데이터 유형을 네이티브로 처리합니다. 또한, 제미니는 구글 생태계에 통합된 제품 중심 모델로, GPT-4나 메타의 라마(Llama)와 같은 모델이 서드파티 애플리케이션과 서비스에 자주 사용되는 것과 대조됩니다.

[ttpp]

[yyxx]
관련 기사
다빈치 레졸브에서 오디오 편집 마스터하기: 프로페셔널 사운드를 위한 페어라이트 가이드 다빈치 레졸브에서 오디오 편집 마스터하기: 프로페셔널 사운드를 위한 페어라이트 가이드 선명한 오디오는 아마추어 프로덕션과 전문 비디오 콘텐츠를 구분합니다. 다빈치 Resolve의 페어라이트 페이지에서는 영화 제작자와 콘텐츠 크리에이터가 사운드 디자인을 완성할 수 있는 정교한 도구를 제공합니다. 이 심층 튜토리얼에서는 기본 레코딩부터 세련된 포스트 프로덕션 마스터링까지 오디오를 향상시키기 위한 필수 기술, 최적의 장비 선택, 전문적인 워크플로
이제 구글의 AI가 전화 통화를 대신 처리합니다. 이제 구글의 AI가 전화 통화를 대신 처리합니다. Google은 검색을 통해 모든 미국 사용자에게 AI 통화 기능을 확대하여 고객이 전화 통화 없이도 현지 비즈니스에 가격 및 이용 가능 여부를 문의할 수 있도록 했습니다. 1월에 처음 테스트된 이 기능은 현재 애완동물 미용사, 세탁 서비스, 자동차 수리점 등 서비스 중심 비즈니스를 지원합니다.검색자는 적격 업체 목록 아래에 'AI에게 가격 확인' 옵션이 표
트럼프, 스마트폰, 컴퓨터, 칩 관세 인상 면제 트럼프, 스마트폰, 컴퓨터, 칩 관세 인상 면제 블룸버그 통신에 따르면 트럼프 행정부는 스마트폰, 컴퓨터 및 다양한 전자 기기에 대해 중국에서 수입되는 경우에도 최근 관세 인상에서 예외를 인정했습니다. 그러나 이러한 제품은 4월 9일 이전에 시행된 이전 관세의 적용을 받습니다.미국 관세국경보호청은 수요일 늦게 스마트폰, 노트북, 컴퓨터 부품, 반도체 제조 장비 등 주요 기술 제품을 중국산 수입품에 대한
의견 (16)
0/200
FredCarter
FredCarter 2025년 8월 4일 오후 10시 0분 59초 GMT+09:00

Gemini's multimodal capabilities sound impressive! 😮 I wonder how it compares to other AI models in real-world tasks like video analysis or creative content generation. Can't wait to see it in action!

CarlGarcia
CarlGarcia 2025년 4월 23일 오후 6시 23분 37초 GMT+09:00

O modelo de IA Gemini do Google parece super avançado com suas capacidades multimodais! É legal que ele possa lidar com texto, imagens, vídeos e áudio ao mesmo tempo. Mas, será que é um exagero para o uso diário? Ainda assim, é uma tecnologia impressionante! 🤖

FrankSmith
FrankSmith 2025년 4월 21일 오후 3시 59분 8초 GMT+09:00

El modelo de IA Gemini de Google suena súper avanzado con sus capacidades multimodales. ¡Es genial que pueda manejar texto, imágenes, videos y audio al mismo tiempo! Pero, ¿será demasiado para el uso diario? Aún así, es una tecnología impresionante. 🤖

AnthonyHernández
AnthonyHernández 2025년 4월 21일 오후 2시 29분 56초 GMT+09:00

구글의 제미니 AI 모델은 멀티모달 기능이 정말 발전된 것 같아요! 텍스트, 이미지, 비디오, 오디오를 한꺼번에 처리할 수 있다니 멋지네요. 하지만 일상적인 사용에는 과하지 않을까요? 그래도 인상적인 기술이에요! 🤖

JustinScott
JustinScott 2025년 4월 19일 오후 8시 47분 21초 GMT+09:00

Google's Gemini AI model sounds super advanced with its multimodal capabilities! It's cool that it can handle text, images, videos, and audio all at once. But, I wonder if it's overkill for everyday use? Still, it's impressive tech! 🤖

WalterWhite
WalterWhite 2025년 4월 18일 오전 8시 33분 28초 GMT+09:00

Google Geminiはすごいです!テキスト、画像、ビデオ、オーディオをプロのように処理します。プロジェクトに使ってみましたが、時間を大幅に節約できました。もう少し速ければ完璧なんですけどね。それでも、革新的です!🚀

위로 돌아갑니다
OR