옵션
뉴스
Google은 효율적인 Gemini AI 모델을 공개합니다

Google은 효율적인 Gemini AI 모델을 공개합니다

2025년 4월 22일
111

Google은 효율적인 Gemini AI 모델을 공개합니다

Google은 새로운 AI 모델인 Gemini 2.5 Flash를 공개할 예정이며, 이는 효율성을 우선시하면서도 강력한 성능을 약속한다. 이 모델은 Google의 AI 개발 플랫폼인 Vertex AI에 통합될 것이다. Google에 따르면, Gemini 2.5 Flash는 "동적이고 제어 가능한" 컴퓨팅 기능을 제공하여 개발자가 쿼리의 복잡성에 따라 처리 시간을 조정할 수 있다.

TechCrunch와 공유한 블로그 포스트에서 Google은 "속도, 정확도, 비용 균형을 특정 요구에 맞게 조정할 수 있다. 이 유연성은 높은 처리량과 비용에 민감한 애플리케이션에서 Flash 성능을 최적화하는 데 핵심이다"라고 밝혔다. 이는 최상위 AI 모델과 관련된 비용이 증가하는 시점에 나온 접근 방식이다. Gemini 2.5 Flash와 같은 모델은 더 저렴하면서도 견고한 성능을 제공하여, 정확도에서 약간의 타협이 있음에도 불구하고 더 비싼 옵션에 대한 매력적인 대안으로 작용한다.

Gemini 2.5 Flash는 OpenAI의 o3-mini와 DeepSeek의 R1과 유사한 "추론" 모델로 분류된다. 이러한 모델은 답변의 사실 확인을 위해 응답 시간이 약간 더 걸리며, 신뢰성을 보장한다. Google은 2.5 Flash가 특히 "높은 처리량"과 "실시간" 애플리케이션, 예를 들어 고객 서비스와 문서 파싱에 적합하다고 강조한다.

Google은 블로그 포스트에서 2.5 Flash를 "일꾼 모델"로 묘사하며, "이는 낮은 지연 시간과 비용 절감을 위해 특별히 최적화되었다. 효율성이 중요한 응답형 가상 비서와 실시간 요약 도구에 이상적인 엔진이다"라고 밝혔다. 그러나 Google은 이 모델에 대한 안전성 또는 기술 보고서를 공개하지 않았으며, 이는 모델의 강점과 약점을 정확히 파악하기 어렵게 만든다. 회사는 이전에 TechCrunch에 "실험적"으로 간주되는 모델에 대해 보고서를 발행하지 않는다고 언급한 바 있다.

수요일, Google은 또한 Gemini 모델, 포함 2.5 Flash를 3분기부터 온프레미스 환경으로 확장할 계획을 밝혔다. 이러한 모델은 데이터 거버넌스 요구가 엄격한 고객을 위해 설계된 Google의 온프레미스 솔루션인 Google Distributed Cloud (GDC)에서 사용할 수 있다. Google은 Nvidia와 협력하여 Gemini 모델이 GDC 호환 Nvidia Blackwell 시스템과 호환되도록 하고 있으며, 고객은 Google 또는 다른 선호 채널을 통해 직접 구매할 수 있다.

관련 기사
구글, 향상된 속도 기능을 갖춘 AI 기반 '사진에 물어보세요' 재출시 구글, 향상된 속도 기능을 갖춘 AI 기반 '사진에 물어보세요' 재출시 Google은 테스트를 일시적으로 중단한 후 Google 포토의 AI 기반 '사진에 질문' 검색 기능을 대폭 개선하여 다시 출시합니다. Google의 Gemini AI 기술을 기반으로 하는 이 혁신적인 기능은 사용자가 자연어 쿼리를 통해 특정 이미지를 찾을 수 있도록 도와줍니다.사진에 질문의 주요 개선 사항Google은 최근 이 기능의 초기 단점, 특히 응
구글 AI 울트라 공개: 월 $249.99의 프리미엄 구독 가격 구글 AI 울트라 공개: 월 $249.99의 프리미엄 구독 가격 Google, 프리미엄 AI 울트라 구독 서비스 공개Google I/O 2025에서 이 기술 대기업은 새로운 종합 AI 구독 서비스인 Google AI Ultra를 발표했습니다. 월 249.99달러의 가격으로 제공되는 이 프리미엄 서비스는 현재 사용 가능한 Google의 최첨단 인공 지능 도구에 대한 독점 액세스를 제공합니다.AI Ultra에는 무엇이 포함
더 많은 AI 토큰이 추론 오류를 증가시킨다는 Microsoft의 연구 결과 더 많은 AI 토큰이 추론 오류를 증가시킨다는 Microsoft의 연구 결과 LLM 추론 효율성에 대한 새로운 인사이트Microsoft의 새로운 연구에 따르면 대규모 언어 모델의 고급 추론 기술이 여러 AI 시스템에서 균일하게 개선되지 않는다는 사실이 밝혀졌습니다. 이 획기적인 연구에서는 9개의 주요 기초 모델이 추론 중에 다양한 확장 접근 방식에 어떻게 반응하는지 분석했습니다.추론 시간 확장 방법 평가하기연구팀은 세 가지 확장 기
의견 (2)
0/200
AnthonyMiller
AnthonyMiller 2025년 8월 21일 오전 8시 1분 21초 GMT+09:00

Google's Gemini 2.5 Flash sounds like a game-changer for efficient AI! Excited to see how it stacks up against other models in real-world apps. 🚀

ChristopherThomas
ChristopherThomas 2025년 8월 15일 오전 3시 1분 7초 GMT+09:00

Google's Gemini 2.5 Flash sounds like a game-changer for efficient AI! I'm curious how its 'dynamic' computing stacks up against others. Anyone tried it on Vertex AI yet? 🤔

위로 돌아갑니다
OR