Google Gemini:有关生成AI应用程序和模型的所有信息
什么是Gemini?
Gemini是谷歌备受期待的下一代生成式AI模型家族,由DeepMind和谷歌研究团队合作开发。它设计多功能,拥有多种型号以满足不同需求:
- Gemini Ultra:功能强大的模型,专为最复杂任务设计。
- Gemini Pro:稳健的模型,最新版本Gemini 2.0 Pro是谷歌当前旗舰。
- Gemini Flash:更快、精简的Pro版本,适合快速任务。
- Gemini Flash-Lite:比Flash更小更快,专为效率设计。
- Gemini Flash Thinking:增强推理能力的专用版本。
- Gemini Nano:包含两个紧凑模型,Nano-1和Nano-2,后者支持离线运行。
Gemini的关键特点是其多模态特性。与谷歌早期模型如LaMDA仅限于文本不同,Gemini模型在音频、图像、视频、代码和多语言文本等多样数据集上训练。这使它们不仅能处理还能生成各种类型内容,在AI领域中独树一帜。
然而,需注意使用公共数据训练这些模型引发的伦理和法律问题。谷歌提供AI赔偿政策,但并非全面保护,若考虑将Gemini用于商业用途,需谨慎行事。
Gemini应用与Gemini模型的区别是什么?
Gemini模型是核心智能,而Gemini应用是用户友好的访问接口。这些应用在网页和移动平台上可用(前身为Bard),类似于ChatGPT或Anthropic的Claude,提供类聊天机器人体验,让用户通过熟悉界面与Gemini功能互动。

图片来源:谷歌 在Android上,Gemini应用已取代谷歌助手,在iOS上,它集成于谷歌和谷歌搜索应用中。Android用户可通过按电源键或语音命令唤出Gemini叠层,与屏幕内容(如YouTube视频)互动。
应用支持图像、语音和文本等多种输入,还能生成图像。若使用同一谷歌账户登录,跨设备对话可同步。
Gemini Advanced
除基础应用外,Gemini Advanced通过Google One AI Premium Plan每月20美元提供增强功能。该计划将Gemini集成到Gmail、Docs、Maps等谷歌Workspace应用中,支持高级任务如电子邮件撰写、文档编辑甚至生成幻灯片。

图片来源:谷歌 Gemini Advanced用户享有优先体验新功能、在应用中直接运行和编辑Python代码、以及NotebookLM等工具的更高使用限额等特权。新近添加的记忆功能帮助Gemini记住用户偏好和历史对话,提升用户体验。突出功能Deep Research利用高级推理创建复杂主题的详细简报。
Gemini在Gmail、Docs、Chrome、开发者工具等中的应用
Gemini的集成扩展到多个谷歌服务。在Gmail和Docs中,它提供侧边栏用于邮件撰写和文档优化。在Slides中,它生成自定义图像和幻灯片,在Sheets中帮助数据整理和公式创建。

图片来源:谷歌 Gemini还通过个性化推荐和评论聚合增强谷歌地图功能。在Drive中,它可总结文件并提供快速见解。在Chrome中,它作为AI写作工具,适应网页上下文。Gemini的影响还扩展到谷歌的安全和开发工具,以及Photos、YouTube和Meet等应用,支持自然语言搜索和翻译。
Gemini扩展和Gems
对于Gemini Advanced用户,创建Gems是一项独特功能。这些是由Gemini模型驱动的自定义聊天机器人,可针对特定任务(如制定每日跑步计划)进行定制。Gems可分享或保持私有,为AI交互增添个性化。

图片来源:谷歌 Gemini应用还利用“Gemini扩展”与谷歌服务如Drive、Gmail和YouTube集成,实现跨平台无缝交互和信息检索。
Gemini Live深度语音聊天
Gemini Live为语音交互提供独特体验,可在Gemini移动应用和Pixel Buds Pro 2上使用。它支持实时适应性对话,用户可打断Gemini提问或寻求澄清。该功能旨在帮助完成求职面试准备和公众演讲练习等任务。

图片来源:谷歌 青少年版Gemini
谷歌还推出了面向青少年的Gemini版本,专为学生设计,包含额外的安全措施和AI素养指南,但功能与标准版相似,包括“双重检查”准确性功能。
Gemini模型能做什么?
凭借多模态能力,Gemini模型可处理多种任务,从语音转录到实时图像和视频字幕生成。谷歌不断扩展这些功能,未来将提供更多可能性。
然而,与所有生成式AI一样,Gemini也存在偏见和生成不准确信息的风险。使用或考虑付费使用Gemini服务时,需注意这些局限性。
Gemini Pro的能力
最新版本Gemini 2.0 Pro在编码和处理复杂提示方面表现出色,在多项基准测试中超越前代。开发者可通过谷歌的Vertex AI平台定制,适配特定场景并与第三方数据或API集成。谷歌的AI Studio还提供创建结构化提示和调整安全设置的工具。
Gemini Flash轻量化,Gemini Flash Thinking增强推理
Gemini 2.0 Flash专为效率设计,适合摘要和数据提取等任务,而Gemini 2.0 Flash-Lite以相同价格提供更高性能。“Thinking”版本的Gemini 2.0 Flash通过在响应前推理问题增强可靠性。
Gemini Nano可在手机上运行
Gemini Nano设计为直接在设备上运行,增强隐私和离线功能。它支持Pixel 8系列和Samsung Galaxy S24等设备上的录音摘要和Gboard智能回复等功能。未来Android版本将使用Nano进行通话诈骗检测,并已增强天气报告和无障碍功能。

图片来源:谷歌 Gemini Ultra暂未露面
虽然Gemini Ultra近期未受关注,但仍是谷歌计划的一部分,未来可能带来新功能。
Gemini模型的价格是多少?
通过Gemini API的Gemini模型定价如下:
- Gemini 1.5 Pro:每百万输入令牌1.25/2.50美元,每百万输出令牌5/10美元,视提示长度而定。
- Gemini 1.5 Flash:每百万输入令牌7.5/15美分,每百万输出令牌30/60美分,视提示长度而定。
- Gemini 2.0 Flash:每百万输入令牌10美分,每百万输出令牌40美分,音频输入每百万令牌70美分。
- Gemini 2.0 Flash-Lite:每百万输入令牌7.5美分,每百万输出令牌30美分。
Gemini 2.0 Pro和Nano的定价尚未公布。
Gemini会登陆iPhone吗?
Gemini有可能登陆iPhone。苹果已表示有兴趣将Gemini和其他第三方模型集成到其Apple Intelligence套件中,但2024年WWDC讨论后细节仍未明确。
此文最初发布于2024年2月16日,并定期更新以反映最新进展。
相关文章
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
YouTube 测试基于人工智能的搜索功能,提供引导式答案
许多用户在搜索食谱或旅行计划时会转向YouTube,寻找相关视频。如今,该平台推出了一款由人工智能驱动的交互式搜索工具,能够提供融合文字和视频内容的分步搜索结果。借助全新的“Ask YouTube”功能,用户可以提出诸如“规划从旧金山到圣巴巴拉的3天自驾游”之类的问题,并获得结合了文字、短视频片段和长视频的分步结果——而非仅显示视频结果。YouTube表示,该功能将展示视频及相关片段,同时提供标题
相关专题推荐
评论 (17)
0/500
C'est fascinant de voir Google repousser les limites avec Gemini ! 🤯 L'idée d'une IA multimodal qui comprend si bien le monde est un vrai pas en avant. Je me demande comment ça se compare réellement dans l'analyse de documents complexes par rapport à GPT-4. Ça pousse vraiment la concurrence ! On verra si dans la pratique, l'accessibilité via les produits Google tient ses promesses. En tout cas, une nouvelle ère s'ouvre pour les assistants numériques.
Gemini sounds like a beast! I'm curious how it stacks up against other AI models in real-world tasks. 😎 Anyone tried it yet?
Google Gemini는 꽤 멋지지만, 다양한 모델 때문에 조금 혼란스러워요! Gemini Ultra의 강력함은 좋지만, 일상적으로 사용할 수 있는 더 간단한 버전이 있었으면 좋겠어요. 그래도 할 수 있는 일이 대단해요! 🤯
Google Gemini es bastante genial, pero es un poco abrumador con todos los diferentes modelos. Me gusta el Gemini Ultra por su potencia, pero desearía que hubiera una versión más simple para el uso diario. Aún así, es impresionante lo que puede hacer! 🤯
什么是Gemini?
Gemini是谷歌备受期待的下一代生成式AI模型家族,由DeepMind和谷歌研究团队合作开发。它设计多功能,拥有多种型号以满足不同需求:
- Gemini Ultra:功能强大的模型,专为最复杂任务设计。
- Gemini Pro:稳健的模型,最新版本Gemini 2.0 Pro是谷歌当前旗舰。
- Gemini Flash:更快、精简的Pro版本,适合快速任务。
- Gemini Flash-Lite:比Flash更小更快,专为效率设计。
- Gemini Flash Thinking:增强推理能力的专用版本。
- Gemini Nano:包含两个紧凑模型,Nano-1和Nano-2,后者支持离线运行。
Gemini的关键特点是其多模态特性。与谷歌早期模型如LaMDA仅限于文本不同,Gemini模型在音频、图像、视频、代码和多语言文本等多样数据集上训练。这使它们不仅能处理还能生成各种类型内容,在AI领域中独树一帜。
然而,需注意使用公共数据训练这些模型引发的伦理和法律问题。谷歌提供AI赔偿政策,但并非全面保护,若考虑将Gemini用于商业用途,需谨慎行事。
Gemini应用与Gemini模型的区别是什么?
Gemini模型是核心智能,而Gemini应用是用户友好的访问接口。这些应用在网页和移动平台上可用(前身为Bard),类似于ChatGPT或Anthropic的Claude,提供类聊天机器人体验,让用户通过熟悉界面与Gemini功能互动。

在Android上,Gemini应用已取代谷歌助手,在iOS上,它集成于谷歌和谷歌搜索应用中。Android用户可通过按电源键或语音命令唤出Gemini叠层,与屏幕内容(如YouTube视频)互动。
应用支持图像、语音和文本等多种输入,还能生成图像。若使用同一谷歌账户登录,跨设备对话可同步。
Gemini Advanced
除基础应用外,Gemini Advanced通过Google One AI Premium Plan每月20美元提供增强功能。该计划将Gemini集成到Gmail、Docs、Maps等谷歌Workspace应用中,支持高级任务如电子邮件撰写、文档编辑甚至生成幻灯片。

Gemini Advanced用户享有优先体验新功能、在应用中直接运行和编辑Python代码、以及NotebookLM等工具的更高使用限额等特权。新近添加的记忆功能帮助Gemini记住用户偏好和历史对话,提升用户体验。突出功能Deep Research利用高级推理创建复杂主题的详细简报。
Gemini在Gmail、Docs、Chrome、开发者工具等中的应用
Gemini的集成扩展到多个谷歌服务。在Gmail和Docs中,它提供侧边栏用于邮件撰写和文档优化。在Slides中,它生成自定义图像和幻灯片,在Sheets中帮助数据整理和公式创建。

Gemini还通过个性化推荐和评论聚合增强谷歌地图功能。在Drive中,它可总结文件并提供快速见解。在Chrome中,它作为AI写作工具,适应网页上下文。Gemini的影响还扩展到谷歌的安全和开发工具,以及Photos、YouTube和Meet等应用,支持自然语言搜索和翻译。
Gemini扩展和Gems
对于Gemini Advanced用户,创建Gems是一项独特功能。这些是由Gemini模型驱动的自定义聊天机器人,可针对特定任务(如制定每日跑步计划)进行定制。Gems可分享或保持私有,为AI交互增添个性化。

Gemini应用还利用“Gemini扩展”与谷歌服务如Drive、Gmail和YouTube集成,实现跨平台无缝交互和信息检索。
Gemini Live深度语音聊天
Gemini Live为语音交互提供独特体验,可在Gemini移动应用和Pixel Buds Pro 2上使用。它支持实时适应性对话,用户可打断Gemini提问或寻求澄清。该功能旨在帮助完成求职面试准备和公众演讲练习等任务。

青少年版Gemini
谷歌还推出了面向青少年的Gemini版本,专为学生设计,包含额外的安全措施和AI素养指南,但功能与标准版相似,包括“双重检查”准确性功能。
Gemini模型能做什么?
凭借多模态能力,Gemini模型可处理多种任务,从语音转录到实时图像和视频字幕生成。谷歌不断扩展这些功能,未来将提供更多可能性。
然而,与所有生成式AI一样,Gemini也存在偏见和生成不准确信息的风险。使用或考虑付费使用Gemini服务时,需注意这些局限性。
Gemini Pro的能力
最新版本Gemini 2.0 Pro在编码和处理复杂提示方面表现出色,在多项基准测试中超越前代。开发者可通过谷歌的Vertex AI平台定制,适配特定场景并与第三方数据或API集成。谷歌的AI Studio还提供创建结构化提示和调整安全设置的工具。
Gemini Flash轻量化,Gemini Flash Thinking增强推理
Gemini 2.0 Flash专为效率设计,适合摘要和数据提取等任务,而Gemini 2.0 Flash-Lite以相同价格提供更高性能。“Thinking”版本的Gemini 2.0 Flash通过在响应前推理问题增强可靠性。
Gemini Nano可在手机上运行
Gemini Nano设计为直接在设备上运行,增强隐私和离线功能。它支持Pixel 8系列和Samsung Galaxy S24等设备上的录音摘要和Gboard智能回复等功能。未来Android版本将使用Nano进行通话诈骗检测,并已增强天气报告和无障碍功能。

Gemini Ultra暂未露面
虽然Gemini Ultra近期未受关注,但仍是谷歌计划的一部分,未来可能带来新功能。
Gemini模型的价格是多少?
通过Gemini API的Gemini模型定价如下:
- Gemini 1.5 Pro:每百万输入令牌1.25/2.50美元,每百万输出令牌5/10美元,视提示长度而定。
- Gemini 1.5 Flash:每百万输入令牌7.5/15美分,每百万输出令牌30/60美分,视提示长度而定。
- Gemini 2.0 Flash:每百万输入令牌10美分,每百万输出令牌40美分,音频输入每百万令牌70美分。
- Gemini 2.0 Flash-Lite:每百万输入令牌7.5美分,每百万输出令牌30美分。
Gemini 2.0 Pro和Nano的定价尚未公布。
Gemini会登陆iPhone吗?
Gemini有可能登陆iPhone。苹果已表示有兴趣将Gemini和其他第三方模型集成到其Apple Intelligence套件中,但2024年WWDC讨论后细节仍未明确。
此文最初发布于2024年2月16日,并定期更新以反映最新进展。
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
YouTube 测试基于人工智能的搜索功能,提供引导式答案
许多用户在搜索食谱或旅行计划时会转向YouTube,寻找相关视频。如今,该平台推出了一款由人工智能驱动的交互式搜索工具,能够提供融合文字和视频内容的分步搜索结果。借助全新的“Ask YouTube”功能,用户可以提出诸如“规划从旧金山到圣巴巴拉的3天自驾游”之类的问题,并获得结合了文字、短视频片段和长视频的分步结果——而非仅显示视频结果。YouTube表示,该功能将展示视频及相关片段,同时提供标题
C'est fascinant de voir Google repousser les limites avec Gemini ! 🤯 L'idée d'une IA multimodal qui comprend si bien le monde est un vrai pas en avant. Je me demande comment ça se compare réellement dans l'analyse de documents complexes par rapport à GPT-4. Ça pousse vraiment la concurrence ! On verra si dans la pratique, l'accessibilité via les produits Google tient ses promesses. En tout cas, une nouvelle ère s'ouvre pour les assistants numériques.
Gemini sounds like a beast! I'm curious how it stacks up against other AI models in real-world tasks. 😎 Anyone tried it yet?
Google Gemini는 꽤 멋지지만, 다양한 모델 때문에 조금 혼란스러워요! Gemini Ultra의 강력함은 좋지만, 일상적으로 사용할 수 있는 더 간단한 버전이 있었으면 좋겠어요. 그래도 할 수 있는 일이 대단해요! 🤯
Google Gemini es bastante genial, pero es un poco abrumador con todos los diferentes modelos. Me gusta el Gemini Ultra por su potencia, pero desearía que hubiera una versión más simple para el uso diario. Aún así, es impresionante lo que puede hacer! 🤯





首页






