“攪拌:AI驅動的圖像混音和可視化工具”

今天,我們很高興介紹Whisk,我們在生成式AI領域的最新嘗試,僅在美國獨家推出。與傳統需要撰寫冗長文字提示以生成圖像的方法不同,Whisk簡化了流程,讓您可以使用圖像作為提示。只需將圖像拖放到工具中即可開始創作。
使用Whisk,您可以輸入三種不同的圖像:一張作為主體,一張作為場景,另一張作為風格。這讓您可以混合搭配這些元素,創造出完全獨特的東西,無論是數位玩偶、琺瑯徽章還是貼紙。重點在於重新混搭,打造屬於您的獨特作品。
Whisk - 奇幻魚 - 生成圖像範例
Whisk - 奇趣海象 - 生成圖像範例
Whisk - 糖霜甜甜圈加彩色糖粒 - 生成琺瑯徽章範例
Whisk - 帶角的奇幻貓 - 生成圖像範例
在幕後,Whisk利用Gemini模型的強大功能,自動為您的輸入圖像生成詳細描述。這些描述隨後被輸入到Google的尖端圖像生成模型Imagen 3中。這種方法專注於捕捉主體的本質,而不是創建精確的複製品,讓您以創新的方式重新混搭主體、場景和風格。
由於Whisk專注於從您的圖像中提取少數關鍵特徵,生成的創作可能不總是符合您的初始期望。例如,生成的主體可能在身高、體重、髮型或膚色上有所不同。我們認識到這些細節對您的項目可能至關重要,有時Whisk可能無法完全達到目標。因此,我們允許您隨時查看和調整底層提示。
在我們與藝術家和創意人士的初步測試中,Whisk被描述為一種新穎的創意工具,與傳統圖像編輯器截然不同。我們設計它以促進快速的視覺探索,而非精確的像素級編輯。重點在於激發新想法,讓您篩選眾多選項,直到找到與您共鳴的作品。
如果您在美國,今天即可在labs.google/whisk體驗Whisk,並與我們分享您的想法。
Google Labs是我們探索生成式AI最新技術的遊樂場,包括Gemini、Imagen和Veo等模型。我們的目標是收集這些新產品和功能的反饋,共同塑造技術的未來。透過訂閱我們的電子報並在X、Reddit和Discord上關注Google Labs,來跟進Whisk和其他令人興奮的實驗。
相關文章
巴里·迪勒:隨著通用人工智慧(AGI)日益臨近,對山姆·奧特曼的信任已無關緊要
儘管近期有報導指出相反的看法,但億萬富翁媒體大亨巴里·迪勒並不認為 OpenAI 執行長山姆·奧特曼不可信。迪勒本週在《華爾街日報》的「萬物未來」會議上發言時,為奧特曼辯護;奧特曼此前曾遭到部分前同事和董事會成員指控,指稱他偶爾會採取操縱和欺騙手段。身為奧特曼好友的迪勒,當時正回應一個關於人們是否應信任奧特曼、以確保人工智慧造福人類的問題。具體而言,提問者探討了被稱為「通用人工智慧」(AGI)的理
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
真正的差異:不在於某件事,而在於另一件事
有時候,事物不僅是某種東西,同時也是另一種東西。在人工智慧生成的文字中,「這不僅是……,更是……」這類句式已變得如此常見,以至於它現在不僅僅是合成內容的線索——幾乎可以說是鐵證。正因如此,當我看到《巴倫周刊》的一份報告,指出這種句式在企業通訊中如何激增時,我不僅感到好奇——更真心覺得頗具諧趣。該報告不僅評論了此句式的出現頻率,更透過搜尋市場情報公司AlphaSense的資料庫,量化了其在企業新聞稿
相關專題推薦
評論 (26)
0/500
So you're telling me I can finally stop writing those novel-length prompts? 😂 This is a game-changer for visual thinkers like me. The US-only launch is a bummer though—hope it goes global soon! The image-as-prompt approach could really shake up how we prototype ideas.
Интересный подход — использовать изображения вместо текстовых подсказок! Это кажется гораздо более интуитивным способом для творчества. Но вот вопрос: как сервис справляется с авторскими правами на исходные картинки? Тема всегда скользкая в AI-индустрии. Хотелось бы попробовать, но пока только для США... Ждём расширения доступности 🌍
Parece interesante la idea de usar imágenes como prompts en lugar de texto, pero me preocupa cómo esto podría afectar los derechos de autor 😬. ¿Podrían las imágenes generadas terminar siendo usadas sin permiso de los creadores originales? La herramienta suena divertida, pero las implicaciones legales podrían ser complicadas.
Finde die Idee echt erfrischend! 🎨 Endlich muss man nicht mehr ellenlange Textbeschreibungen verfassen, um coole Bilder zu generieren. Aber frage mich, wie gut das mit komplexen Konzepten klappt – kann ein Bild wirklich so präzise sein wie ein detaillierter Prompt? Hoffe, das Tool kommt bald auch nach Europa!
Enfin un outil qui comprend qu'on est tous fatigués des prompts interminables ! 😅 Whisk a l'air super intuitif, mais est-ce que ça marche aussi bien avec des photos mal cadrées ? Vivement la version européenne !

今天,我們很高興介紹Whisk,我們在生成式AI領域的最新嘗試,僅在美國獨家推出。與傳統需要撰寫冗長文字提示以生成圖像的方法不同,Whisk簡化了流程,讓您可以使用圖像作為提示。只需將圖像拖放到工具中即可開始創作。
使用Whisk,您可以輸入三種不同的圖像:一張作為主體,一張作為場景,另一張作為風格。這讓您可以混合搭配這些元素,創造出完全獨特的東西,無論是數位玩偶、琺瑯徽章還是貼紙。重點在於重新混搭,打造屬於您的獨特作品。
Whisk - 奇趣海象 - 生成圖像範例
Whisk - 糖霜甜甜圈加彩色糖粒 - 生成琺瑯徽章範例
Whisk - 帶角的奇幻貓 - 生成圖像範例
在幕後,Whisk利用Gemini模型的強大功能,自動為您的輸入圖像生成詳細描述。這些描述隨後被輸入到Google的尖端圖像生成模型Imagen 3中。這種方法專注於捕捉主體的本質,而不是創建精確的複製品,讓您以創新的方式重新混搭主體、場景和風格。
在我們與藝術家和創意人士的初步測試中,Whisk被描述為一種新穎的創意工具,與傳統圖像編輯器截然不同。我們設計它以促進快速的視覺探索,而非精確的像素級編輯。重點在於激發新想法,讓您篩選眾多選項,直到找到與您共鳴的作品。
如果您在美國,今天即可在labs.google/whisk體驗Whisk,並與我們分享您的想法。
Google Labs是我們探索生成式AI最新技術的遊樂場,包括Gemini、Imagen和Veo等模型。我們的目標是收集這些新產品和功能的反饋,共同塑造技術的未來。透過訂閱我們的電子報並在X、Reddit和Discord上關注Google Labs,來跟進Whisk和其他令人興奮的實驗。
巴里·迪勒:隨著通用人工智慧(AGI)日益臨近,對山姆·奧特曼的信任已無關緊要
儘管近期有報導指出相反的看法,但億萬富翁媒體大亨巴里·迪勒並不認為 OpenAI 執行長山姆·奧特曼不可信。迪勒本週在《華爾街日報》的「萬物未來」會議上發言時,為奧特曼辯護;奧特曼此前曾遭到部分前同事和董事會成員指控,指稱他偶爾會採取操縱和欺騙手段。身為奧特曼好友的迪勒,當時正回應一個關於人們是否應信任奧特曼、以確保人工智慧造福人類的問題。具體而言,提問者探討了被稱為「通用人工智慧」(AGI)的理
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
真正的差異:不在於某件事,而在於另一件事
有時候,事物不僅是某種東西,同時也是另一種東西。在人工智慧生成的文字中,「這不僅是……,更是……」這類句式已變得如此常見,以至於它現在不僅僅是合成內容的線索——幾乎可以說是鐵證。正因如此,當我看到《巴倫周刊》的一份報告,指出這種句式在企業通訊中如何激增時,我不僅感到好奇——更真心覺得頗具諧趣。該報告不僅評論了此句式的出現頻率,更透過搜尋市場情報公司AlphaSense的資料庫,量化了其在企業新聞稿
So you're telling me I can finally stop writing those novel-length prompts? 😂 This is a game-changer for visual thinkers like me. The US-only launch is a bummer though—hope it goes global soon! The image-as-prompt approach could really shake up how we prototype ideas.
Интересный подход — использовать изображения вместо текстовых подсказок! Это кажется гораздо более интуитивным способом для творчества. Но вот вопрос: как сервис справляется с авторскими правами на исходные картинки? Тема всегда скользкая в AI-индустрии. Хотелось бы попробовать, но пока только для США... Ждём расширения доступности 🌍
Parece interesante la idea de usar imágenes como prompts en lugar de texto, pero me preocupa cómo esto podría afectar los derechos de autor 😬. ¿Podrían las imágenes generadas terminar siendo usadas sin permiso de los creadores originales? La herramienta suena divertida, pero las implicaciones legales podrían ser complicadas.
Finde die Idee echt erfrischend! 🎨 Endlich muss man nicht mehr ellenlange Textbeschreibungen verfassen, um coole Bilder zu generieren. Aber frage mich, wie gut das mit komplexen Konzepten klappt – kann ein Bild wirklich so präzise sein wie ein detaillierter Prompt? Hoffe, das Tool kommt bald auch nach Europa!
Enfin un outil qui comprend qu'on est tous fatigués des prompts interminables ! 😅 Whisk a l'air super intuitif, mais est-ce que ça marche aussi bien avec des photos mal cadrées ? Vivement la version européenne !





首頁






