ChatGptの見事な新しい画像ジェネレーターは、誰にとっても無料です
OpenAIはChatGPTプラットフォームを着実に強化し、AI音声アシスタント、ファイルや画像の理解、高度な研究ツール、AIエージェントなどの機能を導入してきました。しかし、彼らの提供するサービスには顕著な欠点が一つありました。それは、真正に効果的な画像生成機能です。先週、OpenAIが4o画像生成モデルを発表し、これは以前のDALL-Eモデルから大幅に進化したものでした。少し遅いものの、4oはリアルな画像や正確なテキストを含む複雑なプロンプトの処理に優れています。
ライブストリームデモでは、OpenAIのCEOであるSam Altmanと研究者のGabriel GohおよびPrafulla Dhariwalが4oの能力を披露しました。彼らは特定の視点から撮影された写真を生成し、詳細なテキストが記載されたチラシを特徴とするプロンプトをモデルに与えました。短い読み込み時間の後、結果は印象的で、映画のような演出が的確で、すべてのテキストが正確にレンダリングされていました。

スクリーンショット:Sabrina Ortiz/ZDNET その主要機能を超えて、4oはOpenAIの以前の画像生成ツールにはなかった新機能を備えています。画像参照機能が含まれており、ユーザーは既存の画像をアニメや自撮りなどの別のスタイルに変換したり、新しい創作のインスピレーションとして使用したりできます。
これは@gabeeegooohからの本当の愛の結晶でした。おめでとう、Gabe。素晴らしい仕事です!
ライブストリーム中に生成したものはこちら:pic.twitter.com/fmHWp4d9AF
— Sam Altman (@sama) 2025年3月25日
クリエイティブなワークフローにシームレスに統合されるよう設計された4oは、透明な背景での画像生成、HEXコードによる特定の色の使用、さらにはチャットボットの高度な会話能力を画像作成プロセスに組み込むことができます。例えば、デモ中に写真にユーモアを加えるよう求められた際、4oはそのリクエストを反映したテキストを含めました。
画像生成機能は現在ChatGPTの一部であり、ユーザーは継続的な会話を通じて画像を改良できます。この機能により、画像の微調整が簡素化され、モデルは以前の生成のコンテキストを活用して新しい創作を行うことができます。GPT-4oのウェブアクセスにより、このコンテキストは画像生成プロセスをさらに豊かにします。
OpenAIは、GPT-4oの画像生成モデルが指示に対する強い順守性を持ち、10~20の異なるオブジェクトを同時に処理できるため、1つのプロンプトで複雑なシーンを作成できると主張しています。
より緩やかな保護措置
新しい画像生成ツールの注目すべき変化は、Elon MuskのGrokモデルで知られているような、より大胆なコンテンツを作成できる能力です。ライブストリーム中に、AltmanはユーザーがGPT-4oを使用して「合理的な範囲内で」攻撃的なコンテンツを生成できると述べました。イベント後、AltmanはXでさらに詳しく説明しました:
「私たちが目指しているのは、ユーザーが望まない限りツールが攻撃的なコンテンツを作成しないようにし、望む場合には合理的な範囲内でそれを行うことです。モデル仕様で述べているように、知的自由とコントロールをユーザーの手に委ねることが正しいと考えていますが、どのように進むかを見守り、社会の声を聞きます。」
モデルの発表ブログ投稿では、児童性的虐待素材や性的ディープフェイクなどのコンテンツポリシーに違反するリクエストをブロックすると明確にされました。さらに、実在の人物が関わる場合、特にヌードやグラフィックな暴力に関する強固な保護措置があります。ユーザーは4o画像生成モデルの詳細な安全性情報についてシステムカードを参照できます。

プロンプト:野生で撮影されたリアルなふわふわのウサギの画像を16:9の比率で、ナショナルジオグラフィックスタイルで生成できますか
Sabrina Ortiz/ZDNET via ChatGPT アクセス方法
更新された画像生成機能は現在ChatGPTおよびSoraで展開されており、無料アカウントのユーザーも含めすべてのユーザーが利用できます。ただし、GPT-4oを最大限に活用するには、「/create image」ショートカットを使用する必要があります。「XYZの画像を作成」と入力すると、古いDALL-Eモデルがデフォルトとなり、品質の低い画像になります。
OpenAIは画像生成の制限を明確にしていませんが、無料アカウントで3つの画像を作成した後、1日の制限に達しました。より広範なアクセスには、月額20ドルのChatGPT Plusへの加入が個人ユーザーにとって最良の選択肢で、OpenAIのSoraビデオジェネレーターへのアクセスなどの追加特典があります。執筆時点で、私はPlusアカウントで画像生成機能を使用できました。エンタープライズおよび教育ユーザーは近日中にアクセス可能となり、開発者は数週間以内にAPIアクセスを取得します。
DALL-Eが最初に登場したとき、それは独立した驚異でした。現在ChatGPTに統合されたそれは、Midjourney、Google、Adobeなどの競合他社に後れを取っていました。4oによるこのアップデートは競争の場を均等にし、より競争力のあるものにします。ただし、オリジナルのDALL-Eを使用したい場合は、専用のDALL-E GPTを通じて利用可能です。
関連記事
Anthropic社の実験用AI「Claude」が、Eコマースのテストにおいて交渉と取引を完了した
人工知能(AI)が急速に進化する中、Anthropicは先週金曜日、「Project Deal」と呼ばれる社内実験をひっそりと開始し、EコマースにおけるAIの可能性を披露した。この実験では、同社のAIモデル「Claude」が、実際の金銭取引を伴うクローズドな市場環境において、購入、販売、価格交渉を自律的に行うよう設計された。実験の中核となったのは、Slack上に構築された社内マーケットプレイスであ
DeepSeek Code、まもなくリリースへ
AI技術の進展が加速する中、DeepSeekは今、まさに刺激的な転換点を迎えています。同社は最近、700億元を超える資金調達に成功したことを明らかにしました。経営陣は、目先の商業的利益よりも、画期的なAI研究への取り組みを重視する姿勢を強調しています。この戦略的転換は、新製品、とりわけ待望の「DeepSeek Code」の開発に全力を注ぐというDeepSeekの決意を示しています。DeepSeek
マスク氏の「Grok」:1.5兆のパラメータとカーソルコードの統合――ゲームチェンジャーか、それともブラフか?
イーロン・マスクがついに動き出した。AI開発競争において、OpenAIとAnthropicは加速している一方、xAIは出遅れているようだ。マスクはたびたび「Claude」に対抗する意向を表明してきたが、Grok4.Xシリーズへの度重なるアップデートにもかかわらず、結果は理論上は良好に見えても実用面では不十分であり、その差はほとんど縮まっていない。しかし、今回、彼には新たな切り札がある。マスクはX(
関連特集おすすめ
コメント (42)
0/500
Die Geschwindigkeit, mit der sich Text-zu-Bild-Generatoren entwickeln, ist echt beeindruckend. Letzten Monat habe ich noch einen anderen Dienst genutzt, und jetzt bietet ChatGPT ein kostenloses Tool. Der Wettbewerb wird bestimmt die Qualität weiter in die Höhe treiben, aber man fragt sich, wie nachhaltig das 'kostenlos für alle'-Modell auf Dauer ist. Spannende Zeiten! 🎨
Wow, free image generation from OpenAI? That's a game-changer! Can't wait to mess around with it and see what wild visuals I can create. 🎨
ChatGPT's new image generator is a game-changer! Finally, a free tool that can create stunning visuals. It's easy to use and the results are mind-blowing. Only wish it had more customization options. Still, a must-try for anyone into AI art! 😍
ChatGPT의 새로운 이미지 생성 도구 정말 대단해요! 사용해보니 결과가 너무 놀라웠어요. 무료로 쓸 수 있는 점도 좋고요. 다만, 가끔 느리다는 점이 아쉽네요. 꼭 한번 써보세요! 😄
OpenAIはChatGPTプラットフォームを着実に強化し、AI音声アシスタント、ファイルや画像の理解、高度な研究ツール、AIエージェントなどの機能を導入してきました。しかし、彼らの提供するサービスには顕著な欠点が一つありました。それは、真正に効果的な画像生成機能です。先週、OpenAIが4o画像生成モデルを発表し、これは以前のDALL-Eモデルから大幅に進化したものでした。少し遅いものの、4oはリアルな画像や正確なテキストを含む複雑なプロンプトの処理に優れています。
ライブストリームデモでは、OpenAIのCEOであるSam Altmanと研究者のGabriel GohおよびPrafulla Dhariwalが4oの能力を披露しました。彼らは特定の視点から撮影された写真を生成し、詳細なテキストが記載されたチラシを特徴とするプロンプトをモデルに与えました。短い読み込み時間の後、結果は印象的で、映画のような演出が的確で、すべてのテキストが正確にレンダリングされていました。
その主要機能を超えて、4oはOpenAIの以前の画像生成ツールにはなかった新機能を備えています。画像参照機能が含まれており、ユーザーは既存の画像をアニメや自撮りなどの別のスタイルに変換したり、新しい創作のインスピレーションとして使用したりできます。
これは@gabeeegooohからの本当の愛の結晶でした。おめでとう、Gabe。素晴らしい仕事です!
ライブストリーム中に生成したものはこちら:pic.twitter.com/fmHWp4d9AF— Sam Altman (@sama) 2025年3月25日
クリエイティブなワークフローにシームレスに統合されるよう設計された4oは、透明な背景での画像生成、HEXコードによる特定の色の使用、さらにはチャットボットの高度な会話能力を画像作成プロセスに組み込むことができます。例えば、デモ中に写真にユーモアを加えるよう求められた際、4oはそのリクエストを反映したテキストを含めました。
画像生成機能は現在ChatGPTの一部であり、ユーザーは継続的な会話を通じて画像を改良できます。この機能により、画像の微調整が簡素化され、モデルは以前の生成のコンテキストを活用して新しい創作を行うことができます。GPT-4oのウェブアクセスにより、このコンテキストは画像生成プロセスをさらに豊かにします。
OpenAIは、GPT-4oの画像生成モデルが指示に対する強い順守性を持ち、10~20の異なるオブジェクトを同時に処理できるため、1つのプロンプトで複雑なシーンを作成できると主張しています。
より緩やかな保護措置
新しい画像生成ツールの注目すべき変化は、Elon MuskのGrokモデルで知られているような、より大胆なコンテンツを作成できる能力です。ライブストリーム中に、AltmanはユーザーがGPT-4oを使用して「合理的な範囲内で」攻撃的なコンテンツを生成できると述べました。イベント後、AltmanはXでさらに詳しく説明しました:
「私たちが目指しているのは、ユーザーが望まない限りツールが攻撃的なコンテンツを作成しないようにし、望む場合には合理的な範囲内でそれを行うことです。モデル仕様で述べているように、知的自由とコントロールをユーザーの手に委ねることが正しいと考えていますが、どのように進むかを見守り、社会の声を聞きます。」
モデルの発表ブログ投稿では、児童性的虐待素材や性的ディープフェイクなどのコンテンツポリシーに違反するリクエストをブロックすると明確にされました。さらに、実在の人物が関わる場合、特にヌードやグラフィックな暴力に関する強固な保護措置があります。ユーザーは4o画像生成モデルの詳細な安全性情報についてシステムカードを参照できます。
Sabrina Ortiz/ZDNET via ChatGPT
アクセス方法
更新された画像生成機能は現在ChatGPTおよびSoraで展開されており、無料アカウントのユーザーも含めすべてのユーザーが利用できます。ただし、GPT-4oを最大限に活用するには、「/create image」ショートカットを使用する必要があります。「XYZの画像を作成」と入力すると、古いDALL-Eモデルがデフォルトとなり、品質の低い画像になります。
OpenAIは画像生成の制限を明確にしていませんが、無料アカウントで3つの画像を作成した後、1日の制限に達しました。より広範なアクセスには、月額20ドルのChatGPT Plusへの加入が個人ユーザーにとって最良の選択肢で、OpenAIのSoraビデオジェネレーターへのアクセスなどの追加特典があります。執筆時点で、私はPlusアカウントで画像生成機能を使用できました。エンタープライズおよび教育ユーザーは近日中にアクセス可能となり、開発者は数週間以内にAPIアクセスを取得します。
DALL-Eが最初に登場したとき、それは独立した驚異でした。現在ChatGPTに統合されたそれは、Midjourney、Google、Adobeなどの競合他社に後れを取っていました。4oによるこのアップデートは競争の場を均等にし、より競争力のあるものにします。ただし、オリジナルのDALL-Eを使用したい場合は、専用のDALL-E GPTを通じて利用可能です。
Anthropic社の実験用AI「Claude」が、Eコマースのテストにおいて交渉と取引を完了した
人工知能(AI)が急速に進化する中、Anthropicは先週金曜日、「Project Deal」と呼ばれる社内実験をひっそりと開始し、EコマースにおけるAIの可能性を披露した。この実験では、同社のAIモデル「Claude」が、実際の金銭取引を伴うクローズドな市場環境において、購入、販売、価格交渉を自律的に行うよう設計された。実験の中核となったのは、Slack上に構築された社内マーケットプレイスであ
DeepSeek Code、まもなくリリースへ
AI技術の進展が加速する中、DeepSeekは今、まさに刺激的な転換点を迎えています。同社は最近、700億元を超える資金調達に成功したことを明らかにしました。経営陣は、目先の商業的利益よりも、画期的なAI研究への取り組みを重視する姿勢を強調しています。この戦略的転換は、新製品、とりわけ待望の「DeepSeek Code」の開発に全力を注ぐというDeepSeekの決意を示しています。DeepSeek
マスク氏の「Grok」:1.5兆のパラメータとカーソルコードの統合――ゲームチェンジャーか、それともブラフか?
イーロン・マスクがついに動き出した。AI開発競争において、OpenAIとAnthropicは加速している一方、xAIは出遅れているようだ。マスクはたびたび「Claude」に対抗する意向を表明してきたが、Grok4.Xシリーズへの度重なるアップデートにもかかわらず、結果は理論上は良好に見えても実用面では不十分であり、その差はほとんど縮まっていない。しかし、今回、彼には新たな切り札がある。マスクはX(
Die Geschwindigkeit, mit der sich Text-zu-Bild-Generatoren entwickeln, ist echt beeindruckend. Letzten Monat habe ich noch einen anderen Dienst genutzt, und jetzt bietet ChatGPT ein kostenloses Tool. Der Wettbewerb wird bestimmt die Qualität weiter in die Höhe treiben, aber man fragt sich, wie nachhaltig das 'kostenlos für alle'-Modell auf Dauer ist. Spannende Zeiten! 🎨
Wow, free image generation from OpenAI? That's a game-changer! Can't wait to mess around with it and see what wild visuals I can create. 🎨
ChatGPT's new image generator is a game-changer! Finally, a free tool that can create stunning visuals. It's easy to use and the results are mind-blowing. Only wish it had more customization options. Still, a must-try for anyone into AI art! 😍
ChatGPT의 새로운 이미지 생성 도구 정말 대단해요! 사용해보니 결과가 너무 놀라웠어요. 무료로 쓸 수 있는 점도 좋고요. 다만, 가끔 느리다는 점이 아쉽네요. 꼭 한번 써보세요! 😄





家






