オプション
ニュース
Openaiは業界固有のAIベンチマークを支持しています:これが重要な理由です

Openaiは業界固有のAIベンチマークを支持しています:これが重要な理由です

2025年4月15日
137

Openaiは業界固有のAIベンチマークを支持しています:これが重要な理由です

ベンチマークのパフォーマンス結果は、新しいAIモデルがリリースされる際の一般的な特徴であり、初等数学(GSM8K)や大学院レベルの推論(GPQA)など、さまざまな一般的なタスクにおける能力を示します。しかし、これらのベンチマークは、さまざまな業界の特定のニーズに対応していないことが多いです。

また:ChatGPTは今、あなたが話すすべてを記憶します - 本当のパーソナルアシスタントのようです

OpenAIパイオニアプログラム

このギャップを埋めるために、OpenAIは、対象業界や実際のアプリケーション向けにAIモデルの開発を強化するために設計されたOpenAIパイオニアプログラムを導入しました。この取り組みは、企業がOpenAIの研究者とパートナーシップを組み、よりカスタマイズされた評価を作成し、特定のドメインに適合するようにモデルを改良する二重の焦点を当てた努力です。

私たちはopenaiパイオニアプログラムを立ち上げます -- openaiと先進的なAI製品を構築する企業とのパートナーシップで、(a) 高価値のドメイン固有のタスクで優れたパフォーマンスを発揮するモデルを徹底的に微調整し、(b) 業界がより良く… https://t.co/cCvkGmYqJd

— Brad Lightcap (@bradlightcap) 2025年4月9日

最近のブログ投稿で、OpenAIは、法律、金融、保険、医療、会計などのセクターには包括的なベンチマークソースが不足していると指摘しました。これに対処するために、OpenAIは各セクター内の複数の企業と協力してこれらの評価を開発する予定です。このアプローチは、モデルの開発を強化するだけでなく、公共とAI技術の間のより大きな信頼を育むことを目指しています。

また:AIは壁にぶつかっているのではなく、ベンチマークに対して賢すぎるだけだとAnthropicは述べています

研究では、企業環境におけるAIにとって、業界固有のベンチマークの欠如が大きな課題であると特定されています。たとえば、Salesforce AI Researchを率いるSilvio Savareseは、ブログ投稿でエンタープライズ総合知能(EGI)の概念について議論しました。EGIは、特定のビジネスドメインに特化した先進的なAIソリューションに焦点を当てています。ZDNETとの議論で、彼はEGIを達成するための重要なステップとして、ドメイン固有の機能を評価するベンチマークの開発の重要性を強調しました。

既存モデルの改良

新しい評価の作成に加えて、OpenAIは、強化微調整(RFT)と呼ばれる方法を通じて、3つの特定の業界ユースケース向けに既存のモデルを改良するために企業と協力します。OpenAIはRFTの実装に関するガイダンスを提供し、企業がこれらのモデルをどのように展開するかを決定できるようにします。これらのモデルは、OpenAIによると、大規模な使用に備えることが期待されています。

また:AIモデルのレースは突然非常に近接したと、スタンフォードの学者たちは述べています

このプログラムに参加する最初のグループには、実際の影響が大きいユースケースに焦点を当てた選ばれたスタートアップが含まれます。あなたの企業がこれらの基準を満たしている場合、OpenAIパイオニアプログラムのウェブページを通じて基本的な企業情報を提出することで申請できます。

毎朝のトップストーリーをTech Todayニュースレターであなたの受信トレイに受け取ります。

関連記事
AIを駆使したカバーレター:ジャーナル投稿のためのエキスパートガイド AIを駆使したカバーレター:ジャーナル投稿のためのエキスパートガイド 競争の激しい今日の学術出版環境では、効果的なカバーレターを作成することが、原稿の採否を決定的に左右します。ChatGPTのようなAIを搭載したツールが、この重要なタスクをいかに効率化し、ジャーナル編集者の目を引く洗練されたプロフェッショナルなレターを作成できるかをご覧ください。ChatGPTの包括的なガイドでは、投稿パッケージを最適化し、出版を最大限に成功させるための戦略をステップごとに紹介してい
米国、ソーシャルメディア規制をめぐり外国公務員を制裁へ 米国、ソーシャルメディア規制をめぐり外国公務員を制裁へ 米国、世界のデジタルコンテンツ規制に対抗国務省は今週、ヨーロッパのデジタル・ガバナンス政策を標的に鋭い外交的非難を行い、オンライン・プラットフォームの支配をめぐる緊張の高まりを示唆した。マルコ・ルビオ長官は、米国が米国のデジタル空間に影響を及ぼす検閲の行き過ぎとみなすものに関与する外国政府関係者を対象とした、新しいビザ制限政策を発表した。新しいビザ制限の説明水曜日に発表された政策では、米
AIを搭載したYouTube動画要約機能の究極ガイド AIを搭載したYouTube動画要約機能の究極ガイド 情報が溢れるデジタル環境において、AIを搭載したYouTube動画要約ツールは効率的なコンテンツ消費に欠かせないものとなっている。この詳細なガイドでは、最先端の NLP テクノロジー、特に Hugging Face の BART モデルと YouTube の Transcript API を組み合わせて、洗練された要約ツールを構築する方法を説明します。生産性ツールの開発、アクセシビリティソリューシ
コメント (23)
0/200
WillLopez
WillLopez 2025年9月12日 7:30:33 JST

산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐

RichardSmith
RichardSmith 2025年8月28日 0:01:28 JST

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄

JustinHarris
JustinHarris 2025年8月11日 14:00:59 JST

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄

JosephScott
JosephScott 2025年4月24日 2:47:18 JST

OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀

FrankJackson
FrankJackson 2025年4月23日 6:27:27 JST

業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい!一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅

BrianThomas
BrianThomas 2025年4月22日 8:41:13 JST

A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀

トップに戻ります
OR