OpenAIの研究により、真偽の検証なしに単語予測に焦点を当てた事前トレーニングが原因で、LLMの幻覚が続くことが明らか - xix.ai

ツール

ランキング

カバー生成

画像を生成

モデル

大規模言語モデル

マルチモーダルモデル

プロンプト

プロンプト

画像プロンプト

ニュース

インクルージョンのために提出します

アプリを提出

ツールを提出

English 日本語 한국어 Português español Deutsch Русский Français 繁體中文简体中文

サインインサインアップ

ツール

ランキング

カバー生成

画像を生成

モデル

大規模言語モデル

マルチモーダルモデル

プロンプト

プロンプト

画像プロンプト

ニュース

インクルージョンのために提出します

アプリを提出

ツールを提出

アカウントを作成するサインイン

日本語

設定

English EN 日本語 JA 한국어 KO Português PT español ES Deutsch DE Русский RU Français FR 繁體中文 ZH-TW 简体中文 ZH-CN

家

速報

コンテンツ

ArthurThomas

ArthurThomas

2025年9月7日

OpenAIの研究により、真偽の検証なしに単語予測に焦点を当てた事前トレーニングが原因で、LLMの幻覚が続くことが明らかになった。現在の評価では、不確実性を認めるよりも推測にインセンティブを与えている。修正案としては、盲目的な推測を抑制する標準化されたテストのように、不確実性よりも確信的な誤りにペナルティを課す採点システムがある。

OpenAIの研究により、真偽の検証なしに単語予測に焦点を当てた事前トレーニングが原因で、LLMの幻覚が続くことが明らかになった。現在の評価では、不確実性を認めるよりも推測にインセンティブを与えている。修正案としては、盲目的な推測を抑制する標準化されたテストのように、不確実性よりも確信的な誤りにペナルティを課す採点システムがある。

共有リンクをコピーするにはクリック

コメント (0)

0/300

送信

著者 BillyMartinez

BillyMartinez 2026年6月8日

アリババはAI事業を再編し、同益大型モデル部門とFuture Life LabをCEOのウー・ヨンミンが率いる新設されたToken Foundry部門に統合しました。ジョウ・ジンレンがAI未来研究所の所長に任命されました。Qwen-3.7モデルはコーディング分野で世界トップ3にランクインしています。アリババのAI事業は商業化の段階に入っています。

/ja/live/5034

著者 BruceSmith

BruceSmith 2026年6月8日

テンセント・ハイおよび主要な研究機関は、インストラクション駆動型のオーディオ編集における初の大規模ベンチマークであるMMAEを発表しました。テストの結果、現在のAIモデルでは正確なマッチング率が5％未満であり、精密なオーディオ編集における大きな欠陥が明らかになりました。MMAEは2000件の実世界のサンプルと17,741個のメトリクスを使用して、音声、音楽、音声認識における編集精度を評価します。

著者 EricYoung

EricYoung 2026年6月8日

盛書科技と華策影業は戦略的パートナーシップを結び、盛書科技のViduビデオ生成モデルを活用したAI視聴覚制作センターを立ち上げました。彼らの目的は、AIによるバーチャル制作と従来の撮影技術を統合し、AIを活用した映画・テレビ番組の教育プログラムを開発すること、そして現場での撮影にAIソリューションを導入して効率を向上させコストを削減することであり、これはインテリジェントで産業化された映画制作への一歩となります。

著者 MarkSanchez

MarkSanchez 2026年6月8日

KuaiKan Comicsは、創業者のChen Anniが主導するAIデジタルライフ製品「Livo」を発表しました。この製品は、AIGCを活用して13,000のコミックIPを自律的なデジタルワールドに変えることを目的としています。現在デモテスト段階にあるLivoは、知覚機能、リアルタイムインタラクション、感情応答メカニズムを備えており、従来のチャプター単位での課金方式から、エクスペリエンスや関係性に基づく課金方式へと移行することで、ARPPUを向上させることを目指しています。

著者 RogerMartinez

RogerMartinez 2026年6月8日

シャオミは17Tシリーズの発表会で人型ロボットを披露し、自律的な電話の把持や音量キーによるズーム操作を実演しました。このロボットは2017年から研究開発が始まり、「铁蛋」と「铁大」というモデルがあり、2023年にはロボット会社も設立されました。3月には自動車工場で3時間連続運用を行い、90.2％の成功率を達成しました。アップグレードされたCyberOneバイオニックハンドでは音量が60％減少し、操作性も向上しました。これはシャオミのエンボディドインテリジェンスが産業分野から日常生活へと応用範囲を広げており、ロボット産業化が加速する可能性を示しています。

/ja/live/5030

プライバシー設定

任何のウェブサイトを訪問すると、多くの場合クッキーの形式でブラウザに情報を保存または取得する場合があります。この情報は、あなた、あなたの偏好、またはデバイスに関するものである場合があり、主にサイトが期待どおりに機能するようにするために使用されます。この情報は通常、直接あなたを特定するものではありませんが、よりパーソナライズされたウェブ体験を提供することができます。私たちはあなたのプライバシーの権利を尊重するため、特定の種類のクッキーを許可しないように選択することができます。さまざまなカテゴリの見出しをクリックして詳細を確認し、デフォルト設定を変更してください。ただし、特定の種類のクッキーをブロックすると、サイトの体験や提供できるサービスに影響を与える場合があります。プライバシーポリック声明

偏好設定の管理

必須クッキー

常に有効

これらのクッキーはウェブサイトの機能に必要であり、当社のシステムでは無効にすることができません。これらは通常、プライバシー設定の変更、ログイン、フォームの入力など、サービス要求に相当するあなたの操作に応じてのみ設定されます。ブラウザを設定してこれらのクッキーをブロックしたり、アラートを表示したりすることができますが、その場合サイトの一部機能が正常に動作しなくなります。これらのクッキーは個人を特定できる情報を保存することはありません。

すべてのクッキーを受け入れる

サインインサインアップ

OR

メール

パスワード

私を覚えてますかパスワードをお忘れですか

サインイン

メール

パスワード

グラフィック検証コードを入力してください

サインアップ