チャットボットから信頼できる健康アドバイスを得るための課題が研究で明らかに

医療制度が待ち時間の延長と費用の高騰に苦しむ中、ChatGPTのようなAIチャットボットを使って事前の医療アドバイスを試みる患者が増えている。最近のデータでは、米国の成人の約17%が毎月、健康情報のためにこれらのツールに相談している。しかし、新しい研究によると、この新たな実践には大きなリスクが伴うことが示唆されている。特に、ユーザーが適切なコンテキストを提供しなかったり、AIの応答を誤解したりした場合だ。
オックスフォード大学が主導した研究では、人々が医療自己診断のために会話型AIをいかに効果的に使うかについて、重大な限界があることを明らかにした。研究チームは、英国の参加者1,300人を対象に、医師が作成した医療シナリオを提示した。参加者は、AIアシスタントまたはインターネット検索のような従来の方法のいずれかを使用して診断を試みたが、複数のAIプラットフォームで懸念される結果が得られた。
オックスフォード・インターネット研究所の共著者であるアダム・マハディは、「私たちは、双方向で根本的なコミュニケーションの断絶を観察しました」と説明する。「AIユーザーは、従来のアプローチを採用したユーザーよりも優れた意思決定能力を示さなかった。
この研究では、3つの主要なAIモデルをテストした:OpenAIのGPT-4o(ChatGPTに搭載)、CohereのCommand R+、MetaのLlama 3である。その結果、2つの厄介なパターンが明らかになった:
- AIツールを使用した参加者は、関連する健康状態を特定することにあまり成功していなかった。
- AIとのインタラクションは、症状の重症度を危険なほど過小評価することにつながった。
Mahdi氏は、入力の質と出力の解釈に大きな問題があることを指摘した:"ユーザーは、クエリを作成する際に重要な医学的詳細を省略することが多く、AIの応答は正確なアドバイスと問題のある提案を混同することが多かった"。この組み合わせは、ユーザーが不適切な医療判断を下す可能性のある、特に危険なシナリオを生み出した。
業界の後押しと医療の現実
大手ハイテク企業が健康に特化したAIアプリケーションを積極的に開発している中で、このような調査結果が出た:
- アップルは、運動と睡眠を指導するウェルネス・アドバイザーを開発中と報じられている。
- アマゾンは社会的健康指標を得るために医療記録を分析している。
- マイクロソフトは、患者とのコミュニケーションに優先順位をつけるAIシステムを開発している。
しかし、医療界はこれらの技術を臨床の場に導入することに慎重な姿勢を崩していない。米国医師会は、意思決定支援に消費者向けチャットボットを使用しないよう医師に明確に警告しており、この警告はAI開発者自身も同じことを言っている。Open AIの使用ポリシーでは、診断目的でモデルを使用することを特に禁止している。
「私たちは、ヘルスケアの意思決定にはチャットボットの出力ではなく、検証済みの医療情報源を参照するよう強く勧めます」とマハディ氏は強調する。"広く展開する前に、これらのシステムは、医薬品の臨床試験に匹敵する厳格な実世界試験が必要です。"
結論
AIチャットボットは、医療をより身近なものにするための興味深い可能性を提供する一方で、この研究は、現在の実装における実質的なリスクを浮き彫りにしている。技術が進化するにつれて、開発者は信頼性における重大なギャップに対処しなければならず、一方、利用者は適切な懐疑心を持ってAI医療アドバイスに臨むべきである。
関連記事
社会的信頼の欠如が成長を阻むAI
政治家がAIの成長と効率化の可能性を強調する一方で、最近の報告書では国民の間に大きな信頼の欠如があることが浮き彫りになっている。懐疑的な見方が広がり、政府の取り組みに大きな課題をもたらしている。トニー・ブレア地球変動研究所(TBI)とイプソスによる包括的な調査は、この不安を定量化している。それによると、信頼の欠如が、人々がジェネレーティブAIの利用をためらう主な理由であることが明らかになった。これ
Duolingo、AIを活用した戦略的再編で請負業者から置き換えへ
Duolingoは、「AI第一」組織への移行に伴い、一部チームの再編を実施している。この方針は、CEO兼共同創業者ルイス・フォン・アーン氏による内部文書で明らかになり、後に同社のLinkedInページで公開された。この文書では、人工知能の統合を通じて効率向上、手作業の最小化、コンテンツ制作の拡大を強く推進する一連の運営改革が詳述されている。DuolingoはAIで対応可能な業務について、請負契約の役割を段階的に廃止する。また、採用応募者や従業員のAIツール活用状況を評価項目に加える方針だ。フォン
マサチューセッツ工科大学(MIT)の研究で、AIが人間の脳への関与を低下させることが判明
MIT(マサチューセッツ工科大学)が実施した研究で、大規模言語モデル(LLM)を使用すると、その場での精神的努力が軽減されるだけでなく、その後の課題における認知的パフォーマンスにも悪影響が残ることが明らかになった。この実験では、研究者たちは少人数の参加者を対象に、様々なトピックについてエッセイを書くよう割り当てられた。あるグループはAI(ChatGPTが選択され、研究者たちは類似のツールとの機能的
関連特集おすすめ
コメント (3)
0/500
Wait, 17% of adults already use chatbots for medical advice? That's terrifying. I can barely trust WebMD without spiraling into hypochondria. 😅 Has anyone actually gotten a correct diagnosis from ChatGPT? I'd rather wait for my doctor than risk a hallucination about my symptoms.
Die 17% Nutzerquote ist krass, aber logisch - bei monatelangen Wartezeiten bei nem Facharzt frag ich auch erstmal ChatGPT. Der Artikel bringt es gut auf den Punkt: 'Daten sind ein Problem'. Wenn mein Chatbot mit veralteten Studien oder irreführenden, kommerziellen Gesundheits-Blogs trainiert wurde, ist der Ratschlag mehr als nur 'unzuverlässig', das wird potenziell gefährlich. 🧐 Ich hoffe, die Regulierungsbehörden schlafen da nicht ein.

医療制度が待ち時間の延長と費用の高騰に苦しむ中、ChatGPTのようなAIチャットボットを使って事前の医療アドバイスを試みる患者が増えている。最近のデータでは、米国の成人の約17%が毎月、健康情報のためにこれらのツールに相談している。しかし、新しい研究によると、この新たな実践には大きなリスクが伴うことが示唆されている。特に、ユーザーが適切なコンテキストを提供しなかったり、AIの応答を誤解したりした場合だ。
オックスフォード大学が主導した研究では、人々が医療自己診断のために会話型AIをいかに効果的に使うかについて、重大な限界があることを明らかにした。研究チームは、英国の参加者1,300人を対象に、医師が作成した医療シナリオを提示した。参加者は、AIアシスタントまたはインターネット検索のような従来の方法のいずれかを使用して診断を試みたが、複数のAIプラットフォームで懸念される結果が得られた。
オックスフォード・インターネット研究所の共著者であるアダム・マハディは、「私たちは、双方向で根本的なコミュニケーションの断絶を観察しました」と説明する。「AIユーザーは、従来のアプローチを採用したユーザーよりも優れた意思決定能力を示さなかった。
この研究では、3つの主要なAIモデルをテストした:OpenAIのGPT-4o(ChatGPTに搭載)、CohereのCommand R+、MetaのLlama 3である。その結果、2つの厄介なパターンが明らかになった:
- AIツールを使用した参加者は、関連する健康状態を特定することにあまり成功していなかった。
- AIとのインタラクションは、症状の重症度を危険なほど過小評価することにつながった。
Mahdi氏は、入力の質と出力の解釈に大きな問題があることを指摘した:"ユーザーは、クエリを作成する際に重要な医学的詳細を省略することが多く、AIの応答は正確なアドバイスと問題のある提案を混同することが多かった"。この組み合わせは、ユーザーが不適切な医療判断を下す可能性のある、特に危険なシナリオを生み出した。
業界の後押しと医療の現実
大手ハイテク企業が健康に特化したAIアプリケーションを積極的に開発している中で、このような調査結果が出た:
- アップルは、運動と睡眠を指導するウェルネス・アドバイザーを開発中と報じられている。
- アマゾンは社会的健康指標を得るために医療記録を分析している。
- マイクロソフトは、患者とのコミュニケーションに優先順位をつけるAIシステムを開発している。
しかし、医療界はこれらの技術を臨床の場に導入することに慎重な姿勢を崩していない。米国医師会は、意思決定支援に消費者向けチャットボットを使用しないよう医師に明確に警告しており、この警告はAI開発者自身も同じことを言っている。Open AIの使用ポリシーでは、診断目的でモデルを使用することを特に禁止している。
「私たちは、ヘルスケアの意思決定にはチャットボットの出力ではなく、検証済みの医療情報源を参照するよう強く勧めます」とマハディ氏は強調する。"広く展開する前に、これらのシステムは、医薬品の臨床試験に匹敵する厳格な実世界試験が必要です。"
結論
AIチャットボットは、医療をより身近なものにするための興味深い可能性を提供する一方で、この研究は、現在の実装における実質的なリスクを浮き彫りにしている。技術が進化するにつれて、開発者は信頼性における重大なギャップに対処しなければならず、一方、利用者は適切な懐疑心を持ってAI医療アドバイスに臨むべきである。
社会的信頼の欠如が成長を阻むAI
政治家がAIの成長と効率化の可能性を強調する一方で、最近の報告書では国民の間に大きな信頼の欠如があることが浮き彫りになっている。懐疑的な見方が広がり、政府の取り組みに大きな課題をもたらしている。トニー・ブレア地球変動研究所(TBI)とイプソスによる包括的な調査は、この不安を定量化している。それによると、信頼の欠如が、人々がジェネレーティブAIの利用をためらう主な理由であることが明らかになった。これ
マサチューセッツ工科大学(MIT)の研究で、AIが人間の脳への関与を低下させることが判明
MIT(マサチューセッツ工科大学)が実施した研究で、大規模言語モデル(LLM)を使用すると、その場での精神的努力が軽減されるだけでなく、その後の課題における認知的パフォーマンスにも悪影響が残ることが明らかになった。この実験では、研究者たちは少人数の参加者を対象に、様々なトピックについてエッセイを書くよう割り当てられた。あるグループはAI(ChatGPTが選択され、研究者たちは類似のツールとの機能的
Wait, 17% of adults already use chatbots for medical advice? That's terrifying. I can barely trust WebMD without spiraling into hypochondria. 😅 Has anyone actually gotten a correct diagnosis from ChatGPT? I'd rather wait for my doctor than risk a hallucination about my symptoms.
Die 17% Nutzerquote ist krass, aber logisch - bei monatelangen Wartezeiten bei nem Facharzt frag ich auch erstmal ChatGPT. Der Artikel bringt es gut auf den Punkt: 'Daten sind ein Problem'. Wenn mein Chatbot mit veralteten Studien oder irreführenden, kommerziellen Gesundheits-Blogs trainiert wurde, ist der Ratschlag mehr als nur 'unzuverlässig', das wird potenziell gefährlich. 🧐 Ich hoffe, die Regulierungsbehörden schlafen da nicht ein.





家






