챗봇으로부터 신뢰할 수 있는 건강 조언을 얻는 데 어려움이 있다는 연구 결과 발표

의료 시스템이 대기 시간 연장과 비용 증가로 어려움을 겪고 있는 가운데, 점점 더 많은 환자들이 사전 의료 상담을 위해 ChatGPT와 같은 인공지능 챗봇을 실험하고 있습니다. 최근 데이터에 따르면 미국 성인의 약 17%가 매달 이러한 도구를 통해 건강 정보를 얻고 있습니다. 그러나 새로운 연구에 따르면 이러한 새로운 관행은 특히 사용자가 적절한 맥락을 제공하지 않거나 AI의 응답을 잘못 해석할 경우 상당한 위험을 수반할 수 있습니다.
옥스포드가 주도한 이 연구는 사람들이 의료 자가 진단에 대화형 AI를 얼마나 효과적으로 사용하는지에 대한 중요한 한계를 드러냈습니다. 연구팀은 1,300명의 영국 참가자를 대상으로 의사가 개발한 의료 시나리오를 제시했습니다. 참가자들은 AI 비서 또는 인터넷 검색과 같은 기존 방법을 사용해 진단을 시도했으며, 여러 AI 플랫폼에서 우려스러운 결과가 나왔습니다.
"우리는 양방향에서 근본적인 커뮤니케이션 단절을 관찰했습니다."라고 이 연구의 공동 저자인 옥스퍼드 인터넷 연구소의 아담 마흐디는 설명합니다. "AI 사용자들은 기존 접근 방식을 사용하는 사람들보다 더 나은 의사 결정 능력을 보여주지 못했으며, 어떤 경우에는 더 나쁜 성과를 거두기도 했습니다."
이 연구는 세 가지 주요 AI 모델을 테스트했습니다: OpenAI의 GPT-4o(ChatGPT 지원), Cohere의 Command R+, Meta의 Llama 3. 연구 결과 두 가지 문제가 되는 패턴이 발견되었습니다:
- AI 도구를 사용하는 참가자는 관련 건강 상태를 식별하는 데 덜 성공했습니다.
- AI 상호작용으로 인해 상태의 심각성을 과소평가하는 위험한 결과가 초래됨
마흐디는 입력 품질과 결과 해석에 심각한 문제가 있다고 지적했습니다: "사용자는 질문을 작성할 때 중요한 의학적 세부 사항을 생략하는 경우가 많았고, AI 응답은 정확한 조언과 문제가 있는 제안을 혼합하는 경우가 많았습니다." 이러한 조합은 사용자가 부적절한 의료 결정을 내릴 수 있는 특히 위험한 시나리오를 만들었습니다.
업계의 요구와 의료 현실
이러한 결과는 주요 기술 기업들이 건강에 초점을 맞춘 AI 애플리케이션을 공격적으로 개발하면서 드러나고 있습니다:
- Apple은 운동 및 수면 지도를 위한 웰니스 어드바이저를 개발 중인 것으로 알려졌습니다.
- 아마존은 사회적 건강 지표를 위해 의료 기록을 분석하고 있습니다.
- Microsoft는 환자 커뮤니케이션의 우선 순위를 정하는 AI 시스템을 개발하고 있습니다.
그러나 의료계는 이러한 기술을 임상 환경에 적용하는 것에 대해 여전히 신중한 입장입니다. 미국의사협회는 의사들이 의사 결정 지원을 위해 소비자 챗봇을 사용하는 것에 대해 명시적으로 경고하고 있으며, 이는 AI 개발자들도 같은 경고를 하고 있습니다. Open AI의 사용 정책은 특히 진단 목적으로 모델을 사용하는 것을 금지하고 있습니다.
"우리는 사람들이 의료 결정을 내릴 때 챗봇의 결과물보다는 검증된 의료 자료를 참조할 것을 강력히 권고합니다."라고 마흐디는 강조합니다. "이러한 시스템은 널리 배포되기 전에 제약 임상시험에 필적하는 엄격한 실제 테스트를 거쳐야 합니다."
결론
AI 챗봇은 의료 서비스의 접근성을 높일 수 있는 흥미로운 가능성을 제시하지만, 이 연구는 현재 구현에 상당한 위험이 있음을 강조합니다. 기술이 발전함에 따라 개발자는 신뢰성의 중요한 격차를 해결해야 하며, 사용자는 적절한 회의론을 가지고 AI 의료 조언에 접근해야 합니다.
관련 기사
대중의 신뢰 부족으로 성장에 제동이 걸린 AI
정치인들은 AI의 성장과 효율성 잠재력을 강조하지만, 최근 보고서에 따르면 대중의 신뢰 부족이 심각하다고 합니다. 광범위한 회의론으로 인해 정부 이니셔티브에 큰 어려움이 발생하고 있습니다.토니 블레어 글로벌 변화 연구소(TBI)와 입소스의 종합적인 연구는 이러한 불안감을 정량화합니다. 이 연구에 따르면 사람들이 제너레이티브 AI 사용을 주저하는 가장 큰 이
듀링고, AI 도입으로 계약자 대체하며 전략적 개편 단행
듀오링고가 "AI 최우선" 조직으로 전환함에 따라 일부 팀을 재구성하고 있다고 공동 창업자이자 CEO인 루이스 본 안이 내부 메모를 통해 밝혔으며, 이는 이후 회사의 LinkedIn 페이지에 공개되었습니다.이 메모는 계획된 운영 변화 세부사항을 설명하며, 효율성 향상, 수작업 최소화, 콘텐츠 제작 확장을 위해 인공지능을 통합하는 것에 큰 중점을 둡니다.듀오링고는 AI가 처리할 수 있는 작업에 대해서는 계약자 역할을 단계적으로 폐지할 예정입니다.
MIT 연구, 인공지능이 인간의 두뇌 참여를 감소시킨다는 사실 발견
MIT(매사추세츠 공과대학)에서 실시한 연구에 따르면 대규모 언어 모델(LLM)을 사용하면 순간의 정신적 노력이 줄어들 뿐만 아니라 후속 작업에서 인지 능력에도 부정적인 영향을 미친다고 합니다.이 실험에서 연구자들은 소수의 참가자(연구[PDF]에서도 한계가 인정된 바 있음)를 대상으로 다양한 주제에 대한 에세이를 작성하도록 했습니다. 한 그룹은 AI를 사용
관련 특별 주제 추천
의견 (3)
0/500
Wait, 17% of adults already use chatbots for medical advice? That's terrifying. I can barely trust WebMD without spiraling into hypochondria. 😅 Has anyone actually gotten a correct diagnosis from ChatGPT? I'd rather wait for my doctor than risk a hallucination about my symptoms.
Die 17% Nutzerquote ist krass, aber logisch - bei monatelangen Wartezeiten bei nem Facharzt frag ich auch erstmal ChatGPT. Der Artikel bringt es gut auf den Punkt: 'Daten sind ein Problem'. Wenn mein Chatbot mit veralteten Studien oder irreführenden, kommerziellen Gesundheits-Blogs trainiert wurde, ist der Ratschlag mehr als nur 'unzuverlässig', das wird potenziell gefährlich. 🧐 Ich hoffe, die Regulierungsbehörden schlafen da nicht ein.

의료 시스템이 대기 시간 연장과 비용 증가로 어려움을 겪고 있는 가운데, 점점 더 많은 환자들이 사전 의료 상담을 위해 ChatGPT와 같은 인공지능 챗봇을 실험하고 있습니다. 최근 데이터에 따르면 미국 성인의 약 17%가 매달 이러한 도구를 통해 건강 정보를 얻고 있습니다. 그러나 새로운 연구에 따르면 이러한 새로운 관행은 특히 사용자가 적절한 맥락을 제공하지 않거나 AI의 응답을 잘못 해석할 경우 상당한 위험을 수반할 수 있습니다.
옥스포드가 주도한 이 연구는 사람들이 의료 자가 진단에 대화형 AI를 얼마나 효과적으로 사용하는지에 대한 중요한 한계를 드러냈습니다. 연구팀은 1,300명의 영국 참가자를 대상으로 의사가 개발한 의료 시나리오를 제시했습니다. 참가자들은 AI 비서 또는 인터넷 검색과 같은 기존 방법을 사용해 진단을 시도했으며, 여러 AI 플랫폼에서 우려스러운 결과가 나왔습니다.
"우리는 양방향에서 근본적인 커뮤니케이션 단절을 관찰했습니다."라고 이 연구의 공동 저자인 옥스퍼드 인터넷 연구소의 아담 마흐디는 설명합니다. "AI 사용자들은 기존 접근 방식을 사용하는 사람들보다 더 나은 의사 결정 능력을 보여주지 못했으며, 어떤 경우에는 더 나쁜 성과를 거두기도 했습니다."
이 연구는 세 가지 주요 AI 모델을 테스트했습니다: OpenAI의 GPT-4o(ChatGPT 지원), Cohere의 Command R+, Meta의 Llama 3. 연구 결과 두 가지 문제가 되는 패턴이 발견되었습니다:
- AI 도구를 사용하는 참가자는 관련 건강 상태를 식별하는 데 덜 성공했습니다.
- AI 상호작용으로 인해 상태의 심각성을 과소평가하는 위험한 결과가 초래됨
마흐디는 입력 품질과 결과 해석에 심각한 문제가 있다고 지적했습니다: "사용자는 질문을 작성할 때 중요한 의학적 세부 사항을 생략하는 경우가 많았고, AI 응답은 정확한 조언과 문제가 있는 제안을 혼합하는 경우가 많았습니다." 이러한 조합은 사용자가 부적절한 의료 결정을 내릴 수 있는 특히 위험한 시나리오를 만들었습니다.
업계의 요구와 의료 현실
이러한 결과는 주요 기술 기업들이 건강에 초점을 맞춘 AI 애플리케이션을 공격적으로 개발하면서 드러나고 있습니다:
- Apple은 운동 및 수면 지도를 위한 웰니스 어드바이저를 개발 중인 것으로 알려졌습니다.
- 아마존은 사회적 건강 지표를 위해 의료 기록을 분석하고 있습니다.
- Microsoft는 환자 커뮤니케이션의 우선 순위를 정하는 AI 시스템을 개발하고 있습니다.
그러나 의료계는 이러한 기술을 임상 환경에 적용하는 것에 대해 여전히 신중한 입장입니다. 미국의사협회는 의사들이 의사 결정 지원을 위해 소비자 챗봇을 사용하는 것에 대해 명시적으로 경고하고 있으며, 이는 AI 개발자들도 같은 경고를 하고 있습니다. Open AI의 사용 정책은 특히 진단 목적으로 모델을 사용하는 것을 금지하고 있습니다.
"우리는 사람들이 의료 결정을 내릴 때 챗봇의 결과물보다는 검증된 의료 자료를 참조할 것을 강력히 권고합니다."라고 마흐디는 강조합니다. "이러한 시스템은 널리 배포되기 전에 제약 임상시험에 필적하는 엄격한 실제 테스트를 거쳐야 합니다."
결론
AI 챗봇은 의료 서비스의 접근성을 높일 수 있는 흥미로운 가능성을 제시하지만, 이 연구는 현재 구현에 상당한 위험이 있음을 강조합니다. 기술이 발전함에 따라 개발자는 신뢰성의 중요한 격차를 해결해야 하며, 사용자는 적절한 회의론을 가지고 AI 의료 조언에 접근해야 합니다.
대중의 신뢰 부족으로 성장에 제동이 걸린 AI
정치인들은 AI의 성장과 효율성 잠재력을 강조하지만, 최근 보고서에 따르면 대중의 신뢰 부족이 심각하다고 합니다. 광범위한 회의론으로 인해 정부 이니셔티브에 큰 어려움이 발생하고 있습니다.토니 블레어 글로벌 변화 연구소(TBI)와 입소스의 종합적인 연구는 이러한 불안감을 정량화합니다. 이 연구에 따르면 사람들이 제너레이티브 AI 사용을 주저하는 가장 큰 이
MIT 연구, 인공지능이 인간의 두뇌 참여를 감소시킨다는 사실 발견
MIT(매사추세츠 공과대학)에서 실시한 연구에 따르면 대규모 언어 모델(LLM)을 사용하면 순간의 정신적 노력이 줄어들 뿐만 아니라 후속 작업에서 인지 능력에도 부정적인 영향을 미친다고 합니다.이 실험에서 연구자들은 소수의 참가자(연구[PDF]에서도 한계가 인정된 바 있음)를 대상으로 다양한 주제에 대한 에세이를 작성하도록 했습니다. 한 그룹은 AI를 사용
Wait, 17% of adults already use chatbots for medical advice? That's terrifying. I can barely trust WebMD without spiraling into hypochondria. 😅 Has anyone actually gotten a correct diagnosis from ChatGPT? I'd rather wait for my doctor than risk a hallucination about my symptoms.
Die 17% Nutzerquote ist krass, aber logisch - bei monatelangen Wartezeiten bei nem Facharzt frag ich auch erstmal ChatGPT. Der Artikel bringt es gut auf den Punkt: 'Daten sind ein Problem'. Wenn mein Chatbot mit veralteten Studien oder irreführenden, kommerziellen Gesundheits-Blogs trainiert wurde, ist der Ratschlag mehr als nur 'unzuverlässig', das wird potenziell gefährlich. 🧐 Ich hoffe, die Regulierungsbehörden schlafen da nicht ein.





집






