옵션
뉴스
불확실성을 인정하도록 시스템을 교육하여 AI 환각에 대처하는 MIT 스타트업

불확실성을 인정하도록 시스템을 교육하여 AI 환각에 대처하는 MIT 스타트업

2025년 11월 23일
103

중요한 정보를 드러내고 중대한 결정을 내릴 때 이러한 모델에 점점 더 의존하게 되면서 AI 환각과 관련된 위험은 점점 더 커지고 있습니다.

우리 모두는 무지를 인정하지 않거나 온라인에서 훑어본 내용을 바탕으로 의심스러운 조언을 제공하는 등 모든 것을 아는 사람처럼 행동하는 사람을 알고 있습니다. AI 환각은 그런 친구와 비슷하지만, 이 경우 그 친구가 여러분의 암 치료법을 설계하고 있을 수도 있습니다.

이것이 바로 테미스 AI가 개입하는 부분입니다. MIT에서 분사한 이 회사는 개념적으로는 간단해 보이지만 기술적으로는 어려운 과제인 AI 시스템에 불확실성을 인식하고 인정하도록 가르치는 데 성공했습니다.

AI 모델은 과신하는 경향이 있습니다. 테미스의 Capsa 플랫폼은 현실 점검 기능을 제공하여 모델이 확신을 가지고 작동하는 대신 추측을 하는 경우를 식별할 수 있도록 지원합니다.

MIT의 다니엘라 루스 교수와 전직 연구원이었던 알렉산더 아미니와 엘라헤 아흐마디가 2021년에 설립한 테미스 AI는 거의 모든 AI 시스템과 통합되는 플랫폼을 구축하여 오류가 발생하기 전에 불확실한 순간을 표시합니다.

AI는 Capsa를 사용하여 자체 데이터 처리 과정에서 혼란, 편견 또는 정보 조건의 차이를 암시하는 패턴을 인식하는 방법을 학습하여 종종 환각으로 이어집니다.

출시 이후 테미스는 통신 회사가 막대한 비용이 드는 네트워크 계획 실수를 방지하고, 석유 및 가스 회사가 복잡한 지진 데이터를 해석하는 데 도움을 주었으며, 사실을 자신 있게 발명하지 않는 챗봇 구축에 관한 연구를 발표했습니다.

아직 많은 사람들이 AI 시스템이 얼마나 자주 교육적인 추측을 하고 있는지 알지 못합니다. 이러한 시스템이 더욱 중요한 역할을 맡게 되면서 이러한 추측은 심각한 결과를 초래할 수 있습니다. 테미스 AI는 부족한 요소인 자기 인식을 도입합니다.

AI 환각을 해결하기 위한 테미스 AI의 여정

테미스 AI의 여정은 수년 전 MIT의 루스 교수 연구실에서 연구원들이 핵심적인 질문을 탐구하면서 시작되었습니다: 기계가 어떻게 자신의 한계를 인식할 수 있을까?

2018년, Toyota는 오류로 인해 생명을 위협할 수 있는 자율주행차를 위한 신뢰할 수 있는 AI 연구에 자금을 지원했습니다. 자율주행차가 보행자와 도로의 위험을 정확하게 감지해야 할 때 이 문제는 특히 중요합니다.

연구팀은 얼굴 인식 시스템에서 인종과 성별 편견을 식별할 수 있는 알고리즘을 통해 돌파구를 마련했습니다. 이 시스템은 단순히 편견을 감지하는 데 그치지 않고 학습 데이터의 균형을 재조정하여 편견을 수정함으로써 AI가 스스로 편견을 극복하도록 효과적으로 가르쳤습니다.

2021년까지 연구팀은 이 방법이 신약 발견을 어떻게 변화시킬 수 있는지 시연했습니다. AI 시스템은 잠재적인 약물을 평가하면서 예측이 확실한 데이터에 근거한 경우와 추측이나 완전한 환각에 근거한 경우를 구분할 수 있었습니다. 제약 회사들은 AI가 확신하는 약물 후보만을 추구함으로써 시간과 자원을 절약할 수 있다는 가치를 확인했습니다.

또 다른 이점은 컴퓨팅 성능이 제한된 디바이스에도 적용됩니다. 엣지 디바이스는 서버 기반 시스템의 정확도를 따라잡을 수 없는 소형 모델에 의존하는 경우가 많습니다. 테미스의 기술은 이러한 로컬 모델이 대부분의 작업을 독립적으로 처리하고 어려운 문제가 발생할 때만 서버의 지원을 요청할 수 있도록 지원합니다.

AI는 우리 삶을 개선할 수 있는 엄청난 잠재력을 제공하지만, 여기에는 실질적인 위험이 따릅니다. AI가 중요한 인프라와 의사 결정에 포함됨에 따라 불확실성을 인식하고 환각을 피하는 능력이 가장 인간적이고 가치 있는 특성이 될 수 있습니다. 테미스 AI는 모델이 이 필수적인 기술을 학습하도록 돕고 있습니다.

또한 참조하세요: 당뇨병 관리: AI를 사용하여 혈당 수치를 예측하는 IBM과 Roche

업계 리더들의 AI와 빅데이터에 대해 더 자세히 알고 싶으신가요? 암스테르담, 캘리포니아, 런던에서 열리는 AI & 빅 데이터 엑스포를 확인해 보세요. 이 종합적인 행사는 지능형 자동화 컨퍼런스, 블록엑스, 디지털 트랜스포메이션 위크, 사이버 보안 및 클라우드 엑스포 등 다른 주요 이벤트와 함께 개최됩니다.

예정된 다른 엔터프라이즈 기술 이벤트와 TechForge에서 제공하는 웨비나는 여기에서 살펴보세요.

관련 기사
WordPress.com에서는 이제 AI 에이전트가 게시물을 작성하고 게시할 수 있게 되었으며, 그 외에도 다양한 기능이 추가되었습니다 WordPress.com에서는 이제 AI 에이전트가 게시물을 작성하고 게시할 수 있게 되었으며, 그 외에도 다양한 기능이 추가되었습니다 인기 웹 호스팅 및 게시 플랫폼인 WordPress.com이 이제 AI 에이전트를 도입하고 있으며, 이는 웹의 모습과 사용 경험을 재편할 수 있는 움직임입니다. 이 회사는 금요일, AI 에이전트가 고객 웹사이트에서 콘텐츠를 작성, 편집 및 게시할 뿐만 아니라 댓글을 관리하고, 메타데이터를 업데이트 및 수정하며, 태그와 카테고리를 통해 콘텐츠를 정리할 수 있
카카오 모빌리티, 물리적 AI를 위한 레벨 4 자율주행 로드맵 제시 카카오 모빌리티, 물리적 AI를 위한 레벨 4 자율주행 로드맵 제시 카카오모빌리티는 물리적 AI 전략의 일환으로 레벨 4 자율주행 기술을 자체 개발할 계획이다.서울 코엑스에서 열린 '2026 월드 IT 쇼' 컨퍼런스에서 카카오모빌리티의 김진규 부사장 겸 피지컬 AI 사업본부장은 로드맵을 발표했다. 그의 발표는 피지컬 AI 시대의 모빌리티 플랫폼을 기반으로 한 자율주행 서비스에 중점을 두었다.연합뉴스에 따르면, '아이디어
배리 딜러: AGI 시대가 다가옴에 따라 샘 알트먼에 대한 신뢰는 무의미하다 배리 딜러: AGI 시대가 다가옴에 따라 샘 알트먼에 대한 신뢰는 무의미하다 억만장자 미디어 거물 배리 딜러는 최근 보도에서 달리 제기된 주장에도 불구하고, 오픈AI의 샘 알트만 CEO가 신뢰할 수 없는 인물이라고 생각하지 않는다고 밝혔다. 이번 주 월스트리트저널(WSJ)이 주최한 ‘Future of Everything’ 컨퍼런스에서 연설한 딜러는, 일부 전직 동료들과 이사회 구성원들로부터 때때로 교묘하게 조종하거나 기만적이라는 비
관련 특별 주제 추천
만화 창작 소년 만화를 위한 최고의 AI 생성기: 박진감 넘치는 액션 장면과 에너지 효과 만들기
소년 만화를 위한 최고의 AI 생성기: 박진감 넘치는 액션 장면과 에너지 효과 만들기

XIX.AI에서 2026년 최고의 소년 만화 AI 생성기를 만나보세요. 엄선된 최고 평점 목록에는 박진감 넘치는 액션 장면과 역동적인 에너지 효과를 연출할 수 있는 강력한 도구들이 포함되어 있습니다. 실제 테스트를 통해 무료 버전과 유료 버전을 비교해 보세요. 여러분의 창의력을 마음껏 발휘하여 오늘 바로 장대한 만화를 만들어 보세요!

15 도구
xix.ai
사업 최고의 AI 경비 관리 앱: 영수증을 스캔하고 기업 경비를 자동으로 분류하세요
최고의 AI 경비 관리 앱: 영수증을 스캔하고 기업 경비를 자동으로 분류하세요

2026년 최신 최고의 AI 경비 관리 도구: 영수증을 스캔하고 기업 경비를 자동으로 분류해 주는 최고 평점의 도구들. 손쉬운 경비 관리, 정확한 재무 추적, 효율적인 규정 준수를 위한 강력하고 혁신적인 솔루션을 만나보세요. 무료 및 유료 옵션을 엄선하여 매주 업데이트되는 비교 자료를 통해 귀사에 딱 맞는 도구를 찾으실 수 있습니다. XIX.AI의 전문가 추천 목록으로 AI의 장점을 최대한 활용하세요.

10 도구
xix.ai
사업 최고의 AI 채용 도구: 이력서 심사 및 후보자 면접 일정 자동화
최고의 AI 채용 도구: 이력서 심사 및 후보자 면접 일정 자동화

XIX.AI에서 2026년 최신 최고 평점을 받은 AI 채용 도구를 확인해 보세요. 저희가 엄선한 이 목록에는 이력서 심사 및 후보자 면접 일정 자동화를 위한 강력하고 혁신적인 솔루션이 포함되어 있습니다. 실제 테스트 결과와 매주 업데이트되는 순위를 바탕으로 무료 및 유료 옵션을 비교해 보세요. 지금 바로 귀사에 딱 맞는 채용 도우미를 찾아 채용 프로세스를 효율화하세요!

10 도구
xix.ai
생산력 AI 개인 웰니스 및 집중력 코치: 번아웃 관리 및 정신적 에너지 수준 향상
AI 개인 웰니스 및 집중력 코치: 번아웃 관리 및 정신적 에너지 수준 향상

XIX.AI에서 2026년 최고의 AI 기반 개인 웰니스 및 집중력 코치들을 만나보세요. 저희가 엄선한 순위 목록에는 번아웃을 관리하고 정신적 에너지를 높여주는 최고 평점을 받은 혁신적인 도구들이 소개되어 있습니다. 실제 사용 후기를 바탕으로 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 최고의 생산성과 웰빙을 향한 길을 열어보세요.

10 도구
xix.ai
챗봇 최고 평점을 받은 AI 로맨틱 챗봇: 일관된 성격으로 장기적인 관계를 구축하세요
최고 평점을 받은 AI 로맨틱 챗봇: 일관된 성격으로 장기적인 관계를 구축하세요

진정성 있는 장기적인 관계를 형성할 수 있는 2026년 최신 최고 평점 AI 로맨틱 챗봇을 만나보세요. 저희가 엄선한 이 목록에는 강력하고 일관된 캐릭터, 무료 및 유료 버전 비교, 실제 사용 후기가 담겨 있습니다. XIX.AI에서 나에게 딱 맞는 파트너를 찾아 오늘 바로 관계를 시작해 보세요.

10 도구
xix.ai
교육 및 학습 최고의 AI 데이터 과학 멘토들: SQL, Pandas 및 머신 러닝 워크플로우 마스터하기
최고의 AI 데이터 과학 멘토들: SQL, Pandas 및 머신 러닝 워크플로우 마스터하기

2026년 최고의 AI 데이터 과학 멘토들을 만나 SQL, Pandas 및 머신러닝 워크플로우를 마스터하세요. XIX.AI에서 선별한 최고의 멘토들을 통해 강력하고 혁신적인 지도를 받아보세요. 무료 옵션과 유료 옵션을 실제 사례를 바탕으로 비교해 보세요. 오늘 바로 데이터 과학의 전문성을 확보하세요.

10 도구
xix.ai
의견 (3)
0/500
RichardHarris
RichardHarris 2026년 3월 17일 오후 1시 1분 11초 GMT+09:00

Just read this and wow, the 'know-it-all' analogy hits home. We've all been there where the system is confidently wrong. Teaching AI to say 'I don't know' could be a game-changer for trust in medical or legal advice. Curious about the scalability—is there a performance trade-off? Hope they can make it work at a large scale 🧐.

WillGarcía
WillGarcía 2026년 1월 17일 오전 11시 31분 25초 GMT+09:00

AIが「分からない」と言えるようになるって、逆に人間らしい進歩かも?🤔 実際、私も職場で『多分』って言える上司の方が信用できるし。でもMITのスタートアップがこれをビジネスにできるって面白い。AIの過信防止って医療や裁判で本当に必要だよね。個人的には、この技術がSNSのデマ拡散防止に使われないか心配だけど…

AlbertEvans
AlbertEvans 2025년 12월 19일 오후 11시 30분 45초 GMT+09:00

Diese Startup-Idee aus MIT scheint sehr vielversprechend zu sein. Modelle müssen lernen, Unsicherheiten zuzugeben - genau wie ein vernünftiger Mensch es tun würde 😂. Besonders im Bereich Medizin oder autonomes Fahren, wo fehlerhafte Antworten katastrophal sein können, wird das 'Ich weiß es nicht'-Eingeständnis zu einer lebenswichtigen Funktion. Hoffentlich setzt sich dieser Ansatz bald durch!

OR