AI가 멈추지 않는다고 주장하고, 벤치 마크를 능가합니다

집

뉴스

2025년 4월 17일

ThomasYoung

108

AI가 멈추지 않는다고 주장하고, 벤치 마크를 능가합니다

대형 언어 모델(LLMs) 및 기타 생성 AI 기술은 자체 수정 능력을 크게 향상시키고 있으며, 이는 Anthropic의 부사장인 Michael Gerstenhaber에 따르면 "에이전틱 AI"로 알려진 새로운 응용 프로그램의 길을 열고 있습니다. Anthropic은 선도적인 AI 모델 개발사입니다.

"자체 수정, 자체 추론에서 매우 뛰어난 성과를 내고 있습니다,"라고 Anthropic에서 API 기술을 이끄는 Gerstenhaber는 뉴욕에서 Bloomberg Intelligence의 Anurag Rana와의 인터뷰에서 밝혔습니다. Claude LLM 제품군을 만든 Anthropic은 OpenAI의 GPT 모델과 직접 경쟁합니다. 그는 "몇 달마다 새로운 모델을 출시하며 LLM의 기능을 확장하고 있습니다,"라고 덧붙이며, 각 모델 개정판이 새로운 잠재적 용도를 열어주는 산업의 역동적인 특성을 강조했습니다.

AI 모델의 새로운 기능

Anthropic의 최신 모델은 작업 계획과 같은 기능을 도입하여, 사람이 온라인으로 피자를 주문하는 것처럼 컴퓨터에서 작업을 수행할 수 있게 했습니다. Gerstenhaber는 단계별 작업 실행에 대해 "어제는 불가능했던 중간 단계 계획이 이제 가능해졌습니다,"라고 언급했습니다.

이 논의에는 AI 스타트업 Scale AI의 최고 기술 책임자인 Vijay Karunamurthy도 참여했으며, Bloomberg Intelligence가 주최한 "Gen AI: 생산성 약속을 실현할 수 있을까?"라는 제목의 하루 종일 컨퍼런스의 일부였습니다.

AI 회의론에 대한 도전

Gerstenhaber의 통찰은 생성 AI 및 더 넓은 AI 분야가 "한계에 부딪혔다"고 주장하며, 새로운 모델 반복마다 수익이 감소한다고 보는 AI 회의론자들의 견해에 도전합니다. 예를 들어, AI 학자 Gary Marcus는 2022년부터 AI 모델의 크기(더 많은 매개변수)를 단순히 늘리는 것만으로는 성능이 비례적으로 향상되지 않을 것이라고 경고해 왔습니다.

하지만 Gerstenhaber는 Anthropic이 현재 AI 벤치마크로 측정할 수 있는 것 이상으로 한계를 밀어붙이고 있다고 주장합니다. 그는 "일부 영역에서 진전이 느려 보일 수 있지만, 이는 우리가 완전히 새로운 기능을 열고 있기 때문이며, 벤치마크와 기존 작업 수행 능력은 포화 상태에 이르렀습니다,"라고 설명했습니다. 이로 인해 현재 생성 AI 모델이 달성할 수 있는 전체 범위를 측정하기가 점점 더 어려워지고 있습니다.

확장과 학습

Gerstenhaber와 Karunamurthy는 생성 AI 모델의 자체 수정 능력을 향상시키기 위해 모델을 확장하는 것의 중요성을 강조했습니다. Gerstenhaber는 "우리는 점점 더 많은 지능의 확장을 보고 있습니다,"라고 말했습니다. Karunamurthy는 "계획과 추론에서 한계에 부딪히지 않는다고 믿는 이유 중 하나는 우리가 이러한 작업을 구조화하는 방법을 여전히 배우고 있어 모델이 새롭고 다양한 환경에 적응할 수 있기 때문입니다,"라고 덧붙였습니다.

Gerstenhaber는 동의하며, "우리는 초기 단계에 있으며, 응용 프로그램 개발자들로부터 그들의 필요와 모델의 부족한 점을 배우고, 이를 다시 언어 모델에 통합할 수 있습니다,"라고 말했습니다.

실시간 학습과 적응

Gerstenhaber에 따르면 이러한 진전의 많은 부분은 Anthropic의 기초 연구의 빠른 속도와 산업 피드백으로부터의 실시간 학습에 의해 이루어지고 있습니다. 그는 "우리는 산업이 우리에게 필요하다고 말하는 것에 적응하며 실시간으로 배우고 있습니다,"라고 말했습니다.

고객은 종종 더 큰 모델부터 시작하여 특정 목적에 맞게 더 간단한 모델로 축소합니다. Gerstenhaber는 "처음에는 모델이 작업을 잘 수행할 만큼 충분히 지능적인지 평가하고, 그 다음에는 응용 프로그램 요구를 충족할 만큼 충분히 빠른지, 마지막으로 가능한 한 비용 효율적인지 평가합니다,"라고 설명했습니다.

관련 기사

마스터 에메랄드 카이조 누즐로크: 궁극의 생존 & 전략 가이드 에메랄드 카이조는 지금까지 고안된 가장 강력한 포켓몬 ROM 해킹 중 하나입니다. 누즈락을 시도하면 난이도가 기하급수적으로 증가하지만, 세심한 계획과 전략적인 실행을 통해 승리를 거둘 수 있습니다. 이 최종 가이드는 하드코어 누즐로크 규칙에 따라 에메랄드 카이조를 정복하기 위한 필수 도구, 실전 테스트를 거친 전술, 심층적인 AI 분석을 제공합니다. 포켓몬

AI 기반 커버 레터: 학술지 투고를 위한 전문가 가이드 오늘날과 같이 경쟁이 치열한 학술 출판 환경에서는 효과적인 커버 레터를 작성하는 것이 원고 채택에 결정적인 차이를 만들 수 있습니다. ChatGPT와 같은 AI 기반 도구가 어떻게 이 필수적인 작업을 간소화하여 저널 편집자의 관심을 사로잡는 세련되고 전문적인 서신을 작성하는 데 도움을 주는지 알아보세요. 종합 가이드에서는 제출 패키지를 최적화하고 출판 성공

미국, 소셜 미디어 규제로 외국 공무원을 제재하다 미국, 글로벌 디지털 콘텐츠 규제에 반대 입장 표명이번 주 국무부는 유럽의 디지털 거버넌스 정책을 겨냥해 날카로운 외교적 비난을 발표하며 온라인 플랫폼 통제에 대한 긴장이 고조되고 있음을 알렸습니다. 마르코 루비오 장관은 미국의 디지털 공간에 영향을 미치는 과도한 검열에 관여하는 외국 공무원을 대상으로 하는 새로운 비자 제한 정책을 발표했습니다.새로

의견 (8)

0/200

제출하다

JoseRoberts

2025년 8월 13일 오전 12시 0분 59초 GMT+09:00

This self-correction stuff is wild! 😮 It's like AI is learning to double-check its own homework. Wonder how far this 'agentic AI' will go—could it outsmart us at our own jobs soon?

WalterAnderson

2025년 7월 31일 오후 8시 35분 39초 GMT+09:00

It's wild to think AI can now self-correct! 😮 Makes me wonder how soon we'll see these 'agentic AI' systems running our lives—hope they don’t outsmart us too much!

RonaldMartinez

2025년 7월 22일 오후 4시 39분 52초 GMT+09:00

This article really opened my eyes to how fast AI is evolving! Self-correcting LLMs sound like a game-changer for agentic AI. Can’t wait to see what new apps come out of this! 😄

WillieJackson

2025년 4월 18일 오후 4시 0분 28초 GMT+09:00

La perspectiva de Anthropic sobre que la IA no se estanca sino que supera los benchmarks es bastante genial. Es como si la IA estuviera jugando ajedrez mientras nosotros aún estamos tratando de entender las damas. Lo de la autocorrección suena prometedor, pero aún estoy un poco escéptico. 🤔

GeorgeWilson

2025년 4월 18일 오전 2시 45분 24초 GMT+09:00

Anthropic의 AI가 정체되지 않고 벤치마크를 뛰어넘는다는 생각이 멋지네요. AI는 체스를 하고 있는데, 우리는 아직 체커를 이해하는 단계예요. 자기 교정 이야기는 유망하지만, 아직 조금 회의적이에요. 🤔

NicholasCarter

2025년 4월 17일 오후 8시 27분 31초 GMT+09:00

Anthropic's take on AI not stalling but outsmarting benchmarks is pretty cool. It's like AI is playing chess while we're still figuring out checkers. The self-correction stuff sounds promising, but I'm still a bit skeptical. 🤔

최고의 뉴스

2025 최고 AI 비디오 생성기: Pika Labs 대 비교 Gemini 2.5 Pro는 이제 Claude보다 무제한과 저렴한 GPT-4O AI 목소리: 현실적인 목소리 제작 궁극 가이드 Cambium의 AI는 폐기물을 목재로 변형시킵니다 AI Builder와 Power Automate가 문서 요약을 혁신하다 OpenAi는 더 나은 채팅을 위해 AI 음성 어시스턴트를 향상시킵니다 AI 통합에 데이터가 신뢰할 수 있는지 확인하는 방법 Notebooklm은 전 세계적으로 확장하고 슬라이드와 향상된 사실 확인을 추가합니다 미국에 대한 조정은 76GW의 새로운 전력 용량을 잠금 해제 할 수 있습니다. Google은 AI를 사용하여 사기의 의심에 대한 3,900 만 광고 계정을 중단합니다.

더