AI가 멈추지 않는다고 주장하고, 벤치 마크를 능가합니다

대형 언어 모델(LLMs) 및 기타 생성 AI 기술은 자체 수정 능력을 크게 향상시키고 있으며, 이는 Anthropic의 부사장인 Michael Gerstenhaber에 따르면 "에이전틱 AI"로 알려진 새로운 응용 프로그램의 길을 열고 있습니다. Anthropic은 선도적인 AI 모델 개발사입니다.
"자체 수정, 자체 추론에서 매우 뛰어난 성과를 내고 있습니다,"라고 Anthropic에서 API 기술을 이끄는 Gerstenhaber는 뉴욕에서 Bloomberg Intelligence의 Anurag Rana와의 인터뷰에서 밝혔습니다. Claude LLM 제품군을 만든 Anthropic은 OpenAI의 GPT 모델과 직접 경쟁합니다. 그는 "몇 달마다 새로운 모델을 출시하며 LLM의 기능을 확장하고 있습니다,"라고 덧붙이며, 각 모델 개정판이 새로운 잠재적 용도를 열어주는 산업의 역동적인 특성을 강조했습니다.
AI 모델의 새로운 기능
Anthropic의 최신 모델은 작업 계획과 같은 기능을 도입하여, 사람이 온라인으로 피자를 주문하는 것처럼 컴퓨터에서 작업을 수행할 수 있게 했습니다. Gerstenhaber는 단계별 작업 실행에 대해 "어제는 불가능했던 중간 단계 계획이 이제 가능해졌습니다,"라고 언급했습니다.
이 논의에는 AI 스타트업 Scale AI의 최고 기술 책임자인 Vijay Karunamurthy도 참여했으며, Bloomberg Intelligence가 주최한 "Gen AI: 생산성 약속을 실현할 수 있을까?"라는 제목의 하루 종일 컨퍼런스의 일부였습니다.
AI 회의론에 대한 도전
Gerstenhaber의 통찰은 생성 AI 및 더 넓은 AI 분야가 "한계에 부딪혔다"고 주장하며, 새로운 모델 반복마다 수익이 감소한다고 보는 AI 회의론자들의 견해에 도전합니다. 예를 들어, AI 학자 Gary Marcus는 2022년부터 AI 모델의 크기(더 많은 매개변수)를 단순히 늘리는 것만으로는 성능이 비례적으로 향상되지 않을 것이라고 경고해 왔습니다.
하지만 Gerstenhaber는 Anthropic이 현재 AI 벤치마크로 측정할 수 있는 것 이상으로 한계를 밀어붙이고 있다고 주장합니다. 그는 "일부 영역에서 진전이 느려 보일 수 있지만, 이는 우리가 완전히 새로운 기능을 열고 있기 때문이며, 벤치마크와 기존 작업 수행 능력은 포화 상태에 이르렀습니다,"라고 설명했습니다. 이로 인해 현재 생성 AI 모델이 달성할 수 있는 전체 범위를 측정하기가 점점 더 어려워지고 있습니다.
확장과 학습
Gerstenhaber와 Karunamurthy는 생성 AI 모델의 자체 수정 능력을 향상시키기 위해 모델을 확장하는 것의 중요성을 강조했습니다. Gerstenhaber는 "우리는 점점 더 많은 지능의 확장을 보고 있습니다,"라고 말했습니다. Karunamurthy는 "계획과 추론에서 한계에 부딪히지 않는다고 믿는 이유 중 하나는 우리가 이러한 작업을 구조화하는 방법을 여전히 배우고 있어 모델이 새롭고 다양한 환경에 적응할 수 있기 때문입니다,"라고 덧붙였습니다.
Gerstenhaber는 동의하며, "우리는 초기 단계에 있으며, 응용 프로그램 개발자들로부터 그들의 필요와 모델의 부족한 점을 배우고, 이를 다시 언어 모델에 통합할 수 있습니다,"라고 말했습니다.
실시간 학습과 적응
Gerstenhaber에 따르면 이러한 진전의 많은 부분은 Anthropic의 기초 연구의 빠른 속도와 산업 피드백으로부터의 실시간 학습에 의해 이루어지고 있습니다. 그는 "우리는 산업이 우리에게 필요하다고 말하는 것에 적응하며 실시간으로 배우고 있습니다,"라고 말했습니다.
고객은 종종 더 큰 모델부터 시작하여 특정 목적에 맞게 더 간단한 모델로 축소합니다. Gerstenhaber는 "처음에는 모델이 작업을 잘 수행할 만큼 충분히 지능적인지 평가하고, 그 다음에는 응용 프로그램 요구를 충족할 만큼 충분히 빠른지, 마지막으로 가능한 한 비용 효율적인지 평가합니다,"라고 설명했습니다.
관련 기사
수노(Suno)의 주요 투자자: 게시물 삭제로는 저작권 소송의 허점을 메울 수 없다
많은 기대를 모았던 AI 음악 생성 플랫폼 ‘수노(Suno)’가 치열한 저작권 분쟁에 휘말린 가운데, 이 플랫폼의 주요 투자자가 한 솔직한 발언이 상대방 측이 바랐던 바로 그 증거를 제공해 준 것으로 보인다. Suno의 핵심 투자사인 멘로 벤처스(Menlo Ventures)의 파트너 C.C. 공은 최근 회사의 현재 법적 방어 전략과 정면으로 배치되는 트윗을
클로드 오푸스 4.7, 인공지능보다 신뢰성을 중시하며 출시
Anthropic은 올해도 거의 이틀에 한 번꼴로 새로운 기능을 출시하며 공격적인 행보를 이어가고 있습니다. 많은 기대를 모았던 Claude Opus 4.7이 방금 공식 출시되었는데, 흥미롭게도 Anthropic은 발표문에서 “이 모델이 우리가 개발한 가장 강력한 모델은 아닙니다”라고 솔직하게 밝혔습니다. 소문으로만 돌던 더 강력한 'Claude Mytho
하이얼, 무게가 단 1.75kg에 불과한 세계에서 가장 가벼운 AI 스포츠 외골격 로봇 출시
하이얼 그룹은 세계에서 가장 가벼운 AI 기반 스포츠용 외골격 로봇인 ‘하이얼 외골격 로봇 W3’를 선보였습니다. 이번 출시로 경량성 부문에서 업계 신기록을 세우며, 경량 설계 및 지능형 인간 동작 강화 분야에서 획기적인 진전을 이루었습니다.고급 소재가 구현한 초경량 디자인W3는 풀 카본 파이버와 티타늄 합금을 결합한 혁신적인 일체형 제조 공정을 적용했습니
관련 특별 주제 추천
의견 (8)
0/500
This self-correction stuff is wild! 😮 It's like AI is learning to double-check its own homework. Wonder how far this 'agentic AI' will go—could it outsmart us at our own jobs soon?
It's wild to think AI can now self-correct! 😮 Makes me wonder how soon we'll see these 'agentic AI' systems running our lives—hope they don’t outsmart us too much!
This article really opened my eyes to how fast AI is evolving! Self-correcting LLMs sound like a game-changer for agentic AI. Can’t wait to see what new apps come out of this! 😄
La perspectiva de Anthropic sobre que la IA no se estanca sino que supera los benchmarks es bastante genial. Es como si la IA estuviera jugando ajedrez mientras nosotros aún estamos tratando de entender las damas. Lo de la autocorrección suena prometedor, pero aún estoy un poco escéptico. 🤔
Anthropic의 AI가 정체되지 않고 벤치마크를 뛰어넘는다는 생각이 멋지네요. AI는 체스를 하고 있는데, 우리는 아직 체커를 이해하는 단계예요. 자기 교정 이야기는 유망하지만, 아직 조금 회의적이에요. 🤔

대형 언어 모델(LLMs) 및 기타 생성 AI 기술은 자체 수정 능력을 크게 향상시키고 있으며, 이는 Anthropic의 부사장인 Michael Gerstenhaber에 따르면 "에이전틱 AI"로 알려진 새로운 응용 프로그램의 길을 열고 있습니다. Anthropic은 선도적인 AI 모델 개발사입니다.
"자체 수정, 자체 추론에서 매우 뛰어난 성과를 내고 있습니다,"라고 Anthropic에서 API 기술을 이끄는 Gerstenhaber는 뉴욕에서 Bloomberg Intelligence의 Anurag Rana와의 인터뷰에서 밝혔습니다. Claude LLM 제품군을 만든 Anthropic은 OpenAI의 GPT 모델과 직접 경쟁합니다. 그는 "몇 달마다 새로운 모델을 출시하며 LLM의 기능을 확장하고 있습니다,"라고 덧붙이며, 각 모델 개정판이 새로운 잠재적 용도를 열어주는 산업의 역동적인 특성을 강조했습니다.
AI 모델의 새로운 기능
Anthropic의 최신 모델은 작업 계획과 같은 기능을 도입하여, 사람이 온라인으로 피자를 주문하는 것처럼 컴퓨터에서 작업을 수행할 수 있게 했습니다. Gerstenhaber는 단계별 작업 실행에 대해 "어제는 불가능했던 중간 단계 계획이 이제 가능해졌습니다,"라고 언급했습니다.
이 논의에는 AI 스타트업 Scale AI의 최고 기술 책임자인 Vijay Karunamurthy도 참여했으며, Bloomberg Intelligence가 주최한 "Gen AI: 생산성 약속을 실현할 수 있을까?"라는 제목의 하루 종일 컨퍼런스의 일부였습니다.
AI 회의론에 대한 도전
Gerstenhaber의 통찰은 생성 AI 및 더 넓은 AI 분야가 "한계에 부딪혔다"고 주장하며, 새로운 모델 반복마다 수익이 감소한다고 보는 AI 회의론자들의 견해에 도전합니다. 예를 들어, AI 학자 Gary Marcus는 2022년부터 AI 모델의 크기(더 많은 매개변수)를 단순히 늘리는 것만으로는 성능이 비례적으로 향상되지 않을 것이라고 경고해 왔습니다.
하지만 Gerstenhaber는 Anthropic이 현재 AI 벤치마크로 측정할 수 있는 것 이상으로 한계를 밀어붙이고 있다고 주장합니다. 그는 "일부 영역에서 진전이 느려 보일 수 있지만, 이는 우리가 완전히 새로운 기능을 열고 있기 때문이며, 벤치마크와 기존 작업 수행 능력은 포화 상태에 이르렀습니다,"라고 설명했습니다. 이로 인해 현재 생성 AI 모델이 달성할 수 있는 전체 범위를 측정하기가 점점 더 어려워지고 있습니다.
확장과 학습
Gerstenhaber와 Karunamurthy는 생성 AI 모델의 자체 수정 능력을 향상시키기 위해 모델을 확장하는 것의 중요성을 강조했습니다. Gerstenhaber는 "우리는 점점 더 많은 지능의 확장을 보고 있습니다,"라고 말했습니다. Karunamurthy는 "계획과 추론에서 한계에 부딪히지 않는다고 믿는 이유 중 하나는 우리가 이러한 작업을 구조화하는 방법을 여전히 배우고 있어 모델이 새롭고 다양한 환경에 적응할 수 있기 때문입니다,"라고 덧붙였습니다.
Gerstenhaber는 동의하며, "우리는 초기 단계에 있으며, 응용 프로그램 개발자들로부터 그들의 필요와 모델의 부족한 점을 배우고, 이를 다시 언어 모델에 통합할 수 있습니다,"라고 말했습니다.
실시간 학습과 적응
Gerstenhaber에 따르면 이러한 진전의 많은 부분은 Anthropic의 기초 연구의 빠른 속도와 산업 피드백으로부터의 실시간 학습에 의해 이루어지고 있습니다. 그는 "우리는 산업이 우리에게 필요하다고 말하는 것에 적응하며 실시간으로 배우고 있습니다,"라고 말했습니다.
고객은 종종 더 큰 모델부터 시작하여 특정 목적에 맞게 더 간단한 모델로 축소합니다. Gerstenhaber는 "처음에는 모델이 작업을 잘 수행할 만큼 충분히 지능적인지 평가하고, 그 다음에는 응용 프로그램 요구를 충족할 만큼 충분히 빠른지, 마지막으로 가능한 한 비용 효율적인지 평가합니다,"라고 설명했습니다.
수노(Suno)의 주요 투자자: 게시물 삭제로는 저작권 소송의 허점을 메울 수 없다
많은 기대를 모았던 AI 음악 생성 플랫폼 ‘수노(Suno)’가 치열한 저작권 분쟁에 휘말린 가운데, 이 플랫폼의 주요 투자자가 한 솔직한 발언이 상대방 측이 바랐던 바로 그 증거를 제공해 준 것으로 보인다. Suno의 핵심 투자사인 멘로 벤처스(Menlo Ventures)의 파트너 C.C. 공은 최근 회사의 현재 법적 방어 전략과 정면으로 배치되는 트윗을
클로드 오푸스 4.7, 인공지능보다 신뢰성을 중시하며 출시
Anthropic은 올해도 거의 이틀에 한 번꼴로 새로운 기능을 출시하며 공격적인 행보를 이어가고 있습니다. 많은 기대를 모았던 Claude Opus 4.7이 방금 공식 출시되었는데, 흥미롭게도 Anthropic은 발표문에서 “이 모델이 우리가 개발한 가장 강력한 모델은 아닙니다”라고 솔직하게 밝혔습니다. 소문으로만 돌던 더 강력한 'Claude Mytho
하이얼, 무게가 단 1.75kg에 불과한 세계에서 가장 가벼운 AI 스포츠 외골격 로봇 출시
하이얼 그룹은 세계에서 가장 가벼운 AI 기반 스포츠용 외골격 로봇인 ‘하이얼 외골격 로봇 W3’를 선보였습니다. 이번 출시로 경량성 부문에서 업계 신기록을 세우며, 경량 설계 및 지능형 인간 동작 강화 분야에서 획기적인 진전을 이루었습니다.고급 소재가 구현한 초경량 디자인W3는 풀 카본 파이버와 티타늄 합금을 결합한 혁신적인 일체형 제조 공정을 적용했습니
This self-correction stuff is wild! 😮 It's like AI is learning to double-check its own homework. Wonder how far this 'agentic AI' will go—could it outsmart us at our own jobs soon?
It's wild to think AI can now self-correct! 😮 Makes me wonder how soon we'll see these 'agentic AI' systems running our lives—hope they don’t outsmart us too much!
This article really opened my eyes to how fast AI is evolving! Self-correcting LLMs sound like a game-changer for agentic AI. Can’t wait to see what new apps come out of this! 😄
La perspectiva de Anthropic sobre que la IA no se estanca sino que supera los benchmarks es bastante genial. Es como si la IA estuviera jugando ajedrez mientras nosotros aún estamos tratando de entender las damas. Lo de la autocorrección suena prometedor, pero aún estoy un poco escéptico. 🤔
Anthropic의 AI가 정체되지 않고 벤치마크를 뛰어넘는다는 생각이 멋지네요. AI는 체스를 하고 있는데, 우리는 아직 체커를 이해하는 단계예요. 자기 교정 이야기는 유망하지만, 아직 조금 회의적이에요. 🤔





집






