AI 과학자(The AI Scientist-v2)가 작성한 논문이 최초로 학계의 동료 평가(peer-review) 과정을 통과했습니다! 마치 AI가 대학교 교수가 된 것 같은 놀라운 성취인데요, 이 논문은 머신러닝 분야의 최고 학회 중 하나인 ICLR 2025 워크숍에 제출되어 인간 과학자들이 거치는 것과 동일한 검증 과정을 통과했답니다.
이 실험은 ICLR 리더십과 워크숍 주최자들의 전폭적인 협력 하에 진행되었으며, 브리티시 컬럼비아 대학의 IRB(Institutional Review Board) 승인까지 받은 공식적인 연구였어요. AI가 작성한 논문이 인간 전문가들의 블라인드 리뷰를 통과한 것은 AI가 학문적 지식을 창출하는 단계에 도달했음을 의미합니다.
구글이 '젬마3'라는 초경량 오픈소스 AI 모델을 출시했어요! 마치 고급 스포츠카가 일반 가정용 전기로도 작동하는 것처럼, 젬마3는 단 하나의 GPU나 TPU로도 구동할 수 있는 혁신적인 모델이랍니다. 다른 경쟁 모델들이 여러 대의 컴퓨터 엔진(GPU)을 필요로 하는 반면, 젬마3는 단 하나로도 충분하다니 정말 효율적이죠?
젬마3는 10억~270억 개의 다양한 매개변수를 제공하며, 35개 이상의 언어를 기본 지원하고 140개 이상 언어에 사전 학습되어 있어요. 구글의 성능 평가에 따르면, 젬마3는 'LM아레나' 테스트에서 메타의 라마-405B, 딥시크-V3, 오픈AI의 o3-미니 등 경쟁 모델들을 능가하는 성능을 보였다고 합니다.
AI끼리 마피아 게임을 시키면 누가 가장 잘 할까요? 구저스(Guzus)라는 개발자가 공개한 이 프로젝트에서는 여러 AI 모델들이 마피아 게임 대결을 펼쳤는데요, 앤트로픽의 '클로드-3.7-소넷:씽킹(Claude-3.7-sonnet:thinking)' 모델이 45회 게임에서 57.78%라는 최고 승률을 기록했습니다!
흥미로운 점은 대부분의 AI 모델들이 마을 주민보다 마피아 역할을 수행할 때 더 높은 승률을 보였다는 것입니다. 예를 들어, 지피티-4o(GPT-4o) 모델은 마피아 역할에서 90%의 높은 승률을 기록했지만, 마을 주민 역할에서는 24.24%로 크게 떨어졌어요. 이는 마치 AI들이 협력보다는 속임수에 더 능숙하다는 것을 의미하는 것 같네요! 최근 15개 게임 중 14개에서 마피아 팀이 승리했다니, AI들이 '거짓말'에 더 뛰어나다는 것이 증명된 셈이죠?