핫게 실시간 커뮤니티 인기글
종합 (4411629)  썸네일on   다크모드 on
tsasfr | 24/11/15 23:13 | 추천 45 | 조회 19

[유머] 필즈상 수상자들이 출제한 '세계에서 가장 어려운 수학문제집' +19 [16]

루리웹 원문링크 https://m.ruliweb.com/best/board/300143/read/68429990


img/24/11/15/193301a9c267faca.png

에포크AI라는

AI관련 벤처기업에서 

발표한 FrontierMath


https://epoch.ai/frontiermath


AI들의 진정한 수학실력을

테스트하기 위해서

여러명의 필즈상 수상자 포함

세계 최고급 수학자들이

출제한 수학문제집



img/24/11/15/193301de2697faca.png

수학자들이
AI 벤치마크를 돌리기 위해
문제은행식으로 수백개의
문제를 작성해뒀고

 

현재의 AI들에게

풀어보게 했더니

100점 만점에 2점 


샘플 문제 3개를

공개해둠 


https://epoch.ai/frontiermath/the-benchmark



img/24/11/15/1933020313a7faca.png


아마도(?) 테렌스 타오가 낸 듯한 문제


첫번째 문제만 가져와서

ChatGPT와 Claude에게 풀라고 시켜봤음. 



img/24/11/15/19330213d957faca.png


자신있게 블라블라 하더니 



img/24/11/15/1933021c3967faca.png


파이썬 코드 하나 작성해주고

이거 돌려서 값을 얻을 수 있다고 함



img/24/11/15/19330226cef7faca.png


돌려봄


에러남



img/24/11/15/1933022fb797faca.png


수정해 줌. 

다시 돌려봄



img/24/11/15/1933023a5d17faca.png


답 나옴.

3,333,333


위에 원문 보면 알 수 있지만 틀렸음

답은 3677073



img/24/11/15/1933024bbd57faca.png


img/24/11/15/19330254c377faca.png


아 그래?

테렌스 타오라면 어쩌구 하면서

열심히 변명중


패배자의 변명은 컷트


-----------


이제 Claude 3.5 Sonnet에게 물어봄 



img/24/11/15/19330266a617faca.png


자기도 코드 짜서 풀어보겠다고 해서 

기회를 줘봄. 


작동 안함. 



img/24/11/15/1933026ec9c7faca.png


ChatGPT가 짠 코드 보여주면 

그거 보고 개선하겠다고 주장함

(뭐야 이자식) 



img/24/11/15/19330280b517faca.png


계산해봤지만 틀렸음



img/24/11/15/193302883f57faca.png


힌트를 줬지만 또 틀림.



img/24/11/15/1933028f67d7faca.png


역시 테렌스 타오를 찬양하면서

주절주절 변명중 




역시 아직은 AI가 한계가 있네!






인간들에게 저 문제 풀라고 시키면

100점 만점에 0점 나오겠지만




[신고하기]

댓글(16)

1 2

이전글 목록 다음글

1 23 4 5
    
제목 내용