그 상대는 Qwen
사실 얘네가 제일 빡칠만 했음
중국 최고의 AI팀이 뭘 만들고 있나요? 하면 알리바바+북경대 연구진들이 협업해서 만드는 Qwen이었거든
근데 딥시크가 언플하고 시진핑 독대하고 하는데
"아니 우리가 이전부터 아카이브에 보고서 내고 미국이랑 전면전 하고있는데 무슨?" 할 만 했지
https://arxiv.org/pdf/2501.12948
이게 딥시크 논문 링크
사실 논문 보면 알지만 이게 별반 내용 없긴 혀
https://arxiv.org/pdf/2412.15115
그리고 Qwen 쪽 작년 리서치에서도 나오던 건데
"아무리 소규모 모델을 돌려도 솔직히 양의 상관관계 부정못한다" 였던지라
지금 Qwen이 딥시크 언플 보고 뚜껑 열려서 바로 Max라고 이름붙여서 사이즈 크게 뽑아와서 내려친 게 맞는 것 같음ㅋㅋㅋㅋ
아직 Qwen-Max 관련 정규 보고서는 안 올라왔는데
Qwen 정규보고서는 2월 말에 올라올거라
아 그리고
https://arxiv.org/abs/2501.15570
이런 식으로
Qwen이고 딥시크고 프리트레인 모델 가지고 입터는 거 싫어요 니들은 처음부터 틀렸어요 하고
논문 역습 노리는 젊은 중국 연구학자들도 꽤 많음
추가)
사실 이거도 r1 비교대조가 없어서 ? 싶을 수 있는데
보고서 작성 및 검증기간 생각하면 r1은 보고서엔 안 들어갔을 거임
점수차로 보면 r1과 비교해선 진짜 근소차로 이기거나 비기고 있음
표는 r1이 아니고 v3랑 비교인데
금이 10g에 100만원이다.
-> 이상할게 없음
금이 5g에 1천원이다.
-> 어케했노 소리 바로 나옴
딥시크가 흥한건 절대적 성능 때문이 아니라
투자 대비 성과물이 개쩔어서 그럼
노?
하나의 중국 하나의 ai 당하는건가
어쨌든 이슈는 QWEN인지 뭔지 쟤네들이 아니라는거....
그럼 빨리 언플을 치던가