작년에 Midjourney가 Stable Diffusion을 이미지 도용 혐의로 고발한 것보다 더 놀라운 위선적인 행위로, ChatGPT와 DALL-E 개발사 OpenAI는 최근 NVIDIA가 미국 주식 시장 역사상 가장 큰 단일 일 폭락을 기록하여 17%(약 6,000억 달러)를 기록하게 만든 AI 타운의 신생 기업인 DeepSeek가 자사 AI 모델을 훈련하기 위해 데이터를 훔쳤다고 주장했습니다.
Financial Times에 따르면, OpenAI는 대규모 AI 모델에서 소규모 모델로 지식을 이전하는 머신 러닝 기술인 "증류distillation"의 증거를 발견했다고 합니다. OpenAI는 중국 회사가 이를 저질렀다고 믿고 있습니다.
보고서에 따르면, OpenAI와 Microsoft는 작년에 OpenAI의 API를 사용하는 DeepSeek에 속한다고 여겨지는 계정을 조사했습니다. 이러한 계정은 이후 증류에 관여했다는 의심으로 차단되었는데, 이는 사용자가 OpenAI와 경쟁하는 모델을 개발하는 데 서비스 출력을 사용하는 것을 금지하는 OpenAI의 서비스 약관을 위반한 것입니다. FT에서 연락했을 때 ChatGPT 개발자는 더 이상 언급하거나 DeepSeek를 주장된 활동과 연결하는 증거를 제공하지 않았습니다.
"AI에는 증류distillation라는 기술이 있는데, 한 모델이 다른 모델에서 학습하여 부모 모델에서 지식을 빨아내는 것입니다." 백악관 고문인 데이비드 삭스는 이러한 주장된 증류distillation에 대해 앞서 말했습니다. "그리고 DeepSeek이 여기서 한 일이 OpenAI 모델에서 지식을 증류했다는 상당한 증거가 있으며, OpenAI가 이에 대해 매우 기뻐하지 않을 것이라고 생각합니다."
말할 것도 없이, 최근 몇 년 동안 회사를 상대로 제기된 소송의 엄청난 수를 감안할 때 OpenAI에서 제기된 이러한 비난은 터무니없이 과장된 것입니다. 그 중 많은 소송은, 예상하셨겠지만, 저작권 침해와 관련이 있습니다. 뉴욕 타임즈와 캐나다 미디어 기업부터 인도 출판사, 조지 R.R. 마틴, 심지어 엘론 머스크까지 ? 이들은 OpenAI에 대해 법적 조치를 취한 원고 중 일부에 불과하며, 1년 전 게리 마커스와 레이드 사우센이 발견한 DALL-E의 이미지 스크래핑 사례는 언급조차 하지 않았습니다.
이전에 OpenAI는 "저작권이 있는 자료를 사용하지 않고는 오늘날의 선도적인 AI 모델을 훈련하는 것은 불가능할 것"이라고 인정했지만, 이제 그들이 받는 입장에 처하게 되면서 다른 사람의 데이터를 AI 훈련에 사용하는 것이 갑자기 용납할 수 없는 것으로 간주되어 일부 거대 기술 거물들이 살고 있는 "나에게는 좋지만 너에게는 좋지 않다"는 망상을 다시 한번 드러냈습니다.
디지털 아트워크를 스크래핑으로부터 보호하려면 (광고가 아님) AI 감지로부터 아트워크를 숨기고 스타일 모방을 방지할 수 있는 도구인 Glaze와 본질적으로 이미지를 "독살"하고 생성 AI 모델에서 특징 표현을 왜곡하는 도구인 Nightshade를 사용해 보는 것을 적극 권장합니다. 2024년 OpenAI 대변인이 말했듯이, 이 회사는 이러한 기술의 사용을 "남용"으로 보고 있으며, 이는 그 효과성을 간접적으로 확인하는 역할을 합니다.
----------------------------------------
딥시크의 성과가 효율적인 최적화를 통해 성능을 이끌어 냈다는 건데, 그에 대한 기반이 타사 AI의 학습 정보를 디스틸레이션 해서 빨아 먹고 썼다는 것.
그 구조적 효율성과 별개로 학습에 필요한 기반은 딥시크가 만든 효율성과 거리가 있는데 이게 걍 오픈AI 거 긴빠이 쳐서 얻은 거라는듯.
오픈AI가 애초에 그동안 인공지능 학계의 불문율이었던 코드 공개를 정면으로 거부하고 ChatGPT 장사해온 것도 있어서
오?픈
남탓할 처지인가? ai 학습 자료들 대부분 무단 불펌으로 만들었으면서.
차라리 학습데이터 만드는 기술에서 격차가 있는 걸 강조하던가. 그리고 더 좋은 결과물을 제공해야 가치를 인정받겠지
어딘가에는 짝퉁 AI도 있는 거 뿐이고.
요약: 딥시크는 모두에게 공평하게 ai를 풀어준 따거다
ㅋㅋㅋㅋㅋㅋㅋㅋㅋ 병림픽 시작이네
? 오픈 ai들 다 허가 없이 자료 돋거했잔아 ㅋㅋㅋ
...? 지는
새로운 방식을 기대한 사람들에겐 실망일 소식이겠지만 그게 아닌 소비자 입장에선 댓글들이 말해주듯이 오픈 ai 니들이 할말임? 소리 밖에 안나오겠구만
소스까서 대조해보자
맞아맞아.
설마 중국한테 쫄?
오픈A.I 니들도 어서 소스 까라.
상용 AI중에 긴빠이 없는거 한개라도 있으면 나와서 증명해보라그래
저 말이 사실이라도 그래서?고, 거짓이면 ㅋㅋㅋ고.
오픈소스 해봐 그럼
애초에 소스코드를 긴빠이친것도 아니고
저거 가지고 훔쳤다고 하기엔 니들 업보가...
그럼 니들은 모든 자료 다 제대로 구매한거임? ㅋㅋ
병1신들