지금 ai는 그거임
고3 지식을 갖춘 초4 애새끼.
Gpt 4 omni에서 발생하는 프롬프트 지시사항 무시 이슈라던가
Gemma 2 27b의 컨텍스트 무시,
Llama-3.1 400b에서 나타난다는 신조어 증상 등
딱 초등학교 4학년 애들 말 안 듣는 거랑 비슷함
특히 더 문제는 규격화된 출력을 제대로 못 뽑는다는 거임
12개가 한 줄인 1만 줄의 데이터를 처리하라고 시키면
어떤건 11줄 어떤건 13줄 어떤건 순서 뒤바꿔놓고 등등 엉망으로 작업함
즉 현장에서 쓰려면 얘 출력방식이 에러나면 그 데이터를 무시하고 규격에 맞게 답변할 때까지 재작업시키는 수단밖에 없음
RNN,CNN 초기에는 없던 이슈인데 (거야 행렬로 답변이 통제되니까)
LLM으로 넘어가며 생기는 이슈거든
근데 그러면서도 써야 할 정도임
근데 이걸 일반기업에서 의미있게 쓸 수 있을까?
시중 솔루션도 까놓고말해서
Ms copilot, github copilot, jetbrains ai assistant,adobe firefly 말고는
거의 이거 왜 써 급임
무료 긴빠이 툴 stable diffusion 정도?
이거조차 일반기업은 딸깍충을 넘어 자사 작업에 쓰려면 테크아티스트가 필요할 정도임
학습?
8b 모듈 굴리려면 4080이 두 대 필요함
8b 모듈 학습시키려면 최소 4080 4대를 묶어야 하고
제대로 된 퍼포먼스를 보려면 부르는 게 값인 a100 이상의 gpu를 쌓아야 함
수백B짜리 제일 성능좋은 대형 모듈이요?
일단 돌아가는 머신과 배경서버 마련에 4-5000만원
트레이닝에 30억 정도 준비해야함
완전 자체 트레이닝이요? 100억 이상.
그러니까 가능성은 있는데 통제가 그만큼 ㅈ같은 거임…
댓글(15)
사춘기 오나보네
시간 지나면 울트론은 확정가챠일까
결국 초벌이나 간단하게 찍어낼 레벨만 하는거고 그것조차도 검수해야 하는거임.
물론 그거만으로 혁신이 오는 사무직은 많음
근데 그거 개발 하나 하는 데에만 그 회사에 맞춰 개념증명 2-3개월, 실최적화 3개월 이상 걸림
“하나의 태스크에” 말이지
결국 출장가서 솔루션 커스터마이징 하는거랑 뭐 다르겠나..
대부분의 솔루션 커스터마이징보다는 되는 경우에 한해서 압도적으로 좋은건 맞는데….
참…
그 되는 경우도 기대의 4/5퍼 정도니까
그래서 지금은 주로 업무 보조로 쓰는 중
진짜 특정 직업을 대체하려면 시간 좀 걸릴 것 같음
개인급 ai는 대장장이 수준이고
큰 회사 ai는 제철소 수준인건가?
대장장이 아님
장난감 망치세트 급
우리나라에 엔씨 네이버 급 아니면 수백B짜리 모델 제대로 다룰 회사가 거의 적음
모든 사람이 똘끼넘치는 신입 업무 시키고 그거 똑바로 했는지 검수하는 관리자짓을 해야함..
1000번 잘 돌아가도 1번 찐빠로 폭탄 맞을 수 있다고 생각하면 쉽지 않음
오
기획업무에는 공수 엄청 줄어들긴하는데
이것도 기존에 파이썬으로 업무자동화랑 별 차이 없긴함
근데 정확히 요구사항에 맞는 고퀄리티 결과물을 뽑는 게 아니라
좀 어색해도 타협한 퀄리티의 결과물을 싸게 많이 뽑으려면 ai가 압도적인 거 같음.
그리고 세상엔 싸게 많이 뽑으면 이득인데? 라고 생각하는 사람이 많아서 ai 사용빈도가 늘면 늘었지 줄진 않을 거 같아….
결과물 신뢰할수어뵤는건 실무에서 다 알고 쓰는거.
그래도 예전같음 리서치하고 기초 함수만들고 존나 시간걸리는거 딸깍 한번에 끝나고
그림쪽은 레퍼런스 이미지 만드는거 ㅈ 같은 그림쟁이 새끼들한테 뇌물 받쳐가며 아양떨어 한달씩 걸리던게 ㅈ0분으로 단축되서 기획자들은 다 쓰고 있음.
결론: 이미 실무에선 존나게 씀.