우선 AI를 학습시키기 위한 데이터가 필요합니다
학습용 출석일-레벨 데이터를 준비해줍니다
(위의 값은 설명용으로 임의 생성한 값입니다)
그리고 위 값을 이용해서 이런 그래프를 만들어봅시다
엑셀을 자주 다루시는 분들이라면 여기서 '추세선'이라는 것을 만들 수 있다는걸 아실껍니다
추세선도 넣어봅시다
그 결과 y= 0.0505x + 30.512라는 추세선이 만들어졌습니다.
여기서 R2값은 수학적으로는 데이터가 가진 에러와 설명 가능한 에러의 비율이라고 합니다만
보통은 설명력이라는 표현을 많이 씁니다
설명력은 최대 1이고, 높으면 높을수록 저 수식이 주어진 데이터를 잘 설명하는 것입니다
대충 저 수식은 주어진 데이터를 50%정도 설명하고 있구나!로 이해하셔도 무방합니다
우리는 이제 이 추세선을 알았으므로 이제 출석일을 알면 레벨을 쉽게 알 수 있습니다
y= 0.0505x + 30.512라는 공식의 x값에 출석일 값을 대입하고 y값을 계산하면 되거든요!
이 y= 0.0505x + 30.512라는 수식이 AI입니다
우리는 이 AI에 출석일만 입력하면 됩니다. 그럼 자동으로 레벨을 구해주거든요
그리고 R2=0.5093이라는 값이 이 AI의 성능을 나타내는 지표입니다.
그럼 이 데이터는 더이상 필요 할까요?
아닙니다
y= 0.0505x + 30.512를 얻었으므로, 더이상 원본 데이터를 참조할 필요가 없습니다
대부분의 AI들은 크게 개념에서 벗어나지 않습니다
다만, 저 공식 (여기선 y= 0.0505x + 30.512)를 얻어내는 방식이 달라지는 것이죠
엑셀에서는 최소자승법(least mean square)이라는 방법을 사용합니다만
해결하고자 하는 문제에 따라서는 서포트 백터 머신이 쓰일 수도 있고, 로지스틱 회귀가 쓰일 수도 있겠죠
인공신경망같이 일반인에게도 유명한 알고리즘이 쓰일수도 있을 것입니다.
AI의 개념 자체는 20세기부터 주창된 오래된 개념이지만
최근에 와서야 컴퓨터의 연산력이 향상되면서 실현 가능하게 되었습니다
AI는 어려운 개념 같지만 간단하게 해체하고 보면 개념 자체는 함수와 같습니다.
다만 인공지능은 이 함수의 수식을 학습 데이터에 기반하여 스스로 찾아낼 뿐이지요
으아악 회귀분석 빌런이다
ai는 결국 통계학의 연장선이니
고차원 비선형 manifold를 학습하는게 문제였지 기본적 틀은 똑같지