프로그래밍/딥러닝🧠 2

4.5 보편적인 머신러닝의 작업 흐름

머신러닝은 훈련 데이터에 있는 패턴을 기억하기 위해서만 사용한다. 이미 과거에서 배운것들만 인식할 수 있다. 미래를 예측하기위해 머신러닝을 이용한다는 것은 미래가 과거처럼 움직인다고 가정한 상태일 때만 가능하다. 현재의 상황을 평가할 방법에는 세가지 1) 홀드아웃 검증 세트 분리 : 데이터가 풍부할 때 사용 2) k-겹 교차 검증 : 1번을 사용하기에는 샘플의 수가 너무 적을 때 사용 3) 반복 k-겹 교차 검증 : 데이터가 적고, 정확한 모델 평가가 필요할 때 사용 -> 대부분 첫 번째로 충분하다! 4.5.4 데이터 준비 모델에 주입할 데이터는 텐서로 구성되어있어 일반적으로 작은 값으로 스케일 조정 되어있다. 예) [ 0 , 1 ] 특성마다 범위가 다를 경우 정규화 필요 4.5.6 몸집 키우기 : 과대..

배치(batch)와 에포크(epoch)

배치(batch) : 모델의 가중치를 한번 업데이트시킬 때 사용되는 샘플들의 묶음 100개의 훈련 샘플이 있고, 배치사이즈가 20이라면 20개의 샘플 단위마다 모델의 가중치를 한번씩 업데이트 시킨다. 그러므로 5번 가중치가 업데이트 될것이다. 하나의 데이터셋을 5개의 배치로 나누어 훈련을 진행했다고 볼 수 있다. 에포크(epoch) : 딮러닝에서는 학습의 횟수를 의미한다. 에포크가 10이고, 배치 사이즈가 20이라면 가중치를 5번 업데이트하는 것을 10번 반복한다. 결과적으로 가중치가 총 50번 업데이트된다. history = model.fit(partial_x_train,partial_y_train, epochs=20, batch_size=512, validation_data=(x_val,y_val))..