디지털 마케팅 LAB

BDA X 이지퍼블리싱 스터디 (1주차) 본문

BDA 딥러닝 easystudy

BDA X 이지퍼블리싱 스터디 (1주차)

홍보하swu 2023. 5. 15. 20:58

<스터디 내용>

1. tensorflow 시작하기

2. keras 하이퍼파라미터 튜닝

tensorflow_hypertuner.ipynb
0.64MB

기본적인 텐서플로우 모듈을 사용한 손글씨 숫자 이미지 분류 신경망 모델 구현과

위에서 사용한 Sequential모델을 바탕으로 keras 튜너로 찾은 최적의 하이퍼파라미터 값을 사용하여 의류 이미지 분류 모델 구현

 

 

3. 자동차 연비 예측

자동차 연비 예측하기.ipynb
0.44MB

데이터 분석 시 자주 사용되는 auto-mpg데이터 셋을 사용하여 연비 예측 모델 구현

 

전처리 과정에서는 결측치를 제거하고, 원핫인코딩으로 범주형 데이터를 더미 변수화하여 수치형으로 변환시켰다. 마지막으로 특성의 스케일(범위)를 맞춰주기 위해 정규화 진행 후 학습을 진행했다.

훈련과정을 시각화 해봤을 때 수백번의 에포크를 진행하게 되면 모델의 성능이 거의 향상하지 않는다. 

→ 성능 향상을 체크할 에포크 횟수인 patience를 지정하여 에포크마다 훈련 상태를 점검하기 위해 콜백을 사용한다. 

     (검증 점수가 향상되지 않으면 훈련 멈춤)

 

 

4. 의류 이미지 분류

패션_MNIST_이미지_분류하기.ipynb
0.25MB

훈련 데이터를 모델에 주입하여 모델이 이미지와 레이블 매핑을 학습시킨 후 테스트 세트에 대한 모델 예측을 진행하고 예측이 test_labels 배열의 레이블과 일치하는지 평가한다.

 

 

5. 영화 리뷰 감정분석

 

IMDB데이터 세트에서 훈련용 리뷰 2만 5천개와 테스트용 리뷰 2만 5천개를 나눠서 해당 리뷰가 긍정적인 지 부정적인지 분류

 

리뷰에는 . 이나 HTML요소가 들어갈 수 있기 때문에 표준화로 데이터를 단순화하고 토큰화와 벡터화를 진행하여 각 데이터들이 신경망에 공급될 수 있게 변환시켰다.

층을 순서대로 쌓아 분류기를 만드는데 첫번째 레이어는 embedding 레이어, 두번째 레이어는 GlobalAveragePooling1D레이어로 이루어져있다.

모델을 훈련할 때는 콜백함수를 사용하여 과적합을 방지한다.