| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- 데이터분석가
- 유미의 세포들
- 대외활동
- 패스트캠퍼스
- 국비지원취업
- 부트캠프
- 현혹
- 대중문화
- 미뮤엔토 에디터
- 딥러닝교과서
- BDA
- 미뮤엔토
- 데이터분석
- 국비지원
- 이지스퍼블리싱
- DOIT!
- 미디어 콘텐츠
- 드라마
- 웹툰 원작
- 데이터분석부트캠프
- 재혼황후
- 지금 우리 학교는
- 정년이
- 데이터분석취업
- 딥러닝 스터디
- 대외활동 추천
- 패스트캠퍼스부트캠프
- 이태원 클라쓰
- 패스트캠퍼스데이터분석부트캠프
- 미유엔토
- Today
- Total
디지털 마케팅 LAB
BDA X 이지퍼블리싱 스터디 (1주차) 본문
<스터디 내용>
1. tensorflow 시작하기
2. keras 하이퍼파라미터 튜닝
기본적인 텐서플로우 모듈을 사용한 손글씨 숫자 이미지 분류 신경망 모델 구현과
위에서 사용한 Sequential모델을 바탕으로 keras 튜너로 찾은 최적의 하이퍼파라미터 값을 사용하여 의류 이미지 분류 모델 구현
3. 자동차 연비 예측
데이터 분석 시 자주 사용되는 auto-mpg데이터 셋을 사용하여 연비 예측 모델 구현
전처리 과정에서는 결측치를 제거하고, 원핫인코딩으로 범주형 데이터를 더미 변수화하여 수치형으로 변환시켰다. 마지막으로 특성의 스케일(범위)를 맞춰주기 위해 정규화 진행 후 학습을 진행했다.
훈련과정을 시각화 해봤을 때 수백번의 에포크를 진행하게 되면 모델의 성능이 거의 향상하지 않는다.
→ 성능 향상을 체크할 에포크 횟수인 patience를 지정하여 에포크마다 훈련 상태를 점검하기 위해 콜백을 사용한다.
(검증 점수가 향상되지 않으면 훈련 멈춤)
4. 의류 이미지 분류
훈련 데이터를 모델에 주입하여 모델이 이미지와 레이블 매핑을 학습시킨 후 테스트 세트에 대한 모델 예측을 진행하고 예측이 test_labels 배열의 레이블과 일치하는지 평가한다.
5. 영화 리뷰 감정분석
IMDB데이터 세트에서 훈련용 리뷰 2만 5천개와 테스트용 리뷰 2만 5천개를 나눠서 해당 리뷰가 긍정적인 지 부정적인지 분류
리뷰에는 . 이나 HTML요소가 들어갈 수 있기 때문에 표준화로 데이터를 단순화하고 토큰화와 벡터화를 진행하여 각 데이터들이 신경망에 공급될 수 있게 변환시켰다.
층을 순서대로 쌓아 분류기를 만드는데 첫번째 레이어는 embedding 레이어, 두번째 레이어는 GlobalAveragePooling1D레이어로 이루어져있다.
모델을 훈련할 때는 콜백함수를 사용하여 과적합을 방지한다.
'BDA 딥러닝 easystudy' 카테고리의 다른 글
| BDA X 이지퍼블리싱 스터디 (4주차) (1) | 2023.06.06 |
|---|---|
| BDA X 이지퍼블리싱 스터디 (3주차) (0) | 2023.05.29 |