| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- BDA
- 대외활동
- 딥러닝교과서
- 재혼황후
- 패스트캠퍼스데이터분석부트캠프
- 데이터분석
- 현혹
- 데이터분석가
- 국비지원취업
- 미유엔토
- 패스트캠퍼스부트캠프
- 대중문화
- 유미의 세포들
- 드라마
- 미뮤엔토
- 부트캠프
- 미디어 콘텐츠
- 데이터분석취업
- 데이터분석부트캠프
- DOIT!
- 정년이
- 대외활동 추천
- 이태원 클라쓰
- 딥러닝 스터디
- 패스트캠퍼스
- 웹툰 원작
- 미뮤엔토 에디터
- 지금 우리 학교는
- 이지스퍼블리싱
- 국비지원
- Today
- Total
목록전체 글 (24)
디지털 마케팅 LAB
데이터 가공인덱스인덱스 변경■ 인덱스 몇개를 바꿀 때 - 데이터명.rename({기존 인덱스: 바꿀 인덱스, 기존 인덱스: 바꿀 인덱스, ...}) ■ 인덱스 전체를 바꿀 때 - 데이터명.index = 바꿀 인덱스 리스트열을 인덱스로 설정■ 데이터명.set_index(컬럼명)인덱스를 열로 변환■ 데이터명.reset_index()■ 만약 열로 변환된 인덱스를 삭제하고 싶다면 'drop=True' 옵션 추가 ( = 인덱스가 새로 리셋된 결과)행행 추가■ pd.concat([기존 데이터명, 추가할 데이터명])df3 = pd.concat([df1, df2])df3 = df3.reset_index(drop=True)df3 행 제거■ 데이터명.drop(제거할 인덱스 명)■ 데이터명.drop([제거할..
파이썬 자료형숫자형(number)사칙연산 (+, -, *, /)이 가능a ** b or a ^ b: a를 b번 곱한 것a // b: a를 b로 나눈 몫a % b: a를 b로 나눈 나머지문자형(string)여러 줄로 나타낼 때: \n or """문장""" or '''문장'''문자열 안에 ' 나 " 가 들어갈 때: 따옴표 앞에 \ or 전체 문장을 따옴표로 묶어주기Q. “Failure is simply the opportunity to begin again.” he says.” 이 문장을 파이썬으로 표현하기""" 사용 print(""" "Failure is simply the opportunity to begin again." he says." """)' 사용 print(' "Failure is simpl..
데이터 분석 과정데이터 분석 기획비즈니스 이해 및 목표 설정 ■ 비즈니스적으로 어떤 것을 이루고자 하는지프로젝트 정의 ■ 어떤 데이터를 바탕으로 어떤 것을 예측/측정할 것인지데이터 수집 및 정제분석에 필요한 데이터를 어떻게 수집할 것인지데이터 전처리, 검증 ■ 수집된 데이터의 정합성, 무결성 등을 검증데이터 분석 모델링탐색적 데이터 분석(EDA) ■ 통계량 확인 및 시각화를 통한 데이터의 특성을 파악모델링 ■ 예측을 위한 수학적, 통계적 모델링평가 및 결론 도출모델링을 통해 생성된 결과를 활용하여 결론 도출성능에 대한 평가 ■ 도메인에 따라, 비즈니스적 요구에 따라 성능의 기준은 달라짐 ■ 상황에 따라 위의 과정을 수정해가며 성능을 개선분석 결과의 활용시스템 구현 ■ 주기적으로 업데이트비즈..
가장 처음 진행됐던 강의는 데이터분석을 처음 접해보는 사람들을 위한 프리뷰같은 강의이지 않았나 싶다. 한학기짜리 개론수업을 제조, 에너지, 건설 등 여러 분야에서 근무해보신 데이터사이언티스트 강사님이 4시간으로 압축해서 배운 것 같았다. 강의 내용은왜 데이터 드리븐(Data Driven)이 중요한가언제부터 데이터 드리븐이 중요했고, 언제까지 갈 것인가데이터 관련 어떤 일이 있는지필요한 역량이 무엇인지, 지금부터 준비할 사항은 무엇이 있는지데이터 사이언티스트가 하는 일마지막으로 사전에 수강생들에게 질문받았던 내용에 대한 Q&A까지 꽤나 알차게 이루어졌다.이번 강의에 대해 너무 자세히 다루기엔 쓸 말이 많기 때문에 가장 집중해서 들었던 세번째 파트에 대해서만 정리했다.데이터를 사용하지않는 직업은 없겠지만 그..
복학이 얼마 남지 않았는데 계속 이렇게 유야무야 지낼 수 없겠다싶어 원래는 졸업 후에 하려고 했던 부트캠프들을 알아봤다. 데이터분석 부트캠프가 많지는 않았지만 그 중 패캠을 선택했던 이유는 기수가 가장 많았고(여러번 해본만큼 커리가 좀더 탄탄하지 않을까..?) HRD-Net에서의 후기가 다른 후보군보다 좋았기 때문이다. 무엇보다도 태블로에 대해 제대로 배워볼 수 있다는 점이 가장 마음에 들었다. 솔직히 신청마감기한이 얼마 남지 않은 상태에서 지원했던거라 기대는 안했었지만 다행히 합격했다. 자기소개서는 그렇다치고 녹화면접에서 많이 절어서 탈락했을거라고 생각했는데 다행ㅎㅎ OT를 듣다보니 패스트캠퍼스 부트캠프가 생각보다 더 빡세다는 걸 느꼈다... 출석체크 방법도 복잡하고 여러번 해야하는데다 수료기준도 쉽지..
pix2pix: 조건부 GAN을 사용한 이미지 대 이미지 변환 아래 과정에서는 입력 이미지에서 출력 이미지에 매핑하는 작업을 학습하는 pix2pix라는 cGAN(조건부 생성 적대 네트워크)을 구축하고 훈련하는 방법을 보여준다. pix2pix cGAN에서 입력 이미지에 대한 조건을 지정하고 해당 출력 이미지를 생성하는 방식이다. TensorFlow 및 기타 라이브러리 가져오기 import tensorflow as tf import os import pathlib import time import datetime from matplotlib import pyplot as plt from IPython import display 데이터세트 로드하기 dataset_name = "facades" _URL = f'..
1. 날씨 시계열 예측 막스 플랑크 생물 지구화학 연구소에서 기록한 날씨 시계열 데이터셋을 사용해서 시계열 데이터를 분석해보고 미래의 날씨를 예측한다. 데이터 온도, 대기압, 습도 등 14가지 feature로 이루어져있다. 10분 간격으로 되어있던 데이터를 step 6으로 슬라이싱하여 1시간 간격으로 바꿔준다. 검사 및 정리 풍속의 min이 -9999로 나온 것을 오류로 생각하여 0으로 교체 특성 엔지니어링 풍향과 속도 열을 바람 벡터로 변환한다. 사인 및 코사인 변환을 사용하여 시간 및 시간 신호를 지워 사용가능한 신호를 얻는다. 고속 푸리에 변환을 사용하여 특성을 추출하여 중요한 빈도를 결정한다. 데이터 분할 및 정규화 훈련, 검증 및 테스트 데이터 세트를 (70%, 20%, 10%)로 분할한다. 신..
1. tensorflow 시작하기 2. keras 하이퍼파라미터 튜닝 기본적인 텐서플로우 모듈을 사용한 손글씨 숫자 이미지 분류 신경망 모델 구현과 위에서 사용한 Sequential모델을 바탕으로 keras 튜너로 찾은 최적의 하이퍼파라미터 값을 사용하여 의류 이미지 분류 모델 구현 3. 자동차 연비 예측 데이터 분석 시 자주 사용되는 auto-mpg데이터 셋을 사용하여 연비 예측 모델 구현 전처리 과정에서는 결측치를 제거하고, 원핫인코딩으로 범주형 데이터를 더미 변수화하여 수치형으로 변환시켰다. 마지막으로 특성의 스케일(범위)를 맞춰주기 위해 정규화 진행 후 학습을 진행했다. 훈련과정을 시각화 해봤을 때 수백번의 에포크를 진행하게 되면 모델의 성능이 거의 향상하지 않는다. → 성능 향상을 체크할 에포크..