수료를 했다. 어떤 기분인가?
첫 발걸음을 떼었다. 데이터 사이언스가 무엇인지 전체적인 개론 수업을 들은 느낌이다.
느낌이 좋다. 이 분야가 실용적인 행동을 추구하는 분야라고 느껴지기 때문이다.
데이터 사이언스가 비지니스의 문제에서 시작해서 데이터를 분석하고 시각화해서 알고리즘을 이용해 머신러닝으로 비즈니스의 문제를 해결하려고 한다는 그 백그라운드가! 굉장히 멋있어 보인다.
내가 어느 필드에서 더 전문적인 역량을(도메인 지식) 향상시킬지는 탐구해봐야겠으나 우선, 컴퓨터 과학이라는 수없이 넓은 대지에서 프론트엔드와 백엔드, 클라우드 엔지니어와 앱 개발자 등 수많은 후보지들의 비교 끝에 가장 공부하고 싶은 분야를 찾은 것이 기쁘다.
본 수업은 6시간짜리 수업이었다. 나는 모든 강의를 2배속으로 들었지만 실습 성격의 강의였기에 조금 더 걸렸다.
Google Calendar에 정리해놓은 타임테이블을 종합해보니 총 7시간이 조금 넘게 걸린 거 같다.
무엇이 좋았나?
- Google Colaboratory를 직접 써보면서 체험해본 것도 좋았고
- 파이썬을 다시 한 번 복습하면서 필수 개념을 챙긴 것도 좋았다
- EDA 데이터 분석을 위해 Pandas를 쓰면서 수치형 변수와 범주형 변수를 어떻게 활용해야 하는지, 시각화는 어떤 식으로 하는 것인지 다양한 툴들로 접근해봐서 좋았다. 실무자들의 설명으로 'EDA'와 '시각화'라는 말을 들었을 때에는 엄청 어렵겠다.... 라는 마음이 컸는데 직접 해보니 실용적인 고민이 더 클 것 같아서 좋았다.
- 최종적으로, 텐서플로우로 데이터를 예측하는 '딥러닝 모델'을 구현해본 것도 약간 직업체험 해본 것 같다. 강사가 하라는 대로 했기에 능동적인 학습과정은 아니었다. 그렇지만 데이터를 학습시킨 딥러닝 모델이 처음에는 답을 연관성 없이 구하다가 레이어의 수를 변경하고, 유닛 갯수를 조정하고, epoch횟수(문제집 많이 풀게 하기) 를 늘리자 성능이 개선되어서 종국에는 답을 찾는 것을 보고 '우와아앗' 이게 돼? 뭔가 이해는 안 되지만 말도 안 되는 일이 일어나고 있는 듯하다.
이어서 무엇을 배우려 하는가?
다음 코스워크는 "Introduction to Computational Thinking and Data Science"이다.
이 수업은 MIT 공대의 교수들과 함께하는 수업이다. 영어수업이다...
인공지능과 기계학습의 기초를 배우고,
통계학 기초와 기계학습 기초 또한 배울 수 있을 것이다.
결국 데이터 과학분야에서 문제해결을 어떻게 해야 하는지 알게 된다면 나는 목표를 이뤄나가고 있는 것이다.