데이터 공부의 걸음마 까지 책임져 드립니다.
김문과가 직접 들어보고 도움을 받았던 강의는 어떤 게 있을까요?
목차 —
여긴 어디 나는 누구 : 생활코딩 WEB1 - HTML&인터넷, WEB2 - 파이썬 (생활코딩)
•
링크 :
WEB1 HTML & 인터넷 : https://opentutorials.org/course/3084
WEB2 파이썬 : https://opentutorials.org/course/3256
•
특징
◦
정말 '컴퓨터', '코딩'에 대해 아무런 공부의 경험이 없는 사람을 위한 강의
◦
내가 컴퓨터의 언어와 사고 방식에 "익숙해 질 수 있는가" 를 가늠해 볼 수 있는 기회
→ 누구나 코딩을, 데이터 분석을 잘 할 수 있다 라는 것은 환상이니까... 적성을 검사해봅시다
•
배우는 것
◦
웹 개념, HTML 개념, CSS 개념 ← 나중에 데이터 수집할 때 요긴하게 쓰이니 웹에 대해 잘 배워야 함
◦
파이썬 정말 기초적인 문법
•
예상되는 난관
◦
이것 저것 설치해 보라는 것에서 컴퓨터 자체에 친하지 않은 사람은 멀미가 날 수 있음 
◦
담백하고 정석적이고 섬세한 강사의 교습법 특성상 심심하다고 느낄 수 있음 
•
무료 강좌, 자체 플랫폼
파이썬 문법 : 프로그래밍, 데이터 과학을 위한 파이썬 입문 (TEAM LAB)
•
특징
◦
대학교에서 기초 파이썬을 교육하는 교수님 (김성철 교수) 께서 하는 수업
◦
그렇기 때문에 제출하는 과제(파이썬으로 코드를 짜는 퀴즈)가 존재하며, 정답 코드를 공개하지 않음
"(내 수강생이라면) 이 정도는 다 풀 수 있어야 돼요"
◦
막히면 정답, 힌트 보기에 익숙한 나약한 걸음마를 하드코어하게 트레이닝할 수 있는 기회
→ 2,3일 동안 머리 싸매면서 알고리즘에 대해 고민하게 됨 (야구게임 만들기, 구구단 계산기 만들기)
→ 어려운 만큼 해결할 때 쾌감이 엄청 나고 완강 후 실력 향상이 되어 있음
•
배우는 것
◦
파이썬 문법을 통해 프로그래밍 전반에 대해 배움
◦
내가 원하는 걸 차근차근 쪼개서 코딩할 수 있는 실력을 집중 배양시킴 (과제를 통해 강제로)
◦
HTML, 정규식, JSON, XML 등에 대해서도 알려줌
•
예상되는 난관
◦
처음 알고리즘을 짜서 어플리케이션(?)을 만들어보는 것이기 때문에 에러가 폭주하고 정답 코드를 보고 싶어 미치겠음 (근데 안 보여줌 ...) 
◦
새롭게 개념적으로 공부해야 할 것이 많고, 강의도 길어서 완강 + 과제 해결에 한동안 많은 공을 들여야 함 
•
유료 강좌, 인프런 플랫폼
데이터 뜯어보기 by 파이썬 : 공공데이터로 파이썬 데이터 분석 시작하기 (박조은)
•
특징
◦
친근한 아이템 (스타벅스, 아파트 분양가 등)으로 데이터 분석을 시작하는 가이드라인 제시
◦
파이썬 코드를 데이터 수집, 정리, 분석 등에 어떻게 쓰는지를 교육
•
배우는 것
◦
미리 배운 파이썬을 바탕으로 데이터 분석(기초적인 EDA)에 쓰기 시작함
→ 슬슬 데이터 분석에 자주 쓰는 파이썬 코드가 있음을 깨닫게 됨
◦
데이터를 표 형식으로 다루는 패키지(pandas)와 그래프를 그리는 패키지(matplotlib, seaborn) 를 처음 써보게 됨
•
예상되는 난관
◦
판다스 용법에 익숙해지는 데에 시간이 많이 필요함 (ex. df.loc 문법, pd.Series 개념) 
◦
파이썬 기초가 튼튼하지 않으면 강의를 소화하는데에 시간이 많이 걸림 
◦
그래프를 그리기 시작한다 → 고등학생 시절부터 그래프만 나오면 집중력이 떨어지는 사람들은 자주 보면서 기초 체력을 길러야 함 
•
유료 강좌, 인프런 플랫폼
통계학 : Sapientia a Dei (통통 튜브)
•
특징
◦
통계를 하나도 배우지 않은 사람을 위한 통계학 기초 강의 컨셉 (이렇게 친절한 강의는 본 적이 없다)
◦
기초 강의지만 사회과학 분야에서 활용하는 개념 (차원축소, 공분산 등) 까지 진도가 멀리 나가는 편
◦
친절하고 통계 입문자의 입장을 잘 이해하는 시각의 강의
•
배우는 것
◦
통계학의 기초 개념과 마인드 세팅 방향 ~ 데이터에 대한 검정(test) 기법
◦
자모비(Jamovi) 라는 GUI 기반(프로그래밍이 아닌 클릭을 통한 사용) 통계 툴을 씀 (파이썬, R 안 씀)
•
예상되는 난관
◦
기초 과정이고 친절하게 설명하기 때문에 소개했지, 결코 '쉽다고'만은 할 수 없는 내용 (통계 개념이 낯설다면) 
◦
고교 시절 확률과 통계 단원을 극도로 두려워했다면 그 두려움을 깨는 데에 시간이 조금 더 걸림 
◦
추상적이며 수식과 그래프를 이용한 계산으로 빠지는 챕터가 후반부에 등장함 (회귀식, 아이겐밸류, 매개효과 등등) 
•
무료 강좌, 유튜브, 커리큘럼이 종료 되지 않고 현재 요인분석까지 업로드 된 상황
데이터 크롤링 : 현존 최강 크롤링 기술 Scrapy와 Selenium 정복 (잔재미코딩)
•
특징
◦
웹 페이지에서 데이터를 크롤링하는 방법을 친절하고 구체적인 예제로 강의
◦
◦
데이터베이스(DB)까지 강좌를 개설해 두었으니 강의력이 마음에 들면 연이어 수강 가능
•
배우는 것
◦
셀레늄(selenium)과 스크래피(scrapy) 패키지를 사용해 데이터를 크롤링하는 법
◦
API를 사용해 데이터를 크롤링하는 법 (API가 무엇인지 막연한 사람에게 추천)
•
예상되는 난관
◦
동적 크롤링을 막 배우는 과정에서 수 많은 에러와 반복, 예외처리를 마주하게 됨 
◦
너무 자주 시도해서 사이트 접근 막힘 (과도한 크롤링은 대상 업체를 괴롭히는 불법 행위가 될 수 있습니다) 
•
유료 강좌, 인프런 플랫폼
머신러닝 : 파이썬 머신러닝 완벽 가이드 (권철민)
•
특징
◦
머신러닝이 뭔지 하나도 모르는 사람들에게 두루 맛보게 해주는 강의 (파이썬은 알아야함)
◦
케글 프로젝트를 예시로 들면서 알고리즘을 설명 (케글에 대해서 잘 모르면 유익)
◦
배워둔 것을 두고 두고 꺼내 복습하게 됨 (주제 선정과 예제 선정이 매우 탁월)
•
배우는 것
◦
머신러닝에서 자주 사용되는 알고리즘과 용법
▪
분류 (램덤포레스트 등)
▪
회귀 (선형, 로지스틱, 규제 모델 등)
▪
차원축소
▪
클러스터링
▪
텍스트 분석 (벡터라이징, NLP)
▪
추천 알고리즘
•
예상되는 난관
◦
머신러닝에서 사용하는 개념이 낯설기 때문에 첫 단원부터 멀미가 남 (training target split, RMSE 등) 
◦
파이썬 코딩 경험(그래프 그리기, 넘파이 데이터 다루기 등 포함)이 부족하면 강사가 짜둔 예제 코드를 단번에 이해하기 어려울 수 있다 
◦
강좌의 양이 방대하며 공부할 새로운 개념이 많고 실습까지 해보기 때문에 수강 시간이 길다 
◦
코드를 돌리고 2,30분 동안 결과를 기다려야 하는 경우도 있다 
•
유료 강좌, 인프런 플랫폼
왕초보 탈출, 그 이후는?
다음 포스팅을 통해 중급자의 공부 방향에 대해 작성해보았습니다. 