본문 바로가기

혼자 공부하는 데이터 분석 with 파이썬

(7)
[혼공 분석] 혼공 학습단 회고 "혼자 공부하는 데이터 분석 with 파이썬"이라는 책을 읽었는데, 혼공 학습단을 하지 않았으면 끝까지 읽지 못했을 것 같다. 책을 읽으면서 중반부에서는 웹사이트에서 데이터를 직접 뽑아오는 과정이 기억에 남는다. 해보지 않았던 분야를 해보면서 새로운 경험을 얻을 수 있어서 좋았다. 후반으로 갈 수록은 matplotlib의 함수들을 알려 주는 내용이 많아서 가볍고, 기초를 다질수 있었어서 좋았던 것 같다.   추가적으로 정리하지는 않았지만, 인공지능 모델 학습에 대해서도 공부하면서 pandas와  matplotlib을 기초적인 부분은 찾아보지 않고 사용 할 수 있게 된거 같아 기쁘다.
[혼공 분석] 다양한 그래프 그리기 1. 그래프를 객체로 다루기 subplots() 함수를 사용하면, figure를 여러 개로 나누어서 각각을 다룰 수 있다. 다음과 같이 적용하면, 2x2크기의 서브플롯을 만들어서 다룰 수 있다.fig, axes = plt.subplots(2, 2, figsize=(20, 16))  이에 접근하려면 [row, col]로 접근해서 다룰 수 있다. ex)axes[0, 0].set_title('출판사별 발행도서')  1.1 여러 개의 데이터 그리기 단일 그래프에 여러 데이터를 겹쳐 비교하고 싶다면, 같은 축(ax)을 공유해 사용하면 된다. 예를 들어 선 그래프 2개를 추가한다고 하면 다음과 같다.fig, ax = plt.subplots(figsize=(8, 6))ax.plot(line1['발행년도'], line..
[혼공 분석] 선, 바 그래프 그리기 1. Figure, rcParams Figure 전체 그래프의 컨테이너 역할을 하는 최상위 객체이다. 여러 개의 서브플롯(Axes), lable, title, colorbar 등이 포함된다. plt.figure() 함수를 이용해서 이를 조정할수 있다. figsize를 인수로 크기를 지정할 수 있다.(인치)  rcParams 같은 경우는 맷플롯립 그래프의 기본값을 관리하는 객체이다.   figure 객체에는 여러가지 그래프(subplot)를 담을 수 있다. plt.subplots( rows, cols, index ) 함수를 이용해 서브플롯 객체를 생성할 수 있다. 리스트 접근하듯이 접근하면 사용할 수 있다.fig, axs = plt.subplots(2, 1)axs[0].scatter(ns_book7['도서..
[혼공 분석] 데이터 분석 1. 데이터 분석 데이터를 분석할 때 해야 할 것이 매우 많은데, 판다스는 이런 데이터 분석에서 기초적인 부분을 많이 함수로 제공한다.  DataFrame.describe() 함수는 수치형 데이터나 범주형 데이터를 다룰 때, 해당 데이터에 대한 요약 통계를 제공한다. count : 결측 값을 제외한 데이터 개수mean : 평균std : 표준편차min, max : 최솟값, 최댓값25%, 50%, 75% : 분위 수  각각에 대한 정보를 따로 구하는 함수 또한 제공한다.  DataFrame.mean() : 평균을 구하는 함수 DataFrame.median() : 중앙 값을 구하는 함수 DataFrame.min() or max() : 최대 최소를 구 하는 함수 DataFrame.quantile() : 분위 수..
[혼공 분석] Data cleaning 공부를 하는 입장이기 때문에, 내용에 오류가 있을 수 있습니다. 오류가 있다면 적극적으로 알려주시면 감사합니다! 1. 데이터 삭제 데이터를 삭제하기 위해서는 먼저 데이터에 접근을 해야 한다. 모든 데이터를 접근하기 위해서는 DataFrame ['열 이름']로 접근하지만, 인덱싱을 하기 위해서는 다양한 함수를 사용해야 한다. 특정 부분만 확인하기 위해서는 loc [] 함수와 iloc [] 함수를 많이 사용한다.(둘 다 함수지만, '[ ]'를 사용한다.) loc ['행 이름', '열이름'] 함수의 경우는 레이블을 지정하면서 인덱싱을 할 수 있고, iloc [0,1] 함수는 정수를 지정(위치)해 인덱싱을 할 수 있다.  DataFrame.drop() 함수는 데이터 프레임에서 열을 삭제하는 함수이다. axis라..
[혼공 분석] API, web scraping 공부를 하는 입장이기 때문에, 내용에 오류가 있을 수 있습니다. 오류가 있다면 적극적으로 알려주시면 감사합니다! 1. API  API(Application Programming Interface)란 서로 다른 소프트웨어 사이에서 데이터를 주고받거나 기능을 호출할 수 있도록 돕는 인터페이스를 의미한다. 예를 들어, A라는 프로그램이 a'라는 정보를 B라는 프로그램에 전달하려고 할 때, B는 A가 내부적으로 어떤 방식으로 a'를 구했는지 알 필요가 없다. A와 B는 a'의 형식과 전달 방법에 대해서만 사전에 약속하고 이를 따라 사용하면 된다. 이처럼 두 소프트웨어(시스템) 사이에 정보의 형식과 교환 방식을 정의하고 규칙을 정리한 것을 API라고 한다. 대표적으로 이에 사용하는 방법으로 JSON(JavaScr..
[혼공 분석] 혼자 공부하는 데이터 분석 with 파이썬 혼공 학습단 13기에 혼자 공부하는 데이터 분석 with 파이썬책으로 신청하였다. 공부를 하는데 기한이 정해져 있으면 동기부여로 인해 끝까지 완료하기 더 쉽다고 생각했고, 데이터 분석이나 시각화를 필요할 때마다 찾아서 하다가, 한번 책을 읽어볼까 고민하던 중에 한번 찍먹 해보자는 생각으로 신청하게 되었다.  혼공 학습단은 한주마다 챕터 하나씩 공부하고 정리하는 형식으로 진행된다.1. 공부 환경 책에서는 colab에서 사용하는 것을 전제로 진행된다. 하지만 나는 vscode에서 하려고 한다. window에서 아나콘다를 이용하여 개발환경을 만들었다. 책을 읽으면서 해본 코드 정리 같은 경우는 각 챕터마다 폴더로 정리하고, data들도 따로 모아서 정리하려고 한다.  Study_with_book/hongong..