728x90

numpy 7

작업12: Python으로 부산 평균 최고기온 분석하기3

저번에 이어서 표준편차가 높게 나온 이유를 분석해보겠습니다 자료) 기간 1973년 ~ 2021년 지점 ASOS 부산 관측 지점 자료 월 별 평균 최고기온, 1, 2, 7, 8월 합계 강수량 7월) prec = pd.DataFrame(pd.read_excel("/content/drive/MyDrive/기상통계학/pre.xlsx")) pre7 = prec['july'].to_list() fj1 = np.polyfit(pre7, jul['mmt'], 1) fj5 = np.poly1d(fj1) fig, ax15 = plt.subplots(figsize = (15, 9)) twin1 = ax15.twinx() ax15.plot(hjk, jul, color = 'red', label = 'july m..

파이썬 2022.11.05

작업11: Python으로 부산 평균 최고기온 분석하기 2

저번 포스팅과 이어집니다 저번 포스팅에서 편차를 구해보고 선형회귀분석을 이용해서 추세선까지 그려봤습니다 오늘은 먼저 저번 포스팅에서 예측했던 '편차가 상승하는 추세이니 실제 기온도 상승하는 추세일거다' 를 확인해보고 각 월 별 평균을 구하고 표준편차를 막대그래프로 그려보겠습니다 자료) 기간 1973년 ~ 2021년 지점 ASOS 부산 관측 지점 자료 월 별 평균 최고기온 개념) 먼저 저번 포스팅에서 설명 드렸었지만 표준편차에 대해 한 번 더 설명해보겠습니다 공식으로는 이렇게 표현합니다 Xi는 관측값, X bar는 평, n은 전체 자료 갯수를 의미합니다 데이터 분석 분야에서는 RMSE(Root Mean Square Error)라고도 부릅니다 이 값이 작을수록 자료들의 특성이 선형 예측에 잘 반영된다는 말입..

파이썬 2022.11.05

작업 4 : 표준 정규 분포 그려보기

작업 3과 연결됩니다 저도 공부하며 배워가는 입장에서 하려니까 포스팅 주기가 너무 들쭉날쭉하네요 ㅠㅠ 흔히 표준 정규 분포와 항상 함께 나오는 짝궁 같은 친구가 있습니다 초등학교 때 도수분포표와 함께 배운 히스토그램이라는 친구입니다 히스토그램은 측정값이 존재하는 범위를 몇 개의 구간(급)으로 나눈 경우, 각 구간을 밑변으로 하고 그 구간에 속하는 측정값의 출현 도수에 비례하는 면적을 갖는 기둥(직사각형)으로 배열한 그림입니다 글로만 써놓으니까 어렵죠? 그림으로 봐보겠습니다 코딩 연습 시간(분) 명 10 ~ 30 1 30 ~ 50 8 50~ 70 10 70~ 90 7 90~ 110 12 110 ~ 130 3 계 40 저희가 초등학교 때 보던 도수분포표입니다 일반적인 표와는 다른점이 있습니다 계급들이 모두 ..

파이썬 2022.04.08

작업 3 : np.random 메소드 살펴보기

제가 예전에 설명 드렸던 numpy라는 라이브러리에는 랜덤하게 난수를 생성해주는 random이라는 함수가 있습니다 하지만 아무리 난수라고 해도 지정된 범위 내에서 생성을 해줍니다 범위는 대표적으로 3개가 있습니다 첫 번째는 np.random.rand 입니다 (np는 numpy의 약자로 앞에서 라이브러리를 임포트한걸 전제로 합니다) np.random 부분은 numpy라는 라이브러리 내에 random이라는 메소드를 불러온겁니다 그리고 rand는 구체적인 범위를 알려주는 부분입니다 rand의 경우 0보다 크거나 같고 1보다 작은 범위 내에서 균일한 분포의 난수를 생성해줍니다 EX) np.random.rand(5) => array([0.31912849, 0.50176702, 0.36029099, 0.295245..

파이썬/numpy 2022.04.07

Numpy에 대해 알아보자

첫 주자는 Numpy 입니다 ​ numpy는 행렬이나 대규모 다차원 배열을 쉽게 처리하도록 도와주는 라이브러리입니다 ​ 데이터 구조, 행렬이나 배열 뿐만 아니라 수치 계산을 위한 모듈들도 모함되어 있어 효율적인 계산을 가능하게 합니다 ​ 다른 라이브러리 Matplotlib나 Pandas, 최근에 나온 Tensor Flow 까지 연동이 될 정도로 범용성이 좋습니다 ​ numpy를 불러오기 위해서는 import numpy as np라는 구문으로 numpy를 import를 시켜야 하고 np는 우리가 원하는 이름으로 설정이 가능합니다 ​ 이렇게 import를 시키면 언제든지 numpy 라이브러리를 사용할 수 있습니다 기본적인 단위는 array로 데이터를 관리하고 연산합니다 array는 행렬이라는 뜻입니다 ​ 위..

파이썬/numpy 2021.10.07

내 파이썬 목표

요즘 문득 드는 생각이 내가 과연 라이브러리 내에 모든 함수를 사용할 수 있을까? 라는 생각이 듭니다 ​ Numpy 내에도 다양한 모듈이 있고 Matplotlib 내에도 다양한 모듈이 있는데 이걸 과연 제대로 사용하고 있는 걸까 생각을 해봤습니다 ​ 그래서 당분간은 라이브러리들에 대해 하나씩 알아보려고 합니다 ​ 제가 설명드릴 라이브러리들은 Numpy, Matplotlib, Pandas, (TensorFlow, Keras, PyTorch) Scipy 이렇게 5개 입니다 ​ 저 라이브러리들 모두 머신러닝에 자주 사용되는 라이브러리입니다 ​ 텐서플로우와 케라스, 파이토치는 하나로 묶은 이유는 이 3개는 사용 용도가 비슷합니다 또한 범용성이 서로서로 좋기 때문에 연결시키며 사용하기 편리합니다 ​ 머신러닝에 관..

파이썬 2021.10.05

자료를 불러오고 편집해보자

저번에 포스팅 했던 코랩을 이용해서 파이썬의 다양한 라이브러리를 통해 자료를 시각화 해보려고 합니다 ​ 과가 대기과이다 보니까 자료의 양이 매우 방대합니다 과거 강수량이나 일사량, 일기도 등 이런 지표들의 자료가 많이 축적이 되어있습니다 이 지표들을 통해 앞으로의 날씨를 예측하는 것이 예보관이 하는 일이기도 합니다 ​ 위 사진은 파이썬에서 제공하는 다양한 라이브러리들입니다 상위 라이브러리로 갈수록 훨씬 어렵고 복잡한 작업을 수행합니다 저희는 자료를 정리하거나 시각화하는 작업을 할겁니다 ​ 이때 필요환 라이브러러리를 Numpy, 주로 배열이나 행렬을 만드는 선형대수학과 관련된 라이브러리 Matplotlib, 주로 데이터로 그래프를 그려서 자료를 시각화하는 라이브러리 Pandas, 주로 시계열 자료나 데이터..

파이썬 2021.09.30