728x90

선형회귀분석 5

작업 15: Python으로 선형 회귀 모델 적합성 검사 라이브러리 만들기2

앞에 설명하는 부분들은 파이썬 설명보다는 통계 설명이 더 많아서 통계 카테고리로 옮겼습니다 이 포스팅에서는 전체 코드를 올리고 마무리 지을까 합니다 당분간은 파이썬보다는 포트란과 NCL로 조금 눈을 돌려볼까 합니다 한동안 너무 파이썬만 한 거 같아요.. 과제에서 했던 것들을 간간히 올려보는 걸로 파이썬은 이어가겠습니다! 정말 정말 깁니다... 318줄 정도 되요.. 꼼꼼히 읽어보셔야 해요! import numpy as np from scipy import stats from sklearn.linear_model import LinearRegression import matplotlib.pyplot as plt #Coefficent of Detect class COD: def __init__(self, x..

파이썬 2022.12.31

MSE, MSR 의미 알아보고 F비 파이썬으로 구해보기

종강하고 푹 쉬고 오느라고 한동안 포스팅을 못했네여.. MSR, MSE, F비로 다시 이어가보겠습니다 먼저 MSE랑 MSR, F비에 대해 설명이 조금 필요합니다 쉬운 이해를 위해 그림을 그려왔습니다 파란색 점들은 관측값, 빨간색 선 위에 점들은 예측값, 초록색 수평선은 관측값의 평균입니다 맨 앞부분을 가져와서 옆으로 눕혀서 보겠습니다 (눕혀서 보는게 편해요!) 정의를 써놨지만 그림만 보면 모를수도 있으니 아래에 써보도록 할께요 여기서 예측값은 파이썬에서 Linear Regression 모듈에 predict로 구해진 값을 말합니다 - 평균과 회귀값의 차이 : 평균값 - 예측값 - 편차 : 관측값 - 평균값 - 잔차 : 관측값 - 예측값 이렇게 정의 할 수 있습니다 위에 3가지 정의를 가지고 SSR, SSE..

통계 2022.12.31

상관계수와 회귀식, 예측값 파이썬으로 구해보기

어제도 제 블로그를 찾아주신 다섯 분 감사드립니다! 오늘은 상관계수와 선형회귀 분석, MSE, MSR 부분입니다 저번 포스팅에서 유의성 검사까지 마쳤습니다 이제 상관계수가 유의한지 않은지를 알 수 있으니 선형 회귀 분석도 해보겠습니다 #Correlation class correlation: def __init__(self, x, y): self.p_r, self.pp_val = stats.pearsonr(x, y) self.s_r, self.sp_val = stats.spearmanr(x, y) def pearson(self): print('변수 X,Y에 대한 피어슨 상관계수는 {}입니다'.format(round(self.p_r, 4))) def spearman(self): print('변수 X,Y에 대..

통계 2022.12.21

작업12: Python으로 부산 평균 최고기온 분석하기3

저번에 이어서 표준편차가 높게 나온 이유를 분석해보겠습니다 자료) 기간 1973년 ~ 2021년 지점 ASOS 부산 관측 지점 자료 월 별 평균 최고기온, 1, 2, 7, 8월 합계 강수량 7월) prec = pd.DataFrame(pd.read_excel("/content/drive/MyDrive/기상통계학/pre.xlsx")) pre7 = prec['july'].to_list() fj1 = np.polyfit(pre7, jul['mmt'], 1) fj5 = np.poly1d(fj1) fig, ax15 = plt.subplots(figsize = (15, 9)) twin1 = ax15.twinx() ax15.plot(hjk, jul, color = 'red', label = 'july m..

파이썬 2022.11.05

작업11: Python으로 부산 평균 최고기온 분석하기 2

저번 포스팅과 이어집니다 저번 포스팅에서 편차를 구해보고 선형회귀분석을 이용해서 추세선까지 그려봤습니다 오늘은 먼저 저번 포스팅에서 예측했던 '편차가 상승하는 추세이니 실제 기온도 상승하는 추세일거다' 를 확인해보고 각 월 별 평균을 구하고 표준편차를 막대그래프로 그려보겠습니다 자료) 기간 1973년 ~ 2021년 지점 ASOS 부산 관측 지점 자료 월 별 평균 최고기온 개념) 먼저 저번 포스팅에서 설명 드렸었지만 표준편차에 대해 한 번 더 설명해보겠습니다 공식으로는 이렇게 표현합니다 Xi는 관측값, X bar는 평, n은 전체 자료 갯수를 의미합니다 데이터 분석 분야에서는 RMSE(Root Mean Square Error)라고도 부릅니다 이 값이 작을수록 자료들의 특성이 선형 예측에 잘 반영된다는 말입..

파이썬 2022.11.05