728x90

pandas 5

Python으로 결측치 확인 후 보간(내삽)하기

오늘은 파이썬으로 결측치의 개수를 확인하고 내삽까지 해보도록 하겠습니다 기상 데이터를 받아서 사용하다보면 결측치가 존재하는 경우가 자주 있습니다 과거 데이터의 경우에는 3시간 간격으로 기입했기 때문이고 최근의 자료들에서는 관측이 제대로 안됐거나 잠시 기기 이상이 있었던 경우 결측치가 존재합니다 하지만 모델에 데이터를 사용하기 위해서는 데이터의 양이 충분히 많다면 결측치들을 0으로 처리해도 그 영향이 매우 미미하기 때문에 상관이 없지만 데이터가 충분하지 않을 경우는 영향을 주기 때문에 결측치를 0이 아닌 다른 방법으로 채워주어야합니다 pandas 라이브러리에서는 내장함수로 interpolate를 지원합니다 보간 방식은 많은 보간 방식을 지원하지만 자주 사용되는 것들은 아래 5개 정도인 것 같습니 'line..

파이썬 2024.01.24

Python을 이용해서 다수의 csv파일 한 번에 합치기

오늘은 Python을 사용해서 다수의 csv 파일을 한 번에 합쳐보겠습니다 저는 기상자료개방포털이라는 곳에서 기상자료를 가지고 옵니다 짧은 특정 기간 자료가 아니라 1년 동안의 1시간 단위 자료, 일 단위 자료 이렇게 자료를 크게 가져올 경우 데이터를 쪼개서 주는 경우가 있습니다 특히 제가 이번에 사용중인 1분 단위 자료는 자료의 양이 방대하기 때문에 한 달 단위로 쪼개서 제공합니다 대충 이런 모양이 됩니다 하지만 이 친구들을 전부 따로 사용할게 아니라 한 번에 사용하고 싶기 때문에 한 번에 묶는 방법을 생각해서 코드를 짜봤습니다 혹시 더 깔끔하고 간단하게 짜셨거나 조언이 있으신 분들은 언제든지 댓글 부탁드립니다! #Lbrary Import import numpy as np import tensorflo..

파이썬 2024.01.24

작업9 : Python으로 파장별 복사에너지 그래프 그리기

저번에 포트란으로 계산했던 파장별 복사에너지를 그려보겠습니다 라이브러리) 오늘 필요한 라이브러리는 정말 간단합니다 import pandas as pd import matplotlib.pyplot as plt csv 파일을 읽어올 pandas와 직접 그림을 그릴 matplotlib 만 있으면 됩니다 결과물) 먼저 저희가 그릴 결과물입니다 학생 분이시면 교과서에서 비슷한 그림을 보셨을거라 생각합니다 코드분석) se = pd.DataFrame(pd.read_csv('/content/drive/MyDrive/대기복사학 파일/se.csv')) fig, ax = plt.subplots(figsize = (15, 9)) ax.plot(se[' lamda'], se['T1']) ax.plot(se['..

파이썬 2022.10.26

내 파이썬 목표

요즘 문득 드는 생각이 내가 과연 라이브러리 내에 모든 함수를 사용할 수 있을까? 라는 생각이 듭니다 ​ Numpy 내에도 다양한 모듈이 있고 Matplotlib 내에도 다양한 모듈이 있는데 이걸 과연 제대로 사용하고 있는 걸까 생각을 해봤습니다 ​ 그래서 당분간은 라이브러리들에 대해 하나씩 알아보려고 합니다 ​ 제가 설명드릴 라이브러리들은 Numpy, Matplotlib, Pandas, (TensorFlow, Keras, PyTorch) Scipy 이렇게 5개 입니다 ​ 저 라이브러리들 모두 머신러닝에 자주 사용되는 라이브러리입니다 ​ 텐서플로우와 케라스, 파이토치는 하나로 묶은 이유는 이 3개는 사용 용도가 비슷합니다 또한 범용성이 서로서로 좋기 때문에 연결시키며 사용하기 편리합니다 ​ 머신러닝에 관..

파이썬 2021.10.05

자료를 시각화 해보자

저번 포스팅에 이어서 시각화 했던 코드를 분석해보고 결과물 까지 함께 보겠습니다 ​ 먼저 직접 그래프를 그리는 부분입니다 plt는 앞에서 저희가 라이브러리를 불러올때 봤던 matplotlib.pyplot에 약자 입니다 저렇게 불러오지 않으면 matplotlib.pyplot을 매 부분 전부 작성을 해야하기 때문에 번거롭습니다 ​ 12열을 보시면 plt.style.use('ggplot)이라고 되어있습니다 이 코드는 그대로 읽으시면 됩니다 그래프를 그릴때 'ggplot'이라는 스타일을 사용하겠다는 말입니다 ​ ggplot은 파이썬보다는 R이라는 프로그래밍 언어에서 더 많이 사용됩니다 Grammer of Graphics plot의 약자로 그래픽 문법으로 plot을 한다는 말인데요 영어에도 문법이 있듯이 그래픽을..

카테고리 없음 2021.09.30