자연과학, IT, 공학

파이썬에서 데이터 분석을 위한 명령어

날아라쥐도리 2023. 12. 14. 13:49
반응형

파이썬에서 데이터 분석을 위한 명령어

 
파이썬은 데이터 분석에 매우 유용한 도구입니다. 다음은 파이썬에서 데이터 분석을 위해 자주 사용되는 라이브러리와 그에 대한 간단한 설명입니다.
 
1. pandas: pandas는 데이터 조작 및 분석을 위한 파이썬 라이브러리로, 특히, 숫자 테이블 및 시계열 데이터를 다루는 데 유용합니다.
 
예를 들어, CSV 파일을 읽어오는 코드는 다음과 같습니다.
 
import pandas as pd
df = pd.read_csv('filename.csv')
 
 
2. numpy: numpy는 다차원 배열을 처리하는 데 필요한 기능들을 제공합니다.
 
예를 들면, numpy 배열을 생성하는 코드는 아래와 같습니다.
 
import numpy as np
array = np.array([1, 2, 3])
 
 
3. matplotlib: matplotlib는 데이터를 차트나 플롯으로 시각화하는 데 사용됩니다.
 
예를 들어, 선 그래프를 그리는 코드는 다음과 같습니다.
 
import matplotlib.pyplot as plt
plt.plot([1, 2, 3], [4, 5, 6])
plt.show()
 
 
4. scikit-learn: scikit-learn은 머신러닝을 위한 다양한 알고리즘을 제공하는 라이브러리입니다. 분류, 회귀, 클러스터링 등 다양한 알고리즘을 지원합니다.
 
예를 들어, 선형 회귀 모델을 학습시키는 코드는 다음과 같습니다.
python
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X, y)
 
이 외에도 seaborn, scipy 등 데이터 분석에 유용한 파이썬 라이브러리는 많습니다. 자신의 목적에 맞게 선택해서 사용하시면 됩니다.
 

파이썬으로 데이터 시각화하는 법

 
파이썬에서는 여러 가지 라이브러리를 이용해 데이터를 시각화할 수 있습니다. 여기서는 가장 널리 사용되는 두 가지 라이브러리인 matplotlib과 seaborn에 대해 설명하겠습니다.
 
1. Matplotlib: Matplotlib는 파이썬에서 가장 기본적인 데이터 시각화 도구입니다. 간단한 선 그래프, 히스토그램, 산점도 등을 그릴 수 있습니다.
 
예시:
 
import matplotlib.pyplot as plt
plt.plot([1,2,3,4,5]) # 선 그래프를 그립니다.
plt.ylabel('some numbers') # y 축 레이블을 추가합니다.
plt.show() # 그래프를 표시합니다.
 
 
2. Seaborn: Seaborn은 Matplotlib를 기반으로 더 고급 시각화를 가능하게 하는 라이브러리입니다. 히트맵, pairplot 등 복잡한 시각화를 간단하게 할 수 있습니다.
 
예시:
 
import seaborn as sns
tips = sns.load_dataset("tips") # 내장된 tips 데이터셋을 로드합니다.
sns.boxplot(x="day", y="total_bill", data=tips) # 박스 플롯을 그립니다.
plt.show()
 
 
3. Pandas: Pandas 라이브러리도 간단한 시각화를 지원합니다. DataFrame의 메서드를 이용해 바로 그래프를 그릴 수 있습니다.
 
예시:
 
import pandas as pd
df = pd.DataFrame({
'name':['john','mary','peter','jeff','bill','lisa','jose'],
'age':[23,78,22,19,45,33,20],
'gender':['M','F','M','M','M','F','M'],
'state':['california','dc','california','dc','california','texas','texas'],
'num_children':[2,0,0,3,2,1,4],
'num_pets':[5,1,0,5,2,2,3]
})
df.plot(kind='scatter',x='num_children',y='num_pets',color='red') # 산점도를 그립니다.
plt.show()
 
각 라이브러리는 다양한 시각화 기능을 제공하므로, 필요에 따라 적절히 선택하여 사용하면 됩니다.

728x90

파이썬으로 그래프 스타일을 바꿀 수 있다.

 
네, 그래프의 스타일을 변경하는 것은 가능합니다. Matplotlib와 Seaborn 라이브러리는 다양한 스타일 옵션을 제공하며, 그래프의 스타일을 변경함으로써 데이터를 더욱 명확하고 직관적으로 표현할 수 있게 돕습니다.
 
1. Matplotlib: Matplotlib에서는 `plt.style.use()` 함수를 사용하여 스타일을 변경할 수 있습니다. 이 함수에 스타일의 이름을 문자열로 전달하면 됩니다.
 
예시:
 
import matplotlib.pyplot as plt
plt.style.use('ggplot') # 'ggplot' 스타일을 사용합니다.
plt.plot([1,2,3,4,5])
plt.show()
 
 
사용할 수 있는 스타일의 목록을 보려면 `plt.style.available`를 사용하면 됩니다.
 
2. Seaborn: Seaborn에서는 `sns.set_style()` 함수를 사용하여 스타일을 변경할 수 있습니다. 이 함수에 스타일의 이름을 문자열로 전달하면 됩니다.
 
예시:
 
import seaborn as sns
sns.set_style("whitegrid") # 'whitegrid' 스타일을 사용합니다.
tips = sns.load_dataset("tips")
sns.boxplot(x="day", y="total_bill", data=tips)
plt.show()
 
 
사용 가능한 스타일은 "darkgrid", "whitegrid", "dark", "white", "ticks" 등이 있습니다.
 
또한, 각 라이브러리는 그래프의 색상, 레이블, 타이틀, 눈금 등을 변경하는 다양한 함수를 제공하므로, 이를 사용하여 그래프를 원하는 대로 꾸밀 수 있습니다.

반응형