티스토리 뷰

pandas_main

안녕하세요. 죠쵸입니다.

Machine Learning(머신러닝)에 대해서 알아보고 공부하다가 Pandas(판다스)에 대해서 알게 되었습니다.  오늘은 Pandas(판다스)는 무엇이고, Pandas(판다스)의 기본적인 사용법에 대해서 정리해서 공유하려고 합니다. 

 

# Pandas(판다스)는 무엇인가?

 

Pandas(판다스)는 Python(파이썬)의 Library 중 하나입니다. 이 Library는 데이터의 조작 및 분석을 위해서 사용 됩니다. Pandas(판다스)라는 이름도 "Python data analysis"(파이썬 데이터 분석)이라는 문구에서 유래되었다고 합니다. 머신러닝의 모델을 만들기 위해서 많이 사용되고 있는 중요한 Library입니다. 많은 시간이 데이터 분석을 위해 사용되는데, Pandas(판다스)의 사용법을 잘 알고 있으면, 데이터의 전처리과정과 분석하는데 많은 시간이 줄어 듭니다

 

# Pandas(판다스)의 기능

 

1) Tabular data, 즉 테이블 형식으로 저장된 데이터를 처리할 수 있습니다. Pandas(판다스)에서 데이터 테이블을 "DataFrame"이라 부릅니다. 물론 "Series"로 불리는 각 컬럼, 컬럼별 데이터도 처리가 가능합니다.

DataFram from pandaas.pydata.org

 

2) 여러가지 데이터 소스로 부터 데이터를 읽고, 가공하여 저장이 가능합니다. 그림과 같이 csv, excel, sql, json 등을 사용할 수 있습니다.

Data Source from pandaas.pydata.org

 

3) 데이터를 통해서 Plot(그래프)로 표현이 가능합니다.

 

4) 데이터의 통계적 수치를 간단히 계산할 수 있습니다. (mean, media, min, max, counts)

 

5) 신규 컬럼을 추가하거나, 필요없는 컬럼을 삭제 가능합니다.

 

이전에 올린 타이타닉 데이터 분석 및 시각화 글에서 해당 Pandas(판다스)을 이용하여 데이터를 전처리하고 분석한 내용이 포함 되어 있습니다. 해당 글을 참고 부탁 드립니다.

2020/08/29 - [INFO/IT] - 캐글 타이타닉 데이터 분석 및 시각화

 

다음 포스팅에서는 Pandas(판다스)의 주요 Command(명령)들을 둘러보고, Pandas(판다스)의 기초적 사용법을 알아 보도록 하겠습니다. 방문해 주셔서 감사합니다. 여러분의 공감하기와 구독은 저에게 힘이 됩니다.

이상으로 죠쵸였습니다.

[참고자료]

Pandas.pydata.org - https://pandas.pydata.org/docs/index.html

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함