본문 바로가기
딸깍딸깍

파이썬 - 데이터행열 선택

by 질풍노도동글 2022. 8. 6.

시험에 여차저차 합격해서 웃어 넘길 수 있지만, 남이 올려놓은 1차 가공된 데이터셋으로만 반복연습했던 나.

작업 2유형에서 한 시트로 나온 데이터를 보고 이게 뭐라고 남몰래 흘렸던 식은 땀이 떠오른다.

 

여러가지 방법이 있긴 하겠지만, 아래 3가지 정도면 활용에 무리는 없을 것으로 보인다. (나는 그랬음)

1) 꺽쇠([' '])를 이용하여 직접 해당 열 선택

2) 컬럼명(df.loc[ ])을 활용하여 해당 행/열 선택

3) 위치(df.iloc[ ])을 활용하여 해당 행/열 선택 

 

우선 공공데이터포털을 활용해서 파일을 불러온다. 

 

1. 꺽쇠 활용하기

 - 비교적 간단하다.  이중꺽쇠안에 추출을 원하는 열을 넣어주는 방법이다.

 - DataFrame[['열이름', '열이름']] 

 

 

 

 

 

 

2. 컬럼명(df.loc[ ])을 활용하여 해당 열 선택

 - DataFrame명.loc[:(전체를 의미), '열이름', '열이름'], 전체에서 해당열의 값을 추출

 - 전체에서 '지역명' 컬럼만 추출해 준다. (print해보면 추출이 제대로 되어 있는지 확인 할 수 있다.)

 

여기서 잠깐!  만약 '행만 추출하고 싶으면 위치를 반대로 해주면 된다.

 - DataFrame명.loc['행이름', '행이름', :(전체를 의미)], 전체에서 해당행의 값을 추출

 

여기서 또 잠깐!  만약 '행'/'열'을 추출하고 싶으면?? 

 - DataFrame명.loc[['행이름', '행이름'], ['열이름', '열이름']], 전체에서 해당행/열의 값을 추출

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. 위치(df.iloc[ ])을 활용하여 해당 행/열 선택

- 각열의 순서 인덱스를 먼저 확인하여 선택하고자 하는 열의 인덱스를 넣어 불러주는 방법이다.

 

- DataFrame명.iloc[:(전체), 열인덱스, 열인덱스]

- 지역명은 세번째 컬럼이므로  '2', 연령대는 네번째 컬럼이므로 '3', 종목명은 여덟번째 컬럼이므로 '7'로 하여 추출한다.

여기서 잠깐!  만약 '행'만 추출하고 싶으면 위치를 반대로 해주면 된다.

 - DataFrame명.iloc[행인덱스, 행인덱스, :(전체)], 전체에서 해당행의 값을 추출

 

여기서 또 잠깐!  만약 '행'/'열'을 추출하고 싶으면?? 

 - DataFrame명.iloc[[행인덱스, 행인덱스], [열인덱스, 열인덱스]], 전체에서 해당행/열의 값을 추출

 

조건문을 추가하여 조건에 부합하는 데이터를 추출하는 경우는

위의 데이터 컬럼선택 후 조건문을 추가하면 된다.

 

이건 다음에 해보자.

 

근데 왜.... 그래프에 한글은 아직도 깨지는가.. ㅠ,.ㅠ

 

반응형

'딸깍딸깍' 카테고리의 다른 글

파이썬 - 라이브러리(?)  (0) 2022.07.10
데이터 분석과 데이터 소스  (0) 2022.07.04
파이썬 맛보기? 노노! 맨땅에 헤딩!  (0) 2022.06.30
빅데이터와 파이썬  (1) 2022.06.29
정보의 바다  (0) 2022.06.26

댓글