시험에 여차저차 합격해서 웃어 넘길 수 있지만, 남이 올려놓은 1차 가공된 데이터셋으로만 반복연습했던 나.
작업 2유형에서 한 시트로 나온 데이터를 보고 이게 뭐라고 남몰래 흘렸던 식은 땀이 떠오른다.
여러가지 방법이 있긴 하겠지만, 아래 3가지 정도면 활용에 무리는 없을 것으로 보인다. (나는 그랬음)
1) 꺽쇠([' '])를 이용하여 직접 해당 열 선택
2) 컬럼명(df.loc[ ])을 활용하여 해당 행/열 선택
3) 위치(df.iloc[ ])을 활용하여 해당 행/열 선택
우선 공공데이터포털을 활용해서 파일을 불러온다.
1. 꺽쇠 활용하기
- 비교적 간단하다. 이중꺽쇠안에 추출을 원하는 열을 넣어주는 방법이다.
- DataFrame[['열이름', '열이름']]
2. 컬럼명(df.loc[ ])을 활용하여 해당 열 선택
- DataFrame명.loc[:(전체를 의미), '열이름', '열이름'], 전체에서 해당열의 값을 추출
- 전체에서 '지역명' 컬럼만 추출해 준다. (print해보면 추출이 제대로 되어 있는지 확인 할 수 있다.)
여기서 잠깐! 만약 '행만 추출하고 싶으면 위치를 반대로 해주면 된다.
- DataFrame명.loc['행이름', '행이름', :(전체를 의미)], 전체에서 해당행의 값을 추출
여기서 또 잠깐! 만약 '행'/'열'을 추출하고 싶으면??
- DataFrame명.loc[['행이름', '행이름'], ['열이름', '열이름']], 전체에서 해당행/열의 값을 추출
3. 위치(df.iloc[ ])을 활용하여 해당 행/열 선택
- 각열의 순서 인덱스를 먼저 확인하여 선택하고자 하는 열의 인덱스를 넣어 불러주는 방법이다.
- DataFrame명.iloc[:(전체), 열인덱스, 열인덱스]
- 지역명은 세번째 컬럼이므로 '2', 연령대는 네번째 컬럼이므로 '3', 종목명은 여덟번째 컬럼이므로 '7'로 하여 추출한다.
여기서 잠깐! 만약 '행'만 추출하고 싶으면 위치를 반대로 해주면 된다.
- DataFrame명.iloc[행인덱스, 행인덱스, :(전체)], 전체에서 해당행의 값을 추출
여기서 또 잠깐! 만약 '행'/'열'을 추출하고 싶으면??
- DataFrame명.iloc[[행인덱스, 행인덱스], [열인덱스, 열인덱스]], 전체에서 해당행/열의 값을 추출
조건문을 추가하여 조건에 부합하는 데이터를 추출하는 경우는
위의 데이터 컬럼선택 후 조건문을 추가하면 된다.
이건 다음에 해보자.
근데 왜.... 그래프에 한글은 아직도 깨지는가.. ㅠ,.ㅠ
'딸깍딸깍' 카테고리의 다른 글
파이썬 - 라이브러리(?) (0) | 2022.07.10 |
---|---|
데이터 분석과 데이터 소스 (0) | 2022.07.04 |
파이썬 맛보기? 노노! 맨땅에 헤딩! (0) | 2022.06.30 |
빅데이터와 파이썬 (1) | 2022.06.29 |
정보의 바다 (0) | 2022.06.26 |
댓글