본문 바로가기

데이터셋2

파이썬 - 데이터행열 선택 시험에 여차저차 합격해서 웃어 넘길 수 있지만, 남이 올려놓은 1차 가공된 데이터셋으로만 반복연습했던 나. 작업 2유형에서 한 시트로 나온 데이터를 보고 이게 뭐라고 남몰래 흘렸던 식은 땀이 떠오른다. 여러가지 방법이 있긴 하겠지만, 아래 3가지 정도면 활용에 무리는 없을 것으로 보인다. (나는 그랬음) 1) 꺽쇠([' '])를 이용하여 직접 해당 열 선택 2) 컬럼명(df.loc[ ])을 활용하여 해당 행/열 선택 3) 위치(df.iloc[ ])을 활용하여 해당 행/열 선택 우선 공공데이터포털을 활용해서 파일을 불러온다. 1. 꺽쇠 활용하기 - 비교적 간단하다. 이중꺽쇠안에 추출을 원하는 열을 넣어주는 방법이다. - DataFrame[['열이름', '열이름']] 2. 컬럼명(df.loc[ ])을 활용하.. 2022. 8. 6.
데이터 분석과 데이터 소스 파이썬은 깨작깨작 맛만 보고, 능력자들의 빅분기용 예상문제들을 접하다 보니 세상에 굉장히 많은 데이터 소스들이 있고, 이것들을 시험용으로 1차 가공해 놓아 import pandas as pd df = pd.read_csv('XXXXXXXXXX.csv') 뭐 이런식으로 읽어내기만 하면 물흐르듯 분석진행할 수 있도록 해 놓은 것을 발견할 수 있었다. 그래서 당연히 시험도 그러겠거니 했는데, 그것은 나의 오~해 였다. 사실 필요없는 컬럼 날리고, 하나의 시트에서 데이터 x, y를 나누는 것이 그렇게 어려운 것은 아니지만 너무나도 얕은 지식으로 단기간에 연습만 했더니, 이게 뭐라고 급당황. 혼자 골머리를 썩었던 기억이 난다. 지나고 보니 능력자분들의 많은 데이터 감사합니다~ 만, 적어도 간단하게나마 세상에 산재.. 2022. 7. 4.
반응형