판다스1 유저 데이터 분석 유저 행동 데이터로 서비스 건강성 분석하기 len(df) 출력값이 885129 약 88만개의 데이터가 있음을 알 수 있다 이 때 4 category_code 648910 non-null object 5 brand 672765 non-null object category_code와 brand 컬럼은 88만개에 미치지 못하는 수치가 non-null count로 집계되고 있다. (비어있다는 뜻) 숫자형 컬럼의 중앙값과 평균 살펴보기 ✅대푯값 : 어떤 데이터를 대표하는 값. 일반적으로 자료의 특징을 수 하나로 표현한 값이다. ✅평균(mean) - 일반적으로 말하는 평균은 산술평균 - 관측된 값을 모두 더한 후 관측값의 개수로 나눈 것 - 데이터의 무게 중심 ✅중앙값(median) : 어떤 주어진 값들을 크기의 .. 2023. 11. 14. 이전 1 다음