Small Grey Outline Pointer 'Dev./데이터 분석' 카테고리의 글 목록
본문 바로가기

Dev./데이터 분석2

유저 데이터 분석 유저 행동 데이터로 서비스 건강성 분석하기 len(df) 출력값이 885129 약 88만개의 데이터가 있음을 알 수 있다 이 때 4 category_code 648910 non-null object 5 brand 672765 non-null object category_code와 brand 컬럼은 88만개에 미치지 못하는 수치가 non-null count로 집계되고 있다. (비어있다는 뜻) 숫자형 컬럼의 중앙값과 평균 살펴보기 ✅대푯값 : 어떤 데이터를 대표하는 값. 일반적으로 자료의 특징을 수 하나로 표현한 값이다. ✅평균(mean) - 일반적으로 말하는 평균은 산술평균 - 관측된 값을 모두 더한 후 관측값의 개수로 나눈 것 - 데이터의 무게 중심 ✅중앙값(median) : 어떤 주어진 값들을 크기의 .. 2023. 11. 14.
판다스 데이터 구조 🐱‍💻Colab Colaboratory(줄여서 'Colab'이라고 함)을 통해 브라우저 내에서 Python 스크립트를 작성하고 실행할 수 있다 🐱‍💻판다스 파이썬 데이터 분석 라이브러리 중 하나로, 데이터 조작, 정제, 분석, 시각화 등을 위한 다양한 기능을 제공 판다스에서는 두 가지 핵심 데이터 구조를 사용한다 ✅Series (1차원) - 여러 개의 레이블과 그 값을 들고 있는 일차원 배열 ✅DataFrame (2차원) - 데이터 테이블. 여러 개의 컬럼을 갖고 있으며 각각의 컬럼은 다른 데이터 형식의 값들을 담고 이을 수 있다. 행과 열이 있고 DataFrame은 Series의 모음이다. Series 판다스는 주로 pd라는 이름으로 불러 온다(import) 인덱스와 값이 출력 됨 RangeIndex(.. 2023. 10. 21.