Small Grey Outline Pointer '데이터분석' 태그의 글 목록
본문 바로가기

데이터분석3

유저 데이터 분석 유저 행동 데이터로 서비스 건강성 분석하기 len(df) 출력값이 885129 약 88만개의 데이터가 있음을 알 수 있다 이 때 4 category_code 648910 non-null object 5 brand 672765 non-null object category_code와 brand 컬럼은 88만개에 미치지 못하는 수치가 non-null count로 집계되고 있다. (비어있다는 뜻) 숫자형 컬럼의 중앙값과 평균 살펴보기 ✅대푯값 : 어떤 데이터를 대표하는 값. 일반적으로 자료의 특징을 수 하나로 표현한 값이다. ✅평균(mean) - 일반적으로 말하는 평균은 산술평균 - 관측된 값을 모두 더한 후 관측값의 개수로 나눈 것 - 데이터의 무게 중심 ✅중앙값(median) : 어떤 주어진 값들을 크기의 .. 2023. 11. 14.
판다스 데이터 구조 🐱‍💻Colab Colaboratory(줄여서 'Colab'이라고 함)을 통해 브라우저 내에서 Python 스크립트를 작성하고 실행할 수 있다 🐱‍💻판다스 파이썬 데이터 분석 라이브러리 중 하나로, 데이터 조작, 정제, 분석, 시각화 등을 위한 다양한 기능을 제공 판다스에서는 두 가지 핵심 데이터 구조를 사용한다 ✅Series (1차원) - 여러 개의 레이블과 그 값을 들고 있는 일차원 배열 ✅DataFrame (2차원) - 데이터 테이블. 여러 개의 컬럼을 갖고 있으며 각각의 컬럼은 다른 데이터 형식의 값들을 담고 이을 수 있다. 행과 열이 있고 DataFrame은 Series의 모음이다. Series 판다스는 주로 pd라는 이름으로 불러 온다(import) 인덱스와 값이 출력 됨 RangeIndex(.. 2023. 10. 21.
데이터 분석에 기반한 기획하기 : 지표, 데이터 분석 도구, Amplitude 좋은 지표 사업에 도움이 되는 지표 -상대적 -이해하기 쉬움 -비율료 표현 -행동방식을 바꾼다 -비교가 가능한 지표 -팀 구성원들이 이해할 수 있는 지표 -쉽게 측정할 수 있는 지표 나쁜 지표 사업에 도움이 되지 않는 허영 지표 -누적 지표 -페이지 뷰 -SNS의 좋아요, 팔로워 수 ✅우리가 이 지표를 가지고 어떤 행동을 취할 수 있는가? ✅행동방침을 결정하는데 도움이 되지 않는 지표는 필요 없다 ✅성과보고에는 사용 가능하지만, 행동을 변화시키지는 못한다 정성적 VS 정량적 지표 정성적 정량적 비구조적, 종합하기 힘듦 정황 정보 부족 '왜'에 대한 답을 제공 체계적 객관적 제품 설계 단계에서 중요 제품 개선 단계에서 중요 지표 선택 시 염두할 사항 탐색 ↔ 보고 지표 ✅탐색지표 : 추론에 기반, 아직 알.. 2023. 9. 19.