데이터분석 study 72

TIL_24.09.13_리텐션 분석

▶ 리텐션   - 처음으로 서비스를 이용한 이후 일정 기간이 지난 이후에도 계속해서 이용하고 있는     유저의 비율     - AARRR 순서에서 RARRA 순서로 Retention이 가장 중요한 앞단계로 Acquisition 단계가      가장 뒤로 변경되는 버전이 등장.          ○ Acquisition 단계는 마케팅과 광고 비용이 많이 들고 신규 사용자를 확보하는 것보다        사용자를 유지하는 것이 비용이 더 저렴한 상황이 많다.     ● 리텐션 측정 기준       리텐션 측정 방법을 선택하는 기준은 시간을 포함해서 리텐션 정의,        프로덕트 사용자 주기, 유저의 상태가 중요하다.             1. 리텐션 정의          : 유저가 서비스에서 어떤 행동을..

TIL_24.09.12_Referral, Revenue

▶ Referral우리 서비스의 유저가 지인들에게 추천할만큼 우리의 제품을 좋아할까?    - 유저가 친구 중 1명 이상과 공유할 정도로 우리 서비스를 좋아하고 있을까?   - 해당 단계는 UX 디자인팀 혹은 UX Researcher와 협업할 경우 많이 활용됨     ● 주요 지표NPS(Net Promoter Score), SNS 채널별 공유수, 바이럴 계수, 앱스토어 평점,리뷰, 추천 코드 사용률, 추천 가입 수       ○ NPS(Net Promoter Score, 순수 고객 추천 지수)         - 기업이 고객 만족도와 충성도를 평가하는 데 사용됨         - 서비스가 시장에 잘 정착했는지, 앞으로 성장할 수 있을지를 판단 NPS = 추천 그룹 비율%(Promoters) - 비추천 그룹..

TIL_24.09.11_지표의 종류

▶ 지표의 종류    ● OKR       - 조직이나 팀이 특정 기간 동안 달성하고자 하는 목표를 설정하는 프레임워크     ● KPI 지표       - 회사의 주요 성과 지표       - 회사의 KPI 지표는 비즈니스 상황에 따라 연도별, 분기별 등 계속 바뀝니다.       ○ SMART KPI 특징         - Specific : 구체적이고 분명하게 정의되어야 한다.         - Measurable : 측정 가능해야 한다.         - Achievable : 달성 가능한 숫자여야 한다.         - Relevant : 다른 지표들과 비슷한 방향으로 움직여야 한다.         - Time - bound : 정해진 시간 범위가 있어야 한다.     ● 상대 지표 vs 절대..

TIL_24.09.10_COALESCE함수

SQL 코딩테스트 문제를 풀다가 다른 분들 풀이를 보고 몰랐던 함수에 대해서찾아보았다. ▶ COALESCE함수로 NULL 값 처리하기SELECT COALESCE(컬럼1, 컬럼2, 컬럼3, ... , 컬럼 N, ...) FROM table;     만약, 컬럼1이 null이 아니면 컬럼1을 반환되고, null이면 컬럼2를 반환    컬럼2가 null이 아니면 컬럼2를 반환하고, 컬럼1과 컬럼2 모두 null이면 컬럼3을 반환    컬럼1 ~ 컬럼5까지 null 이면 컬럼 6을 반환하는 형식  예시)SELECT COALESCE(컬럼1, 컬럼2, '공백') FROM member;결과값: 컬럼1의 null값 대신 컬럼2가 반환되고, 컬럼2의 null값 대신'공백'으로 반환  ▶ IFNULL과 COALESCE의 ..

TIL_24.09.06_ Activation, Retention

▶ Carrying Capacity(C.C)    - 매일 들어오는 유저(inflow), 매일 얼마나 유저를 잃고 있는지(churn rate) 계산식 = 기간 중 새로 들어오는 유저수(마케팅, 광고 없이) / 기간 중 잃게 되는 유저 비율(MAU대비)  ▶ 아하 모먼트    ● 이 제품의 핵심 가치를 말함       - xx라는 행동을, 가입한 지 yy라는 날짜 안에 zz번 한다.       - 토스의 아하 모먼트 : 4일 안에  두 번이상 송금  ▶ 리텐션에 대한 기준    ● 리텐션의 높이가 기업의 가치를 정한다.       리텐션 40% : 유니콘       리텐션 70% : 세상을 바꿀 수 있는 정도   ▶ SHAP value         * 변수 중요도를 나타내기도 함     ● Activat..

TIL_24.09.04_지표 프레임 워크

▶ 지표 프레임 워크     - 프레임워크 중심의 지표 관리 : 지표 중심으로 현재 서비스의 상황을 판단      ● 서비스 흐름에 따라 퍼널과 퍼널에 맞는 지표를 정의하고 해당 지표를           개선하기 Action을 수립       ●  그로스에 가장 많이 사용되는 지표 프레임 워크는 AARRR이다.          GAME, HEART 등 다양한 지표 프레임 워크             ● 회사의 현재 상황에 따라 어떤 프레임 워크를 선택할지를 결정               1) HEART 프레임 워크의 5단계 프로세스          ● 행복(Happiness) : 사용자는 얼마나 행복합니까?              - 앱스토어 평점, NPS           ● 참여도(Engagement)..

TIL_24.09.03_태블로 계산식 활용 1

▶ 텍스트 테이블       - SQL, Python에서도 많이 사용하는 데이터 프레임과 비슷하게         행과 열로 이루어짐 (엑셀의 피벗 테이블과 같음)        - 행과 열 바꾸기 [분석탭]에서 활용 가능        - 데이터 형태와 목적에 따라서 long format table         --> wide format table로 전환하기도 하고,           wide format table --> long format table데이터          형태로 전환하기도 한다     1) wide format table        - 옆으로 넓은 형태로 데이터가 쌓임        - 하나의 열에 여러개의 데이터를 나란히 나열하는 형태        - 데이터 분석을 할 경우 많이 ..

TIL_24.09.02_데이터 분석과 지표 1

▶ Ad-hoc 분석    - 단순 쿼리 추출, 구글 스프레드 시트 레포트, 시각화 등 일회성 분석을 말함     ● Ad-hoc 분석 종류       - 엑셀 시트 레포트       - 시각화       - 단순한 지표 추출 쿼리       - 기술 통계량(평균값, 중앙값, 최소, 최대값 등)   ▶ 지표 확인 및 지표 증감 원인 파악      - overview 대시보드 : 현재 서비스 상황 및 주요 지표 확인     - By Dimension(시간별, 유저별, 세그먼트 별 등) 대시보드 : 지표 증감 원인 파악     - 대시보드에서 원인 파악이 어렵거나 데이터를 더 딥하게 봐야할 경우:       SQL, Python 으로 deep dive   ▶ 주요 데이터 분석 방법론    - 실험 : A/B..

TIL_24.08.30_DL(딥러닝)

▶ 머신러닝 vs 딥러닝   ● 공통점 :     - 데이터로부터 가중치를 학습하여 패턴을 인식하고 결정을 내리는       알고리즘 개발과 관련된 인공지능(AI)의 하위 분야   ● 차이점 :     - 머신러닝 : 데이터 안의 통계적 관계를 찾아내며 예측이나 분류를 하는 방법     - 딥러닝 : 머신러닝의 한 분야로 신경세포 구조를 모방한 인공신경망을 사용  ▶ 딥러닝의 유래     ● 인공 신경망(Artifical Neural Networks)        - 인간의 신경세포를 모방하여 만든 망(Networks)            1) 단층 신경망 : 입력층과 출력층으로 구성(단일 퍼셉트론)            2) 다층 신경망 : 입력층과 출력층 사이에 1개 이상의 은닉층 보유         ..

TIL_24.08.29_비지도학습

▶ 지도학습과 비지도학습     1) 지도학습 : 문제(X)와 정답(Y)가 주어지고 문제(X)가 주어졌을 때                          정답(Y)을 맞추는 학습      2) 비지도학습 : 답(Y)을 알려주지 않고, 데이터 간 유사성을 이용해서                              답(Y)을 맞추는 학습           ● 비지도 학습은 데이터를 기반으로 레이블링을 하는 작업          ● 정답이 없는 문제이기 때문에 지도 학습보다 조금 어렵고              주관적인 판단이 개입하게 된다.           ●  비지도학습 예시              ○ 고객 특성에 따른 그룹화                  ex) 헤비유저, 일반유저            ..