[Recommendation system]Deep Learning 기반의 Recommendation System 구현 II

5 minute read

ML 기반 추천 엔진: 마무리

Top N 추천 정확도

모델 방식의 추천이고 N이 10이라고 가정하고(top 10개의 아이템을 추천함) 사용자별로 아래를 반복
- 평점 데이터에서 이 사용자의 모든 데이터를 찾는다
- 여기서 한 평점 레코드를 빼서 테스트 셋에 추가
- 나머지 레코드들을 훈련 셋에 추가
- 훈련셋과 테스트셋을 나누는 기준이 사용자별이다.
- 모든 사용자에 대해 반복하면 테스트셋에는 데이터셋에 있는 평점이 존재하는 사용자의 수만큼의 레코드가 들어간다. 나머지가 훈련셋에 들어간다. -> surprise의 LeaveOneOut 모듈을 사용하여 사용자별로 평점 정보를 하나씩 테스트셋으로 저장하고 이를 나중에 Top N 추천 정확도 계산에 사용
만들어진 훈련 셋으로 모델 학습
훈련에 사용되지 않은 모든 레코드들을 가지고 평점 예측
- sparse한 행렬들을 훈련할때 쓸 수는 없지만 예측할때 쓸 수 있다. 테스트셋에 들어간 데이터와 테스트셋에 들어가진 않았지만 비어있는 데이터들이 훈련에 사용되지 않은 모든 레코드들이다.
- 즉 기본적으로 평점 정보가 없는 모든 사용자 ID와 아이템 ID 레코드들(여기에는 테스트셋의 레코드들도 들어감)
사용자별로 테스트셋의 아이템 중 평점이 높은 것들 중에 추천된 Top 10개에 포함된 것의 비율 계산 후 평균 계산 -> 이게 바로 Toop N 추천 정확도
Top N 추천 정확도: 모든 사용자들의 추천 정확도 평균
- 원래 Top N 추천 정확도:
  - 분모: 사용자별로 하나씩 떼서 테스트셋에 보관한 것 중 평점이 높은 것(예를 들어 4.5 이상)의 수
  - 분자: 그것들 중 각 사용자에게 추천이 된 아이템의 수
  - 이것을 사용자별로 다 계산에서 평균을 낸 것이 Top N 정확도
- 추천 위치에 따라 가중치를줬다면 이를 Top N 추천 NDCG(Discounted Cumulative Gain) 정확도라 부름. 위치에 따라 디스카운트를 한다는 뜻. top 10이라면 top10보다 top1에게 더 높은 가중치를 주는 것이다.

A/B 테스트란?

A/B 테스트: 온라인 실험이라고 부르기도 함

A/B 테스트란 다수의 그룹으로 구성. 하나의 컨트롤 그룹과 하나 이상의 테스트 그룹
- 컨트롤 그룹: 기존의 서비스에 그대로 노출되는 그룹
- 테스트 그룹: 새로운 테스트에 노출되는 그룹
- 두 그룹으로 나눌 때 bias가 고르게 분포되도록 해야한다.
실제 사용자를 대상으로 새로운 기능이나 변경을 객관적으로 검증하는 방법
테스트 시작 전에 어떤 지표를 가지고 테스트의 성패 여부를 정할지 결정함. -> 결과의 자의적인 판단 방지
두 그룹으로 나눌 때 bias가 고르게 분포되도록 해야한다.
한번에 하나의 새로운 기능이나 변화를 테스트해야함
- 동시에 2가지 이상을 테스트할 경우 결과를 해석할 수 없음
작은 수의 사용자들에게 먼저 노출시켜 위험부담 줄임 -> 지표를 모니터링하면서 점차적으로 노출 비율 높임
A/B 테스트 인프라 없이는 테스트를 할 수도 없고 분석도 불가능!
- 프런트엔드, 백엔드, 데이터, 모든 엔지니어링 팀의 도움이 필요

A/B 테스트 방식 설명

A/B 테스트 가설 세우기: ~한 기능을 노출하면 ~의 지표가 개선될 것이다.
사용자를 같은 크기와 같은 속성의 두 그룹으로 나누기(bias가 없어야함)
- 기존 기능에 노출될 사용자 그룹
- 새로운 기능에 노출될 사용자 그룹
- 그룹 사이의 차이점을 간략하게 테스트해보면 좋다(평균 연령, 사는 지역, 성별 등)
이 사용자들의 다양한 행동을 기록
- 어떤 아이템을 보고, 클릭하고, 소비하고, 리뷰하는지…
두 개의 그룹별로 다양한 지표 계산 후 기록
- 두 그룹 간의 지표 차이가 통계적으로 유의미한지? -> 통계적 지식 필요
시간이 지나면서 어떤 흐름이 있는지 확인

태블로 기반 A/B 테스트 대시보드 예제

분석 기간을 선택하여 다양한 A와 B 그룹간에 필터의 결과들을 볼 수 있다.

채린

[Recommendation system]Deep Learning 기반의 Recommendation System 구현 II

ML 기반 추천 엔진: 마무리

추천 엔진 평가 방법

추천 엔진 평가 방법

Top N 추천 정확도

추천 성능 평가가 어려운 이유

A/B 테스트란?

A/B 테스트: 온라인 실험이라고 부르기도 함

A/B 테스트 방식 설명

태블로 기반 A/B 테스트 대시보드 예제

추천 엔진과 개인 정보 보호

개인 정보란?

개인 정보 보호란?

GDPR이란?

구글/페이스북/마이크로소프트가 아는 내 정보 찾아보기

추천 엔진 개발 교훈

추천 엔진 개발시 고려할 점

You May Also Enjoy

[프로그래머스]MySQL 문제

MySQL 정리

[프로그래머스 코딩테스트]Level03 - 네트워크

[Leetcode]85 - Maximul Rectangle