H&M 소비 데이터 기반 추천 시스템
전세계 5000여개 이상의 매장을 보유하고 있는 대표적인 spa 브랜드 H&M에서 제공하는 소비 데이터를 통해 고객에게 옷을 추천해주는 시스템을 만들고자 한다. 의류 추천 시스템을 개발하는 것은 고객 맞춤 최적화를 통해 고객 만족도를 높일 뿐만 아니라 소비 트렌드를 알 수 있는 척도이기도 하다. 또한 재고 확보를 최적화할 수 있다는 장점이 있다.
kaggle에서 제공하는 데이터를 통해서 판매 경향성을 알아보고, 사용자 기반 협업 필터링, 아이템 기반 협업 필터링, ALS 모델을 활용한 방식으로 고객에게 의류를 추천해주느 시스템을 구현하고자 한다.
도유정
서지은 https://github.com/zal-eun
최보경 https://github.com/B0gyeong
해당 데이터를 통해 제품의 종류,색상,무늬 등을 알 수 있음
-
고객 데이터 중 패션관심이 평균보다 높은 소비자들의 구매 데이터 이용
-
구매자 id를 기준으로 구매했으면 1, 아니면 0값을 가지는 pivot table 생성
-
cos 유사도를 이용해 각 사용자간 유사도를 계산해 표 생성
-
추천해줄 사용자에 대한 타 사용자의 유사도와 transactions 데이터를 곱해준 후 제품별로 다 더해줌
-
더한 값이 가장 큰 제품 상위 3개를 추천
-
transactions 데이터 "article_id" 열의 값들을 세어서 가장 많이 등장한 상위 1500개의 값들을 추출
-
transactions의 customer_id와
-
article_id을 사용하여 pivot_table을 만듦 아이템을 기준으로 행간 유사도 측정 cosine_similarity 사용
-
유사도 순서를 나열하여 아이템 추천