Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

취급상품 매장 3곳 안내 함수 구현 #63

Open
njy622 opened this issue Nov 1, 2023 · 0 comments
Open

취급상품 매장 3곳 안내 함수 구현 #63

njy622 opened this issue Nov 1, 2023 · 0 comments
Assignees

Comments

@njy622
Copy link
Owner

njy622 commented Nov 1, 2023

◈ <상품명 검색으로 취급하는 매장 3곳 알아보기> 함수

  • 입력받은 상품명과 대조할 원 데이터 csv파일 호출
  • 상품명을 2차원 데이터 프레임으로 만들고 원 데이터와 함께 TF-IDF 벡터화하고 코사인 유사도를 계산
  • 코사인 유사도를 컬럼으로 추가하여 유사도가 0.5이상인 경우에 채택.
  • 채택된 매장의 수가 많으면 복잡하므로 리스트에서 3개만 슬라이싱하여 리턴
  • 만약, 빈 리스트라면 매장 없음을 리턴

[[시행착오]]

  • 찾는 상품이 '김' 또는 '배'같이 한 글자일 경우 오류메세지 출력.
  • 이유는 TF-IDF Default 값으로 벡터화 중 한 글자 단어는 제외하기 때문.
  • TF-IDF의 파라미터 값으로 analyzer='word'와 token_pattern=r'\w{1,}'을 주어 해결.
@njy622 njy622 converted this from a draft issue Nov 1, 2023
@njy622 njy622 changed the title 취급상품 매장 3곳 안내 함수 취급상품 매장 3곳 안내 함수 구현 Nov 1, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
Development

No branches or pull requests

2 participants