목록Project (5)
헤매어도 한 걸음씩

평소 추천 알고리즘에 관심이 있어 대표적인 추천 모델 중 하나인 NCF(Neural Collaborative Filtering)와 LightFM을 테스트해 봤습니다. 추천 시스템은 사용자의 선호도를 기반으로 적절한 아이템을 추천하는 시스템입니다. 본 포스팅에서는 상품 조회 이력 데이터를 활용하여 사용자 맞춤형 추천을 제공하기까지의 과정과, 각 모델의 특징 및 성능 비교, 그리고 과정별 고민과 해결 방법을 공유하고자 합니다. 일부 코드만 포함되어 있으며, 중요하다고 생각한 부분 및 고민했던 부분을 위주로 작성했습니다. 1. EDA 및 기본 전처리사용한 데이터는 각 유저의 상품 조회 이력 및 상품 정보가 담긴 parquet 파일입니다. 약 160만개 행*10개의 컬럼으로 구성되어 있으며, 주요 컬럼으로는..

아래 버튼을 누르면 배포 링크로 이동합니다.프로젝트 진행 기간2021.08 ~ 2021.09프로젝트 목표기계독해 기반 질의응답(QA) 모델 구현 후 Web App service 배포 Introduction 저는 평소에 구글, 유튜브, 네이버 등의 여러 플랫폼을 이용하는데, 그중 가장 많이 사용하는 기능은 검색 기능입니다.넷플릭스조차 영상 시청시간보다 검색시간이 더 길 때가 있는데요,😅그럴 때마다 어떻게 이렇게 추상적인 키워드로 검색해도 원하는 결과를 낼 수 있는지, 어떤 원리인지 항상 궁금했습니다. 지난 8월간 딥러닝 학습을 진행하면서, 검색 결과를 내는 알고리즘이 단순히 키워드를 기반으로 리스트를 출력하는 것이 아닌 MRC(Machine Reading Comprehension, 기계 독해)라고 불리는..

Recipe Sharing 개인적으로 채식에 관심이 생겨, 채식의 종류와 요리시간에 따라 레시피를 추천해주는 Web App 을 개발했습니다. 1. 프로젝트 진행기간 2021.07.29 ~ 2021.08.04 2. 목표 Flask와 MongoDB를 사용하여 비건 레시피를 검색 수 있는 웹사이트 구축 비건 레시피를 찾아 커뮤니티와 공유 3. 페이지 구성 3-1. 사용자 계정 추가 3-2. 로그인, 로그아웃 3-3. 사용자 레시피 추가, 수정, 삭제 3-4. 레시피 검색 (필터링 기능 포함- 비건 정도 3중 택1, 요리 시간 3중 택1) 4. 사용 언어, 프레임워크 및 라이브러리 Git GitHub Flask MongoDB Jinja syntax Python3 CSS3 HTML5 5. 추가 예정 기능 각 레시..

신용카드 서비스 이탈 여부를 예측하는 ML Model 개발기존 고객 정보를 바탕으로, 고객의 이탈 여부를 예측하는 Machine Learning Model 개발0. 분석 배경 이번 프로젝트에선 기존 고객 정보를 바탕으로 고객의 이탈 여부를 예측하는 Machine Learning Model을 개발했습니다.이러한 예측이 중요한 이유는, 신규 고객 수를 확보하는데 드는 비용이 기존 고객을 유지하는 비용보다 훨씬 크기 때문입니다. 신규 고객을 확보하는 것에 천문학적 영업비용이 들고, 신규 카드 발급과 관련한 심사 비용 또한 무시할 수 없습니다. 많은 비용을 들여 획득한 고객이 이탈해 버릴 경우 이로 인한 손실은 막대합니다. 기존 고객의 이탈률을 낮출 경우 수익이 크게 개선될 것입니다. 따라서 기존 고객 중 이탈..

Project. Game Data Analysis게임 데이터를 바탕으로 다음 분기에는 어떤 게임을 개발할지 의사결정을 내립니다.EDA 및 시각화, 가설검정을 진행했습니다.1. 프로젝트 진행 기간2021.05.31 ~ 2021.06.032. 프로젝트 목표1980년 ~ 2020년 발매된 게임 데이터를 바탕으로 '다음 분기에는 어떤 게임을 개발해야 할까?'의 질문에 답한다.3. 프로젝트 가설지역에 따라서 선호하는 게임 장르가 다를까? (지역별 Two-Sample 카이제곱 검정)연도별 게임의 트렌드가 있을까? 4. 진행 과정 및 세부사항4-1. 데이터 로드 및 전처리결측치 처리데이터 타입 변경, 단위 통일4-2. 데이터 분석 및 시각화 Q1 : 지역에 따라 선호하는 게임 장르가 다를까? → 지역별 Two-Sam..