탐색적 분석 - 탐색적 데이터 분석 및 시각화
1. 주문정보 테이블(내부데이터)에 대한 특징과 구조적 관계 파악
2. 키워드 검색량 분석
1.
주문정보 테이블(내부데이터)에 대한 특징과 구조적 관계 파악
(주)리턴박스에서 받은 반품관리, 재고관리, 주문정보 테이블의 칼럼만으로 분석 기회를 발굴
2.
키워드 검색량 분석
‘캠핑용품’ 키워드 검색량 분석
통계분석 - 통계검정
1. 주문량과 검색량 공적분 분석 (내부데이터)
1.
주문량과 검색량 공적분 분석 (내부데이터)
통계분석 - 시각화분석
1. 주문량(내부데이터)와 검색량(소셜데이터) 시계열 시각화
1.
주문량(내부데이터)와 검색량(소셜데이터) 시계열 시각화
모델링 - 모델선정
1. LSTM(Long Short-Term Memory)
2. ARIMA(Auto Regressive Integrated Moving Average)
3. DTW(Dynamic Time Warping)
1.
LSTM : RNN의 장기 의존성 문제를 해결할 뿐만 아니라 학습 또한 빠르게 수렴한다.
2.
ARIMA : Autoregressive는 자기회귀모형을 의미하고, Moving Average는 이동평균모형을 의미한다. 시계열의 비정상성을 설명하기 위해 관측치 간의 차분을 사용한다.
3.
DTW : 동적시간와핑(DTW)는 약간의 시간 오차를 허용하여 시퀀스 데이터 흐름 유사도를 구하는 것이다. 속도가 다른 2개의 시계열 패턴의 유사성을 비교할 때 사용
모델링 - 데이터 분할
1. Hold_Out 진행 ( 비율이 적혀있지 않음)
모델링 - 데이터 모델링
1. LSTM : 주문량과 검색량 예측
2. ARIMA : 주문량 예측
3. DTW : 주문량과 검색량 시계열 패턴의 유사성 비교
1.
LSTM : 주문량과 검색량 예측
2.
ARIMA : 주문량 예측
3. DTW : 주문량과 검색량 시계열 패턴의 유사성 비교
모델링 - 모델 평가
1. LSTM과 ARIMA 성능 비교
1. LSTM과 ARIMA 성능 비교