Data mining applications in a forklift distributor
Files
Date
2018-02-22
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Uludağ Üniversitesi
Abstract
Sales forecasting has a vital role in today's business environment. In a company, accurate and reliable sales forecasting is the fundamental basis for production planning processes. In this study, a data mining-based forecasting methodology is proposed for a forklift distributor. Monthly sales data for 100 different types of forklifts between years 1998 and 2016 are used. The proposed methodology has three stages. In the first stage, items with similar sales patterns are identified using hierarchical clustering. Dynamic time warping (DTW) is used for measuring the similarities among the items. The number of clusters is determined using the heterogeneity and homogeneity criteria. For each cluster, cluster prototypes are found based on cluster medoids and DTW barycenter averaging (DBA) method. In the second stage, features are extracted. In addition to the features that characterize amount, trend, growth, and volatility, new features are proposed to identify the intermittency in the data. Also, the important features are selected using multivariate adaptive regression splines (MARS). Then, support vector regression (SVR) is used as a forecasting model for each cluster prototype. In the final stage, the proposed approach is evaluated according to inventory performance. The numerical analysis shows that the proposed methodology forecasts the sales with reasonable accuracy and low complexity, and provides a reduction in inventory management costs.
Satış tahmini bugünün iş ortamında hayati bir role sahiptir. Bir şirkette, doğru ve güvenilir satış tahminleri, üretim planlama sürecinin esas dayanağıdır. Bu çalışmada, bir forklift distribütörü için veri madenciliğine dayalı bir tahmin metodolojisi önerilmiştir. 1998 ve 2016 yılları arasında 100 farklı forkliftin aylık satış verileri kullanılmıştır. Önerilen metodolojinin üç aşaması vardır. İlk aşamada, benzer satış yapıları içeren ürünler hiyerarşik kümeleme kullanılarak belirlenmiştir. Ürünler arasındaki benzerliklerin ölçülmesinde dinamik zaman bükmesi (DTW) kullanılmıştır. Kümelerin sayısı, heterojenlik ve homojenlik kriterleri kullanılarak belirlenmiştir. Her küme için küme prototipleri küme medoidleri ve DTW ağırlık merkezi ortalaması (DBA) metodu temel alınarak bulunmuştur. İkinci aşamada, öznitelikler çıkarılmıştır. Miktar, eğilim, büyüme ve oynaklığı karakterize eden özniteliklerin yanı sıra verideki düzensiz aralıkları belirlemek için yeni öznitelikler önerilmiştir. Ayrıca, önemli öznitelikler çok değişkenli uyarlanabilir regresyon eğrileri (MARS) kullanılarak seçilmiştir. Ardından, her bir küme prototipi için bir tahmin modeli olarak destek vektör regresyonu (SVR) kullanılmıştır. Son aşamada, önerilen yaklaşım envanter performansına göre değerlendirilmiştir. Sayısal analiz, önerilen metodolojinin satışları makul doğruluk ve düşük karmaşıklıkla tahmin ettiğini ve envanter maliyetlerinde azalma sağladığını göstermektedir.
Satış tahmini bugünün iş ortamında hayati bir role sahiptir. Bir şirkette, doğru ve güvenilir satış tahminleri, üretim planlama sürecinin esas dayanağıdır. Bu çalışmada, bir forklift distribütörü için veri madenciliğine dayalı bir tahmin metodolojisi önerilmiştir. 1998 ve 2016 yılları arasında 100 farklı forkliftin aylık satış verileri kullanılmıştır. Önerilen metodolojinin üç aşaması vardır. İlk aşamada, benzer satış yapıları içeren ürünler hiyerarşik kümeleme kullanılarak belirlenmiştir. Ürünler arasındaki benzerliklerin ölçülmesinde dinamik zaman bükmesi (DTW) kullanılmıştır. Kümelerin sayısı, heterojenlik ve homojenlik kriterleri kullanılarak belirlenmiştir. Her küme için küme prototipleri küme medoidleri ve DTW ağırlık merkezi ortalaması (DBA) metodu temel alınarak bulunmuştur. İkinci aşamada, öznitelikler çıkarılmıştır. Miktar, eğilim, büyüme ve oynaklığı karakterize eden özniteliklerin yanı sıra verideki düzensiz aralıkları belirlemek için yeni öznitelikler önerilmiştir. Ayrıca, önemli öznitelikler çok değişkenli uyarlanabilir regresyon eğrileri (MARS) kullanılarak seçilmiştir. Ardından, her bir küme prototipi için bir tahmin modeli olarak destek vektör regresyonu (SVR) kullanılmıştır. Son aşamada, önerilen yaklaşım envanter performansına göre değerlendirilmiştir. Sayısal analiz, önerilen metodolojinin satışları makul doğruluk ve düşük karmaşıklıkla tahmin ettiğini ve envanter maliyetlerinde azalma sağladığını göstermektedir.
Description
Keywords
Data mining, Clustering, Forecasting, Dynamic time warping (DTW), Multivariate adaptive regression splines (MARS), Support vector regression (SVR)
Citation
Puspita, P. E. (2018). Data mining applications in a forklift distributor. Yayınlanmamış yüksek lisans tezi. Uludağ Üniversitesi Fen Bilimleri Enstitüsü.