線上購物資料集 / Dataset: Online Shopping
這份資料集改編自Sakar與Kastro在2018年發佈的線上購物顧客購買意圖資料集。可作為機器學習練習使用。
資料來源 / Source
https://archive.ics.uci.edu/dataset/468/online+shoppers+purchasing+intention+dataset
Sakar,C. and Kastro,Yomi. (2018). Online Shoppers Purchasing Intention Dataset. UCI Machine Learning Repository. https://doi.org/10.24432/C5F88Q.
資料集下載 / Download
https://docs.google.com/spreadsheets/d/1-0QDRqWZkVO4KXZxjRsLHnJSV8N_rwUUfMppTeZXrXc/edit?usp=sharing
- Google試算表線上檢視
- ODS格式下載
- OpenDoucment Spreadsheet (.ods) 格式備份:Google Drive、GitHub、One Drive、Mega、Box、MediaFire、pCloud、Degoo
簡介 / Description
這些資料是來自於使用者造訪線上購物網站的記錄,並且會根據使用者的操作而即時更新,例如進入另一個網頁。部分指標的計算是來自於Google分析。
案例數 / Instances
總共12330筆購物行為記錄。
屬性 / Attributes
本資料集沒有缺失值。
名稱 | 資料類型 | 定義 | 類別或數值的單位 |
Administrative | 類別型 | 使用者造訪帳號管理網頁的次數 | 單位是次數 |
Administrative_Duration | 類別型 | 使用者造訪帳號管理網頁的時間 | 單位是秒數 |
Informational | 數值型 | 使用者造訪購物網站的聯絡資訊網頁的次數 | 單位是次數 |
Informational_Duration | 數值型 | 使用者造訪購物網站的聯絡資訊網頁的時間 | 單位是秒數 |
ProductRelated | 數值型 | 使用者造訪產品相關網頁的次數 | 單位是次數 |
ProductRelated_Duration | 數值型 | 使用者造訪產品相關網頁的時間 | 單位是秒數 |
BounceRates | 數值型 | 使用者瀏覽過的多個頁面的平均跳出率。跳出率是指對某一網頁而言,造訪的使用者中,一進來就立刻離開的比例。比例越高,表示使用者大部分都指造訪看一次就離開的網頁。詳細計算請見Google分析的跳出率。 | 單位是比例,介於0至1之間 |
ExitRates | 數值型 | 使用者瀏覽過的多個頁面的平均離開率。離開率是指對某一網頁而言,使用者在瀏覽多個網頁之中會在這個網頁離開的比例。比例越高,表示使用者可能常常瀏覽到會讓人離開的頁面。詳細計算請見Google分析的離開率。 | 單位是比例,介於0至1之間 |
PageValues | 數值型 | 使用者瀏覽過的多個頁面的網頁價值。網頁價值是指該頁面會引導使用者完成交易的指標。數值越大,表示使用者造訪的網頁會帶來更大量的購物。詳細計算請見Google分析的網頁價值計算方式。 | 單位是消費金額 |
SpecialDay | 數值型 | 特殊節日(母親節、情人節等)的時間接近程度。該數值是由電子商務的下單和運送時間動態決定。例如靠近求婚日(2月8日)的2月2日至2月12日期間,此數值都不為0,而在2月8日則是最大值1 | 單位是接近程度,介於0至1之間 |
Month | 類別型 | 月份 | 從Feb 2月到Dec 12月 |
OperatingSystems | 類別型 | 使用者的作業系統 | 有8種作業系統,但資料來源未敘述這8種是什麼 |
Browser | 類別型 | 使用者的瀏覽器 | 有13種瀏覽器,但資料來源未敘述這些是什麼 |
Region | 類別型 | 使用者的所在區域 | 有9種區域,但資料來源未敘述這些是什麼 |
TrafficType | 類別型 | 使用者瀏覽網站的方式 | 有20種方式,但資料來源未敘述這些是什麼 |
VisitorType | 類別型 | 使用者瀏覽網站的類型 | New_Visitor 新造訪者 Other 其他 Returning_Visitor 再次造訪 |
Weekend | 類別型 | 是否是週末 | FALSE 不是 TRUE 是 |
Revenue | 類別型 | 使用者是否完成交易 | FALSE 不是 TRUE 是 |
目標屬性 / Target class
「Revenue」,也就是使用者是否完成交易。
最後的問題是:你認為可以根據使用者的行為判斷他是否有購物的意圖嗎?
- 1. 可以。真的想買東西的時候,使用者會有特別明顯的舉動。
- 2. 不行。人心跟行為表現不一定一致。
- 3. 其他。
如果有什麼想法,歡迎在下面留言分享喔!
我覺得可以,但要先定義什麼「真的想買」,是他最後真的採購才算嗎?
回覆刪除因為我蝦皮購物車也是放了一堆想買的,但就是懶得付錢 XD
可以參考資料來源的原始論文。
刪除這邊的定義應該是真的有付錢才算有購買,只是想想的並不算完成。