搞外貿(mào)獨(dú)立站運(yùn)營(yíng)的人,相信大家都接觸過(guò)Google Trend。
它能夠分析產(chǎn)品關(guān)鍵詞的偏離度、產(chǎn)品本地化、區(qū)域化的熱度和上升/下降趨勢(shì)。
但是,很多時(shí)候,我們?cè)谒阉鳟a(chǎn)品的時(shí)候,看到的產(chǎn)品趨勢(shì),都是沒(méi)有任何周期性的波動(dòng),就像沒(méi)有解調(diào)之前無(wú)線(xiàn)電的雜波一樣。
怎么辦?
今天給大家介紹SPSS數(shù)據(jù)分析——線(xiàn)性回歸分析,在復(fù)雜產(chǎn)品趨勢(shì)中的應(yīng)用。
操作步驟如下:
1. 獲取SPSS數(shù)據(jù)分析軟件包
微信掃描并關(guān)注——TradeSNS公共號(hào),回復(fù)“SPSS數(shù)據(jù)分析”,將得到破解版,SPSS數(shù)據(jù)分析軟件包(內(nèi)附激活碼)
2. SPSS安裝與激活
SPSS的安裝時(shí),前幾步與其他軟件安裝流程一樣,大家點(diǎn)擊“確定”或者“下一步”就OK。
當(dāng)彈出“產(chǎn)品授權(quán)”界面時(shí),我們?nèi)匀稽c(diǎn)擊“下一步”,
這個(gè)時(shí)候,會(huì)出現(xiàn)“輸入代碼”,大家將軟件包里的“SPSS20無(wú)期限授權(quán)號(hào)”里面的激活碼,復(fù)制粘貼過(guò)來(lái),然后點(diǎn)擊“下一步”,完成激活。
3. 數(shù)據(jù)采集
回到Google Trend界面,輸入自己要查詢(xún)的產(chǎn)品關(guān)鍵字,選擇查詢(xún)的時(shí)間序列,點(diǎn)擊右上方下載按鈕,保存本地。
4. 數(shù)據(jù)清洗與數(shù)據(jù)挖掘
我們主要用產(chǎn)品趨勢(shì)數(shù)據(jù),分析產(chǎn)品搜索量隨著時(shí)間變化的響應(yīng)趨勢(shì)(時(shí)域響應(yīng)),時(shí)間的間隔為1個(gè)月,不存在缺失項(xiàng),所以,就產(chǎn)品趨勢(shì)的貿(mào)易數(shù)據(jù)而言,數(shù)據(jù)清洗和挖掘可以跳過(guò)。
大家也不是搞數(shù)據(jù)的,沒(méi)必要把時(shí)間,用在數(shù)據(jù)挖掘的算法上面。神經(jīng)網(wǎng)絡(luò)、貝葉斯控制,與我們無(wú)關(guān)。
5. 數(shù)據(jù)導(dǎo)入
打開(kāi)安裝好的SPSS數(shù)據(jù)軟件,點(diǎn)擊左上方文件圖樣按鈕,選擇剛剛下載的Google Trend數(shù)據(jù)(csv格式),將其導(dǎo)入到SPSS。
數(shù)據(jù)格式,選擇“時(shí)間/日期”,將其設(shè)定為yy/mm/dd(個(gè)人習(xí)慣,大家可以根據(jù)自己的習(xí)慣,設(shè)置不同的時(shí)間表現(xiàn)形式)。
導(dǎo)入數(shù)據(jù)之后,我們要針對(duì)數(shù)據(jù)屬性、分析目的進(jìn)行簡(jiǎn)單設(shè)置。我們把”時(shí)間“當(dāng)做輸入,“搜索熱度”作為輸出。
6. 選擇合適的數(shù)據(jù)分析方法
我們這次演示的案例,主要是產(chǎn)品搜索熱度隨時(shí)間的變化規(guī)律,所以,選擇線(xiàn)性回歸分析,來(lái)判斷兩者的線(xiàn)性關(guān)系。
當(dāng)然,如果是研究肺癌與吸煙的關(guān)系,還要計(jì)算數(shù)據(jù)降噪處理、多元回歸計(jì)算相關(guān)系數(shù)、復(fù)雜抽樣、計(jì)算生存函數(shù)等等。
今天這個(gè)例子,單純從數(shù)據(jù)表面看,二者之間并無(wú)強(qiáng)相關(guān)性,所以,就做線(xiàn)性回歸分析足夠了。
7. 分析過(guò)程
+ 選擇分析——回歸——線(xiàn)性(L)
+ 將自變量、因變量輸入到對(duì)應(yīng)位置。
+ 點(diǎn)擊”統(tǒng)計(jì)量”,配置置信區(qū)間、模型擬合度、D-W值。
(1)置信區(qū)間95%:被測(cè)量參數(shù)的真實(shí)值,有95%的概率落在真實(shí)的預(yù)測(cè)結(jié)果。換句話(huà)說(shuō),我們做的時(shí)間與搜索熱度的關(guān)系
分析,可信度在95%以上。
(2)模型擬合度:回歸分析,特別是線(xiàn)性回歸分析,最終的二維、三維關(guān)系曲線(xiàn),實(shí)際上都是根據(jù)變量的變化趨勢(shì),擬合出
來(lái)的,存在一定誤差。
(3)D-W值:在做回歸分析時(shí),隨機(jī)誤差項(xiàng),往往都存在,因?yàn)樽宰兞俊⒁蜃兞恐g,有時(shí)內(nèi)部是存在很多相關(guān)因子的。但是,我們又不希望這些隨機(jī)誤差之間自相關(guān),換句話(huà)說(shuō),變量的內(nèi)部之間,不能出現(xiàn)多維關(guān)聯(lián)。
D-W的值越趨近于2,隨機(jī)誤差項(xiàng)(殘差項(xiàng))之間的相關(guān)性越小,那么,我們建立的回歸模型,就越真實(shí)。
+ 點(diǎn)擊“繪制”,勾選直方圖、正態(tài)概率圖
全部設(shè)置完畢,點(diǎn)擊“確定”,進(jìn)入數(shù)據(jù)分析。
8. 分析結(jié)果(報(bào)告)
D-W=1.602,說(shuō)明回歸模型隨機(jī)誤差項(xiàng),相關(guān)度較弱,模型可信。
回歸標(biāo)準(zhǔn)化殘差=0.998:說(shuō)明標(biāo)準(zhǔn)化殘差落在(-2,2)區(qū)間以外的概率≤0.05,標(biāo)準(zhǔn)化殘差完全符合標(biāo)準(zhǔn)正態(tài)分布N(0,1)。
95%以上的數(shù)據(jù)測(cè)量值參與正?;貧w擬合,回歸模型良好。
在此基礎(chǔ)之上,我們擬合出來(lái)的曲線(xiàn),才最接近于真實(shí)值。
那么,由此,我們就大體上可以看出產(chǎn)品的搜索熱度,隨著時(shí)間的大體變化趨勢(shì)。
從而,對(duì)產(chǎn)品的需求趨勢(shì),就可以從數(shù)據(jù)角度,進(jìn)行一個(gè)客觀性判斷。
更多外貿(mào)運(yùn)營(yíng)技術(shù),請(qǐng)關(guān)注TradeSNS——基于貿(mào)易大數(shù)據(jù)的SNS跨境電商平臺(tái)。