單機遊戲下載單機遊戲下載基地
最新遊戲|熱門遊戲|遊戲大全|遊戲專題
壓縮解壓光盤工具文字輸入殺毒軟件文件處理轉換翻譯股票證券辦公學習編程軟件虛擬光驅
當前位置:首頁應用軟件編程軟件 → weka數據挖掘工具3.8中文版

weka數據挖掘工具3.8中文版

  • weka數據挖掘工具3.8中文版截圖0
< >
weka數據挖掘工具3.8中文版下載
好玩 好玩 0
坑爹 坑爹 0
  • 應用語言:中文
  • 應用大小:100M
  • 更新時間:2017-05-23 14:52
  • 發行時間:
  • 應用類型:普通
  • 應用標簽: weka
weka數據挖掘工具3.8中文版是一款非常好用的數據庫類軟件,集合了大量數據挖掘任務的機器學習算法,用戶可以通過軟件來進行一係列的數據管理或者是處理。軟件的功能很好用,是進行數據分析或者是挖掘必備的一款軟件,歡迎需要的用戶前來下載。weka數據挖掘3.[更多]
應用介紹

weka數據挖掘工具3.8中文版是一款非常好用的數據庫類軟件,集合了大量數據挖掘任務的機器學習算法,用戶可以通過軟件來進行一係列的數據管理或者是處理。軟件的功能很好用,是進行數據分析或者是挖掘必備的一款軟件,歡迎需要的用戶前來下載。

weka(數據挖掘)3.8中文版功能

原理與實現

聚類分析中的“類”(cluster)和前麵分類的“類”(class)是不同的,對cluster更加準確的翻譯應該是“簇”。聚類的任務是把 所有的實例分配到若幹的簇,使得同一個簇的實例聚集在一個簇中心的周圍,它們之間距離的比較近;而不同簇實例之間的距離比較遠。對於由數值型屬性刻畫的實 例來說,這個距離通常指歐氏距離。

模型應用

現在我們要用生成的模型對那些待預測的數據集進行預測了。注意待預測數據集和訓練用數據集各個屬性的設置必須是一致的。即使你沒有待預測數據集的Class屬性的值,你也要添加這個屬性,可以將該屬性在各實例上的值均設成缺失值。

在“Test Opion”中選擇“Supplied test set”,並且“Set”成你要應用模型的數據集,這裏是“bank-new.arff”文件。

現在,右鍵點擊“Result list”中剛產生的那一項,選擇“Re-evaluate model on current test set”。右邊顯示結果的區域中會增加一些內容,告訴你該模型應用在這個數據集上表現將如何。如果你的Class屬性都是些缺失值,那這些內容是無意義 的,我們關注的是模型在新數據集上的預測值。

現在點擊右鍵菜單中的“Visualize classifier errors”,將彈出一個新窗口顯示一些有關預測誤差的散點圖。點擊這個新窗口中的“Save”按鈕,保存一個Arff文件。打開這個文件可以看到在倒 數第二個位置多了一個屬性(predictedpep),這個屬性上的值就是模型對每個實例的預測值。

建模結果

OK,選上“Cross-validation”並在“Folds”框填上“10”。點“Start”按鈕開始讓算法生成決策樹模型。很快,用文 本表示的一棵決策樹,以及對這個決策樹的誤差分析等等結果出現在右邊的“Classifier output”中。同時左下的“Results list”出現了一個項目顯示剛才的時間和算法名稱。如果換一個模型或者換個參數,重新“Start”一次,則“Results list”又會多出一項。

weka(數據挖掘)3.8中文版說明

WEKA文件相關術語

表格裏的一個橫行稱作一個實例(Instance),相當於統計學中的一個樣本,或者數據庫中的一條記錄。豎行稱作一個屬性(Attribute),相當於統計學中的一個變量,或者數據庫中的一個字段。這樣一個表格,或者叫數據集,在WEKA看來,呈現了屬性之間的一種關係(Relation)。上圖中一共有14個實例,5個屬性,關係名稱為“weather”。

WEKA存儲數據的格式是ARFF(Attribute-Relation File Format)文件,這是一種ASCII文本文件。上圖所示的二維表格存儲在如下的ARFF文件中。這也就是WEKA自帶的“weather.arff”文件,在WEKA安裝目錄的“data”子目錄下可以找到。

文件內容說明

識別ARFF文件的重要依據是分行,因此不能在這種文件裏隨意的斷行。空行(或全是空格的行)將被忽略。以“%”開始的行是注釋,WEKA將忽略這些行。如果你看到的“weather.arff”文件多了或少了些“%”開始的行,是沒有影響的。

除去注釋後,整個ARFF文件可以分為兩個部分。

第一部分給出了頭信息(Head information),包括了對關係的聲明和對屬性的聲明。

第二部分給出了數據信息(Data information),即數據集中給出的數據。從“@data”標記開始,後麵的就是數據信息了。

關係聲明

關係名稱在ARFF文件的第一個有效行來定義,格式為@relation

是一個字符串。如果這個字符串包含空格,它必須加上引號(指英文標點的單引號或雙引號)。

屬性聲明

屬性聲明用一列以“@attribute”開頭的語句表示。數據集中的每一個屬性都有它對應的“@attribute”語句,來定義它的屬性名稱和數據類型。

這些聲明語句的順序很重要。首先它表明了該項屬性在數據部分的位置。例如,“humidity”是第三個被聲明的屬性,這說明數據部分那些被逗號分開的列中,第三列數據85 90 86 96 ... 是相應的“humidity”值。其次,最後一個聲明的屬性被稱作class屬性,在分類或回歸任務中,它是默認的目標變量。屬性聲明的格式為

@attribute

其中是必須以字母開頭的字符串。和關係名稱一樣,如果這個字符串包含空格,它必須加上引號。

數值屬性

數值型屬性可以是整數或者實數,但WEKA把它們都當作實數看待。

標稱屬性

標稱屬性由列出一係列可能的類別名稱並放在花括號中:{, ,

, ...} 。數據集中該屬性的值隻能是其中一種類別。

例如如下的屬性聲明說明“outlook”屬性有三種類別:“sunny”,“overcast”和“rainy”。而數據集中每個實例對應的“outlook”值必是這三者之一。

@attribute outlook {sunny, overcast, rainy}

如果類別名稱帶有空格,仍需要將之放入引號中。

 

相關應用
下載地址

weka數據挖掘工具3.8中文版

    熱門評論

    最新評論

    發表評論 查看所有評論(0)

    昵稱:
    表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
    (您的評論需要經過審核才能顯示)

    配置需求

    推薦專題

    up對戰平台up對戰平台

    關於飛翔 | 聯係我們 | 大事記 | 下載幫助(?) | 廣告聯係 | 版權聲明 | 網站地圖 | 友情鏈接

    Copyright 2010-2013 單機遊戲下載 (R) 版權所有 飛翔下載所有遊戲及軟件下載資源來源互聯網,並由網友上傳分享。如有侵權,請來電來函告之。
    飛翔忠告:抵製不良色情、反動、暴力遊戲 合理安排遊戲時間 享受健康生活【鄂ICP備13011873號-1】