關鍵詞:數據分類算法 貝葉斯算法 海量數據處理
摘要:針對目前機器學習研究領域中的數據分類問題,選擇樸素貝葉斯算法作為研究對象。首先,通過對樣本數據特征屬性的權重進行加權調整,提高算法處理的準確率;然后,改進樸素貝葉斯算法分類器模型,使其能夠利用Map/Reduce并行編程模型,采用多計算資源節點并行處理,進一步提高處理速度。最后,對UCI dataset數據庫進行實驗驗證,結果表明:改進后的算法在海量數據分類處理中具有更好的性能表現。
海軍工程大學學報雜志要求:
{1}如為多位作者,且不屬同一單位,請在各作者姓名的右上方加數字序號,并相對應地列明各位作者的單位全稱、單位所在的省、市和郵政編碼。
{2}內容正確、準確、專業、完整,強調創新性,注重實踐過程中的發現與創見,避免和回避帶有宣傳性質的純粹經驗介紹,文字精煉,結構嚴謹,數據可靠(重要數據請注明出處)。
{3}摘要是對論文的內容不加注釋和評論的簡短陳述,不用公式和化學結構式、圖表、特殊符號等。表達力求簡單、具體,術語規范,一般400字內。
{4}文章正文全部采用宋體五號字。全文行距固定值17磅。論文中的所有字母和數字均采用Times New Roman字體。文章內有插圖的,請提供原圖。
{5}文中圖、表要用中文清晰明了,表格內容不與文字,插圖重復,均采用三線表。表中參數應標明量和單位和符號,需注釋處。
{6}注釋。注釋用于對文內某一特定內容的解釋或說明,其序號分別為:①、②、③…,注釋內容置于正文之后。
{7}論文英文題名與中文題名內容上應一致,但不等于說詞語要一一對應。在許多情況下,個別非實質性的詞可以省略或變動。
{8}作者需要配合本刊編輯核實內容的真實性和準確性,必要時對稿件進行修改。
{9}參考文獻在文中需用括號表示著者和出版年信息,例如(王玲,1983),著錄根據《信息與文獻 參考文獻著錄規則》(GB/T 7714—2015)國家標準的規定執行。
{10}屬于課題基金項目的成果或論文,請在首頁注明基金項目類別、課題項目名稱及編號。如有鳴謝文字請附于文末。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社