期刊在線咨詢服務,立即咨詢

400-838-9662 購物車(0)

基于弱標注數據的漢語分詞領域移植

朱運; 李正華; 黃德朋; 張民 蘇州大學計算機科學與技術學院; 江蘇蘇州215006

關鍵詞:漢語分詞 領域移植 弱標注數據 

摘要:近年來,基于神經網絡的分詞模型在封閉領域文本上取得了很高的性能。然而,在領域移植場景下,即測試數據與訓練數據的領域差異較大時,分詞的性能會顯著下降。該文嘗試利用自動獲取的弱標注數據來提升領域移植場景下的分詞性能。首先,對目前性能最好的BiLSTM-CRF分詞模型進行擴展,引入適用于弱標注數據的損失函數;進而提出一種簡單有效的數據篩選方法,從海量弱標注數據中篩選和目前領域更相關的數據;最后,該文發現數據預處理和在神經網絡中引入傳統特征均可以有效提高分詞性能。在SIGHAN Bakeoff 2010和ZhuXian標注測試集上的實驗結果表明,該文所提方法可有效提升漢語分詞領域移植性能,平均F值提高了3.6%。

中文信息學報雜志要求:

{1}本刊對刊發的文章擁有版權,不得擅自轉載、改編。凡轉載、改編務經我刊同意,違者必究。

{2}作者簡介包括:姓名、性別、出生年月、畢業學校及所學專業、工作單位、職務職稱、現從事的研究工作情況。

{3}來稿若屬國家自然科學基金項目或省部基金項目,請在文稿中標明其基金來源和編號,我刊可以優先審核發表。

{4}正文內連續敘述中的序號采用①……;②……;③……。分級超過3級后用網括號如:“①”,“②”表示,并采用連排。

{5}附注請一律使用當頁腳注的形式,以帶圈①……⑩的方式編號,使用每頁重新編號的方式。

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

中文信息學報

北大期刊
預計1-3個月審稿

期刊主頁
相關期刊
我們的服務
主站蜘蛛池模板: 99久久精品国产一区二区三区| 亚洲欧美第一页| 黄色特级片黄色特级片| 国内精品一区二区三区最新| 中文字幕水野优香在线网在线| 欧美xxxx性疯狂bbbb| 人妻少妇看A偷人无码精品视频| 色窝窝亚洲AV网在线观看| 国产欧美日韩另类一区乌克兰 | 真实的国产乱xxxx在线| 国产做受视频激情播放| 亚洲成人自拍网| 国产裸拍裸体视频在线观看| xxx国产精品xxx| 手机在线看片你懂得| 久久婷婷色一区二区三区| 欧美丰满熟妇XXXX| 亚洲男女一区二区三区| 精品久久久噜噜噜久久久| 国产hd高清freexxxx| 高中生被老师第一次处破女| 国产男女免费完整视频| 91丨九色丨首页| 天堂8在线天堂资源bt| 一级全免费视频播放| 扒开粉嫩的小缝喷出水视频| 久久国产成人精品国产成人亚洲| 欧美.成人.综合在线| 亚洲欧美视频在线| 狠狠躁天天躁无码中文字幕 | 一本大道无码人妻精品专区| 无翼乌漫画全彩| 久久国产精品一国产精品金尊| 欧美一区视频在线| 亚洲成人网在线播放| 求网址你懂你的2022| 免费又黄又硬又爽大片| 精品欧洲AV无码一区二区男男| 国产三级在线观看播放| 麻豆视频免费看| 国产成人啪精品午夜在线播放|