期刊在線咨詢服務,立即咨詢

400-838-9662 購物車(0)

基于深度學習和遷移學習的領域自適應中文分詞

成于思; 施云濤 東南大學土木工程學院; 江蘇南京210096; 中國移動通信集團南京分公司網絡部; 江蘇南京210019

關鍵詞:深度學習 遷移學習 領域分詞 工程法律 

摘要:為了提高專業領域中文分詞性能,以及彌補專業領域大規模標注語料難以獲取的不足,該文提出基于深度學習以及遷移學習的領域自適應分詞方法。首先,構建包含詞典特征的基于深度學習的雙向長短期記憶條件隨機場(BI-LSTM-CRF)分詞模型,在通用領域分詞語料上訓練得到模型參數;接著,以建設工程法律領域文本作為小規模分詞訓練語料,對通用領域語料的BI-LSTM-CRF分詞模型進行參數微調,同時在模型的詞典特征中加入領域詞典。實驗結果表明,遷移學習減少領域分詞模型的迭代次數,同時,與通用領域的BI-LSTM-CRF模型相比,該文提出的分詞方法在工程法律領域的分詞結果F1值提高了7.02%,與預測時加入領域詞典的BI-LSTM-CRF模型相比,分詞結果的F1值提高了4.22%。該文提出的分詞模型可以減少分詞的領域訓練語料的標注,同時實現分詞模型跨領域的遷移。

中文信息學報雜志要求:

{1}本刊對刊發的文章擁有版權,不得擅自轉載、改編。凡轉載、改編務經我刊同意,違者必究。

{2}作者簡介包括:姓名、性別、出生年月、畢業學校及所學專業、工作單位、職務職稱、現從事的研究工作情況。

{3}來稿若屬國家自然科學基金項目或省部基金項目,請在文稿中標明其基金來源和編號,我刊可以優先審核發表。

{4}正文內連續敘述中的序號采用①……;②……;③……。分級超過3級后用網括號如:“①”,“②”表示,并采用連排。

{5}附注請一律使用當頁腳注的形式,以帶圈①……⑩的方式編號,使用每頁重新編號的方式。

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

中文信息學報

北大期刊
預計1-3個月審稿

期刊主頁
相關期刊
我們的服務
主站蜘蛛池模板: 午夜成人在线视频| 国产精品丝袜久久久久久不卡| 久久久亚洲欧洲日产国码二区| 欧美成人午夜视频| 免费人成在线观看视频高潮| 芬兰bbw搡bbbb搡bbbb| 国产欧美日韩在线观看精品| 91精品91久久久久久| 天天综合色天天综合网| 两个人看的www免费| 日本理论午夜中文字幕| 亚洲av永久无码精品秋霞电影影院 | 午夜私人影院免费体验区| 青草娱乐极品免费视频| 国产真实乱在线更新| 91手机视频在线| 大学生美女特级毛片| 一区二区三区四区欧美| 成年在线网站免费观看无广告| 久久人妻av无码中文专区| 最近免费中文字幕大全高清10| 亚洲成人中文字幕| 波多野给衣一区二区三区| 免费看**一片毛片| 绿茶可约可空降直播软件| 国产一区二区三区免费视频| 风间由美100部合集| 国产欧美精品一区二区三区四区| 91免费播放人人爽人人快乐| 夜来香免费观看视频在线| 一个人看的www免费高清| 性感美女视频在线观看免费精品| 中文字幕黑人借宿神宫寺| 日本不卡一二三| 久久久精品人妻无码专区不卡| 日韩精品一区二区三区中文精品 | 国产综合精品在线| 99re视频在线观看| 天天操天天摸天天射| jux662正在播放三浦惠理子| 少妇人妻精品一区二区|