欧美日韩激情电影,久久亚洲精品毛片,日日夜夜天天综合入口,亚洲激情六月丁香

您的位置: 首頁 >互聯網 >

一個神經網絡 用于提取知識淵博的片段和文檔

2019-06-11 17:06:16 編輯: 來源:
導讀 每天,在社交媒體和其他平臺上發布數百萬篇文章,從瀏覽網頁的用戶那里獲得大量點擊和分享。其中許多文章包含有用的信息,如果提取,可用于

每天,在社交媒體和其他平臺上發布數百萬篇文章,從瀏覽網頁的用戶那里獲得大量點擊和分享。其中許多文章包含有用的信息,如果提取,可用于編譯知識數據庫或提供知識檢索和問答服務。

中國科學院(CAS)的研究人員開發了一種基于卷積神經網絡(CNN)的模型,用于提取知識淵博的片段和注釋文檔。他們的方法在arXiv上發表的論文中概述,盡管經過較??短時間的培訓,但發現其效果優于現有工具。

在他們的論文中,研究人員將術語“知識淵博的文檔”定義為“包含多個知識淵博的片段的文檔,這些片段描述了實體的概念,屬性或實體之間的關系”。到目前為止,大多數知識庫,如YAGO或DBpedia,都基于Wikipedia,WordNet,GeoNames和其他在線資源提取知識。但是,與社交媒體平臺相比,這些資源通常包含有限且不靈活的信息。

研究人員在他們的論文中寫道:“另一個最近的知識庫Probase擁有270萬個概念,它是從迄今為止最大的語料庫中自動獲取的,其中包括從16.8億個網頁中提取的3.26億個知識淵博的句子。” “然而,這些句子只能通過赫斯特模式提取。為了提取更多知識淵博的片段以構建更全面的知識庫,需要基于語義的方法來補充以前基于模式的方法。”

知識淵博的片段和文章也可用于開發知識檢索和問答服務。例如,這些服務將回答正在尋找特定問題幫助的用戶提出的問題。考慮到這些應用,CAS的研究人員開始開發基于CNN的模型,該模型可以分析文檔的語義,確定它是否有用,并從中提取知識豐富的信息片段。

“具體來說,我們提出SSNN,這是一個基于CNN的聯合模型,用于協同理解不同領域中文檔的抽象概念,并判斷文檔是否具有知識性,”研究人員在他們的論文中解釋道。“更詳細地說,SSNN的網絡結構是'低級共享,高級分裂',其中低級別層為不同域共享,而CNN之外的高級層分別訓練以感知不同領域的差異。“

研究人員設計的模型提供了一種端到端的解決方案來注釋文檔,這些解決方案不需要進行大量耗時的特征工程。他們還開發了手動功能并訓練了SVM分類器模型來完成任務。

研究人員評估了他們的模型在微信開發的中文消息,社交媒體和移動支付平臺微信三個內容領域的真實文檔數據集上的有效性。他們的研究結果非常有希望,SSNN的表現始終優于其他CNN模型,同時通過更短,更有效的培訓流程節省了時間和內存消耗。

研究人員在他們的論文中寫道:“與構建多個特定領域的CNN相比,這種聯合模型不僅可以大大節省訓練時間,而且可以明顯提高預測精度。” “在Wechat公共平臺的真實數據集中證明了所提模型的優越性。”

將來,本研究中提出的SSNN 模型可用于構建更全面的知識數據庫。它還可以幫助開發創新服務,以實時快速和詳盡地回答用戶查詢。


免責聲明:本文由用戶上傳,如有侵權請聯系刪除!

最新文章

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經網.復制必究 聯系QQ   備案號:

本站除標明“本站原創”外所有信息均轉載自互聯網 版權歸原作者所有。

郵箱:toplearningteam#gmail.com (請將#換成@)

主站蜘蛛池模板: 欧美性xxxx交| 国产aa视频| 五月伊人六月| 欧美精品另类| eeuss影影院www在线播放| sm国产在线调教视频| 天堂资源最新在线| 精品176二区| 狠狠操狠狠色| 国产理论片免费观看| 国产精品久久一区二区三区不卡| 国产高清视频在线观看| 国产69精品久久久久孕妇国产69久久 | 日本在线视频www鲁啊鲁| 久草视频国产| 最近中文字幕av免费高清| 综合激情亚洲| 国产免费永久在线观看| 国产区在线观看| а√资源新版在线天堂| 国产精品视频一区二区免费不卡| 国产一卡二卡3卡4卡四卡在线| 四虎免费视频| 狠狠干天天爱| 国产在线更新| a视频在线播放| 日本中文字幕视频| www.亚洲视频| 最新天堂资源在线资源| 国产黄色免费网| 一区免费观看| 国产小视频在线高清播放| 日本免费黄色| 午夜影院在线免费观看| 国产免费av在线| 日本aⅴ写真网站免费| 五月天婷婷基地| 精品福利影院| 国产日本在线观看| 久久精品亚洲7777影院| 青青国产在线|