欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

提供組織的內(nèi)容的制作方法_3

文檔序號:8548086閱讀:來源:國知局
鈕304可W允 許任何合適數(shù)量的相關子文檔308和310被顯示。例如,用戶可能希望查看與脊柱文檔的 特定章節(jié)相關的子文檔。在某些示例中,擴展按鈕304可W允許與脊柱文檔的一章節(jié)相關 的子文檔308和310的顯示。
[0039] 在某些實施例中,組織器模塊122可W判斷,子文檔308或310與脊柱文檔的主題 相關W及子文檔308或310匹配脊柱文檔的一章節(jié)。組織器模塊122也可W提供對應于脊 柱文檔的特定章節(jié)的來自子文檔308和310(此處也被稱為匹配的子文檔)的文本??蒞 W各種機器學習技術,諸如神經(jīng)網(wǎng)絡,等等,來標識匹配的子文檔。機器學習技術可W判斷 匹配的子文檔是否增強脊柱文檔的一章節(jié)。在某些示例中,增強脊柱文檔的一章節(jié)可包括 判斷脊柱文檔的該章節(jié)中的信息是否是子文檔的子集,或子文檔中的信息是否增強脊柱文 檔的該章節(jié)中的信息。
[0040] 在某些實施例中,可W使用為每一個子文檔計算出的相關性分數(shù)來標識匹配的子 文檔。在某些實施例中,超過某一合適的數(shù)量或百分比的相關性分數(shù)可W指示子文檔是與 脊柱文檔的一章節(jié)的匹配。在某些示例中,用戶可W調(diào)整指示子文檔是與脊柱文檔的一章 節(jié)的匹配的相關性分數(shù)的值。
[0041] 圖3的圖示并不意在指示組織器模塊122將顯示圖3的全部特征。相反,組織器 模塊122可W顯示任何合適數(shù)量的相關子文檔,等等。此外,組織器模塊122還可W不顯示 擴展按鈕304。例如,組織器模塊122可W自動地提供與當前正被查看的章節(jié)相關的文檔。
[0042] 圖4是顯示子文檔與脊柱文檔的關系的示例的圖示。在某些實施例中,關系可包 括匹配的關系、互補關系,或冗余關系,等等。組織器模塊122可W提供要被顯示的圖表 400,圖表400指示相關的文檔中的每一子文檔和脊柱文檔之間的關系。例如,圖表可W使 用不同的陰影或顏色來指示每一個子文檔的關系。在某些實施例中,圖表400可W顯示特 定文檔,其中,基于子文檔和脊柱文檔之間的關系來顯示文檔中所包含的各個子文檔。
[0043] 圖表400顯示相關的文檔的六個子文檔。在某些實施例中,圖表400的左軸包括 0和1之間的值,指示子文檔與脊柱文檔具有特定關系的概率。在圖表400中所示出的示 例中,每一子文檔都具有每一子文檔與脊柱文檔的一章節(jié)具有特定關系的百分之一百的概 率。圖表400的陰影指示每一子文檔和脊柱文檔之間的關系。例如,圖表400的子文檔1402 和子文檔2404中的斜線可W指示子文檔1和子文檔2匹配脊柱文檔的章節(jié)。在此示例中, 子文檔1和2可包括與脊柱文檔的一章節(jié)相關的信息,因為匹配關系指示高相關性分數(shù)。在 某些示例中,圖表400的子文檔3406包括虛線的陰影,該虛線的陰影可W指示子文檔3包 括對脊柱文檔的補充的信息。例如,子文檔3可包括不匹配脊柱文檔的一章節(jié)中的信息并 且相對于脊柱文檔的一章節(jié)不是冗余信息的信息。在某些示例中,圖表400的子文檔4408、 子文檔5410W及子文檔6412中的水平線陰影可W指示子文檔4, 5W及6包括已經(jīng)被包括 在脊柱文檔中的冗余信息。在某些實施例中,可W基于子文檔是否包含來自脊柱文檔的一 章節(jié)的概念的子集的超集來計算冗余關系。在某些示例中,也可W基于子文檔和脊柱文檔 的一章節(jié)之間的在概念上的重疊量或子文檔的長度或子文檔的其他特征來確定冗余關系。
[0044] 某些子文檔也可W是脊柱文檔的章節(jié)的near-verbatim(接近逐字)重復。在某 些實施例中,組織器模塊122可W通過計算子文檔的每一句子和spine文章的一章節(jié)的每 一句子之間的基于TFIDF的余弦相似度來檢測重復子文檔。在某些示例中,子文檔中的每 一句子與脊柱文檔中的某個句子的最大余弦相似度值可W存儲在諸如矢量之類的任何合 適的數(shù)據(jù)結構中,等等。組織器模塊122可W計算存儲的最大余弦相似度值的平均值,并判 斷平均值是否高于闊值。如果平均值高于闊值,則子文檔的句子可W被視為與脊柱文檔中 的句子重復。在某些實施例中,用于確定重復的闊值可W是預定的,或被周期性地修改。
[0045] 圖4的圖示并不意在指示組織器模塊122將顯示圖4的全部特征。相反,組織器 模塊122可W顯示任何合適數(shù)量的文檔和子文檔,等等。此外,組織器模塊122還可W利用 彩色、陰影或圖像等等來顯示子文檔相對于脊柱文檔的一章節(jié)的關系。
[0046] 圖5是示出了提供組織的內(nèi)容的有形的計算機可讀存儲介質(zhì)500的框圖。有形的 計算機可讀存儲介質(zhì)500可由處理器502在計算機總線504上訪問。進一步,有形的計算 機可讀存儲介質(zhì)500可包括引導處理器502執(zhí)行當前方法的步驟的代碼。
[0047] 此處討論的各軟件組件可被存儲在如圖5中所示的有形的計算機可讀存儲介質(zhì) 500上。例如,有形的計算機可讀存儲介質(zhì)500可包括組織器模塊506。組織器模塊506可 W通過標識脊柱文檔并標識與脊柱文檔相關的文檔內(nèi)的子文檔的關系,基于主題,來組織 內(nèi)容。組織器模塊506也可W通過圖表和突出顯示技術,等等,顯示子文檔和脊柱文檔之間 的關系。
[0048] 可W理解,取決于特定的應用,圖5中未示出的任意數(shù)量的額外的軟件組件可W 被包括在有形的計算機可讀存儲介質(zhì)500內(nèi)。盡管用結構結構特征和/或方法方法專用的 語言描述了本主題,但可W理解,所附權利要求書中定義的主題不必限于上述具體結構特 征或方法。相反,上文所描述的具體結構特征和方法是作為實現(xiàn)權利要求書的示例形式來 公開的。
【主權項】
1. 一種用于提供組織的內(nèi)容的方法,包括: 從文檔集合中標識脊柱文檔,其中所述脊柱文檔包括多個章節(jié); 將相關的文檔拆分為多個子文檔; 將所述子文檔映射到所述脊柱文檔的對應的章節(jié);以及 基于對所述文檔集合的搜索來顯示子文檔。
2. 如權利要求1所述的方法,其特征在于,包括基于所述子文檔和所述脊柱文檔的所 述對應的章節(jié)之間的所述關系來突出顯示所述子文檔。
3. 如權利要求1所述的方法,其特征在于,顯示子文檔包括: 確定所述子文檔和所述脊柱文檔之間的關系;以及 基于所述關系來顯示所述子文檔。
4. 如權利要求1所述的方法,其特征在于,包括計算所述子文檔中的每一個的相關性 分數(shù),其中利用邏輯回歸技術來計算所述相關性分數(shù)。
5. 如權利要求4所述的方法,其特征在于,計算所述子文檔的相關性分數(shù)包括: 生成子文檔中的單詞的第一矢量表示,其中所述第一矢量中的每一條目都對應于所述 子文檔中的特定單詞; 生成所述脊柱文檔中的所述文本段的所述單詞的第二矢量表示,其中所述第二矢量中 的每一條目都對應于所述脊柱文檔中的特定單詞;以及 檢測所述第一矢量和所述第二矢量之間的余弦相似度。
6. 如權利要求1所述的方法,其特征在于,包括: 檢測文檔集合中的一組讀取文檔;以及 基于所述該組讀取文檔,增強所述脊柱文檔以產(chǎn)生增強的脊柱文檔;以及 計算子文檔和所述增強的脊柱文檔之間的關系。
7. -個或多個計算機可讀存儲介質(zhì),包括多個指令,當由處理器執(zhí)行時,導致所述處理 器: 從文檔集合中標識脊柱文檔,其中所述脊柱文檔包括多個章節(jié); 將所述文檔集合中的相關的文檔拆分為多個子文檔; 將所述子文檔映射到所述脊柱文檔的對應的章節(jié);以及 基于對所述文檔集合的搜索和所述子文檔與所述脊柱文檔的關系來顯示子文檔,其中 所述子文檔與所述脊柱文檔之間的所述關系包括互補關系、冗余關系、重復關系以及匹配 關系中的一個。
8. 如權利要求7所述的一個或多個計算機可讀存儲介質(zhì),其特征在于,所述多個指令, 在由所述處理器執(zhí)行時,導致所述處理器基于所述子文檔以及所述脊柱文檔的所述對應的 章節(jié)之間的所述關系來突出顯示所述子文檔。
9. 一種用于提供組織的內(nèi)容的系統(tǒng),包括: 顯示多個子文檔的顯示設備; 執(zhí)行處理器可執(zhí)行代碼的處理器; 存儲處理器可執(zhí)行代碼的存儲設備,其中,所述處理器可執(zhí)行代碼當由所述處理器執(zhí) 行時,導致所述處理器: 從文檔集合中標識脊柱文檔,其中所述脊柱文檔包括多個章節(jié); 將相關的文檔拆分為所述多個子文檔; 將所述子文檔映射到所述脊柱文檔的對應的章節(jié);以及 基于對所述文檔集合的搜索來顯示子文檔。
10.如權利要求9所述的系統(tǒng),其特征在于,所述處理器駐留在網(wǎng)絡計算環(huán)境上的服務 中。
【專利摘要】此處描述了用于提供組織的內(nèi)容的系統(tǒng)和方法。在一個示例中,方法包括從文檔集合中標識脊柱文檔,其中脊柱文檔包括多個章節(jié)。該方法還包括將相關的文檔拆分為多個子文檔。另外,該方法還包括將子文檔映射到脊柱文檔的對應的章節(jié)。此外,該方法還包括基于對文檔集合的搜索來顯示子文檔。
【IPC分類】G06F17-21
【公開號】CN104871152
【申請?zhí)枴緾N201380067535
【發(fā)明人】S·巴蘇, L·范德溫德, L·張
【申請人】微軟技術許可有限責任公司
【公開日】2015年8月26日
【申請日】2013年12月20日
【公告號】US20140181097, WO2014100567A2, WO2014100567A3
當前第3頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
洪湖市| 佛冈县| 海门市| 渝北区| 沛县| 玛曲县| 如皋市| 铅山县| 七台河市| 田阳县| 石嘴山市| 巴南区| 曲水县| 伊宁县| 会同县| 富锦市| 安塞县| 土默特右旗| 拉孜县| 报价| 新民市| 炉霍县| 宁化县| 邛崃市| 中西区| 曲靖市| 文水县| 平武县| 喀什市| 东乡族自治县| 南召县| 合川市| 子长县| 前郭尔| 鞍山市| 巴彦县| 阜宁县| 龙门县| 临泽县| 江达县| 萍乡市|