欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng)的制作方法

文檔序號:6399430閱讀:285來源:國知局
專利名稱:基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)信息處理技術(shù)領(lǐng)域,尤其涉及一種可為使用者實(shí)時(shí)推薦句型以及相關(guān)例句信息的基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng)。
背景技術(shù)
高度概括寫作過程,可以用八個(gè)字四個(gè)詞來概括,即“謀篇、安章、遣詞、造句”,其中謀篇、安章可以說是戰(zhàn)略層面的事,而遣詞、造句則是戰(zhàn)術(shù)層面的事,也是寫作中最勞心勞力的階段,是捉筆人最需要得到計(jì)算機(jī)幫助的中間過程。就技術(shù)現(xiàn)狀來看,計(jì)算機(jī)輔助寫作主要集中于兩類活動(dòng),這兩類活動(dòng)的差別在于活動(dòng)主體的差別和活動(dòng)目的的差異。第一類計(jì)算機(jī)輔助寫作活動(dòng)的主體是人,是以人為主,而計(jì)算機(jī)只是提供文字輸入、編輯、文檔管理等多種輔助功能,這類活動(dòng)因計(jì)算機(jī)的介入可以提高寫作的效率,確實(shí)給了捉筆人不小的幫助,甚至悄然改變了人們的寫作模式,但是,這類活動(dòng)對寫作活動(dòng)的精髓一“謀篇、安章、遣詞、造句”似乎幫助不大,也就是說,只是在寫作活動(dòng)的低層次上給予捉筆人以有益的幫助;另一類則是嘗試以機(jī)器(計(jì)算機(jī))為寫作活動(dòng)主體的研究開發(fā)活動(dòng),研究如何利用計(jì)算機(jī)軟件實(shí)現(xiàn)“謀篇、安章、遣詞、造句”,即在人的有限參與下主要由計(jì)算機(jī)按一定規(guī)則完成行文作詩,它們屬于狹義的計(jì)算機(jī)語言信息處理研究領(lǐng)域。這兩類活動(dòng)都有大量的實(shí)用產(chǎn)品或科研成果,發(fā)表了很多論文和專著。分析計(jì)算機(jī)輔助寫作技術(shù)現(xiàn)狀可以發(fā)現(xiàn),上述第一類活動(dòng)由于其不針對寫作活動(dòng)的核心需求,輔助寫作的功能作用是有限的,甚至可以說不具實(shí)質(zhì)性;上述第二類活動(dòng)限于技術(shù)基礎(chǔ)的限制,目前還需要人的參與才能達(dá)到一定的實(shí)用效果,否則可能會(huì)輸出看起來非常低級的結(jié)果,離達(dá)到真正意義上的寫作還有很長的路要走。因此,這兩類活動(dòng)都滿足不了計(jì)算機(jī)輔助寫作的現(xiàn)實(shí)需求。但需求是現(xiàn)實(shí)存在的。人類已進(jìn)入以信息和網(wǎng)絡(luò)為顯著文明特征的時(shí)代,這個(gè)時(shí)代,互聯(lián)網(wǎng)和無線通信飛速發(fā)展,全民寫作的時(shí)代已悄然來臨。在這個(gè)時(shí)代,寫作不應(yīng)該還是少數(shù)人的絕技,千百年來限制著人們表達(dá)和交流的“謀篇、安章、遣詞、造句”的原始手段亟需突破和改變??焖侔l(fā)展的計(jì)算機(jī)技術(shù)是可幫助人們在寫作活動(dòng)中實(shí)現(xiàn)寫作模式改變的優(yōu)選手段,而且,利用計(jì)算機(jī)技術(shù)我們還可以做得更多。除上述兩類活動(dòng)之外,充分利用計(jì)算機(jī)技術(shù)的快速、精確、大存儲容量、集成化、網(wǎng)絡(luò)化、交互方式友好便捷等技術(shù)特點(diǎn),可以探索另一類以寫作輔助信息的實(shí)時(shí)、準(zhǔn)確、便捷提供為特征的計(jì)算機(jī)輔助寫作活動(dòng),以達(dá)到對人的寫作能力的補(bǔ)充,以服務(wù)于因人的局限性而困擾人們的寫作核心過程,例如遣詞、造句等。這種可稱為第三類的計(jì)算機(jī)輔助寫作活動(dòng),通過人與計(jì)算機(jī)的充分互補(bǔ)及協(xié)同,既因可對寫作的核心過程大有助益而不同于第一類活動(dòng),也沒有第二類活動(dòng)的技術(shù)成熟時(shí)間的遙遙無期問題,具有現(xiàn)實(shí)性,應(yīng)該是十分可取且前景廣闊的。目前,還沒有出現(xiàn)可用于第三類計(jì)算機(jī)輔助寫作活動(dòng)的產(chǎn)品或相關(guān)應(yīng)用成果報(bào)道,只是在專利信息庫里可以查到技術(shù)機(jī)理相似的申請文件(尚無授權(quán)專利)。本人前期提交的“義類計(jì)算機(jī)檢索系統(tǒng)”專利申請可以說是第三類計(jì)算機(jī)輔助寫作活動(dòng)的一個(gè)實(shí)例,該系統(tǒng)可以通過人機(jī)交互方式幫助捉筆人解決寫作中的遣詞難題。造句,是寫作過程中兩大基本活動(dòng)(遣詞、造句)中的另一個(gè),是寫作過程中的另一個(gè)困擾捉筆人的難題,捉筆人有時(shí)會(huì)為如何準(zhǔn)確運(yùn)用詞語恰當(dāng)?shù)貥?gòu)造語句,以正確地表達(dá)原意和情感而頗費(fèi)思量或絞盡腦汁。教科書告訴我們,要寫好文章、要造好句,沒有捷徑,必須靠日積月累,需要長期、大量的閱讀和寫作練習(xí)才可能達(dá)到才思如涌、下筆如神。這千百年來的諄諄教導(dǎo),在計(jì)算機(jī)技術(shù)快速發(fā)展的今天,雖仍有教導(dǎo)意義,但其真理的相對性就凸顯出來了??茖W(xué)研究發(fā)現(xiàn),人腦對信息的記憶、處理、提取、辨別(評估)的能力是有限的,而且因人而異、差別很大,這解釋了寫作只是少數(shù)人的絕技之現(xiàn)象的必然性。但在計(jì)算機(jī)技術(shù)高速發(fā)展和日益普及的今天,情況正在快速改變。計(jì)算機(jī)可以及時(shí)有效地提供捉筆人所需的大量素材、詞語、句法、文法等基本信息,以彌補(bǔ)人腦的局限性,也可以通過搜索、統(tǒng)計(jì)、比較等技術(shù)手段幫助人們達(dá)到遣詞造句時(shí)的擇優(yōu)萃精。這些都可以通過日益普及的計(jì)算機(jī)通過人機(jī)交互形式來實(shí)現(xiàn),使寫作的普及化,或稱全民寫作成為可能。語料庫語言學(xué)是80年代才嶄露頭角的一門計(jì)算語言學(xué)的新的分支學(xué)科。它研究機(jī)器可讀的自然語言文本的采集、存儲、檢索、統(tǒng)計(jì)、語法標(biāo)注、句法語義分析,以及研究具有上述功能的語料庫在語言研究、語言教學(xué)、自然語言處理等領(lǐng)域中的應(yīng)用。語料庫語言學(xué)的技術(shù)基礎(chǔ)即語料庫,是一種很大規(guī)模的有序存儲計(jì)算機(jī)可讀的自然語言的數(shù)據(jù)庫?;谡Z料庫對語言信息進(jìn)行統(tǒng)計(jì)和處理的技術(shù)稱為語料庫技術(shù)。從本質(zhì)上講,語料庫語言學(xué)的研究采用的是一種基于統(tǒng)計(jì)的經(jīng)驗(yàn)主義處理方法,它與語言學(xué)界傳統(tǒng)的基于規(guī)則的理性主義處理方法是大不相同的。前者是從大量現(xiàn)實(shí)存在的語言材料中去統(tǒng)計(jì)和發(fā)現(xiàn)語言知識,而后者的基礎(chǔ)則是語言學(xué)家人為制定的語言學(xué)規(guī)則。傳統(tǒng)語言學(xué)基本上是通過語言學(xué)家用手工方法或“內(nèi)省”的方法,從有限的語料資料中歸納總結(jié)個(gè)別的語言數(shù)據(jù)來獲取語言知識的。由于人的記憶能力有限,任何語言學(xué)家,明時(shí)白是語言學(xué)界的權(quán)威泰斗,都不可能記憶和處理浩如煙海的全部語言數(shù)據(jù),因此,使用傳統(tǒng)的手工方法來獲取語言知識,猶如以管窺豹,這種獲取語言知識的方法不僅效率極低,而且?guī)в泻艽蟮闹饔^性。因而,基于規(guī)則的研究范式難以全面揭示動(dòng)態(tài)語言復(fù)雜性系統(tǒng)的本質(zhì)屬性和功能價(jià)值。語料庫語言學(xué)使用統(tǒng)計(jì)的方法或機(jī)器學(xué)習(xí)的方法,自動(dòng)或半自動(dòng)地從浩如煙海的語料庫中獲取準(zhǔn)確的語言知識。這是語言學(xué)獲取語言知識方式的巨大變化,在語言學(xué)的發(fā)展歷史上具有革命性的意義。來源于現(xiàn)實(shí)世界的真實(shí)語料信息,為語言研究、語言教學(xué)等提供了最原始、最可靠的素材或證據(jù),由此得到的研究成果和應(yīng)用成果真實(shí)可信、具有生命力。從上世紀(jì)90年代開始,語料庫方法逐漸成為語言學(xué)研究的主流方法,受到語言研究者的普遍歡迎。即便是傳統(tǒng)語言學(xué)研究者也開始利用語料庫技術(shù)來開展研究活動(dòng),以彌補(bǔ)基于規(guī)則的方法的不足。語料庫作為一種方法或技術(shù)有著廣泛的應(yīng)用領(lǐng)域,如在語言教學(xué)、語言定量分析、詞匯研究、詞語搭配研究、語法研究、多語言跨文化研究、詞典編纂、作品風(fēng)格分析、自然語言理解和機(jī)器翻譯等領(lǐng)域中的應(yīng)用,但迄今還未在公開文獻(xiàn)上發(fā)現(xiàn)將語料庫應(yīng)用于計(jì)算機(jī)輔助寫作活動(dòng)。當(dāng)將語料庫技術(shù)應(yīng)用于前述第三類計(jì)算機(jī)輔助寫作活動(dòng)時(shí),計(jì)算機(jī)向捉筆人推薦的知識是來源于語料庫,亦即來源于真實(shí)語言,而不是來源于人為設(shè)定的規(guī)則,這既適應(yīng)了語言學(xué)發(fā)展的大方向,也將有助于推動(dòng)語言學(xué)新理論和新技術(shù)走向?qū)嵱?、走向社?huì)。在中國發(fā)明專利數(shù)據(jù)庫中進(jìn)行檢索,發(fā)現(xiàn)屬于上述第三類計(jì)算機(jī)輔助寫作技術(shù)的并不算多,尚沒有發(fā)現(xiàn)基于語料庫技術(shù)的計(jì)算機(jī)輔助寫作專利申請文件。經(jīng)檢索發(fā)現(xiàn)6個(gè)專利申請公開說明書屬第三類計(jì)算機(jī)輔助寫作專利申請,而目前尚無授權(quán)的相關(guān)主題中國發(fā)明專利。檢索到的6個(gè)專利文件簡單介紹和說明如下申請?zhí)枮镃NOl 121472. 4的“外語寫作輔助方法和輔助工具”專利申請和申請?zhí)枮镃N03134379.1的“寫作語意輔助提示系統(tǒng)及方法”專利申請主要為英語寫作時(shí)的遣詞輸入過程提供參考信息,不涉及句型輔助信息的提供。申請?zhí)枮镃N200310121288.X的“電子文檔的計(jì)算機(jī)輔助寫作和瀏覽的方法及裝置”專利申請對已輸入的電子文檔生成結(jié)構(gòu)摘要,并可在輔助寫作和瀏覽過程中呈現(xiàn)摘要給使用者以供參考,不涉及句型輔助信息的提供。申請?zhí)枮镃N200710018035. 8的專利申請“一種實(shí)時(shí)句子輔助寫作方法及系統(tǒng)”、申請?zhí)枮镃N201010200796. 7的專利申請“文章輔助寫作系統(tǒng)及其方法”、申請?zhí)枮镃N201210107089. 2的專利申請“規(guī)范文檔輔助寫作系統(tǒng)及規(guī)范文檔生成方法”都采用了人機(jī)交互的形式,且以提供參考句型為主要功能,但它們都可以歸類為基于規(guī)則的方法,與基于語料庫的方法有效果上和本質(zhì)上的不同。例如申請?zhí)枮镃N200710018035. 8和申請?zhí)枮镃N201010200796. 7的專利申請中,作為寫作基本素材的例句均來源于系統(tǒng)構(gòu)建時(shí)人為設(shè)定的例句數(shù)據(jù)庫,具有很強(qiáng)的主觀色彩,同時(shí)也缺乏全面性、權(quán)威性和開放性,對寫作的輔助作用是有限的,更難以提升寫作質(zhì)量。類似問題在采用基于語料庫的方法時(shí)都將不復(fù)存在。

發(fā)明內(nèi)容
——要解決的技術(shù)問題日益普及的個(gè)人通信與網(wǎng)絡(luò)終端技術(shù)催熱了對大眾化寫作工具的需求,而真正能對寫作中遣詞、造句等核心活動(dòng)提供便捷幫助的產(chǎn)品還沒有在市場上出現(xiàn)。本系統(tǒng)針對人們在寫作活動(dòng)中采集、存儲、處理、提取、比較及組織相關(guān)信息能力的不足夠,引入語料庫和基于語料庫的處理方法,通過人機(jī)交互形式實(shí)時(shí)便捷地推薦來源于真實(shí)語料庫的句型和例句,面向造句這個(gè)寫作的核心活動(dòng)為人們提供幫助,填補(bǔ)基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng)的技術(shù)空白?!夹g(shù)方案本系統(tǒng)由控制程序存儲裝置、語料庫裝置、過程信息暫存裝置、輸入裝置、顯示裝置、連接裝置、處理與控制裝置組成,通過它們之間相互作用與配合,實(shí)現(xiàn)為使用者實(shí)時(shí)推薦句型以及相關(guān)例句信息的輔助寫作功能。本系統(tǒng)各組成裝置相互連接圖如圖1,各裝置在系統(tǒng)運(yùn)行中的作用和功能如下I)控制程序存儲裝置(110),用以存儲本系統(tǒng)的控制程序,供本系統(tǒng)運(yùn)行控制之用;2)語料庫裝置(120),用以存儲較大規(guī)模的已對詞語和句子進(jìn)行語法信息標(biāo)注的語料信息,供本系統(tǒng)以使用者輸入的關(guān)鍵信息為檢索要素進(jìn)行檢索,得到候選的供推薦的參考句子及其句法信息;其中所標(biāo)注的語法信息至少包括句法信息;3)過程信息暫存裝置(130),用以暫存本系統(tǒng)信息處理過程中產(chǎn)生的中間過程信息;4)輸入裝置(140),用于使用者輸入所期望的目標(biāo)句子的關(guān)鍵信息或操作指令;其中輸入的關(guān)鍵信息至少包括下述信息之一種目標(biāo)句子的關(guān)鍵詞、目標(biāo)句子關(guān)鍵詞的語法信息、目標(biāo)句子的句法信息;5)顯示裝置(150),用以顯示本系統(tǒng)的用戶界面信息、操作提示信息、推薦的檢索結(jié)果及其它信息;6)連接裝置(161,162),161用以在輸入裝置和處理與控制裝置之間傳輸信號和信息;162用以在顯示裝置和處理與控制裝置之間傳輸信號和信息;7)處理與控制裝置(170),用以執(zhí)行本系統(tǒng)的運(yùn)行程序,實(shí)現(xiàn)輔助寫作過程的檢索和處理,以得到供推薦的參考句子及參考句型信息;在運(yùn)行過程中向本系統(tǒng)內(nèi)各裝置發(fā)出控制信號或采集狀態(tài)信息;上述連接成一個(gè)系統(tǒng)的各裝置之間的相互作用與配合關(guān)系是處理與控制裝置170根據(jù)來自控制程序存儲裝置110的控制程序和經(jīng)連接裝置161傳來的來自輸入裝置140的使用者操作指令信息,對本系統(tǒng)運(yùn)行過程涉及的系統(tǒng)內(nèi)各裝置發(fā)出控制指令或采集狀態(tài)信息;處理與控制裝置170根據(jù)來自控制程序存儲裝置110的控制程序在顯示裝置150顯示輸入提示信息,提示使用者在輸入裝置140輸入所期望的目標(biāo)句子的關(guān)鍵信息,經(jīng)連接裝置161傳送給處理與控制裝置170作為檢索要素,在對語料庫裝置120存放的熟語料信息進(jìn)行以句子為輸出單位的檢索后,對檢索結(jié)果進(jìn)行進(jìn)一步分析處理,這些過程中產(chǎn)生的中間過程集合暫存于過程信息暫存裝置130中,所得到的可推薦給使用者選用的參考句子集合及參考句子對應(yīng)的句型信息,經(jīng)連接裝置162送往顯示裝置150按句型推薦規(guī)則進(jìn)行顯示,供使用者選用。組成本系統(tǒng)的各裝置具有特定的功能和相互關(guān)系,在實(shí)際實(shí)現(xiàn)方案中,它們既可以是相互分離的裝置,也可以由其中部分裝置組合成一體化的裝置或功能模塊,或者本系統(tǒng)的全部裝置組合成一體化的單機(jī)型產(chǎn)品。當(dāng)系統(tǒng)作為一個(gè)單機(jī)型產(chǎn)品存在時(shí),前述各裝置構(gòu)成系統(tǒng)的功能硬件主體,連接輸入裝置140的連接裝置161與連接顯示裝置150的連接裝置162均等效為該單機(jī)型計(jì)算機(jī)計(jì)算機(jī)輔助寫作裝置內(nèi)部的連接電路。當(dāng)系統(tǒng)運(yùn)行于互聯(lián)網(wǎng)平臺時(shí),系統(tǒng)的各個(gè)裝置分布在互聯(lián)網(wǎng)的不同位置,互聯(lián)網(wǎng)計(jì)算機(jī)終端的輸入功能部件作為本系統(tǒng)輸入裝置140,互聯(lián)網(wǎng)計(jì)算機(jī)終端的顯示功能部件作為本系統(tǒng)顯示裝置150,接入互聯(lián)網(wǎng)的服務(wù)器的相應(yīng)功能模塊代為行使本系統(tǒng)除輸入裝置140、顯示裝置150和連接裝置161、162以外的各功能裝置的功能,其中語料庫還可以是與前述服務(wù)器相連接的另一個(gè)服務(wù)器。這種應(yīng)用形式下,本系統(tǒng)的連接裝置161、162與互聯(lián)網(wǎng)傳輸設(shè)施等效,連接輸入裝置140的連接裝置161與連接顯示裝置150的連接裝置162合用互聯(lián)網(wǎng)接入鏈路接入互聯(lián)網(wǎng),并通過互聯(lián)網(wǎng)連接到遠(yuǎn)端服務(wù)器?!幸嫘Ч景l(fā)明針對日益凸顯的計(jì)算機(jī)輔助寫作需求,引入語料庫語言學(xué)和語料庫技術(shù)以彌補(bǔ)人們的信息視野、信息處理和反應(yīng)速度等能力的不足夠,利用計(jì)算機(jī)的大容量存儲、快速處理和便捷的人機(jī)交互能力,構(gòu)建一種可為使用者實(shí)時(shí)推薦句型以及相關(guān)例句信息的基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng),面向造句這個(gè)寫作的核心活動(dòng)為人們提供幫助,填補(bǔ)基 于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng)的技術(shù)空白。


圖1是本發(fā)明的系統(tǒng)組成示意圖,各組成裝置的作用和相互關(guān)聯(lián)關(guān)系參見以上發(fā)明內(nèi)容的技術(shù)方案。圖2是本發(fā)明實(shí)施例的系統(tǒng)組成示意圖,是圖1所示系統(tǒng)的一種應(yīng)用實(shí)例,詳見實(shí)施例說明。圖3是本發(fā)明實(shí)施例的處理流程簡圖,詳見實(shí)施例說明。圖4a、圖4b、圖4c是本發(fā)明實(shí)施例的顯示界面示意圖,各窗口在系統(tǒng)運(yùn)行中的交互功能參見實(shí)施例說明。圖中40為互聯(lián)網(wǎng)計(jì)算機(jī)終端IB的顯示裝置150的正視圖示意圖;410為安裝在40上的LED顯示屏;411為410上顯示的文字編輯窗口 ;412為410上顯示的目標(biāo)句子關(guān)鍵信息輸入提示窗口,包括待輸入的關(guān)鍵詞的指定語法功能及其輸入框,以及下拉菜單式句型選擇輸入框;413為410上顯示的句型檢索結(jié)果推薦窗口,包括句型信息、例句框和例句對應(yīng)的鏈接標(biāo)志414為410上鏈接顯示例句上下文的窗口。411窗口與412、413、414窗口同時(shí)顯示在一個(gè)顯示屏幕上,可以在各窗口間相互切換操作。
具體實(shí)施例方式實(shí)施例基于語料庫的計(jì)算機(jī)輔助寫作在線系統(tǒng)實(shí)施方案1.系統(tǒng)構(gòu)成基于語料庫的計(jì)算機(jī)輔助寫作在線系統(tǒng)由服務(wù)器IA和互聯(lián)網(wǎng)計(jì)算機(jī)終端IB組成,以B/S架構(gòu)運(yùn)行于互聯(lián)網(wǎng)平臺,使用者通過互聯(lián)網(wǎng)平臺實(shí)現(xiàn)在線輔助寫作活動(dòng)。系統(tǒng)構(gòu)成如圖2,系統(tǒng)由處于網(wǎng)絡(luò)不同位置的服務(wù)器IA和互聯(lián)網(wǎng)計(jì)算機(jī)終端IB以及互聯(lián)網(wǎng)設(shè)施160組成。與圖1相比較,圖1中的連接裝置161和連接裝置162在本實(shí)施方案中等效為互聯(lián)網(wǎng)設(shè)施160,利用互聯(lián)網(wǎng)計(jì)算機(jī)終端IB的輸入功能部件作為本實(shí)施例系統(tǒng)輸入裝置140,利用互聯(lián)網(wǎng)計(jì)算機(jī)終端IB的顯示功能部件作為本實(shí)施例系統(tǒng)顯示裝置150,利用服務(wù)器IA的相應(yīng)功能模塊代為行使本實(shí)施例系統(tǒng)如圖1所示除輸入裝置140、顯示裝置150、連接裝置161、162以外的各功能裝置的功能。各功能模塊或部件的構(gòu)成和作用如下控制程序存儲模塊110,為服務(wù)器IA上一程序存儲區(qū),用以存儲本系統(tǒng)的控制程序,供本系統(tǒng)運(yùn)行控制之用;語料庫模塊120,為服務(wù)器IA上一程序存儲區(qū),用以存儲較大規(guī)模的已對詞語的詞性、詞語的語法功能和句子的句型進(jìn)行標(biāo)注的語料信息,供本系統(tǒng)以使用者輸入的關(guān)鍵信息為檢索要素進(jìn)行檢索,得到候選的參考句子及其句型信息;過程信息暫存模塊130,為服務(wù)器IA上一可讀寫存儲區(qū),用以暫存本系統(tǒng)信息處理過程中產(chǎn)生的中間過程信息;輸入部件140,為互聯(lián)網(wǎng)計(jì)算機(jī)終端IB上的觸控屏,用于使用者輸入所期望的目標(biāo)句子的關(guān)鍵信息或操作指令;其中輸入的關(guān)鍵信息包括目標(biāo)句子的部分具有指定語法功能的關(guān)鍵詞,或選擇目標(biāo)句子的一種句型;輸入界面提示的多種指定語法功能的關(guān)鍵詞不一定要求全輸入,可以部分缺省,句型選擇也可以缺省。當(dāng)不選擇句型信息時(shí),至少輸入兩個(gè)及兩個(gè)以上關(guān)鍵詞;當(dāng)選擇句型信息時(shí),至少輸入一個(gè)關(guān)鍵詞,對語料庫進(jìn)行檢索后可以按使用者指定的句型推薦參考例句;顯示部件150,為互聯(lián)網(wǎng)計(jì)算機(jī)終端IB上的觸控屏(顯示屏),用以顯示本系統(tǒng)的用戶界面信息、操作提示信息、推薦的檢索結(jié)果及其它信息;互聯(lián)網(wǎng)或移動(dòng)互聯(lián)網(wǎng)傳輸設(shè)施160等效于如圖1所示的連接裝置161和162 ;處理與控制模塊170,為服務(wù)器IA內(nèi)中心處理/控制器及其連接接口等配套單元組成,用以執(zhí)行本系統(tǒng)的運(yùn)行程序,進(jìn)行計(jì)算和處理操作,實(shí)現(xiàn)輔助寫作過程的檢索和處理,以得到供推薦的參考句子及參考句型信息;模塊170在運(yùn)行過程中向本系統(tǒng)內(nèi)各模塊和部件發(fā)出控制信號或采集狀態(tài)信息。上述連接成一個(gè)系統(tǒng)的各模塊或部件之間的相互作用與配合關(guān)系是IA上的處理與控制模塊170根據(jù)來自控制程序存儲模塊110的控制程序和經(jīng)互聯(lián)網(wǎng)傳來的來自互聯(lián)網(wǎng)終端IB上輸入部件140的使用者操作指令信息,對本系統(tǒng)運(yùn)行過程涉及的系統(tǒng)內(nèi)各模塊和部件發(fā)出控制指令或采集狀態(tài)信息;1A上處理與控制模塊170根據(jù)來自控制程序存儲模塊110的控制程序在IB上顯示部件150顯示輸入提示信息,提示使用者在輸入部件140輸入所期望的目標(biāo)句子的關(guān)鍵信息,經(jīng)互聯(lián)網(wǎng)傳送給IA上處理與控制模塊170作為檢索要素,在對IA上語料庫模塊120存放的語料信息進(jìn)行以句子為輸出單位的檢索后,對檢索結(jié)果進(jìn)行進(jìn)一步分析處理,這些過程中產(chǎn)生的中間過程集合暫存于IA上過程信息暫存模塊130中,所得到的可推薦給使用者選用的參考句子集合及參考句子對應(yīng)的句型信息,經(jīng)互聯(lián)網(wǎng)送往IB上顯示部件150按句型推薦規(guī)則進(jìn)行顯示,供使用者選用。2.系統(tǒng)處理流程系統(tǒng)的處理流程簡圖如圖3所示。系統(tǒng)軟件啟動(dòng)后,系統(tǒng)自動(dòng)選擇句型推薦規(guī)則模式統(tǒng)計(jì)語料庫搜索結(jié)果中具有相同句型的句子數(shù)量統(tǒng)計(jì)值,按統(tǒng)計(jì)值由大到小排列句型優(yōu)先順序(步驟310)。由使用者通過輸入界面輸入啟動(dòng)句型推薦流程的指令(步驟320);系統(tǒng)先在顯示界面上顯示輸入關(guān)鍵信息的語法功能要求和輸入位置,以及句型選擇下拉菜單框(見圖4a)(步驟321);使用者按照提示輸入關(guān)鍵信息,例如輸入主語“見義勇為者”、謂詞“攙扶”、賓語“傷者”,或者輸入主語“見義勇為者”并在下拉菜單中選擇SVO句型(步驟322);系統(tǒng)根據(jù)使用者輸入的關(guān)鍵信息確定搜索策略,例如選定全要素布爾檢索表達(dá)式為(見義勇為者and攙and傷者)(步驟323);采用以上搜素策略對語料庫進(jìn)行檢索,例如得到若干同時(shí)含有“見義勇為者”、“攙”、“傷者”的句子(步驟324);由于語料庫是經(jīng)標(biāo)注的熟語料庫,可以將關(guān)鍵詞在句子中的實(shí)際語法功能與輸入的語法功能信息對比以判定句子是否符合推薦要求(步驟325);根據(jù)檢索得到的句子的句型標(biāo)注信息,對不同句型的句子分類,并進(jìn)行統(tǒng)計(jì),得到統(tǒng)計(jì)值(步驟326);根據(jù)統(tǒng)計(jì)值大小順序填寫句型推薦優(yōu)先順序表,排定推薦順序(步驟327);按句型推薦優(yōu)先順序表逐項(xiàng)顯示句型格式和對應(yīng)的部分句子,以及與句子對應(yīng)的鏈接標(biāo)志,顯示策略有利于區(qū)別推薦順序,例如用數(shù)字序列標(biāo)示優(yōu)先順序(見圖4b)(步驟328);接下來,系統(tǒng)不斷檢測輸入界面有無使用者輸入的信息或指令,并在有輸入時(shí)判定信息或指令類型(步驟330);當(dāng)使用者點(diǎn)擊顯示界面上的某一個(gè)句子對應(yīng)的鏈接標(biāo)志時(shí),系統(tǒng)根據(jù)該鏈接所附著的地址搜索對應(yīng)該句子的上下文(步驟331 ),并顯示給使用者(見圖4c)(步驟332),然后重新監(jiān)測使用者的輸入指令(步驟333),并在得到“返回”指令后返回步驟328;當(dāng)使用者點(diǎn)擊顯示界面上的“退出”軟鍵時(shí),系統(tǒng)結(jié)束句型推薦流程(步驟340)。
權(quán)利要求
1.一種基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng),其特征在于,該系統(tǒng)(以下或稱本系統(tǒng))基于以下多個(gè)裝置實(shí)現(xiàn)輔助寫作功能,即根據(jù)使用者輸入的所期望的目標(biāo)句子的關(guān)鍵信息,向使用者推薦目標(biāo)句子的參考句型及例句供選用參考: 1)控制程序存儲裝置,用以存儲本系統(tǒng)的控制程序,供本系統(tǒng)運(yùn)行控制之用; 2)語料庫裝置,用以存儲較大規(guī)模的已對詞語和句子進(jìn)行語法信息標(biāo)注的語料信息,供本系統(tǒng)以使用者輸入的關(guān)鍵信息為檢索要素進(jìn)行檢索,得到候選的供推薦的參考句子及其句法信息;其中所標(biāo)注的語法信息至少包括句法信息; 3)過程信息暫存裝置,用以暫存本系統(tǒng)信息處理過程中產(chǎn)生的中間過程信息; 4)輸入裝置,用于使用者輸入所期望的目標(biāo)句子的關(guān)鍵信息或操作指令;其中輸入的關(guān)鍵信息至少包括下述信息之一類:目標(biāo)句子的關(guān)鍵詞、目標(biāo)句子關(guān)鍵詞的語法信息、目標(biāo)句子的句法信息; 5)顯示裝置,用以顯示本系統(tǒng)的用戶界面信息、操作提示信息、推薦的檢索結(jié)果及其它信息; 6)連接裝置,用以在輸入裝置和處理與控制裝置之間傳輸信號和信息;或用以在顯示裝置和處理與控制裝置之間傳輸信號和信息; 7)處理與控制裝置,用以執(zhí)行本系統(tǒng)的運(yùn)行程序,實(shí)現(xiàn)輔助寫作過程的檢索和處理,以得到供推薦的參考句子及參考句型信息;在運(yùn)行過程中向本系統(tǒng)內(nèi)各裝置發(fā)出控制信號或采集狀態(tài)信息; 上述連接成一個(gè)系統(tǒng)的各裝置之間的相互作用與配合關(guān)系是:處理與控制裝置根據(jù)來自控制程序存儲裝置的控制程序和經(jīng)連接裝置傳來的來自輸入裝置的使用者操作指令信息,對本系統(tǒng)運(yùn)行過程涉及的系統(tǒng)內(nèi)各裝置發(fā)出控制指令或采集狀態(tài)信息;處理與控制裝置根據(jù)來自控制程序存儲裝置的控制程序在顯示界面顯示輸入提示信息,提示使用者在輸入裝置輸入所期望的目標(biāo)句子的關(guān)鍵信息,經(jīng)連接裝置傳送給處理與控制裝置作為檢索要素,在對語料庫裝置存放的語料信息進(jìn)行以句子為輸出單位的檢索后,對檢索結(jié)果進(jìn)行進(jìn)一步分析處理,這些過程中產(chǎn)生的中間過程集合暫存于過程信息暫存裝置中,所得到的可推薦給使用者選用的參考句子集合及參考句子對應(yīng)的句型信息,經(jīng)連接裝置送往顯示裝置按句型推薦規(guī)則進(jìn)行顯示,供使用者選用。
2.如權(quán)利要求1所述基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng),其特征在于,上述顯示裝置之界面上的輸入提示信息標(biāo)明需輸入的關(guān)鍵詞的語法或句法功能信息(例如主語、謂詞等)及其輸入位置。
3.如權(quán)利要求1或權(quán)利要求2所述基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng),其特征在于,上述處理與控制裝置根據(jù)使用者按顯示裝置的提示通過輸入裝置輸入不少于兩個(gè)具有指定語法或句法功能的關(guān)鍵詞,針對語料庫存儲的所有句子執(zhí)行以全部輸入的關(guān)鍵詞為檢索要素的全要素布爾檢索過程,檢索得到的包含全部關(guān)鍵詞的句子作為候選參考句子供進(jìn)一步處理。
4.如權(quán)利要求1所述基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng),其特征在于,系統(tǒng)按照程序設(shè)定的或程序運(yùn)行前由使用者通過界面選定的句型推薦優(yōu)先規(guī)則,在顯示界面上按句型歸類顯示檢索得到的部分或全部參考句子集合;系統(tǒng)根據(jù)句型推薦優(yōu)先規(guī)則規(guī)定的句型優(yōu)先順序,采用界面顯示策略有區(qū)別地顯示各推薦句型及對應(yīng)的句子;上述界面顯示策略至少包括下列策略之一:用數(shù)字或字母序列標(biāo)明推薦內(nèi)容優(yōu)先順序、優(yōu)先推薦的內(nèi)容安排在更利于吸引使用者目光的屏幕區(qū)域、對優(yōu)先推薦的內(nèi)容相關(guān)的顯示界面的文字、圖形、圖像等施加強(qiáng)調(diào)效果。
5.如權(quán)利要求1或權(quán)利要求4所述基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng),其特征在于,該句型推薦優(yōu)先規(guī)則的優(yōu)先順序排定準(zhǔn)則為:依據(jù)對檢索得到的候選參考句子集合中各句型類別對應(yīng)的句子數(shù)量的統(tǒng)計(jì)值由大到小排列。
6.如權(quán)利要求1所述基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng),其特征在于,顯示裝置上的推薦信息顯示界面上與每一推薦句子相對應(yīng)設(shè)置鏈接標(biāo)志,通過操作該鏈接標(biāo)志可鏈接至該推薦句子所對應(yīng)的上下文信息或所在的語篇。
7.如權(quán)利要求1所述基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng),其特征在于,本系統(tǒng)在顯示裝置上顯示的操作窗口與計(jì)算機(jī)的文字編輯窗口可同時(shí)同屏顯示,便于在輔助寫作、文章修改或輔助翻譯過程中隨時(shí)相互切換使用,起到便于使用者使用的輔助寫作工具的作用;文字編輯窗口至少是如下形式的窗口之一:文本編輯窗口、網(wǎng)絡(luò)瀏覽器窗口、短信編輯窗口、彩信編輯窗口、電子郵件編輯窗口、博客編輯窗口、微博編輯窗口、網(wǎng)絡(luò)論壇窗口、網(wǎng)絡(luò)社區(qū)窗口。
8.如權(quán)利要求1所述基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng),其特征在于,本系統(tǒng)所含各裝置構(gòu)成單機(jī)型計(jì)算機(jī)輔助寫作裝置的功能硬件主體,上述連接輸入裝置的連接裝置與連接顯示裝置的連接裝置均等效為該單機(jī)型計(jì)算機(jī)輔助寫作裝置內(nèi)部的連接電路。
9.如權(quán)利要求1所述基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng),其特征在于,本系統(tǒng)運(yùn)行于互聯(lián)網(wǎng)平臺,利用互聯(lián)網(wǎng)計(jì)算機(jī)終端的輸入功能部件作為本系統(tǒng)輸入裝置,利用互聯(lián)網(wǎng)計(jì)算機(jī)終端的顯示功能部件作為本系 統(tǒng)顯示裝置,利用接入互聯(lián)網(wǎng)的服務(wù)器的相應(yīng)功能模塊代為行使本系統(tǒng)除輸入裝置、顯示裝置和連接裝置以外的各功能裝置的功能;這種應(yīng)用形式下,本系統(tǒng)的連接裝置與互聯(lián)網(wǎng)傳輸設(shè)施等效,連接輸入裝置的連接裝置與連接顯示裝置的連接裝置合用互聯(lián)網(wǎng)接入鏈路接入互聯(lián)網(wǎng),并通過互聯(lián)網(wǎng)連接到遠(yuǎn)端服務(wù)器。
10.如權(quán)利要求1所述基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng),其特征在于,上述顯示裝置顯示的用戶界面文字信息至少屬于下列一種語言系統(tǒng):漢語、日語、韓語、英語、法語、西班牙語、德語、俄語、意大利語。
全文摘要
本發(fā)明針對日益凸顯的計(jì)算機(jī)輔助寫作需求,引入語料庫和語料庫技術(shù)以彌補(bǔ)人們的信息視野、信息處理和反應(yīng)速度等能力的不足夠,利用計(jì)算機(jī)的大容量存儲、快速處理和便捷的人機(jī)交互能力,構(gòu)建一種基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng),通過人機(jī)交互形式為使用者實(shí)時(shí)推薦來源于真實(shí)語料庫的句型和例句,面向造句這個(gè)寫作的核心活動(dòng)為人們提供幫助,填補(bǔ)基于語料庫的計(jì)算機(jī)輔助寫作系統(tǒng)的技術(shù)空白。本發(fā)明由控制程序存儲裝置、語料庫裝置、過程信息暫存裝置、輸入裝置、顯示裝置、連接裝置、處理與控制裝置組成,通過它們之間相互作用與配合,實(shí)現(xiàn)為使用者實(shí)時(shí)推薦句型以及相關(guān)例句信息的輔助寫作功能。
文檔編號G06F17/21GK103077158SQ20131005364
公開日2013年5月1日 申請日期2013年2月19日 優(yōu)先權(quán)日2013年2月19日
發(fā)明者吳志超 申請人:吳志超
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
周宁县| 马龙县| 济阳县| 枣阳市| 福泉市| 西平县| 巢湖市| 田阳县| 合水县| 包头市| 竹山县| 德州市| 东阿县| 五河县| 武夷山市| 唐河县| 昭通市| 祁连县| 吴桥县| 阳西县| 桑日县| 获嘉县| 维西| 宁国市| 张家界市| 平定县| 汝城县| 荆门市| 平邑县| 谷城县| 德惠市| 大宁县| 泾阳县| 布拖县| 南昌市| 海口市| 兴城市| 枞阳县| 沙洋县| 孙吴县| 桐庐县|