本公開的實施例總體涉及數(shù)據(jù)處理領(lǐng)域,具體涉及用于處理生成內(nèi)容的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品。
背景技術(shù):
1、目前,機器學習行業(yè)的發(fā)展變得越來越快速。越來越多的不同類型的機器學習模型也應(yīng)運而生,并被廣泛應(yīng)用于不同的行業(yè)、不同的領(lǐng)域當中。例如,視覺相關(guān)的模型可以被應(yīng)用于視覺檢測領(lǐng)域、智能駕駛領(lǐng)域等,語言相關(guān)的模型可以被應(yīng)用于文本處理領(lǐng)域、知識問答領(lǐng)域等,還有將各類不同側(cè)重點的模型進行綜合整合而形成的多模態(tài)機器學習模型,可以被用于更為復雜的、串聯(lián)多個不同領(lǐng)域的作業(yè)當中。
2、隨著機器學習產(chǎn)業(yè)的加速發(fā)展,與機器學習相關(guān)的新技術(shù)層出不窮,機器學習模型的應(yīng)用場景也變得越來越多。尤其在文本處理領(lǐng)域,機器學習模型的應(yīng)用也變得越來越廣泛。在處理數(shù)據(jù)時,如何應(yīng)用機器學習模型以及更加高效地應(yīng)用機器學習模型也有越來越多的討論,對于大量的數(shù)據(jù),在處理的時候應(yīng)用機器學習模型也會遇到不小的挑戰(zhàn)。因此,在面對海量的數(shù)據(jù)時,如何靈活地、高效地使用機器學習模型來處理相關(guān)的數(shù)據(jù)處理任務(wù)成為了當下熱門的研究話題。
技術(shù)實現(xiàn)思路
1、本公開的實施例提供了一種用于處理生成內(nèi)容的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品。
2、根據(jù)本公開的第一方面,提供了一種用于處理生成內(nèi)容的方法。該方法包括基于用戶的輸入內(nèi)容,生成與輸入內(nèi)容相對應(yīng)的多個候選生成內(nèi)容。該方法還包括利用第一相似度算法從多個候選生成內(nèi)容中確定出與輸入內(nèi)容不相似一組候選生成內(nèi)容,輸入內(nèi)容與一組候選生成內(nèi)容中的候選生成內(nèi)容的第一相似度小于第一閾值相似度。該方法還包括利用第二相似度算法確定輸入內(nèi)容與一組候選生成內(nèi)容中的候選生成內(nèi)容的第二相似度。該方法還包括基于第一相似度和第二相似度,確定針對候選生成內(nèi)容的組合相似度。該方法還包括基于組合相似度,從一組候選生成內(nèi)容中確定一組目標生成內(nèi)容,一組目標生成內(nèi)容中的目標生成內(nèi)容與輸入內(nèi)容的組合相似度小于第二閾值相似度。
3、在本公開的第二方面中,提供了一種用于處理生成內(nèi)容的裝置。該裝置包括多個候選生成內(nèi)容生成模塊,被配置為基于用戶的輸入內(nèi)容,生成與輸入內(nèi)容相對應(yīng)的多個候選生成內(nèi)容;一組候選生成內(nèi)容確定模塊,被配置為利用第一相似度算法從多個候選生成內(nèi)容中確定出與輸入內(nèi)容不相似一組候選生成內(nèi)容,輸入內(nèi)容與一組候選生成內(nèi)容中的候選生成內(nèi)容的第一相似度小于第一閾值相似度;相似度確定模塊,被配置為利用第二相似度算法確定輸入內(nèi)容與一組候選生成內(nèi)容中的候選生成內(nèi)容的第二相似度;組合相似度確定模塊,被配置為基于第一相似度和第二相似度,確定針對候選生成內(nèi)容的組合相似度;以及一組目標生成內(nèi)容確定模塊,被配置為基于組合相似度,從一組候選生成內(nèi)容中確定一組目標生成內(nèi)容,一組目標生成內(nèi)容中的目標生成內(nèi)容與輸入內(nèi)容的組合相似度小于第二閾值相似度。
4、在本公開的第三方面中,提供了一種電子設(shè)備,包括至少一個處理器;以及存儲裝置,用于存儲至少一個程序,當至少一個程序被至少一個處理器執(zhí)行,使得至少一個處理器實現(xiàn)根據(jù)本公開的第一方面的方法。
5、在本公開的第四方面中,提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)根據(jù)本公開的第一方面的方法。
6、在本公開的第五方面中,提供了一種計算機程序產(chǎn)品。該計算機程序產(chǎn)品包括計算機程序,該計算機程序在被處理器執(zhí)行時實現(xiàn)根據(jù)本公開的第一方面的方法。
7、應(yīng)當理解,該內(nèi)容部分中所描述的內(nèi)容并非旨在限定本公開的實施例的關(guān)鍵或重要特征,亦非用于限制本公開的范圍。本公開的其它特征將通過以下的描述變得容易理解。
1.一種用于處理生成內(nèi)容的方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中利用第一相似度算法從所述多個候選生成內(nèi)容中確定出與所述輸入內(nèi)容不相似一組候選生成內(nèi)容包括:
3.根據(jù)權(quán)利要求2所述的方法,其中所述輸入內(nèi)容是輸入文本,所述多個候選生成內(nèi)容是多個候選生成文本,所述一組候選生成內(nèi)容是一組候選生成文本,并且利用所述第一相似度算法計算所述輸入內(nèi)容與所述多個候選生成內(nèi)容的多個相似度包括:
4.根據(jù)權(quán)利要求3所述的方法,其中利用第二相似度算法確定所述輸入內(nèi)容與所述一組候選生成內(nèi)容中的所述候選生成內(nèi)容的第二相似度包括:
5.根據(jù)權(quán)利要求4所述的方法,其中所述第二文本相似度算法是字粒度相似度算法,所述第三文本相似度算法是詞粒度相似度算法。
6.根據(jù)權(quán)利要求4所述的方法,其中基于所述第一文本相似度、所述第二文本相似度和所述第三文本相似度,確定針對所述候選生成文本的組合相似度包括:
7.根據(jù)權(quán)利要求1所述的方法,其中從所述一組候選生成內(nèi)容中確定一組目標生成內(nèi)容包括:
8.根據(jù)權(quán)利要求7所述的方法,其中通過對所述一組候選生成內(nèi)容進行過濾來生成所述一組目標生成內(nèi)容包括:
9.根據(jù)權(quán)利要求7所述的方法,還包括:
10.根據(jù)權(quán)利要求1所述的方法,其中生成與所述輸入內(nèi)容相對應(yīng)的多個候選生成內(nèi)容包括:
11.根據(jù)權(quán)利要求1所述的方法,其中所述輸入內(nèi)容是音頻或者圖像中的一種,并且利用第一相似度算法從所述多個候選生成內(nèi)容中確定出與所述輸入內(nèi)容不相似一組候選生成內(nèi)容包括:
12.根據(jù)權(quán)利要求11所述的方法,其中所述第一相似度算法是分層可導航小世界圖算法。
13.根據(jù)權(quán)利要求12所述的方法,其中所述輸入內(nèi)容是圖像,所述第二相似度算法是分層可導航小世界圖算法,針對第一相似度算法的所述候選生成內(nèi)容的量化表示的第一維度小于針對第二相似度算法的所述候選生成內(nèi)容的量化表示的第二維度。
14.根據(jù)權(quán)利要求12所述的方法,其中所述輸入內(nèi)容是音頻,所述第二相似度算法包括梅爾頻譜系數(shù)特征匹配和動態(tài)時間規(guī)整。
15.一種用于處理生成內(nèi)容的裝置,包括:
16.一種電子設(shè)備,包括:
17.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序在被處理器執(zhí)行時實現(xiàn)根據(jù)權(quán)利要求1-14中任一項所述的方法。
18.一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序在被處理器執(zhí)行時實現(xiàn)根據(jù)權(quán)利要求1-14中的任一項所述的方法。