欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

智能終端及其應用程序的自動分類方法與流程

文檔序號:11917543閱讀:333來源:國知局
智能終端及其應用程序的自動分類方法與流程

本發(fā)明涉及智能電子設備技術領域,具體涉及一種智能終端及其應用程序的自動分類方法。



背景技術:

隨著電子技術的快速發(fā)展以及智能終端的大規(guī)模普及應用,可被智能終端安裝的應用程序達到了百億量級,因此如何對所要下載及安裝的應用程序進行有效的分類與管理顯得越來越重要。當前市場上的應用程序分類方法一般是基于云端服務器的大數(shù)據(jù)支持,或者將這部分大數(shù)據(jù)內置于智能終端。不過這類方法運算量大,維護復雜,可移植性較弱。



技術實現(xiàn)要素:

鑒于此,本發(fā)明實施例提供一種智能終端及其應用程序的自動分類方法,無需依賴于云端服務器的大數(shù)據(jù)支持,也無需將這部分大數(shù)據(jù)內置于智能終端,維護簡單,可移植性較強,且分類結果準確。

本發(fā)明一實施例的應用程序的自動分類方法,包括:從已劃分為至少兩個分類的多個應用程序的配置文件中提取有效特征;計算每個有效特征在各個分類中出現(xiàn)的概率;根據(jù)每個有效特征在各個分類中出現(xiàn)的概率以及樸素貝葉斯算法訓練生成樸素貝葉斯分類器;從待分類的應用程序的配置文件中提取特征,并計算特征在各個分類中出現(xiàn)的概率;將特征在各個分類中出現(xiàn)的概率作為樸素貝葉斯分類器的輸入?yún)?shù),以得到在具有所述特征時待分類的應用程序為各個分類的概率中最大的一個,從而將待分類的應用程序劃分為概率最大的分類。

可選地,所述從已分類的多個應用程序的配置文件中提取有效特征的步驟,包括:從已分類的多個應用程序的配置文件中提取初始特征;獲取每個分類中正向概率與逆向概率比值最大的初始特征,并將所述比值最大的初始特征作為有效特征。

可選地,所述初始特征的語種包括多類語種中的至少一類。

可選地,所述從待分類的應用程序的配置文件中提取特征的步驟,包括:對待分類的應用程序的配置文件進行語種識別,并對識別出的同一語種采用相同特征提取方法以得到特征。

可選地,所述根據(jù)每個有效特征在各個分類中出現(xiàn)的概率以及樸素貝葉斯算法訓練生成樸素貝葉斯分類器的步驟,包括:將每個有效特征在各個分類中出現(xiàn)的概率轉變?yōu)閷?shù)形式;所述得到在具有所述特征時待分類的應用程序為各個分類的概率中最大的一個的步驟,包括:獲取對數(shù)形式的特征在各個分類中出現(xiàn)的概率;將對數(shù)形式的特征在各個分類中出現(xiàn)的概率相加,并比較得到相加之和最大的一個。

本發(fā)明一實施例的智能終端,包括:提取模塊,用于從已劃分為至少兩個分類的多個應用程序的配置文件中提取有效特征;計算模塊,用于計算每個有效特征在各個分類中出現(xiàn)的概率;訓練生成模塊,用于根據(jù)每個有效特征在各個分類中出現(xiàn)的概率以及樸素貝葉斯算法訓練生成樸素貝葉斯分類器;提取模塊還用于從待分類的應用程序的配置文件中提取特征,計算模塊還用于計算所述特征在各個分類中出現(xiàn)的概率;應用管理模塊,用于將所述特征在各個分類中出現(xiàn)的概率作為樸素貝葉斯分類器的輸入?yún)?shù),以得到在具有所述特征時待分類的應用程序為各個分類的概率中最大的一個,從而將待分類的應用程序劃分為概率最大的分類。

可選地,提取模塊從已分類的多個應用程序的配置文件中提取初始特征,并獲取每個分類中正向概率與逆向概率比值最大的初始特征,從而將所述比值最大的初始特征作為有效特征。

可選地,所述初始特征的語種包括多類語種中的至少一類。

可選地,提取模塊包括語言識別單元,用于對待分類的應用程序的配置文件進行語種識別,所述提取模塊對識別出的同一語種采用相同特征提取方法以得到特征。

可選地,訓練生成模塊將每個有效特征在各個分類中出現(xiàn)的概率轉變?yōu)閷?shù)形式;應用管理模塊獲取對數(shù)形式的所述特征在各個分類中出現(xiàn)的概率,并將對數(shù)形式的特征在各個分類中出現(xiàn)的概率相加,比較得到相加之和最大的一個,從而得到在具有所述特征時待分類的應用程序為各個分類的概率中最大的一個。

有益效果:本發(fā)明實施例只需采樣智能終端中多個應用程序的配置文件的特征,并結合樸素貝葉斯算法即可對待分類的應用程序進行分類,無需依賴于云端服務器的大數(shù)據(jù)支持,也無需將這部分大數(shù)據(jù)內置于智能終端,并且可表現(xiàn)為純軟件算法實現(xiàn)分類,維護簡單,可移植性較強,且分類結果準確。

附圖說明

圖1是本發(fā)明的應用程序的自動分類方法一實施例的流程圖;

圖2是本發(fā)明的有效特征的提取方法一實施例的流程圖;

圖3是本發(fā)明的初始特征的提取方法一實施例的流程圖;

圖4是本發(fā)明的有效特征在分類中出現(xiàn)的概率的獲取方法一實施例的流程圖;

圖5是本發(fā)明訓練生成樸素貝葉斯分類器方法一實施例的流程圖;

圖6是本發(fā)明的未知應用程序的分類識別方法一實施例的流程圖;

圖7是本發(fā)明的應用程序的自動分類方法另一實施例的流程圖;

圖8是本發(fā)明的智能終端一實施例的原理框示意圖;

圖9是本發(fā)明的智能終端一實施例的硬件結構示意圖。

具體實施方式

下面將結合本發(fā)明實施例中的附圖,對本發(fā)明所提供的各個示例性的實施例的技術方案進行清楚、完整地描述。在不沖突的情況下,下述各個實施例以及實施例中的特征可以相互組合。

請參閱圖1,為本發(fā)明一實施例的應用程序的自動分類方法。所述應用程序的自動分類方法可以包括步驟S11~S15。

S11:從已劃分為至少兩個分類的多個應用程序的配置文件中提取有效特征。

S12:計算每個有效特征在各個分類中出現(xiàn)的概率。

S13:根據(jù)每個有效特征在各個分類中出現(xiàn)的概率以及樸素貝葉斯算法訓練生成樸素貝葉斯分類器。

S14:從待分類的應用程序的配置文件中提取特征,并計算特征在各個分類中出現(xiàn)的概率。

S15:將特征在各個分類中出現(xiàn)的概率作為樸素貝葉斯分類器的輸入?yún)?shù),以得到在具有所述特征時待分類的應用程序為各個分類的概率中最大的一個,從而將待分類的應用程序劃分為概率最大的分類。

本發(fā)明實施例相當于為智能終端增加了一項未知應用程序自動分類的功能,所述未知應用程序可理解為從互聯(lián)網(wǎng)上下載及所要安裝的應用程序。在現(xiàn)實應用場景中,實現(xiàn)該功能的方式包括但不限于:以智能手機為例,首先,預先編程一腳本或程序,以在智能手機的設置界面中增加“未知應用程序自動分類”選項;然后,用戶通過滑動滑塊開啟該選項。也就是說,本發(fā)明實施例可以通過能夠在智能終端的操作系統(tǒng)上運行的腳本或程序自動進行上述步驟S11~S15。

上述方法可以分為三個階段:第一階段,建立特征庫,包括步驟S11和S12;第二階段,訓練生成樸素貝葉斯分類器,包括步驟S13;第三階段,識別未知應用程序的分類,包括步驟S14和S15。

第一階段

本實施例可以從多個應用程序的配置文件中提取有效特征。參閱圖2,提取有效特征的方法可以包括步驟S21和S22。

S21:從已分類的多個應用程序的配置文件中提取初始特征。

所述已分類的多個應用程序包括但不限于PMS(Plant Management System,設備管理系統(tǒng))獲取的終端已經(jīng)下載及安裝的應用程序,這些應用程序可視為已知分類的應用程序。

所述配置文件中包含有各個應用程序的ID(Identification,身份標識號)信息,例如labelRes(應用名地址)、descriptionRes(應用描述信息地址),從中獲取應用程序的基準地址(又稱首地址),并將其作為有效地址。而對于未能從ID中獲取基準地址的情況,終端可以根據(jù)操作系統(tǒng)地址規(guī)則遍歷該應用程序可能的地址,從而獲取有效地址。

所述有效地址實際上就是一段字符串,終端提取其中的字符以作為初始特征。在提取過程中,終端可以對不同語種采用相對應的提取方法。具體地,終端可以采用ASCII(American Standard Code for Information Interchange,美國信息交換標準代碼)識別英語與其他語種的區(qū)別,以此篩選出配置文件中相同語種的有效地址。而后,針對不同語種使用不同的分詞算法,分詞后即可得到所述初始特征。也就是說,本實施例的初始特征的語種包括多類語種中的至少一類。

請結合圖3,為本發(fā)明的提取初始特征一具體應用例,該具體應用實現(xiàn)本發(fā)明前述實施例的整個過程,在此不作贅述。

S22:獲取每個分類中正向概率與逆向概率比值最大的初始特征,并將所述比值最大的初始特征作為有效特征。

鑒于采樣的為已知分類的多個應用程序,即多個應用程序已經(jīng)提前分類,本實施例可以建立多個文件夾,各個文件夾的命名為應用程序的包名,并建立多個文件夾與各個分類的一一映射關系。

對于通過分詞算法得到的初始特征(字符串),本實施例計算每個分類的應用程序擁有某一初始特征的概率,即每個有效特征在各個分類中出現(xiàn)的概率,以作為該初始特征的正向概率,并且,計算不是該分類的應用程序擁有該初始特征的概率,以作為該初始特征的逆向概率。舉例而言,以分類為Music的應用程序、初始特征為song為例,正向概率可理解為分類Music中擁有字符song的概率,逆向概率可理解為除分類Music之外的分類中擁有字符song的概率。正向概率和逆向概率是統(tǒng)計學領域普遍采用的概率統(tǒng)計方式,其計算原理及過程可參閱現(xiàn)有技術,此處不予以贅述。

進一步,對于各個分類中的各個初始特征,本實施例計算每一初始特征的正向概率與逆向概率的比值,并選取其中比值最大的初始特征作為該分類的有效特征。此步驟能夠避免某一字符串作為有效特征在多個分類中重復出現(xiàn),以減少后續(xù)對未知應用程序的分類的影響。

請結合圖4,為本發(fā)明的計算每個有效特征在各個分類中出現(xiàn)的概率一具體應用例。在前述步驟S22之后,該具體應用將每個有效特征的正向概率作為其在各個分類中出現(xiàn)的概率。

第二階段

結合圖5所示,本實施可以以列表形式顯示前述有效特征,以及統(tǒng)計的每個有效特征在各個分類中出現(xiàn)的概率。

結合樸素貝葉斯算法的關系式如下:

P(C│F1F2…Fn)=P(F1F2…Fn│C)*P(C)/P(F1F2…Fn)

P(F1F2…Fn│C)=P(F1│C)*P(F2│C)…P(Fn│C)

結合上述關系式,即可得到如下樸素貝葉斯關系式:

P(C│F1F2…Fn)=P(F1│C)*P(F2│C)…P(Fn│C)*P(C)/P(F1F2…Fn)

其中,F(xiàn)1,F2,…Fn表示各個有效特征,C表示其中一個分類,P(C│F1F2…Fn)表示當一個未知應用程序擁有F1,F2,…Fn這些特征時它是分類C的概率,P(F1F2…Fn│C)表示分類C擁有有效特征F1,F2,…Fn的概率,P(C)表示所有分類中為分類C的概率,P(F1F2…Fn)表示所有分類擁有有效特征F1,F2,…Fn的概率,P(F1│C)表示分類C中擁有有效特征F1的概率,P(F2│C)表示分類C中擁有有效特征F2的概率,P(Fn│C)表示分類C中擁有有效特征Fn的概率。

由于采樣的有效特征較多,且計算得到的上述概率均小于1,上述多個概率相乘會出現(xiàn)尾數(shù)丟失的問題,因此本實施例優(yōu)選將每個有效特征在各個分類中出現(xiàn)的概率轉變?yōu)閷?shù)形式。也就是說,將上述樸素貝葉斯關系式進行對數(shù)轉換,以得到如下對數(shù)關系式:

log(P(C│F1F2…Fn))=log(P(F1│C))+log(P(F2│C))…+log(P(Fn│C))+log(P(C))-log(P(F1F2…Fn))

該對數(shù)關系式即可視為樸素貝葉斯分類器。在該對數(shù)關系式中,多個分類中的各分類的log(P(C))和log(P(F1F2…Fn))相等,因此只需將以對數(shù)形式表示的各個分類中分別擁有有效特征F1,F2,…Fn的概率相加,并比較得到相加之和最大的一個,即可將未知應用程序劃分為相加之和最大的分類。換言之,通過該關系式,本實施例可以得到在擁有有效特征F1,F2,…Fn時未知應用程序為相加之和最大的分類的正向概率,反言之,將關系式中的分類C換為多個分類中的其他分類,得到不是該相加之和最大的分類擁有有效特征F1,F2,…Fn的概率,即相加之和最大的分類的逆向概率。

第三階段

結合圖6所示,從待分類的應用程序的配置文件中提取特征,所述特征的提取方法與第一階段的初始特征的提取方法相同,例如,首先從配置文件中包含的應用程序的ID信息中提取有效地址,而后對其進行語種識別,最后采用與識別的語種相對應的分詞算法對有效地址的字符串進行分詞,從而得到至少一個特征。進一步地,本階段提取的特征屬于第一階段采樣的有效特征的一部分,通過結合上述有效特征的正向概率即可得到本階段提取的每個特征在各個分類中出現(xiàn)的概率。

如果本階段提取的特征為F1,F3,F6,Fn,多個分類C包括A,B,D,則上述樸素貝葉斯分類器的對數(shù)關系式即可表示為:

log(P(C│F1F3F6Fn))=log(P(F1│C))+log(P(F3│C))+log(P(F6│C))+log(P(Fn│C))+log(P(C))-log(P(F1F3F6Fn))

將已知的特征在各個分類A,B,D中出現(xiàn)的概率log(P(F1│C))、log(P(F3│C))、log(P(F6│C))、log(P(Fn│C)),作為參數(shù)輸入樸素貝葉斯分類器,基于前述中l(wèi)og(P(C))-log(P(F1F2…Fn))相等,因此只需比較log(P(F1│A))+log(P(F3│A))+log(P(F6│A))+log(P(Fn│A))、log(P(F1│B))+log(P(F3│B))+log(P(F6│B))+log(P(Fn│B))、log(P(F1│D))+log(P(F3│D))+log(P(F6│D))+log(P(Fn│D))中最大的一個,即可將待分類的應用程序劃分為該相加之和最大的分類。

請參閱圖7,為本發(fā)明的應用程序的自動分類方法一具體應用例。該應用例實現(xiàn)本發(fā)明前述實施例的整個過程,在此不作贅述。

由上述可知,本發(fā)明實施例只需采樣智能終端中多個應用程序的配置文件的特征,并結合樸素貝葉斯算法即可對待分類的應用程序進行分類,無需依賴于云端服務器的大數(shù)據(jù)支持,也無需將這部分大數(shù)據(jù)內置于智能終端,也可以實現(xiàn)準確分類,維護方便,成本較低,并且可以適用于不同語種,通用性很高,另外上述各個步驟可由純軟件算法實現(xiàn),即通過純軟件算法實現(xiàn)分類,維護簡單,可移植性較強。

應該理解到,上述功能如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可存儲在一個電子設備可讀取存儲介質中,即本發(fā)明實施例可以以軟件產(chǎn)品的形式體現(xiàn)出來,其包括若干指令用以使得一臺智能終端執(zhí)行本發(fā)明各實施例所述方法的全部或部分步驟。

請參閱圖8,為本發(fā)明一實施例的智能終端。所述終端80可以包括提取模塊81、計算模塊82、訓練生成模塊83和應用管理模塊84。提取模塊81用于從已劃分為至少兩個分類的多個應用程序的配置文件中提取有效特征。計算模塊82用于計算每個有效特征在各個分類中出現(xiàn)的概率。訓練生成模塊83用于根據(jù)每個有效特征在各個分類中出現(xiàn)的概率以及樸素貝葉斯算法訓練生成樸素貝葉斯分類器。提取模塊81還用于從待分類的應用程序的配置文件中提取特征。計算模塊82還用于計算所述特征在各個分類中出現(xiàn)的概率。應用管理模塊84用于將所述特征在各個分類中出現(xiàn)的概率作為樸素貝葉斯分類器的輸入?yún)?shù),以得到在具有所述特征時待分類的應用程序為各個分類的概率中最大的一個,從而將待分類的應用程序劃分為概率最大的分類。

為了避免某一字符串作為有效特征在多個分類中重復出現(xiàn),以減少后續(xù)對未知應用程序的分類的影響,所述提取模塊81可以從已分類的多個應用程序的配置文件中提取初始特征,并獲取每個分類中正向概率與逆向概率比值最大的初始特征,從而將所述比值最大的初始特征作為有效特征。

其中,初始特征的語種包括多類語種中的至少一類。提取模塊81可以對不同語種采用相對應的提取方法,具體地,提取模塊81的語言識別單元811對多個應用程序的配置文件進行語種識別,而后提取模塊81采用相對應的分詞算法得到初始特征?;诖?,語言識別單元811可以對待分類的應用程序的配置文件進行語種識別,所述提取模塊81對識別出的同一語種采用相同特征提取方法以得到特征。

由于采樣的有效特征較多,且計算得到的上述概率均小于1,上述多個概率相乘會出現(xiàn)尾數(shù)丟失的問題,因此本實施例優(yōu)選訓練生成模塊83將每個有效特征在各個分類中出現(xiàn)的概率轉變?yōu)閷?shù)形式。對應地,在對未知應用程序進行分類時,應用管理模塊84獲取對數(shù)形式的所述特征在各個分類中出現(xiàn)的概率,并將對數(shù)形式的特征在各個分類中出現(xiàn)的概率相加,比較得到相加之和最大的一個,從而得到在具有所述特征時待分類的應用程序為各個分類的概率中最大的一個。

本發(fā)明實施例的智能終端80的上述模塊對應執(zhí)行上述各個實施例的應用程序的自動分類方法,具有與其相同的技術效果。

應該理解到,上述模塊的劃分為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如兩個模塊可以集成到另一個系統(tǒng)中,或一些特征可以忽略,或不執(zhí)行。另外,模塊相互之間的連接可以通過一些接口,也可以是電性或其它形式。上述模塊既可以采用軟件功能框的形式實現(xiàn),也可以采用例如圖9所示的硬件的形式實現(xiàn)。

參閱圖9,所述智能終端80包括至少一個處理器91、至少一個存儲器92以及至少一個通信總線93,通信總線93用于處理器91調用各種數(shù)據(jù),存儲器92用于存儲程序指令。為了方便說明,圖9所示處理器91、存儲器92以及通信總線93的數(shù)量為一個。

其中,所述處理器91用于:

執(zhí)行程序指令以從已劃分為至少兩個分類的多個應用程序的配置文件中提取有效特征,并計算每個有效特征在各個分類中出現(xiàn)的概率;

執(zhí)行程序指令以根據(jù)每個有效特征在各個分類中出現(xiàn)的概率以及樸素貝葉斯算法訓練生成樸素貝葉斯分類器;

執(zhí)行程序指令以從待分類的應用程序的配置文件中提取特征,并計計算所述特征在各個分類中出現(xiàn)的概率;

執(zhí)行程序指令以將所述特征在各個分類中出現(xiàn)的概率作為樸素貝葉斯分類器的輸入?yún)?shù),以得到在具有所述特征時待分類的應用程序為各個分類的概率中最大的一個,從而將待分類的應用程序劃分為概率最大的分類。

為了避免某一字符串作為有效特征在多個分類中重復出現(xiàn),以減少后續(xù)對未知應用程序的分類的影響,處理器91可以從已分類的多個應用程序的配置文件中提取初始特征,并獲取每個分類中正向概率與逆向概率比值最大的初始特征,從而將比值最大的初始特征作為有效特征。

其中,初始特征的語種包括多類語種中的至少一類。處理器91可以對不同語種采用相對應的提取方法,具體地,處理器91對多個應用程序的配置文件進行語種識別,而后采用相對應的分詞算法得到初始特征?;诖?,處理器91可以對待分類的應用程序的配置文件進行語種識別,并對識別出的同一語種采用相同特征提取方法以得到特征。

由于采樣的有效特征較多,且計算得到的上述概率均小于1,上述多個概率相乘會出現(xiàn)尾數(shù)丟失的問題,因此本實施例優(yōu)選處理器91將每個有效特征在各個分類中出現(xiàn)的概率轉變?yōu)閷?shù)形式。對應地,在對未知應用程序進行分類時,處理器91獲取對數(shù)形式的所述特征在各個分類中出現(xiàn)的概率,并將對數(shù)形式的特征在各個分類中出現(xiàn)的概率相加,比較得到相加之和最大的一個,從而得到在具有所述特征時待分類的應用程序為各個分類的概率中最大的一個。

本發(fā)明實施例全文所述的終端(包括智能終端80)可以為智能手機、PDA(Personal Digital Assistant,個人數(shù)字助理或平板電腦)等移動終端,也可以是佩戴于肢體或者嵌入于衣物、首飾、配件中的可穿戴設備,還可以是其他具有應用程序下載及安裝的智能電子設備。

需要說明,以上所述僅為本發(fā)明的實施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內容所作的等效結構或等效流程變換,例如各實施例之間技術特征的相互結合,或直接或間接運用在其他相關的技術領域,均同理包括在本發(fā)明的專利保護范圍內。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
光泽县| 永兴县| 油尖旺区| 潮州市| 冕宁县| 桃江县| 瑞金市| 吉水县| 博白县| 嘉祥县| 九龙城区| 太原市| 清水县| 许昌县| 安阳市| 兴安盟| 桐梓县| 高清| 大姚县| 南靖县| 谢通门县| 扶绥县| 饶河县| 龙泉市| 井研县| 麦盖提县| 徐闻县| 安徽省| 隆尧县| 阿克| 舒城县| 招远市| 河间市| 晋城| 眉山市| 吴桥县| 武夷山市| 巨鹿县| 县级市| 永和县| 福贡县|