專利名稱:信息處理裝置和信息處理方法以及記錄介質(zhì)、程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及到使用所謂的DNA微陣列進(jìn)行核酸序列解析,特別是涉及到對菌等微生物的種類進(jìn)行判定的技術(shù)。
背景技術(shù):
作為對得了傳染病的患者的病原菌進(jìn)行判定的技術(shù),稱之為“培養(yǎng)法”的技術(shù)就一直存在。該方法是通過對從患者采集的血液中含有的菌在特定培養(yǎng)基中進(jìn)行培養(yǎng),觀察增殖的菌,對傳染病的病原菌進(jìn)行特別判定。
該技術(shù)的缺點(diǎn)是對病原菌的判定需要數(shù)日的時(shí)間,在決定對患者的治療方針之前判定病原菌幾乎是不可能的。就是說,本來希望在對患者使用抗生素等治療藥之前預(yù)先對病原菌進(jìn)行特別判定,但若等待數(shù)日后的判定結(jié)果,患者的病情有可能惡化,耽誤治療。因此,在進(jìn)行病原菌判定之前,必須使用相對應(yīng)于多種可能性的藥劑,結(jié)果使患者蒙受著與藥效相反的副作用的危險(xiǎn)。
作為用于解決這樣問題的一個(gè)方法有通過解析病原菌的DNA,對傳染病的病原菌進(jìn)行判定的方法。該方法是使用例如PCR(Polymerase Chain Reaction)法或LAMP法等生物化學(xué)方法對病原菌基因組的某一特定部分進(jìn)行擴(kuò)增,對該擴(kuò)增的核酸序列進(jìn)行破譯判定病原菌的方法,利用這樣方法在短時(shí)間內(nèi)進(jìn)行判定是可能的,而且不管病原菌的種類如何,對多個(gè)病原菌都可以判定。
而作為解決上述問題的其他方法,例如有美國專利第6040138號說明書中公開的通過使擴(kuò)增的來自目標(biāo)生物的核酸片段與稱為為探針的核酸片段進(jìn)行雜交反應(yīng),對來自目標(biāo)生物的核酸片段的量進(jìn)行定量的方法。
根據(jù)同一說明書(美國專利第6040138號說明書),通過使用高密度集積的DNA微陣列,對一個(gè)目標(biāo)核酸片段可以設(shè)定多個(gè)探針,其結(jié)果是,在短時(shí)間內(nèi)就可以得到與破譯目標(biāo)核酸片段的序列大致相同的信息。
然而,上述以往技術(shù)給出的方法中,通過病原菌的DNA解析對傳染病的病原菌進(jìn)行判定的方法存在著對核酸序列的破譯需要非常高的技術(shù)技能和高費(fèi)用的問題。雖然PCR法和LAMP法等DNA擴(kuò)增手法本身步驟簡單可以實(shí)施,但為了破譯核酸序列,要求擴(kuò)增的核酸片段的純度高。另外,稱之為測序儀的“核酸序列的讀出儀器”價(jià)格昂貴,讀出操作遠(yuǎn)比通過PCR法和LAMP法等的DNA擴(kuò)增復(fù)雜,通常的檢查技師的技藝實(shí)施往往都很困難。
而利用雜交反應(yīng)的方法(美國專利第6040138號說明書所述方法)雖然與測序儀相比無論是必要的技能和花費(fèi)都可以壓低,但需要根據(jù)雜交反應(yīng)的結(jié)果對生物種類進(jìn)行判定的程序。當(dāng)對生物種類進(jìn)行判定時(shí),一般都使用所謂的“同源性檢索”的方法,這樣的方法存在著對堿基序列相似的病原菌進(jìn)行區(qū)別、判定困難的問題。這是由于“同源性檢索”是根據(jù)雜交反應(yīng)導(dǎo)出各個(gè)病原菌的存在概率,最后對生物種類進(jìn)行特別判定的手法。
一般來說,為了對在同源性檢索中堿基序列類似的病原菌進(jìn)行區(qū)別、判定,在DNA微陣列的雜交反應(yīng)中大前提是“對不同種類的核酸片段設(shè)定的不同探針各個(gè)都是獨(dú)立的”。例如,對應(yīng)于基因A的探針有10個(gè)時(shí),前提是來自基因B的核酸片段不與該探針反應(yīng)。而有了這樣的前提,例如根據(jù)通過將上述10個(gè)探針的雜交反應(yīng)結(jié)果得到的信號強(qiáng)度(例如熒光強(qiáng)度)平均得到的基因A的推定量應(yīng)當(dāng)可以正確地判定病原菌的有無(存在概率)。
然而,即使是來自不同的生物種類的核酸片段,他們非常相似時(shí),探針之間獨(dú)立的上述前提是不現(xiàn)實(shí)的,例如,即使是針對上述基因A設(shè)計(jì)的探針,往往可以與基因B進(jìn)行雜交反應(yīng)(這樣的現(xiàn)象稱為“交叉雜交”)。因此,“使用通過對該目標(biāo)核酸片段的多個(gè)探針的平均操作得到的代表值,導(dǎo)出該目標(biāo)核酸片段的存在概率”的上述手法對含有多個(gè)類似的堿基序列的檢體中的病原菌進(jìn)行特別判定時(shí)是不現(xiàn)實(shí)的,通過這樣的手法得到的判定精度存在著缺乏可靠性的問題。
發(fā)明內(nèi)容
本發(fā)明是鑒于上述課題做出的發(fā)明,目的在于當(dāng)檢體中存在多個(gè)相互具有類似堿基序列的生物種類時(shí),簡易、費(fèi)用低、而且在短時(shí)間內(nèi)高精度地對生物種類進(jìn)行判定。
為了達(dá)到上述目的,本發(fā)明的信息處理裝置具備以下那樣的構(gòu)成。即是使用配置了作為與生物種的核酸序列的一部分互補(bǔ)的核酸的探針的DNA微陣列,對有關(guān)對所定檢體進(jìn)行雜交反應(yīng)結(jié)果得到的各個(gè)探針的信號強(qiáng)度的有關(guān)信息進(jìn)行處理的信息處理裝置,具備對與使已知生物種進(jìn)行雜交反應(yīng)結(jié)果得到的上述各個(gè)探針的信號強(qiáng)度有關(guān)的第1信息進(jìn)行保持的保持手段,取得有關(guān)使上述所定檢體進(jìn)行雜交反應(yīng)結(jié)果得到的各個(gè)探針的信號強(qiáng)度有關(guān)的第2信息的取得手段,在上述第1以及第2信息中,提取與所定生物種有關(guān)的信息的提取手段,和進(jìn)行依據(jù)通過上述提取手段提取的上述第1信息中與所定生物種有關(guān)的信息與上述第2信息中與所定生物種有關(guān)的信息的比較,對上述所定檢體是否含有該所定生物種進(jìn)行判定的判定手段。
根據(jù)本發(fā)明,當(dāng)檢體中存在多個(gè)相互具有類似堿基序列的生物種時(shí),可以簡易、費(fèi)用低、而且在短時(shí)間內(nèi)高精度地對生物種類進(jìn)行判定。
附圖的簡單說明
圖1是表示包括本發(fā)明的信息處理方法的檢查整體的流程圖。
圖2是表示用于實(shí)現(xiàn)本發(fā)明的一實(shí)施方式的信息處理方法(生物種類判定方法)的信息處理裝置構(gòu)成的方塊圖。
圖3是表示DNA微陣列上雜交樣子的圖。
圖4是用于說明使用DNA微陣列的雜交反應(yīng)實(shí)驗(yàn)的所有實(shí)驗(yàn)步驟的圖。
圖5是用于說明對傳染病菌進(jìn)行特別判定的DNA微陣列的原理的圖。
圖6是用于說明雜交溶液中多種類堿基序列存在的理由的圖。
圖7是表示一例顯示雜交反應(yīng)后熒光強(qiáng)度圖像的圖。
圖8A、B是表示一例向量的分布圖和判定該向量的分類樹的圖。
圖9是用于對本發(fā)明一實(shí)施方式的生物種類判定方法的處理進(jìn)行說明的功能方塊圖。
圖10是表示同類探針具有多個(gè)點(diǎn)的DNA微陣列的例子的圖。
圖11是表示在本發(fā)明一實(shí)施方式的信息處理方法中使用的原始向量過濾的一個(gè)例子的圖。
圖12是表示主成分分析處理流程的流程圖。
圖13是說明學(xué)習(xí)階段和圖形識別階段的圖。
圖14是表示分類樹作成處理的流程的流程圖。
圖15是用于對決定分支點(diǎn)(node)判定函數(shù)的步驟進(jìn)行說明的圖。
具體實(shí)施例方式
圖1是表示包括本發(fā)明的信息處理方法的檢查處理整體的流程圖。就象該圖表示的那樣,當(dāng)進(jìn)行檢查時(shí),首先使用DNA微陣列,進(jìn)行已知檢體的雜交反應(yīng)實(shí)驗(yàn)(步驟S101)、將該結(jié)果得到的DNA微陣列的熒光強(qiáng)度代表的有關(guān)信號強(qiáng)度的信息(掃描圖形)作為標(biāo)準(zhǔn)樣品的反應(yīng)結(jié)果貯存(步驟S102、S104),然后就有關(guān)未知樣品反實(shí)驗(yàn)的結(jié)果得到的DNA微陣列的熒光強(qiáng)度有關(guān)信息(掃描圖形),根據(jù)該標(biāo)準(zhǔn)樣品的反應(yīng)結(jié)果進(jìn)行生物種類的判定處理(步驟S102、S103)。以下就步驟S101以及S103的處理按順序進(jìn)行詳細(xì)說明。
1.有關(guān)雜交反應(yīng)實(shí)驗(yàn)(步驟S101)的說明 首先,利用圖4就使用DNA微陣列的雜交反應(yīng)實(shí)驗(yàn)的整個(gè)實(shí)驗(yàn)過程進(jìn)行說明。
所謂的401“樣品”是理應(yīng)含有目標(biāo)核酸的液體或固體等的檢體。例如,對傳染病的病原菌進(jìn)行特別判定時(shí),來自人、家畜等動物的血液、痰、胃液、陰道分泌物、口腔內(nèi)粘液等體液、尿以及糞便那樣的排泄物等所有被認(rèn)為有細(xì)菌存在的物質(zhì)作為樣品。另外,也可以將成為食物中毒、污染對象的食品、飲料水以及溫泉水那樣環(huán)境中的水等有可能由于細(xì)菌引起污染的介質(zhì)用作樣品。另外,進(jìn)出口時(shí)被檢疫等的動植物也是檢體對象。
樣品401是使用402所示的“生物化學(xué)擴(kuò)增”方法擴(kuò)增的。例如,在對傳染病的病原菌進(jìn)行特別判定時(shí),使用在16s rRNA檢測用中設(shè)計(jì)的PCR反應(yīng)用引物,有時(shí)通過PCR法擴(kuò)增目標(biāo)核酸,或以PCR擴(kuò)增物為基礎(chǔ)再進(jìn)行PCR反應(yīng)等調(diào)整目標(biāo)核酸。另外,也可以通過PCR以外的LAMP法等擴(kuò)增方法調(diào)整。
擴(kuò)增的樣品、或原來的樣品401可以通過各種標(biāo)記法進(jìn)行標(biāo)記(標(biāo)記攙入403)以便于信號強(qiáng)度的檢測。本發(fā)明中所謂的信號強(qiáng)度是通過適當(dāng)手段適于檢測和可測定的信號強(qiáng)度,包括熒光、放射能、化學(xué)發(fā)光等,優(yōu)選熒光強(qiáng)度。作為這樣的標(biāo)記物質(zhì)最好使用通常的Cy3、Cy5、Rodamin等熒光物質(zhì)。另外,在生物化學(xué)擴(kuò)增處理(402)中,也可以攙入標(biāo)記分子。
使用附加標(biāo)記分子的核酸,與DNA微陣列404進(jìn)行雜交反應(yīng)(405)(后面詳細(xì)敘述)。例如,對傳染病的病原菌進(jìn)行特別判定時(shí),作為DNA微陣列404使用在基板上固定了對菌特異的探針。各個(gè)菌的探針的設(shè)計(jì),應(yīng)當(dāng)設(shè)計(jì)為例如來自包括編碼16s rRNA的基因組部分,預(yù)期對相關(guān)菌特異性非常高,而且使用各個(gè)探針堿基序列“盡可能”沒有誤差的雜交靈敏度。對DNA微陣列404的探針進(jìn)行固定的載體(基板)考慮使用玻璃基板、塑料基板、硅晶片等平面基板。另外,也可以使用具有凹凸的三維結(jié)構(gòu)體、球珠那樣的球狀物品、棒狀、帶狀、線狀的物質(zhì)(材料)等。
通常,上述基板使用進(jìn)行了能夠固定探針DNA的表面處理的基板。特別是在表面導(dǎo)入可進(jìn)行化學(xué)反應(yīng)的官能團(tuán)的基板由于在雜交反應(yīng)過程中使探針穩(wěn)定結(jié)合,在重現(xiàn)性方面可以說是理想狀態(tài)。
而在固化時(shí),例如有使用馬來酰亞胺基和巰基(-SH)基的組合的例子。即,通過預(yù)先使巰基結(jié)合在核酸探針末端,通過將固相表面預(yù)先處理為含有馬來酰亞胺基,供給到固相表面的核酸探針的硫基與固相表面的馬來酰亞胺基進(jìn)行反應(yīng)之后,對核酸探針進(jìn)行固化。
在導(dǎo)入馬來酰亞胺基時(shí),首先在玻璃基板使氨基硅烷偶聯(lián)劑反應(yīng),然后,通過這一氨基與EMCS試劑(N-(6-Maleimidocaproyloxy)succinimideDojin公司制造)反應(yīng),將馬來酰亞胺基導(dǎo)入。SH基向DNA導(dǎo)入可以通過使用DNA自動合成儀上5’-Thiol-ModifierC6(Glen Research公司制造)來進(jìn)行。
另外,在固化中利用官能團(tuán)的組合是指除上述巰基和馬來酰亞胺基的組合以外,還有例如環(huán)氧基(固相上)和氨基(核酸探針的末端)的組合等。由各種氨基硅烷偶聯(lián)劑進(jìn)行的表面處理也是有效的,也可以使用導(dǎo)入了與由該氨基硅烷偶聯(lián)劑導(dǎo)入的官能團(tuán)可發(fā)生反應(yīng)的官能團(tuán)的寡核苷酸。還有,對含有官能團(tuán)的樹脂進(jìn)行包覆的方法也有效。
進(jìn)行雜交反應(yīng)的DNA微陣列404的表面被洗滌,沒有與探針結(jié)合的核酸脫落后,(通常)使其干燥。然后通過對DNA微陣列基板照射激發(fā)光,測定熒光量(406)。另外,通過在照射激發(fā)光的狀態(tài)下進(jìn)行掃描,可以得到與熒光強(qiáng)度成比例的掃描圖像(407)。
以下利用圖3對上述的雜交反應(yīng)(405)的概要進(jìn)行說明。圖3是表示DNA微陣列上的雜交樣子的圖。在生物體內(nèi),幾乎所有的DNA都為雙螺旋結(jié)構(gòu),該雙鏈之間的結(jié)合是通過堿基間氫鍵實(shí)現(xiàn)的。而RNA通常多是以單鏈存在的。堿基的種類,DNA中為ACGT 4種,而RNA為ACGU 4種,可以分別形成氫鍵的堿基對為A-T(U)、G-C堿基對。
一般所謂的雜交反應(yīng)指的是單鏈狀態(tài)的核酸分子之間通過其中的部分堿基序列部分結(jié)合的狀態(tài)。而本實(shí)施方式為假定附著在圖3上側(cè)的基板上的核酸分子(探針301)比處于下側(cè)樣品中的核酸分子(302)短的情形。因此對于存在于樣品中的核酸分子含有探針堿基序列時(shí),該雜交反應(yīng)順利進(jìn)行,樣品中的靶核酸分子應(yīng)當(dāng)被DNA微陣列捕獲。
以下利用圖5對用于特別判定傳染病菌的DNA微陣列的原理進(jìn)行說明。圖5所述的DNA微陣列(500-1、500-2)是一例以特別判定金黃色葡萄球菌為目的制作的DNA微陣列。
該圖左面一列是使用DNA微陣列時(shí)處理來自金黃色葡萄球菌野生株DNA的處理系列,右面一列是使用DNA微陣列時(shí)處理來自大腸桿菌野生株DNA的處理系列。例如,可以認(rèn)為左面是處理感染金黃色葡萄球菌的患者的血液的流程,而右面是處理感染大腸桿菌的患者血液的流程。
無論哪一面基本上都進(jìn)行同樣處理。即,首先從例如菌感染患者的血液、或痰等中提取DNA(501-1、501-2)。此時(shí)一般來說,也可能含有來自患者體細(xì)胞的人的DNA。
而當(dāng)提取的DNA少時(shí),用PCR法等進(jìn)行擴(kuò)增。此時(shí)一般可以攙入標(biāo)記的熒光物質(zhì)或攙入使熒光物質(zhì)結(jié)合的物質(zhì)作為標(biāo)記(502-1、502-2)。
不進(jìn)行擴(kuò)增時(shí),可以使用提取的DNA,在制作互補(bǔ)鏈時(shí)攙入熒光物質(zhì)或攙入可以使熒光物質(zhì)結(jié)合的物質(zhì)作為標(biāo)記(503-1、503-2)?;蛘?,在直接提取的DNA上附加作為標(biāo)記的熒光物質(zhì)或可以使熒光物質(zhì)結(jié)合的物質(zhì)。
通常進(jìn)行PCR擴(kuò)增時(shí),只要目的是特別判定傳染病菌,一般都是對構(gòu)成稱之為16s rRNA的核糖體RNA的堿基序列的部分進(jìn)行擴(kuò)增。此時(shí),左側(cè)的金黃色葡萄球菌的PCR引物和右側(cè)的大腸桿菌的PCR引物應(yīng)當(dāng)使用幾乎相同的引物。更具體地講,使用編碼無論什么樣的菌的16s rRNA可以擴(kuò)增的引物組,都可以進(jìn)行多重PCR。此時(shí),結(jié)果圖5右和左中任一個(gè)雜交溶液都應(yīng)當(dāng)含有多種堿基序列。其理由通過下面的圖詳細(xì)敘述。
而當(dāng)希望進(jìn)行更詳細(xì)的序列解析時(shí),可以分別設(shè)定例如金黃色葡萄球菌用的PCR引物組、大腸桿菌用的PCR引物組。這時(shí),如果設(shè)定的引物只是有選擇地?cái)U(kuò)增菌的基因組的特定部分,那么雜交溶液中含有的堿基序列的種類非常有限。盡管如此,由于通常存在于自然界的菌株達(dá)到數(shù)種,存在于雜交溶液的堿基序列的種類為1種是很稀少的。
如果用于判定金黃色葡萄球菌為目的設(shè)計(jì)的DNA微陣列正確運(yùn)轉(zhuǎn)的話,在左側(cè)的雜交溶液中,點(diǎn)反應(yīng)為陽性(500-1),而在右側(cè)的雜交溶液中,點(diǎn)反應(yīng)為陰性(500-2)。
與金黃色葡萄球菌完全相同,如果用于判定大腸桿菌為目的設(shè)計(jì)的DNA微陣列正確運(yùn)轉(zhuǎn)的話,在左側(cè)的雜交溶液中,點(diǎn)反應(yīng)為陰性,而在右側(cè)的雜交溶液中,點(diǎn)反應(yīng)為陽性。在本實(shí)施方式中,使用同時(shí)排列了對各種各樣的菌特異反應(yīng)的數(shù)種類的點(diǎn)的DNA微陣列,對感染菌進(jìn)行判定。
以下,利用圖6對在圖5的雜交溶液中存在數(shù)種堿基序列的理由進(jìn)行說明。通常自然界存在的菌頻繁發(fā)生突變。其結(jié)果,經(jīng)淘汰活下來的主要的數(shù)種菌株有時(shí)同時(shí)存在。例如,由于引起院內(nèi)感染等問題的菌株,通常應(yīng)當(dāng)沒有抗藥性的菌通過突變獲得抗藥性而出現(xiàn)。獲得抗藥性的結(jié)果,有時(shí)即使進(jìn)行了努力殺菌的衛(wèi)生環(huán)境也出現(xiàn)維持旺盛繁殖力的菌。這樣一來,自然界存在的同樣的菌的堿基序列是具有數(shù)種變化的序列。
圖6表示的是金黃色葡萄球菌中的Mu50和MW2的兩種菌株的基因組結(jié)構(gòu)。各個(gè)菌株的基因組的總堿基數(shù)分別為2878040和2820462。另外,編碼16s核糖體RNA的部位,在Mu50中存在正向2處,反向3處,合計(jì)5處,而對于MW2,存在正向3處,反向3處,合計(jì)6處。
這些16s核糖體RNA的各個(gè)部位的堿基序列各個(gè)非常類似,但都不相同。就是說,在研究的菌感染患者的體內(nèi)存在的菌株的種類即使是一種,如果在象圖5那樣的一般處理中制備雜交溶液,在雜交溶液中也應(yīng)當(dāng)存在數(shù)種類似的堿基序列。而對于數(shù)種類似的堿基序列在使用DNA微陣列進(jìn)行實(shí)驗(yàn)時(shí),也可以穩(wěn)定地進(jìn)行生物種的判定,這是本申請的生物種類判定方法的主要目的。
以下就以傳染病的病原菌的特別判定為目的實(shí)際進(jìn)行雜交反應(yīng)實(shí)驗(yàn)的具體實(shí)施例進(jìn)行詳細(xì)說明。但本發(fā)明的生物種類判定方法并不限定于以以下敘述的傳染菌的病原菌特別判定為目的的例子,也可以用于MHC等人體質(zhì)判定、以及與癌等疾病相關(guān)的DNA、RNA的解析等。
作為陰溝腸桿菌檢測(Enterobacter cloacae)用探針設(shè)計(jì)了表1表示的核酸序列(I-n)(n為數(shù)字)。
具體來說,從編碼16s rRNA的基因組部分選擇以下所示的探針堿基序列。這些探針堿基序列組被設(shè)計(jì)成預(yù)期對該菌的特異性非常高,充分而且用各個(gè)探針堿基序列“盡可能”無誤差的雜交靈敏度。
表1
表中所示的探針作為用于固定于DNA微陣列的官能團(tuán)合成后,按照常規(guī)方法在核酸的5′末端導(dǎo)入巰基。導(dǎo)入官能團(tuán)后,進(jìn)行精制、冷凍干燥。冷凍干燥過的內(nèi)部標(biāo)準(zhǔn)用探針保存在-30℃的冷庫中。
關(guān)于金黃色葡萄球菌(A-n)、表皮葡萄球菌(B-n)、大腸桿菌(C-n)、肺炎桿菌(D-n)、綠濃桿菌(E-n)、沙雷氏菌(F-n)、肺炎雙球菌(G-n)、流感桿菌(H-n)、以及糞腸球菌(J-n)(n為數(shù)字)也通過同樣手法設(shè)計(jì)以下所示探針組。
表2-1
表2-2
表2-3
表2-4
表2-5
表2-6
表2-7
表2-8
表2-9
作為病原菌檢測用的16s rRNA核酸(靶核酸)擴(kuò)增用PCR引物設(shè)計(jì)了如表2所示的核酸序列。
具體來說,在特異擴(kuò)增編碼16s rRNA基因組部分的探針組,即,在大約1500堿基長度的16s rRNA編碼區(qū)的兩端部分設(shè)計(jì)了特異融解溫度盡可能一致的引物。另外,設(shè)計(jì)了同時(shí)可擴(kuò)增變異菌株,或基因組上存在的多個(gè)16s rRNA編碼區(qū)的多種引物。
表3
表中所示的引物合成后經(jīng)高效液相色譜(HPLC)精制,將3種正向引物和3種反向引物混合,溶解于TE緩沖液中,各個(gè)引物的最終濃度為10pmol/μl。
[1-5-3-1]微生物的培養(yǎng)和基因組DNA提取的預(yù)處理首先按照常規(guī)方法對陰溝腸桿菌(Enterobacter cloacae)標(biāo)準(zhǔn)株進(jìn)行培養(yǎng)。取1.0ml(OD600=0.7)的該微生物培養(yǎng)液放到1.5ml容量的微量管中,經(jīng)離心分離回收菌體(8500rpm、5min、4℃)。
去掉上清后,加300μl的酶緩沖液(50mM Tris-HClp.H.8.0,25mM EDTA),用攪拌器再懸浮。再懸浮的菌液再次通過離心分離回收菌體(8500rpm、5min、4℃)。
去掉上清后,向回收的菌體中加入以下的酶溶液,用攪拌器再懸浮。
溶菌酶50μl(20mg/ml在酶緩沖液中)N-乙酰胞壁酸酶SG50μl(0.2 mg/ml在酶緩沖液中)接下來,將加入酶溶液再懸浮的菌液在37℃的溫育箱中靜置30分鐘,進(jìn)行細(xì)胞壁的溶解處理。
基因組DNA的提取以下給出的微生物基因組DNA的提取是使用核酸精制試劑盒(MagExtractor-Genome-TOYOBO公司制造)進(jìn)行的。
具體來說,首先,在進(jìn)行了預(yù)處理的微生物懸浮液中加入溶解和吸附液750μl和磁珠40μl,使用試管攪拌器,劇烈地?cái)嚢?0分鐘(步驟1)。
然后,將微量管插到分離用架(Magical Trapper)上,靜置30秒,讓磁珠集中在管壁,在管插在架上的狀態(tài)下,將上清液去掉(步驟2)。
接著,加入清洗液900μl,用攪拌器攪拌5秒鐘左右,再懸浮(步驟3)。
然后,將微量管插到分離用架上,靜置30秒,讓磁珠集中在管壁,在管插在架上的狀態(tài)下,將上清液去掉(步驟4)。
反復(fù)進(jìn)行步驟3、4后,清洗二次(步驟5),然后加入70%乙醇900μl,用攪拌器攪拌5秒鐘左右再懸浮(步驟6)。
接下來,將微量管插到分離用架上,靜置30秒,讓磁珠集中在管壁,在管插在架上的狀態(tài)下,將上清液去掉(步驟7)。
反復(fù)進(jìn)行步驟6、7,用70%乙醇清洗二次(步驟8)后,在回收的磁珠中加入純水100μl,用試管攪拌器攪拌10分鐘。
然后,將微量管插到分離用架上,靜置30秒,讓磁珠集中在管壁,在管插在架上的狀態(tài)下,將上清液回收到新的管中。
回收的基因組DNA的檢查回收的微生物(陰溝腸桿菌株)的基因組DNA,根據(jù)常規(guī)方法,進(jìn)行瓊脂糖凝膠電泳以及260/280nm的吸光度測定,測定其品質(zhì)(低分子核酸的混入量、分解程度)和回收量。
在本實(shí)施例中,大約回收到10μg的基因組DNA,沒有發(fā)現(xiàn)基因組DNA的降解或rRNA的混入。回收的基因組DNA溶解于TE緩沖液中,使其最終濃度達(dá)到50ng/μl,在以下的實(shí)施例中使用。
[1-5-4-1]玻璃基板的洗滌將合成石英玻璃基板(大小25mm×75mm×1mm,飯山特殊玻璃公司制造)放在耐熱、耐堿的架上,在調(diào)制到所定濃度的超聲波洗滌用的洗滌液中浸泡。在洗滌液中浸泡一夜后,進(jìn)行20分鐘超聲波洗滌。然后取出基板,輕輕地用純水進(jìn)行沖洗,再在超純水中進(jìn)行20分鐘超聲波洗滌。然后,將基板在加熱到80℃的1N NaOH水溶液中浸泡10分鐘,再用純水和超純水進(jìn)行洗滌,制備成DNA芯片用的石英玻璃基板。
表面處理將硅烷偶聯(lián)劑KBM-603(信越硅公司制造)溶解在純水中,使之濃度達(dá)到1%,室溫下攪拌2小時(shí)。接著,將先前洗滌的玻璃基板浸入硅烷偶聯(lián)劑的水溶液中,室溫下放置20分鐘。取出玻璃基板,輕輕地用純水洗滌表面后,用氮?dú)獯蹈苫宓膬擅?,使其干燥。接著,將干燥的基板在加熱?20℃的烤箱中烘1小時(shí),完成偶聯(lián)劑處理,將氨基導(dǎo)入到基板表面。然后,準(zhǔn)備將同仁化學(xué)研究所公司制造的N-(6-馬來酰亞胺己酰氧)琥珀酰亞胺(以下略稱為EMCS)溶解在二甲亞砜與乙醇的1∶1混合溶劑中,使最終濃度達(dá)到0.3mg/ml的EMCS溶液。將烘烤完了的玻璃基板放置冷卻,室溫下在調(diào)制好的EMCS溶液中浸泡2小時(shí)。經(jīng)過這樣處理,通過硅烷偶聯(lián)劑導(dǎo)入在表面的氨基與EMCS的琥珀酰亞胺基發(fā)生反應(yīng),使玻璃基板表面導(dǎo)入馬來酰亞胺基。從EMCS液中取出玻璃基板,用溶解了先前所述EMCS的混合溶劑對玻璃基板進(jìn)行洗滌,再進(jìn)一步用乙醇洗滌后,氮?dú)鈿夥窄h(huán)境下使之干燥。
探針DNA將本實(shí)施例中制作的微生物檢測用探針溶解在純水中,使最終濃度(溶解墨水時(shí))分別達(dá)到10μM,分注后,進(jìn)行冷凍干燥,將水分除去。
利用BJ點(diǎn)樣器噴出DNA,以及與基板的結(jié)合準(zhǔn)備含有丙三醇7.5wt%、硫二甘醇7.5wt%、尿素7.5wt%、Acetylenol EH 1.0wt%(川研フアインケミカル公司制造)的水溶液。接著,將先前準(zhǔn)備的7種探針(表1)溶解于上述的混合溶劑中,使之達(dá)到規(guī)定濃度。將得到的DNA溶液充填在バブルジエツト(注冊商標(biāo))點(diǎn)樣器(商品名BJF-850佳能公司制造)用墨盒中,裝在印字頭上。
另外,這里使用的バブルジエツト點(diǎn)樣器(注冊商標(biāo))是可以改造成在平板上印刷的儀器。這個(gè)バブルジエツト點(diǎn)樣器(注冊商標(biāo))通過按所指定的文件作成方法輸入印字圖形,大約5微微升的DNA溶液可以點(diǎn)印在約120μm間距上。
使用這個(gè)改造的バブルジエツト點(diǎn)樣器(注冊商標(biāo)),對一塊基板進(jìn)行點(diǎn)印操作,制備成DNA微陣列。確認(rèn)了點(diǎn)印已確切進(jìn)行后,于加濕箱內(nèi)中靜止30分鐘,使玻璃基板表面的馬來酰亞胺基與核酸探針末端的巰基發(fā)生反應(yīng)。
清洗反應(yīng)30分鐘后,用含有100mM NaCl的10mM磷酸緩沖液(pH7.0)沖洗表面殘留的DNA溶液,得到玻璃基板表面上固定了單鏈DNA的DNA微陣列。
檢體微生物DNA的擴(kuò)增,以及標(biāo)記反應(yīng)如下所示。
預(yù)混合PCR試劑(TAKARA ExTaq) 25μl模板基因組DNA2μl(100ng)正向引物混合物 2μl(20pmol/每試管)反向引物混合物 2μl(20pmol/每試管)Cy-3 dUTP(1mM) 2μl(2nmol/每試管)水 17μl共計(jì) 50μl上述組成的反應(yīng)液按以下程序,用市售的熱循環(huán)儀進(jìn)行擴(kuò)增反應(yīng)。
95℃ 10分鐘 72℃ 10分鐘反應(yīng)結(jié)束后,使用精制用柱(QIAGEN QIAquick PCRPurification Kit)將引物除去后,對擴(kuò)增產(chǎn)物進(jìn)行定量,作為標(biāo)記檢體。
使用上述[1-5-4.DNA微陣列制作]中制備的DNA微陣列與[1-5-5.檢體的擴(kuò)增和標(biāo)記(PCR擴(kuò)增&熒光標(biāo)記的整合)]制備的標(biāo)記檢體,進(jìn)行檢測反應(yīng)。
DNA微陣列的封閉將BSA(牛血清白蛋白級分VSigma公司制造)溶解在100mM氯化鈉/10mM磷酸緩沖液中使成為1wt%,將[1-5-4.DNA微陣列的制作]制備的DNA微陣列于室溫下在該溶液中浸泡2小時(shí),進(jìn)行封閉。封閉結(jié)束后,用含有0.1wt%SDS(十二烷基硫酸納)的2×SSC溶液(氯化鈉300mM、檸檬酸納(檸檬酸三鈉二水合物C6H5Na3·2H2O)30mM、pH7.0)進(jìn)行清洗,用純水漂洗后,用旋轉(zhuǎn)干燥裝置除去水。
雜交將除去水后的DNA微陣列置于雜交裝置(Genomic Solutions Inc.Hybridization Station)中,在以下([1-5-6-3]、[1-5-6-4])所示的雜交溶液、條件下進(jìn)行雜交反應(yīng)。
雜交溶液6×SSPE/10%甲酰胺/靶(第二次PCR產(chǎn)物全量)(6×SSPENaCl 900mM、NaH2PO4·H2O 60mM、EDTA 6mM、pH 7.4)。
雜交條件65℃3分鐘→92℃2分鐘→45℃3小時(shí)→在25℃用2×SSC/0.1%SDS清洗→在20℃用2×SSC清洗→(用純水漂洗Manual)→旋轉(zhuǎn)干燥(65℃3分鐘、92℃2分鐘、于45℃下進(jìn)行3小時(shí)雜交反應(yīng)后、于25℃用2×SSC/0.1%SDS清洗、20℃下用2×SSC清洗、純水漂洗、旋轉(zhuǎn)干燥)。
將上述雜交反應(yīng)結(jié)束后的DNA微陣列用DNA微陣列熒光檢測裝置(Axon公司制造、GenePix 4000B)進(jìn)行熒光測定。
圖7示出了一例以上實(shí)施例結(jié)果得到的掃描圖像。在圖7中,熒光強(qiáng)度強(qiáng)的探針用深色表示。
701是使含有金黃色葡萄球菌的基因組的樣品與DNA微陣列反應(yīng)得到的掃描圖像,702是一例使含有大腸桿菌的基因組的樣品與DNA微陣列反應(yīng)得到的掃描圖像。
圖左側(cè)寫的字母表是探針序列的字母表,從A到J分別為設(shè)計(jì)成與下列各個(gè)菌特異結(jié)合的探針金黃色葡萄球菌(A)、表皮葡萄球菌(B)、大腸桿菌(C)、肺炎桿菌(D)、綠膿桿菌(E)、沙雷氏菌(F)、肺炎雙球菌(G)、流感桿菌(H)、陰溝腸桿菌(I)、以及糞腸球菌(J)。
2.關(guān)于生物種類判定處理(步驟S103)的說明以下就使用實(shí)施步驟S101中得到的掃描圖像進(jìn)行的生物種類判定處理(步驟S103)進(jìn)行說明。
圖2是表示用于實(shí)現(xiàn)本發(fā)明的一實(shí)施方式的信息處理方法(生物種類判定方法)的信息處理裝置的構(gòu)成的方塊圖。
生物種類判定方法是在由外部記錄裝置201、中央處理裝置(CPU)202、存儲203、輸入輸出裝置204構(gòu)成的裝置中實(shí)現(xiàn)的。外部記錄裝置201保持實(shí)現(xiàn)本實(shí)施方式的生物種類判定方法的程序以及雜交反應(yīng)結(jié)果得到的掃描圖像。另外還具有保持通過本實(shí)施方式得到的生物種類判定結(jié)果的功能。中央處理裝置(CPU)202執(zhí)行生物種類判定方法的程序,進(jìn)行所有裝置的調(diào)控。而存儲203暫時(shí)記錄經(jīng)中央處理裝置(CPU)202處理的程序、以及子程序和數(shù)據(jù)。輸入輸出裝置204進(jìn)行與用戶的交流。另外,程序執(zhí)行啟動用戶通過輸入輸出裝置204輸入。還有,用戶通過輸入輸出裝置204可以看到判定結(jié)果,或設(shè)定程序的參數(shù)。
以下在對本發(fā)明的信息處理方法進(jìn)行詳細(xì)說明前,就要明確本方法特征的通過雜交反應(yīng)實(shí)驗(yàn)得到的掃描圖像給出了以往判定處理方法的具體例子,對其問題方面進(jìn)行研究。
就象上述“以往技術(shù)”中列舉的美國專利第6040138號說明書已經(jīng)敘述的那樣,為了判定未知樣品生物種類,有通過同源性檢索對存在的多個(gè)病原菌進(jìn)行判定的方法。
例如,通過使用DNA微陣列的表達(dá)解析進(jìn)行的解析手法,即,在圖7中,從A組多個(gè)探針到J組多個(gè)探針,在將各個(gè)組的多個(gè)探針的平均熒光強(qiáng)度作為目標(biāo)菌的熒光強(qiáng)度基礎(chǔ)上,將各個(gè)菌的存在概率作為{(X組的熒光強(qiáng)度)/(A~J組的熒光強(qiáng)度的總合)}(X為A~J組中的任一個(gè))的解析手法。通過這樣的解析手法,未知樣品中即使混入多個(gè)病原菌,也可以適當(dāng)推導(dǎo)出各個(gè)菌存在的概率。
然而,就象以往技術(shù)已經(jīng)敘述的那樣,使用這樣的解析手法時(shí),不能嚴(yán)格區(qū)別堿基序列類似的病原菌有沒有存在。舉一個(gè)例子,理想狀態(tài)下,雜交反應(yīng)結(jié)果最好是只有701的A行的探針熒光強(qiáng)度變高,而702的C行的探針熒光強(qiáng)度也變高(該701的理想結(jié)果與圖5給出的實(shí)驗(yàn)結(jié)果的例子相同)。
這里,所有的探針如果都具有圖5所示那樣的理想性質(zhì),從A組探針到J組探針,可以將各個(gè)組的探針的平均熒光強(qiáng)度作為目標(biāo)菌的強(qiáng)度,此時(shí)由于一個(gè)樣品的實(shí)驗(yàn)結(jié)果成了A~J組的熒光強(qiáng)度的10個(gè)的值,所以將例如各個(gè)菌存在概率作為{(X組的熒光強(qiáng)度)/(A~J組的熒光強(qiáng)度的總合)}(X為A~J組中的任一個(gè))是可能的。
然而,就象圖7所示那樣,實(shí)際上不象理想那樣發(fā)生所謂的“雜交反應(yīng)”,對于701,A以外的行的探針熒光強(qiáng)度也強(qiáng),另外,對于702,C以外的行的探針熒光強(qiáng)度也變強(qiáng),更進(jìn)一步對于702即使在C行也存在熒光強(qiáng)度弱的探針。
象上述那樣求存在概率的作法雖然是在使用以往DNA微陣列的mRNA的定量分析等中適用的方法,但不適用于象圖7那樣結(jié)果的傳染病的病原菌的判定。
利用雜交反應(yīng)的結(jié)果判定生物種類的方法除了上述同源性檢索之外還可以考慮另外幾種方法。例如預(yù)先存儲從預(yù)先已知的生物種類構(gòu)成的標(biāo)準(zhǔn)樣品經(jīng)雜交反應(yīng)結(jié)果得到的掃描圖像,根據(jù)來自該已知生物種類的標(biāo)準(zhǔn)樣品的掃描圖像識別圖像,對未知樣品的生物種類進(jìn)行判定的方法等。
以下,就通過圖像識別實(shí)現(xiàn)生物種類判定的可能性進(jìn)行研究。這里,就標(biāo)準(zhǔn)樣品和未知樣品的各個(gè)樣品,將所有的已知的熒光強(qiáng)度歸納在一起,表示為一個(gè)向量,對用兩者的向量進(jìn)行判定的方法進(jìn)行研究。
例如,如果得到象圖7那樣的熒光強(qiáng)度,將A~J組合計(jì)72個(gè)探針歸納做成一個(gè)72維向量。即,從一個(gè)樣品(標(biāo)準(zhǔn)樣品或未知樣品)的實(shí)驗(yàn)結(jié)果得到一個(gè)向量(這樣的向量稱為“統(tǒng)合向量”)。而通過對從多個(gè)標(biāo)準(zhǔn)樣品得到的多個(gè)統(tǒng)合向量和從未知樣品得到的統(tǒng)合向量進(jìn)行比較,通過圖像識別可以判定未知樣品對應(yīng)于哪種生物種類。
在圖8A、B中,作為一個(gè)例子,給出了根據(jù)2維向量(即,探針數(shù)為2個(gè)(X、Y)DNA微陣列得到的掃描圖像導(dǎo)出的統(tǒng)合向量)中的圖像識別例子(此時(shí)探針X和探針Y希望都設(shè)計(jì)成對金黃色葡萄球菌特異的探針)。
在圖8A、B中,作為標(biāo)準(zhǔn)樣品給出了合計(jì)64個(gè)樣品,從他們的測定結(jié)果得到64個(gè)統(tǒng)合向量(在該圖中,X軸、Y軸分別表示探針X、探針Y的熒光強(qiáng)度(實(shí)際上,是將各個(gè)樣品的測定值進(jìn)行了歸一化))。64個(gè)樣品中,例如來自金黃色葡萄球菌的統(tǒng)合向量用黑點(diǎn)表示,而來自大腸桿菌的統(tǒng)合向量用白點(diǎn)表示。而在這里,為了便于說明,將探針定為兩種,通常象圖7那樣存在多種,測定結(jié)果為維數(shù)高的向量。
而對于圖8B示出的來自多個(gè)標(biāo)準(zhǔn)樣品的統(tǒng)合向量分布圖,可以利用分類樹(圖8A)進(jìn)行圖像識別。
所謂分類樹是按階層對標(biāo)準(zhǔn)樣品分布的特征空間進(jìn)行分割的方法,例如,如果按照圖8B所示的基準(zhǔn)集合作成分類樹,可以作成圖8A所示那樣構(gòu)造的圖像。圖8A所示的分類樹的各個(gè)分支點(diǎn)表示圖8B中用粗線表示的邊界線,總體上看,可以將特征空間分割成7個(gè)部分區(qū)間。各個(gè)部分區(qū)間對應(yīng)于分類樹的平結(jié)點(diǎn),用白圈和黑圈表示。對于圖8A、B給出的例子,金黃色葡萄球菌的部分區(qū)間分為4個(gè),而大腸桿菌的部分區(qū)間分為3個(gè)。
使用分類樹的判定方法在給出了來自未知樣品的統(tǒng)合向量時(shí),對屬于哪一部分區(qū)間進(jìn)行判斷,可以將對應(yīng)于該附屬的部分區(qū)間的生物種類作為判定結(jié)果(圖8A、B,例如,如果X的值在0.5以下,Y值也在0.5以下,屬于來自金黃色葡萄球菌的統(tǒng)合向量分布的區(qū)域,而如果X的值在0.5以下,Y值在0.75以上,屬于來自大腸桿菌的統(tǒng)合向量分布的區(qū)域)。
另外,通過按階層對分類樹進(jìn)行探索,由于可以判定來自未知樣品的統(tǒng)合向量屬于哪一部分區(qū)間,一般來說具有可以非常高速地對生物種類進(jìn)行判定的優(yōu)點(diǎn)。
就象通過以上說明所了解的那樣,用統(tǒng)合向量進(jìn)行圖像識別時(shí),每一種生物種類至少預(yù)先需要準(zhǔn)備一個(gè)以上樣品的標(biāo)準(zhǔn)樣品,如果標(biāo)準(zhǔn)樣品少,該生物種類的判定精度降低,或不能判定。當(dāng)然,對于只存在一個(gè)病原菌時(shí),不會有什么樣問題,但象上述那樣的傳染病的病原菌的判定情形,通常存在多個(gè)病原菌,在這樣的情況下,不能獲得正確的判定結(jié)果。這是由于進(jìn)行雜交反應(yīng)的檢體中含有的病原菌的組合使得統(tǒng)合向量的取向、大小變得不同的緣故。即,檢體中存在多個(gè)病原菌時(shí),由于導(dǎo)出的統(tǒng)合向量接近符合多個(gè)病原菌的結(jié)果的結(jié)論,所以根據(jù)這樣的統(tǒng)合向量進(jìn)行上述的圖像識別,得到未知樣品也不與任一個(gè)標(biāo)準(zhǔn)樣品類似的判定結(jié)果。
作為對策,對于一個(gè)生物種類預(yù)先準(zhǔn)備多個(gè)與各種各樣病原菌組合的標(biāo)準(zhǔn)樣品,需要預(yù)先蓄積有關(guān)各個(gè)樣品雜交反應(yīng)的結(jié)果。但是,預(yù)先準(zhǔn)備針對所有病原菌的組合的標(biāo)準(zhǔn)樣品是不現(xiàn)實(shí)的。因此,這樣的圖像識別直接運(yùn)用于含有具有類似堿基序列的病原菌的情況的生物種類判定是不合適的。
在上述背景的基礎(chǔ)上,本申請進(jìn)行的生物種類判定處理中,采用通過用于解決上述“2-2-1.同源性檢索的情況”問題的圖像識別的判定方法,考慮有關(guān)利用圖像識別時(shí)的問題的上述研究,即使不預(yù)先準(zhǔn)備所有病原菌的組合,已經(jīng)可以精度高地判定類似的堿基序列。具體來說,當(dāng)對標(biāo)準(zhǔn)樣品和未知樣品的向量進(jìn)行對比時(shí),特征在于附加向量過濾處理方面。以下進(jìn)行詳細(xì)說明。
圖9是用于說明本實(shí)施方式的生物種類判定方法的處理的功能方塊圖。901是“對標(biāo)準(zhǔn)樣品的掃描圖像”,使含有來自靶生物種類的核酸片段的標(biāo)準(zhǔn)樣品雜交反應(yīng)結(jié)果得到的圖像。通常在該核酸片段中,附加熒光物質(zhì)等標(biāo)記分子后,可以簡單地測定與DNA微陣列的雜交反應(yīng)強(qiáng)度。
902是雜交反應(yīng)數(shù)值化部,對上述DNA微陣列和上述標(biāo)準(zhǔn)樣品的雜交反應(yīng)強(qiáng)度進(jìn)行數(shù)值化處理。903是測定結(jié)果向量化部,在對上述雜交反應(yīng)數(shù)值化部得到的DNA微陣列上的各個(gè)探針的測定值進(jìn)行統(tǒng)計(jì)處理后,以n維向量表示,進(jìn)行矯正處理。904是向量歸一化部,對生成的向量進(jìn)行歸一化。向量化的歸一化數(shù)據(jù)(標(biāo)準(zhǔn)向量數(shù)據(jù))儲存在標(biāo)準(zhǔn)向量數(shù)據(jù)收集部905。
909是主成分分析部,就儲存在標(biāo)準(zhǔn)向量數(shù)據(jù)收集部905的標(biāo)準(zhǔn)向量數(shù)據(jù)進(jìn)行主成分分析。主成分分析部909中的主成分分析的的結(jié)果在向量過濾部905中進(jìn)行過濾處理時(shí)使用。
907是“對未知樣品的掃描圖像”,與對標(biāo)準(zhǔn)樣品的掃描圖像同樣,在雜交反應(yīng)數(shù)值化部902進(jìn)行數(shù)值化處理,于測定結(jié)果向量化部903中變換為向量表示,然后在向量歸一化部904被歸一化(未知向量數(shù)據(jù))。
在生物種類判定部908中,通過圖像識別對未知樣品的生物種類進(jìn)行判定,在判定時(shí),使用在向量過濾部905中被過濾的向量。即,對從針對未知樣品的掃描圖像得到的歸一化的未知向量數(shù)據(jù)經(jīng)向量過濾部905過濾的向量數(shù)據(jù)和儲存在標(biāo)準(zhǔn)向量數(shù)據(jù)部906中的標(biāo)準(zhǔn)向量數(shù)據(jù)經(jīng)向量過濾部905過濾的向量數(shù)據(jù)進(jìn)行對比,判定未知樣品的生物種類。
以下就圖9的各部分的處理進(jìn)行詳細(xì)說明。
所謂在向量歸一化部904進(jìn)行的向量歸一化處理指的是對根據(jù)每個(gè)樣品得到的熒光強(qiáng)度導(dǎo)出的向量進(jìn)行歸一化的處理。
例如,在DNA微陣列上同一探針有多個(gè)點(diǎn)時(shí),一般都是將該熒光強(qiáng)度的平均值作為探針的熒光強(qiáng)度。
圖10中示出了有多個(gè)點(diǎn)相同探針的DNA微陣列的例子。在圖10的DNA微陣列中,4組基板上固定了20種探針,存在合計(jì)80個(gè)點(diǎn)。此時(shí),分別將4個(gè)同種類探針的平均強(qiáng)度作為該探針的測定值,歸納為20維的向量。
在圖10所示的DNA微陣列的例子中,左上的探針為陽性對照。例如作為陽性對照,預(yù)先點(diǎn)上無論哪一個(gè)探針都不干涉的核酸,在將要進(jìn)行雜交反應(yīng)前,對作為該探針堿基序列的互補(bǔ)鏈的寡核苷酸加附加了熒光色素的物質(zhì)。另外,也可以將具有樣品中必定含有的那樣的部分堿基序列的探針作為陽性對照。
在DNA微陣列的實(shí)驗(yàn)中,熒光強(qiáng)度整體有時(shí)高,有時(shí)低。在這樣的情況中,通過使用陽性對照,可以對所有的探針的熒光強(qiáng)度進(jìn)行歸一化。另外,也可以將DNA微陣列中熒光輝度最高的點(diǎn)的測定值作為基準(zhǔn),對整個(gè)探針的熒光強(qiáng)度進(jìn)行歸一化的方法。
以下就作為本發(fā)明特征的在向量過濾部905中的向量過濾處理進(jìn)行說明。首先,就向量過濾處理的概念進(jìn)行說明。象上述那樣,雜交反應(yīng)結(jié)果得到的統(tǒng)合向量在由探針數(shù)決定的多維空間中是由每個(gè)樣品決定的。此時(shí),由于檢體中含有什么樣的病原菌,在相關(guān)多維空間中的統(tǒng)合向量有很大不同。
例如,由只含有單一病原菌的檢體的反應(yīng)結(jié)果得到的統(tǒng)合向量和除了該病原菌之外也含有其他病原菌的檢體的反應(yīng)結(jié)果得到的統(tǒng)合向量變成了差別很大的向量。
即,將對于含有什么樣組合的病原菌的檢體的反應(yīng)結(jié)果作為標(biāo)準(zhǔn)樣品對判定結(jié)果影響很大。因此,也可以考慮準(zhǔn)備含有所有組合的病原菌的雜交反應(yīng)結(jié)果得到的標(biāo)準(zhǔn)樣品的方法,但已經(jīng)講過這是不現(xiàn)實(shí)的。
因此,本發(fā)明的特征在于在極力排除組合的影響的狀態(tài)下進(jìn)行判定的方面。具體來說,通過對統(tǒng)合向量加以過濾,一方面從未知樣品中提取所定的病原菌的向量成分(特定向量),另一方面對于標(biāo)準(zhǔn)樣品的統(tǒng)合向量也同樣進(jìn)行所定的病原菌的特定向量提取。然后通過對該特定向量之間進(jìn)行比較,進(jìn)行圖像識別,可以一邊控制標(biāo)準(zhǔn)樣品的數(shù),一邊高精度地判定該所定的病原菌的有無。
這樣一來,通過進(jìn)行向量過濾處理,提取排除了所定病原菌以外的向量成分的特定向量,只制備有限的標(biāo)準(zhǔn)樣品,就可以得到正確的判定結(jié)果。
以下就在向量過濾部905中的具體處理進(jìn)行說明。圖11示出了向量過濾部906的最原始的算法。1101是金黃色葡萄球菌用的過濾器,黑點(diǎn)的系數(shù)是1,而白點(diǎn)的系數(shù)意味著0。例如,得到象圖7那樣的雜交反應(yīng)的結(jié)果時(shí),1101過濾器對701的實(shí)驗(yàn)數(shù)據(jù)和702的實(shí)驗(yàn)數(shù)據(jù)都適用。結(jié)果72維的向量被過濾成9維。
同樣,1102指的是大腸桿菌用的過濾器,黑點(diǎn)的系數(shù)是1,而白點(diǎn)的系數(shù)意味著0。將該過濾器應(yīng)用于例如象圖7那樣的實(shí)驗(yàn)數(shù)據(jù),72維的向量應(yīng)當(dāng)被過濾成7維。如果得到象圖7那樣的2個(gè)標(biāo)準(zhǔn)樣品的實(shí)驗(yàn)結(jié)果,在圖9的標(biāo)準(zhǔn)向量數(shù)據(jù)收集部906,應(yīng)當(dāng)收集到2個(gè)9維的向量,2個(gè)7維的特定向量。而由未知樣品的實(shí)驗(yàn)數(shù)據(jù)各得到一個(gè)9維的特定向量和7維的特定向量,將他們分別與上述同維的基準(zhǔn)向量進(jìn)行比較,可以推定有無金黃色葡萄球菌、大腸桿菌各個(gè)菌的存在。這樣一來,就象圖10所示的金黃色葡萄球菌的過濾器和大腸桿菌的過濾器那樣,在對每一種生物種類準(zhǔn)備過濾器中,通過用該過濾器對向量進(jìn)行過濾求特定向量,利用圖像識別可以探求有無生物種類存在。
在圖10中,為便于說明,給出了將對應(yīng)于各個(gè)生物種類探針的測定值設(shè)為1,而其他的探針設(shè)為0的單純的過濾器的例子,一般來說,根據(jù)預(yù)先得到的見解,通過對每一個(gè)探針的測定值設(shè)置從0到1之間的常數(shù),可以實(shí)現(xiàn)過濾。以下就過濾器的構(gòu)成方法進(jìn)行說明。
一般來說,在對向量組的信息進(jìn)行壓縮的技術(shù)中有主成分分析(詳細(xì)的技術(shù)參照例如書籍《回歸分析和主成分分析 統(tǒng)計(jì)解析程序講座2》芳賀 敏郎,橋本 茂司(著),出版社日科技連出版社;ISBN4817120118;(1980/05))。這是對從多個(gè)測定結(jié)果向量得到的協(xié)方差矩陣進(jìn)行固有值分解,利用對應(yīng)于各個(gè)固有值的固有向量,對測定結(jié)果向量進(jìn)行主成分分解(光譜分解)的方法。由于固有向量可以成為正規(guī)直交基底,主成分分解(光譜分解)變成了所謂的直交座標(biāo)變換。因此,主成分分解前的向量的維數(shù)和主成分分解后的向量的維數(shù)基本上沒有變化。然而主成分分解后,可以忽略對應(yīng)于固有值極端小的值的成分的情形很多,此時(shí)可以將向量維數(shù)變小。而這又起到過濾作用。
以下就對每種生物種類進(jìn)行主成分分析,在構(gòu)成過濾的主成分分析部909中的處理進(jìn)行說明。
圖12是表示在圖9的主成分分析部909中的處理流程的流程圖。首先選擇制造過濾的生物種類。對于傳染病的病原菌判定的情形,對例如金黃色葡萄球菌或大腸桿菌等進(jìn)行指定。然后在圖9的標(biāo)準(zhǔn)向量收集部906中收集的標(biāo)準(zhǔn)樣品的統(tǒng)合向量中,只選擇來自步驟S1201中選擇的生物種類向量。此時(shí),通常對來自在1201選擇的生物種類的標(biāo)準(zhǔn)樣品的統(tǒng)合向量數(shù)據(jù)都進(jìn)行選擇。另外,對來自在步驟1201選擇的生物種以往的生物種的標(biāo)準(zhǔn)樣品的統(tǒng)合向量數(shù)據(jù)也進(jìn)行選擇。
然后,求步驟1202和1203中選擇的統(tǒng)合向量數(shù)據(jù)組的協(xié)方差矩陣,計(jì)算固有值,忽略固有值小的成分。這樣一來,為了對步驟S1202中選擇的生物種進(jìn)行判定,重要的探針的測定值應(yīng)當(dāng)被過濾。
例如,如果探針有n個(gè),由步驟1202和1203中選擇的統(tǒng)合向量數(shù)據(jù)組得到的協(xié)方差矩陣變成了nxn的對稱非負(fù)矩陣(Symmetvicalnon-negative matrix),其固有值也存在n個(gè)。如果將固有值按照大的順序排列變成λi(i=1,2,…n),直至第m成分的累積比率(accumulated propotion)可以用下式計(jì)算。
數(shù)1Σi=1mλi/Σi=1nλi]]>
這個(gè)值在例如80%以上時(shí),停止主成分分解(光譜分解),忽略對應(yīng)于比他小的固有值的成分。而在上述例子中所謂的80%的數(shù)字可以設(shè)定為用戶給予的任意比率。另外,將對于用戶的各個(gè)固有向量與固有值一起表示后看到,也可以使用戶選擇可忽略的主成分分解成分。
此時(shí),也可以對來自在步驟S1201選擇的生物種以外的生物種的標(biāo)準(zhǔn)樣品的統(tǒng)合向量數(shù)據(jù)都進(jìn)行選擇,但要判定的生物種多時(shí),會出現(xiàn)在步驟S1203中選擇的統(tǒng)合向量數(shù)比步驟S1202中選擇的統(tǒng)合向量數(shù)多得多的狀況。如果那樣的話,其后的主成分分析結(jié)果被拖到步驟S1203選擇的統(tǒng)合向量,結(jié)果所有生物種類主成分分析的結(jié)果幾乎都相同了。為了避免這樣的結(jié)果,要在例如使步驟S1203中選擇的統(tǒng)合向量數(shù)與步驟S1202中選擇的統(tǒng)合向量數(shù)變成同樣的程度上想想辦法。
例如,從來自在步驟S1201選擇的生物種類以外的生物種類的標(biāo)準(zhǔn)樣品的統(tǒng)合向量數(shù)據(jù)中隨機(jī)選擇只與步驟S1202中選擇的統(tǒng)合向量數(shù)相同的數(shù)目。此時(shí),為了對各種各樣生物種類的標(biāo)準(zhǔn)樣品的統(tǒng)合向量數(shù)據(jù)進(jìn)行選擇,如果要判定的生物種的數(shù)為N,例如,可以對每一生物種類收集的統(tǒng)合向量的1/(N-1)數(shù)的標(biāo)準(zhǔn)樣品的統(tǒng)合向量進(jìn)行隨機(jī)選擇。這樣在步驟S1203選擇的統(tǒng)合向量數(shù)就與在步驟1202中選擇的統(tǒng)合向量數(shù)幾乎相同了。
一般來說,向量之間的比較、分類通過稱之為“圖像識別”的技術(shù)來進(jìn)行。其詳細(xì)的技術(shù)內(nèi)容在例如IEEE Transaction on PatternAnalysis and Machine Learning,Vol.22,No.1,January 2000,pp.4-pp.37中的“Statistical Pattern RecognitionA Review”Anil K.Jain,Robert P.W.Duin,and Jianchan Mao.的論文中有綜述。在本發(fā)明的生物種類判定方法中可以適用作為圖像識別技術(shù)的k-Nearest-Neighbor法、分類樹、Support Vector Machine、ベイズ(Bayes)識別法、ブ-ステイング(boosting)法、ニユ-ラルネツト(neural net)等任一種方法。
這里就利用k-Nearest-Neighbor法的圖像識別和實(shí)驗(yàn)分類樹的圖像識別進(jìn)行說明。K-Nearest-Neighbor法是在圖像識別的算法中最原始的方法。所謂k-Nearest-Neighbor法是計(jì)算標(biāo)準(zhǔn)樣品和未知樣品的特定向量之間的距離,將與基本上處于近距離的標(biāo)準(zhǔn)樣品相同的生物種類作為判定結(jié)果的方法。一般對于特定向量之間的距離用以數(shù)2式表示的歐幾里得(Euclidean)距離。
數(shù)2Σi=1n(xi-yi)2/n]]>(X為來自未知樣品,Y為來自標(biāo)準(zhǔn)樣品的向量),數(shù)3Σi=1n|xi-yi|/n]]>另外,也可以用數(shù)3式表示的絕對值距離。所謂k-Nearest-Neighbor法按照距離近的順序排列基準(zhǔn)樣品,將從最近方開始的K個(gè)中的數(shù)最多的標(biāo)準(zhǔn)樣品的生物種類作為判定結(jié)果的方法。尤其1-Nearest-Neighbor法是將與來自未知樣品的特定向量最近的標(biāo)準(zhǔn)樣品的生物種作為判定結(jié)果的方法。
以下用圖13~15就使用分類樹的圖像識別進(jìn)行說明。首先用圖13就使用分類樹的圖像識別的概要進(jìn)行說明。就象圖13所示的那樣,在使用分類樹的圖像識別中,首先,實(shí)行作成從學(xué)習(xí)圖像1301到多個(gè)分類樹1303的分類樹作成處理(1302)。
該學(xué)習(xí)圖像稱之為“教師賦予數(shù)據(jù)”,預(yù)先知道屬于哪個(gè)范疇的圖像。用傳染病病原菌判定的例子說,在樹中含有DNA芯片的雜交圖像和該菌成對的信息。而一般將作成該分類樹1303的工序稱之為學(xué)習(xí)階段。
然后使用學(xué)習(xí)階段中做成的分類樹1303對所屬種類不明的圖像(未知圖像1304)進(jìn)行圖像核對(1305),對所屬的種類進(jìn)行推定。用傳染病病原菌判定例子來說,以DNA芯片的雜交圖像為基礎(chǔ),進(jìn)行該菌的判定。一般來說,將對該未知圖像1304進(jìn)行圖像核對的工序稱之為圖像識別階段。
在本實(shí)施方式中,在學(xué)習(xí)階段由同一學(xué)習(xí)圖像1301做成多個(gè)分類樹1303。當(dāng)在學(xué)習(xí)階段中做成的分類樹1303為n個(gè)時(shí),即使在圖像識別階段,對應(yīng)于各個(gè)分類樹1303應(yīng)該得到n個(gè)識別結(jié)果。而最終識別結(jié)果1306是通過這些n個(gè)識別結(jié)果的多數(shù)決定投票進(jìn)行的。另外,當(dāng)作成的各個(gè)分類樹1303也是含有概率的分類樹時(shí),使所有n個(gè)有概率的識別結(jié)果適合每一類,將概率更高的種類作為整體的識別結(jié)果1306(這樣的算法一般稱之為嵌合算法(ensemble algorithm))。
以下用圖14就上述分類樹作成處理(1302)進(jìn)行詳細(xì)說明。圖14是表示分類樹作成處理(1302)流程的流程圖。就象該圖所示的那樣,在做成分類樹時(shí),首先,作為初期設(shè)定在步驟S1401中將根分支點(diǎn)設(shè)定為現(xiàn)行分支點(diǎn)。這里所謂現(xiàn)行是著眼于現(xiàn)在的分支點(diǎn),含有學(xué)習(xí)圖像的子集合(也可能含有全集合或根集合)。而所謂根分支點(diǎn)是分類樹的最親的分支點(diǎn),包括所有的學(xué)習(xí)圖像。
然后對在步驟S1402中的現(xiàn)行分支點(diǎn)是否含有學(xué)習(xí)圖像進(jìn)行判定。對于現(xiàn)行分支點(diǎn)是根分支點(diǎn)時(shí),通常含有學(xué)習(xí)圖像,進(jìn)行分類樹作成處理的分類樹被細(xì)分化的結(jié)果,下位層的分支點(diǎn)變成現(xiàn)行分支點(diǎn)時(shí),有時(shí)在該現(xiàn)行分支點(diǎn)中也會出現(xiàn)不含有學(xué)習(xí)圖像的時(shí)候。假如不含有時(shí),進(jìn)入到步驟S1408,將現(xiàn)行分支點(diǎn)當(dāng)做NULL分支點(diǎn)。這里所謂NULL分支點(diǎn)是判定結(jié)果不清楚的分支點(diǎn),當(dāng)未知圖像落入到NULL分支點(diǎn)時(shí),將其親代的分支點(diǎn)的種類存在概率作為圖像識別結(jié)果。
當(dāng)現(xiàn)行分支點(diǎn)設(shè)定為NULL分支點(diǎn)時(shí),關(guān)于該分支點(diǎn)由于不需要生成以上子代分支點(diǎn),返回到該分支點(diǎn)的親代分支點(diǎn)(就是說,將該分支點(diǎn)的親代分支點(diǎn)設(shè)定為現(xiàn)行分支點(diǎn)(步驟S1410))。
另外,現(xiàn)行分支點(diǎn)含有學(xué)習(xí)圖像時(shí)(不是NULL分支點(diǎn)時(shí)),在步驟S1403中對是否滿足平分支點(diǎn)進(jìn)行確認(rèn)。所謂平分支點(diǎn)指的是不具有子代分支點(diǎn),當(dāng)進(jìn)行確認(rèn)時(shí),求例如學(xué)習(xí)分支點(diǎn)中含有的學(xué)習(xí)圖像的熵,如果該熵為某一閾值以下時(shí),判定為平分支點(diǎn)。而此時(shí)用的閾值如果設(shè)定為0,在平分支點(diǎn)中應(yīng)當(dāng)只含有屬于單獨(dú)種類的學(xué)習(xí)圖像。
步驟S1403中確認(rèn)的結(jié)果如果滿足平分支點(diǎn)的條件時(shí),進(jìn)入到步驟S1409,將學(xué)習(xí)分支點(diǎn)作為平分支點(diǎn)。象上述那樣由于平分支點(diǎn)是不具有子代分支點(diǎn)的分支點(diǎn),對該分支點(diǎn)不生成子代分支點(diǎn),所以返回到該分支點(diǎn)的親代分支點(diǎn)(就是說,將該分支點(diǎn)的親分支點(diǎn)設(shè)定為現(xiàn)行分支點(diǎn)(步驟S1410))。
另一方面,當(dāng)現(xiàn)行分支點(diǎn)既不是NULL分支點(diǎn),也不是平分支點(diǎn)時(shí),在步驟S1404中決定分支點(diǎn)的判定函數(shù),生成子代分支點(diǎn)(步驟S1405)。而在步驟S1407中,將各個(gè)子代分支點(diǎn)依次設(shè)定為現(xiàn)行分支點(diǎn),反復(fù)進(jìn)行從步驟S1402到步驟S1405以及從步驟S1407到步驟S1410的處理,進(jìn)一步作成分類樹。
另外,在本實(shí)施方式中,分類樹使用2叉分類樹,在步驟S1405中生成的子代分支點(diǎn)的數(shù)通常為2個(gè)(這樣的算法稱之為2分叉分類樹嵌合算法)。在程序中實(shí)際安裝這樣的算法時(shí),將現(xiàn)行分支點(diǎn)設(shè)定為子代分支點(diǎn)是用循環(huán)實(shí)現(xiàn)的,所謂的2分叉,循環(huán)的次數(shù)應(yīng)當(dāng)為2。
如果根分支點(diǎn)以下的所有的子代分支點(diǎn)被展開,即,最終根分支點(diǎn)以下的所有的分支點(diǎn)的末端都變成NULL分支點(diǎn)或平分支點(diǎn)(在步驟S1406中變成“否”),進(jìn)入到步驟S1411,對親代分支點(diǎn)是否是根分支點(diǎn)進(jìn)行確認(rèn)。根分支點(diǎn)以下的所有的子代分支點(diǎn)都被展開時(shí),現(xiàn)行分支點(diǎn)位于分類樹的下位層的分支點(diǎn)時(shí),通過反復(fù)進(jìn)行步驟S1411、步驟S1410、步驟S1406,移到到上位層的分支點(diǎn),在現(xiàn)行分支點(diǎn)移到到一個(gè)根分支點(diǎn)以下的分支點(diǎn)為止時(shí),完成了處理。
以下用圖15對在分支點(diǎn)中決定判定函數(shù)的工序(步驟S1404)的概要進(jìn)行說明。通過圖14能夠說明的分類樹作成處理(1302)在分類樹作成算法中是普遍的處理。而在各個(gè)分類樹作成處理中作成的分類樹由于得到很高的識別率,所有在各個(gè)分支點(diǎn)中,用什么樣的算法決定判定函數(shù)的點(diǎn)變得重要。在本實(shí)施方式中,使用隨機(jī)取樣,決定判定函數(shù)。
圖15是用隨機(jī)取樣決定決定函數(shù)的處理的概要圖進(jìn)行說明的圖,1501表示現(xiàn)行分支點(diǎn)含有的學(xué)習(xí)圖像的分布。這里,為了簡化說明,種類定為用白和黑表示的2種,在現(xiàn)行分支點(diǎn)中白的學(xué)習(xí)圖像有7個(gè),而黑的學(xué)習(xí)圖像有5個(gè),合計(jì)含有12個(gè)學(xué)習(xí)圖像。
在決定判定函數(shù)時(shí),首先,從含有現(xiàn)行分支點(diǎn)決定的所有學(xué)習(xí)圖像中隨機(jī)選一個(gè)學(xué)習(xí)圖像,然后從與屬于該選擇的學(xué)習(xí)圖像的種類不同的其他種類的學(xué)習(xí)圖像中隨機(jī)選擇一個(gè)學(xué)習(xí)圖像(1503選擇的學(xué)習(xí)圖像)。然后將表示靠近這兩個(gè)學(xué)習(xí)圖像中任一個(gè)的函數(shù)作為判定函數(shù)。
成為求表示與兩個(gè)學(xué)習(xí)圖像中的哪一個(gè)近的函數(shù)時(shí)的指標(biāo)的“近”通常使用歐幾里得距離,但不限定于此,只要是可以構(gòu)成距離空間的距離尺度無論什么樣的距離都可以。如果學(xué)習(xí)圖像向量采用歐幾里得距離,被判定函數(shù)隔開的判定曲線1502變成超平面。一般來說,如果使用復(fù)雜的距離長度,可以得到更復(fù)雜的判定曲線。而對于圖15的情況,判定曲線1502的紙面右側(cè)是靠近黑的學(xué)習(xí)圖像的區(qū)域,判定曲線1502的紙面左側(cè)變成了靠近白的學(xué)習(xí)圖像的區(qū)域。
另外,隨機(jī)選擇的學(xué)習(xí)圖像的個(gè)數(shù)不限于2個(gè),從某個(gè)種類選m個(gè)、從其他種類選m個(gè),求各個(gè)m個(gè)的平均圖像,通過測定這兩個(gè)圖像的距離,也可以求判定函數(shù)。
這樣一來,在本實(shí)施方式中當(dāng)進(jìn)行分類樹作成處理時(shí),在使用2分叉分類樹嵌合算法的同時(shí),還可以通過用表示靠近從存在于各個(gè)分支點(diǎn)的學(xué)習(xí)數(shù)據(jù)中隨機(jī)選分類樹各個(gè)分支點(diǎn)的判定函數(shù)的相互類別不同的兩個(gè)學(xué)習(xí)圖像中的哪一個(gè)的函數(shù)再進(jìn)行定義,有可能在作成的分類樹中實(shí)現(xiàn)高的識別率。
3.總結(jié)就象以上說明所闡明的那樣,在本實(shí)施方式中,代替以往的培養(yǎng)法,通過使用通過DNA微陣列進(jìn)行的雜交反應(yīng),進(jìn)行判定,可以實(shí)現(xiàn)簡易、價(jià)廉,而且在短時(shí)間內(nèi)的對生物種類判定。
另外,當(dāng)利用雜交反應(yīng)結(jié)果得到的掃描圖像進(jìn)行生物種的判定時(shí),代替以往的求存在概率的方法,根據(jù)與標(biāo)準(zhǔn)樣品的對比,通過使用圖像識別,即使是具有相互類似的堿基序列的生物種類也可以進(jìn)行判定。
此時(shí),在與標(biāo)準(zhǔn)樣品的對比中,不使用對標(biāo)準(zhǔn)樣品上的所有的熒光強(qiáng)度進(jìn)行統(tǒng)合的統(tǒng)合向量,而是用從統(tǒng)合向量中提取所定的病原菌成分得到的特定向量,即使預(yù)先制備的標(biāo)準(zhǔn)樣品的數(shù)目少,也可以進(jìn)行判定。
還有,用于從統(tǒng)合向量提取特定向量時(shí)的每個(gè)病原菌的向量過濾是通過對所定病原菌含有的多個(gè)標(biāo)準(zhǔn)樣品的統(tǒng)合向量進(jìn)行主成分分析獲得的。
另外,本發(fā)明可適用于由多個(gè)儀器(例如,主計(jì)算機(jī)、連系裝置、讀數(shù)裝置、打印機(jī)等)構(gòu)成的系統(tǒng),也適用于由一個(gè)儀器構(gòu)成的裝置(例如復(fù)印機(jī)、傳真裝置等)。
另外,本發(fā)明的目的通過將記錄實(shí)現(xiàn)上述實(shí)施方式功能的軟件的程序表的記錄介質(zhì)供給系統(tǒng)或裝置,對記錄介質(zhì)中儲存了該系統(tǒng)或裝置的計(jì)算機(jī)(或CPU和MPU)的程序表實(shí)施讀出,不用說也可以達(dá)到。
此時(shí),通過從記錄介質(zhì)讀出的程序表本身實(shí)現(xiàn)上述實(shí)施方式的功能,記錄該程序表的記錄介質(zhì)構(gòu)成了本發(fā)明。
作為用于供給程序表的記錄介質(zhì),可以使用例如軟盤(注冊商標(biāo))、硬盤、光盤、光磁盤、CD-ROM、CD-R、磁帶、沒有揮發(fā)性的存儲卡、ROM等。
另外,通過實(shí)行計(jì)算機(jī)讀出的程序卡,不僅可以實(shí)現(xiàn)上述的實(shí)施方式的功能,而且根據(jù)該程序卡的指示,在計(jì)算機(jī)上運(yùn)轉(zhuǎn)的OS(操作系統(tǒng))等進(jìn)行實(shí)際處理的一部分或全部,通過這樣的處理,不用說也包括實(shí)現(xiàn)上述實(shí)施方式的功能的情形。
另外,從記錄介質(zhì)讀出的程序卡被寫入到插入計(jì)算機(jī)的功能擴(kuò)張卡或連接在計(jì)算機(jī)的功能擴(kuò)張單元中備有的存儲中后,按照該程序卡的指示,該功能擴(kuò)張卡或功能擴(kuò)張單元備有的CPU等可以實(shí)際處理的一部分或全部,不用說通過該處理,也包括實(shí)現(xiàn)上述實(shí)施方式的功能的情形。
序列表<110>佳能株式會社<120>信息處理裝置和信息處理方法以及記錄介質(zhì)、程序<130>XXXXX<150>2003-140793<151>2003-05-19<160>78<170>PatentIn version 3.2<210>1<211>22<212>DNA<213>人工<220>
<223>合成的DNA探針<400>1cagagagctt gctctcgggt ga 22<210>2<211>26<212>DNA<213>人工<220>
<223>合成的DNA探針<400>2gggaggaagg tgttgtggtt aataac 26<210>3<211>26<212>DNA<213>人工
<220>
<223>合成的DNA探針<400>3ggtgttgtgg ttaataacca cagcaa 26<210>4<211>22<212>DNA<213>人工<220>
<223>合成的DNA探針<400>4gcggtctgtc aagtcggatg tg 22<210>5<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>5attcgaaact ggcaggctag agtct 25<210>6<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>6taaccacagc aattgacgtt acccg 25<210>7
<211>24<212>DNA<213>人工<220>
<223>合成的DNA探針<400>7gcaattgacg ttacccgcag aaga24<210>8<211>26<212>DNA<213>人工<220>
<223>合成的DNA探針<400>8gaaccgcatg gttcaaaagt gaaaga 26<210>9<211>24<212>DNA<213>人工<220>
<223>合成的DNA探針<400>9cacttataga tggatccgcg ctgc24<210>10<211>26<212>DNA<213>人工<220>
<223>合成的DNA探針<400>10
tgcacatctt gacggtacct aatcag 26<210>11<211>22<212>DNA<213>人工<220>
<223>合成的DNA探針<400>11ccccttagtg ctgcagctaa cg 22<210>12<211>23<212>DNA<213>人工<220>
<223>合成的DNA探針<400>12aatacaaagg gcagcgaaac cgc 23<210>13<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>13ccggtggagt aaccttttag gagct 25<210>14<211>25<212>DNA<213>人工
<220>
<223>合成的DNA探針<400>14taacctttta ggagctagcc gtcga 25<210>15<211>23<212>DNA<213>人工<220>
<223>合成的DNA探針<400>15tttaggagct agccgtcgaa ggt 23<210>16<211>23<212>DNA<213>人工<220>
<223>合成的DNA探針<400>16tagccgtcga aggtgggaca aat 23<210>17<211>22<212>DNA<213>人工<220>
<223>合成的DNA探針<400>17gaacagacga ggagcttgct cc 22<210>18
<211>26<212>DNA<213>人工<220>
<223>合成的DNA探針<400>18tagtgaaaga cggttttgct gtcact 26<210>19<211>26<212>DNA<213>人工<220>
<223>合成的DNA探針<400>19taagtaacta tgcacgtctt gacggt 26<210>20<211>26<212>DNA<213>人工<220>
<223>合成的DNA探針<400>20gacccctcta gagatagagt tttccc 26<210>21<211>24<212>DNA<213>人工<220>
<223>合成的DNA探針<400>21
agtaaccatt tggagctagc cgtc24<210>22<211>23<212>DNA<213>人工<220>
<223>合成的DNA探針<400>22gagcttgctc ctctgacgtt agc 23<210>23<211>22<212>DNA<213>人工<220>
<223>合成的DNA探針<400>23agccggtgga gtaaccattt gg 22<210>24<211>22<212>DNA<213>人工<220>
<223>合成的DNA探針<400>24ctcttgccat cggatgtgcc ca 22<210>25<211>26<212>DNA<213>人工
<220>
<223>合成的DNA探針<400>25atacctttgc tcattgacgt tacccg 26<210>26<211>24<212>DNA<213>人工<220>
<223>合成的DNA探針<400>26tttgctcatt gacgttaccc gcag24<210>27<211>24<212>DNA<213>人工<220>
<223>合成的DNA探針<400>27actggcaagc ttgagtctcg taga24<210>28<211>23<212>DNA<213>人工<220>
<223>合成的DNA探針<400>28atacaaagag aagcgacctc gcg 23<210>29
<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>29cggacctcat aaagtgcgtc gtagt 25<210>30<211>26<212>DNA<213>人工<220>
<223>合成的DNA探針<400>30gcggggagga agggagtaaa gttaat 26<210>31<211>23<212>DNA<213>人工<220>
<223>合成的DNA探針<400>31tagcacagag agcttgctct cgg 23<210>32<211>23<212>DNA<213>人工<220>
<223>合成的DNA探針<400>32
tcatgccatc agatgtgccc aga 23<210>33<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>33cggggaggaa ggcgataagg ttaat 25<210>34<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>34ttcgattgac gttacccgca gaaga 25<210>35<211>26<212>DNA<213>人工<220>
<223>合成的DNA探針<400>35ggtctgtcaa gtcggatgtg aaatcc 26<210>36<211>24<212>DNA<213>人工
<220>
<223>合成的DNA探針<400>36gcaggctaga gtcttgtaga gggg24<210>37<211>24<212>DNA<213>人工<220>
<223>合成的DNA探針<400>37tgagggagaa agtgggggat cttc24<210>38<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>38tcagatgagc ctaggtcgga ttagc 25<210>39<211>24<212>DNA<213>人工<220>
<223>合成的DNA探針<400>39gagctagagt acggtagagg gtgg24<210>40
<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>40gtacggtaga gggtggtgga atttc 25<210>41<211>24<212>DNA<213>人工<220>
<223>合成的DNA探針<400>41gaccacctgg actgatactg acac24<210>42<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>42tggccttgac atgctgagaa ctttc 25<210>43<211>23<212>DNA<213>人工<220>
<223>合成的DNA探針<400>43
ttagttacca gcacctcggg tgg 23<210>44<211>22<212>DNA<213>人工<220>
<223>合成的DNA探針<400>44tagtctaacc gcaaggggga cg 22<210>45<211>22<212>DNA<213>人工<220>
<223>合成的DNA探針<400>45tagcacaggg agcttgctcc ct 22<210>46<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>46aggtggrgag cttaatacgc tcatc 25<210>47<211>26<212>DNA<213>人工
<220>
<223>合成的DNA探針<400>47tcatcaattg acgttactcg cagaag 26<210>48<211>26<212>DNA<213>人工<220>
<223>合成的DNA探針<400>48actgcatttg aaactggcaa gctaga 26<210>49<211>24<212>DNA<213>人工<220>
<223>合成的DNA探針<400>49ttatcctttg ttgcagcttc ggcc24<210>50<211>23<212>DNA<213>人工<220>
<223>合成的DNA探針<400>50actttcagcg aggaggaagg tgg 23<210>51
<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>51agtagaacgc tgaaggagga gcttg 25<210>52<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>52cttgcatcac taccagatgg acctg 25<210>53<211>26<212>DNA<213>人工<220>
<223>合成的DNA探針<400>53tgagagtgga aagttcacac tgtgac 26<210>54<211>26<212>DNA<213>人工<220>
<223>合成的DNA探針<400>54
gctgtggctt aaccatagta ggcttt 26<210>55<211>23<212>DNA<213>人工<220>
<223>合成的DNA探針<400>55aagcggctct ctggcttgta act 23<210>56<211>24<212>DNA<213>人工<220>
<223>合成的DNA探針<400>56tagacccttt ccggggttta gtgc24<210>57<211>26<212>DNA<213>人工<220>
<223>合成的DNA探針<400>57gacggcaagc taatctctta aagcca 26<210>58<211>24<212>DNA<213>人工
<220>
<223>合成的DNA探針<400>58gcttgggaat ctggcttatg gagg24<210>59<211>23<212>DNA<213>人工<220>
<223>合成的DNA探針<400>59tgccatagga tgagcccaag tgg 23<210>60<211>26<212>DNA<213>人工<220>
<223>合成的DNA探針<400>60cttgggaatg tactgacgct catgtg 26<210>61<211>23<212>DNA<213>人工<220>
<223>合成的DNA探針<400>61ggattgggct tagagcttgg tgc 23<210>62
<211>22<212>DNA<213>人工<220>
<223>合成的DNA探針<400>62tacagaggga agcgaagctg cg 22<210>63<211>26<212>DNA<213>人工<220>
<223>合成的DNA探針<400>63ggcgtttacc acggtatgat tcatga 26<210>64<211>23<212>DNA<213>人工<220>
<223>合成的DNA探針<400>64aatgcctacc aagcctgcga tct 23<210>65<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>65
tatcggaaga tgaaagtgcg ggact 25<210>66<211>23<212>DNA<213>人工<220>
<223>合成的DNA探針<400>66ttctttcctc ccgagtgctt gca 23<210>67<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>67aacacgtggg taacctaccc atcag 25<210>68<211>24<212>DNA<213>人工<220>
<223>合成的DNA探針<400>68atggcataag agtgaaaggc gctt24<210>69<211>22<212>DNA<213>人工
<220>
<223>合成的DNA探針<400>69gacccgcggt gcattagcta gt 22<210>70<211>25<212>DNA<213>人工<220>
<223>合成的DNA探針<400>70ggacgttagt aactgaacgt cccct 25<210>71<211>22<212>DNA<213>人工<220>
<223>合成的DNA探針<400>71ctcaaccggg gagggtcatt gg 22<210>72<211>22<212>DNA<213>人工<220>
<223>合成的DNA探針<400>72ttggagggtt tccgcccttc ag 22<210>73
<211>23<212>DNA<213>人工<220>
<223>合成的DNA用作正向引物<400>73gcggcgtgcc taatacatgc aag 23<210>74<211>23<212>DNA<213>人工<220>
<223>合成的DNA用作正向引物<400>74gcggcaggcc taacacatgc aag 23<210>75<211>23<212>DNA<213>人工<220>
<223>合成的DNA用作正向引物<400>75gcggcaggct taacacatgc aag 23<210>76<211>22<212>DNA<213>人工<220>
<223>合成的DNA用作反向引物<400>76
atccagccgc accttccgat ac 22<210>77<211>22<212>DNA<213>人工<220>
<223>合成的DNA用作反向引物<400>77atccaaccgc aggttcccct ac 22<210>78<211>22<212>DNA<213>人工<220>
<223>合成的DNA用作反向引物<400>78atccagccgc aggttcccct ac 2權(quán)利要求
1.信息處理裝置,是使用配置了作為與生物種核酸序列的一部分互補(bǔ)的核酸的探針的DNA微陣列,對涉及到的使所定檢體進(jìn)行雜交反應(yīng)結(jié)果得到的DNA微陣列上的各個(gè)探針的信號強(qiáng)度的有關(guān)信息進(jìn)行處理的信息處理裝置,其特征是具備以下手段對與使已知生物種進(jìn)行雜交反應(yīng)結(jié)果得到的上述各個(gè)探針的信號強(qiáng)度有關(guān)的第1信息進(jìn)行保持的保持手段,取得有關(guān)使上述所定檢體進(jìn)行雜交反應(yīng)結(jié)果得到的各個(gè)探針的信號強(qiáng)度的信息的第2信息的取得手段,在上述第1以及第2信息中,提取與所定生物種有關(guān)的信息的提取手段,和依據(jù)通過上述提取手段提取的上述第1信息中與所定生物種有關(guān)的信息與上述第2信息中與所定生物種有關(guān)的信息,對上述所定檢體是否含有該所定生物種類進(jìn)行判定的判定手段。
2.權(quán)利要求1所述的信息處理裝置,其特征是所謂的上述第1和第2信息是在對應(yīng)于上述DNA微陣列上的探針數(shù)的多維空間,以該各個(gè)探針的信號強(qiáng)度作為成分的向量數(shù)據(jù)。
3.權(quán)利要求2所述的信息處理裝置,其特征是上述提取手段是進(jìn)行削減作為上述第1和第2信息的向量數(shù)據(jù)的維數(shù)的變換。
4.權(quán)利要求2所述的信息處理裝置,其特征是上述提取手段是根據(jù)對保持在上述保持手段的上述第1信息的向量數(shù)據(jù)中的含有上述所定生物種的多個(gè)向量數(shù)據(jù)進(jìn)行的主成分分析,提取與上述所定生物種有關(guān)的信息。
5.權(quán)利要求1所述的信息處理裝置,其特征是上述判定手段是通過圖形識別處理進(jìn)行判定的。
6.權(quán)利要求5所述的信息處理裝置,其特征是上述判定手段是分類樹,該分類樹是用2分叉分類樹嵌合算法(ensemble algorithm)作成的,而且位于該分類樹的各個(gè)分支點(diǎn)的判定函數(shù)是用表示接近從存在于該各個(gè)分支點(diǎn)的學(xué)習(xí)數(shù)據(jù)中隨機(jī)選擇出來的不同種類的兩個(gè)學(xué)習(xí)圖形中的一個(gè)的函數(shù)定義的。
7.信息處理方法,是使用配置了作為與生物種核酸序列的一部分互補(bǔ)的核酸的探針的DNA微陣列,對有關(guān)使所定檢體進(jìn)行雜交反應(yīng)結(jié)果得到的DNA微陣列上的各個(gè)探針的信號強(qiáng)度的信息進(jìn)行處理的信息處理方法,其特征是具備以下工序?qū)εc使已知生物種進(jìn)行雜交反應(yīng)結(jié)果得到的上述各個(gè)探針的信號強(qiáng)度有關(guān)的第1信息進(jìn)行保持的保持工序,取得有關(guān)對上述所定檢體進(jìn)行雜交反應(yīng)結(jié)果得到的各個(gè)探針的信號強(qiáng)度的第2信息的取得工序,在上述第1以及第2信息中,提取與所定生物種有關(guān)的信息的提取工序,和依據(jù)通過上述提取手段提取的上述第1信息中與所定生物種有關(guān)的信息與上述第2信息中與所定生物種有關(guān)的信息,對上述所定檢體是否含有該所定生物種進(jìn)行判定的判定工序。
8.權(quán)利要求7所述的信息處理方法,其特征是所謂的上述第1和第2信息是在對應(yīng)于上述DNA微陣列上的探針數(shù)的多維空間,以該各個(gè)探針的信號強(qiáng)度作為成分的向量數(shù)據(jù)。
9.權(quán)利要求8所述的信息處理方法,其特征是上述提取工序是進(jìn)行削減作為上述第1和第2信息的向量數(shù)據(jù)的維數(shù)的變換。
10.權(quán)利要求8所述的信息處理方法,其特征是上述提取工序根據(jù)對保持在上述保持工序的上述第1信息的向量數(shù)據(jù)中的含有上述所定生物種的多個(gè)向量數(shù)據(jù)進(jìn)行的主成分分析,提取與上述所定生物種有關(guān)的信息。
11.權(quán)利要求7所述的信息處理方法,上述判定工序是通過圖形識別處理進(jìn)行判定的。
12.權(quán)利要求11所述的信息處理方法,其特征是上述判定工序通過分類樹進(jìn)行處理的,該分類樹是用2分叉分類樹嵌合算法做成的,而且位于該分類樹的各個(gè)分支點(diǎn)的判定函數(shù)是用表示接近從存在于該各個(gè)分支點(diǎn)的學(xué)習(xí)數(shù)據(jù)中隨機(jī)選擇出來的不同種類的兩個(gè)學(xué)習(xí)圖形中的一個(gè)的函數(shù)定義的。
13.用于通過計(jì)算機(jī)使權(quán)利要求7至12任一項(xiàng)所述的信息處理方法實(shí)現(xiàn)的調(diào)控程序。
14.貯存用于通過計(jì)算機(jī)使權(quán)利要求7至12任一項(xiàng)所述的信息處理方法實(shí)現(xiàn)的調(diào)控程序的記錄介質(zhì)。
全文摘要
根據(jù)本發(fā)明,即使是在檢體中存在多個(gè)具有相互類似堿基序列的生物種時(shí),也可以簡易、費(fèi)用低、而且在短時(shí)間對生物種進(jìn)行高精度地進(jìn)行判定。為了達(dá)到這樣的目的,本發(fā)明涉及到的信息處理裝置是使用配置了作為與生物種核酸序列的一部分互補(bǔ)的核酸的探針的DNA微陣列,對有關(guān)使所定檢體進(jìn)行雜交反應(yīng)結(jié)果得到的DNA微陣列上的各個(gè)探針的信號強(qiáng)度的信息進(jìn)行處理的信息處理裝置,其特征是具備保持已知樣品的手段、取得有關(guān)使所定檢體進(jìn)行雜交反應(yīng)結(jié)果得到的未知樣品的手段、在上述已知和未知樣品中,提取與所定生物種有關(guān)的向量的手段、和通過對上述提取手段的上述已知樣品的向量和上述未知樣品的向量進(jìn)行比較,對上述所定檢體是否含有該所定生物種進(jìn)行判定的判定手段。
文檔編號G06F19/20GK1550557SQ20041004464
公開日2004年12月1日 申請日期2004年5月19日 優(yōu)先權(quán)日2003年5月19日
發(fā)明者吉井裕人 申請人:佳能株式會社