本發(fā)明屬于醫(yī)療器械與人工智能,具體涉及一種基于改進rt-detr和deeplabv3+的喉鏡影像識別方法,主要應用于咽喉疾病的圖像分割與病變檢測。
背景技術:
1、隨著醫(yī)療技術的發(fā)展,喉鏡檢查已成為檢測咽喉疾病的重要手段。然而,傳統(tǒng)的喉鏡檢查依賴于醫(yī)生的經(jīng)驗,存在一定的主觀性和局限性,尤其是在疾病早期表現(xiàn)微弱的情況下,可能出現(xiàn)漏診或誤診。近年來,深度學習技術在圖像處理和醫(yī)學輔助診斷領域取得了顯著進展,為基于喉鏡的自動診斷提供了新思路。通過結合喉鏡圖像和深度學習算法,可以提高診斷的準確性、效率和實時性,幫助醫(yī)生做出更為準確的判斷。
技術實現(xiàn)思路
1、本發(fā)明提出一種基于改進rt-detr和deeplabv3+的喉鏡影像識別方法,以解決傳統(tǒng)喉鏡檢查中的主觀性問題,提高診斷的準確性和效率。本發(fā)明包括以下步驟:
2、s1:構建基礎數(shù)據(jù)集:獲取喉鏡影像視頻,構建喉鏡視頻數(shù)據(jù)集,并通過專家標注生成病變區(qū)域的標簽,作為基礎數(shù)據(jù)集;
3、s2:擴充數(shù)據(jù)集:使用數(shù)據(jù)增強方法對不均衡的喉鏡影像數(shù)據(jù)進行擴充。采用翻轉(zhuǎn)、旋轉(zhuǎn)、對比度調(diào)整等方式增強數(shù)據(jù)集的多樣性,增加訓練樣本,提升模型的魯棒性;
4、s3:聲帶區(qū)域分割:使用deeplabv3+模型對喉鏡影像中的聲帶區(qū)域進行精確分割;
5、s4:病變區(qū)域識別:搭建并改進rt-detr模型,用于喉鏡影像中病變區(qū)域的識別。
6、s5:病變診斷與結果評估:根據(jù)病變區(qū)域的識別與分割結果,結合影像特征,輸出輔助診斷建議;基于病變區(qū)域的形態(tài)、大小等特征,綜合評估其嚴重程度,生成診斷評分指標,以輔助醫(yī)生做出最終診斷。
7、優(yōu)選地,使用了輕量化的mobilenetv4模型并加入slim-neck,mobilenetv4的輕量化、高效性和可擴展性使其在喉鏡目標檢測任務中成為一個非常具有競爭力的解決方案。在便攜、低功耗和實時檢測需求上,它能夠提供兼顧速度和精度的平衡表現(xiàn)。
8、優(yōu)選地,在聲帶分割環(huán)節(jié)使用了deeplabv3+并使用ghostnet。ghostnet是一種專為移動設備設計的輕量級網(wǎng)絡,具有較少的參數(shù)和計算復雜度。相比傳統(tǒng)的deeplabv3+使用的骨干網(wǎng)絡,ghostnet能夠在保持良好檢測精度的同時,顯著提升推理速度。這對于喉鏡目標檢測的實時性要求非常重要,能夠更快速地完成圖像處理和分析。
9、有益效果
10、本發(fā)明實現(xiàn)了基于喉鏡圖像的自動化病變檢測與分類,提高了診斷的客觀性和準確性。
11、深度學習算法能夠?qū)崟r處理喉鏡視頻,為醫(yī)生提供實時的輔助診斷。
12、本發(fā)明降低了漏診和誤診的風險,特別適用于復雜的咽喉疾病早期診斷。
1.一種基于改進rt-detr和deeplabv3+的喉鏡影像識別方法,屬于醫(yī)療影像分析技術領域,包括以下步驟:
2.根據(jù)權利要求1所述的基于改進rt-detr和deeplabv3+的喉鏡影像識別方法,其特征在于,還包括:
3.根據(jù)權利要求1所述的基于改進rt-detr和deeplabv3+的喉鏡影像識別方法,其特征在于,使用deeplabv3+模型對聲帶區(qū)域進行分割,該模型通過多尺度特征提取和空洞卷積提升對復雜區(qū)域的分割精度。
4.根據(jù)權利要求1所述的基于的改進rt-detr和deeplabv3+喉鏡影像識別方法,其特征在于,使用rt-detr模型對喉鏡影像中的病變區(qū)域進行高效識別。
5.根據(jù)權利要求1所述的基于改進rt-detr和deeplabv3+的喉鏡影像識別方法,其特征在于,診斷分析根據(jù)病變區(qū)域的識別與聲帶分割結果,生成診斷評分指標,用以評估病變的嚴重程度。