本發(fā)明屬于工業(yè)數字化領域,尤其是涉及一種基于大語言模型的cae求解器文件格式通用轉換系統(tǒng)。
背景技術:
1、cae(computer?aided?engineering,工程設計中的計算機輔助工程)求解器的開發(fā)往往獨立于前處理軟件、后處理軟件的開發(fā),并以文件的形式與二者進行交互,這樣做有其歷史淵源,也有工程實際上的考慮。但求解器開發(fā)領域尚未形成具體的行業(yè)標準,因此使得最終開發(fā)出來的求解器高度依賴于開發(fā)人員的個人編程習慣,這影響了求解器與其他第三方前后處理軟件之間的兼容性,尤其是輸入輸出文件內容格式不匹配可能直接導致求解器無法與前后處理銜接。
2、現有的cae求解器文件格式轉換工具通常作為黑箱內置于商業(yè)cae軟件,開發(fā)人員無法直接對該工具進行擴展,導致求解器開發(fā)者只能圍繞要采用的前后處理軟件規(guī)定進行開發(fā),或者額外寫一個專門的轉換器進行適配,而轉換器的開發(fā)涉及到復雜的學科背景和編程知識,這限制了求解器開發(fā)的靈活性、降低了求解器開發(fā)的效率;開源cae求解器文件格式轉換工具五花八門,它們讀寫原理不同、編程語言不同,很難全部集成到一個平臺上管理;目前市場上的cae求解器文件格式轉換工具,轉換后的模型會丟失大量細節(jié)信息,使用時需要人工對轉換后的模型進行手動修復,效率極低;此外,現有的cae求解器文件格式轉換工具往往采用表格將待轉文件、目標文件的格式主題一一對應,這對1轉n、n轉1的批量轉換任務而言較為繁復。
3、因此,亟需一種技術方案能夠在解耦求解器與前后處理軟件的同時不影響兼容性,在交互靈活便捷前提下能夠進一步提高準確可靠性,并且能夠處理1轉n、n轉1的批量轉換任務。
技術實現思路
1、本發(fā)明提供了一種基于大語言模型的cae求解器文件格式通用轉換系統(tǒng),解決了現有技術開發(fā)技術門檻高、可擴展性差、進行1轉n與n轉1困難、轉換后需要大量人工干預校核等技術問題。
2、一種基于大語言模型的cae求解器文件格式通用轉換系統(tǒng),包括llm分析轉換模塊、知識存儲模塊、轉換算法模塊、圖檢索模塊;
3、所述llm分析轉換模塊,應用chatglm理解轉換指令,查詢調用知識存儲模塊并結合文檔知識圖譜生成目標文件內容,輸出結果文件路徑供用戶查看或調用;
4、所述知識存儲模塊,存儲cae求解器的文件格式模板、領域知識、版本信息、文檔知識圖譜;所述文檔知識圖譜以有向邊的形式標記各文件間是否已經存在有效轉換路徑,作為轉換算法切換算法過程的依據;
5、所述圖檢索模塊,快速索引文件格式轉換任務過程中當下主題格式轉換相關的文檔知識圖譜子圖,結合轉換算法定位轉換任務關鍵詞主題,為llm分析轉換模塊提供當前任務背景知識;
6、所述轉換算法模塊,內含轉換算法,實現文檔知識圖譜中新轉換路徑的構建與存儲、結合圖檢索模塊實現轉換任務關鍵詞主題的確定與定位,完成轉化內容填充,并串聯llm分析轉換模塊與圖檢索模塊。
7、下面對每一個模塊進一步進行說明。
8、所述的llm分析轉換模塊中,查詢調用知識存儲模塊指的是通過langchain連接知識庫中以向量形式存儲的知識,擴展chatglm在求解器文件轉換業(yè)務中的知識內容與相關學科知識規(guī)則;
9、結合文檔知識圖譜指的是通過結合文檔知識圖譜補充的模板結構信息,豐富由待轉文件格式到目標文件格式的具體任務背景知識、目標文件格式模板中的主題層次與復雜關系。
10、所述的知識存儲模塊中,cae求解器的文件格式模板、領域知識、版本信息基于faiss以向量的形式高效存儲;
11、所述文檔知識圖譜基于neo4j,以自底向上的方式逐級分類文件模板內容,基于分類結果構建,以展現文件模板中各主題間的復雜關系。
12、進一步地,文件格式模板在開始轉換任務之前以向量的形式存儲在知識庫中,若不存在應當先創(chuàng)建該模板,模板中應包括關鍵字及對應關鍵字表示主題的內容結構示例;
13、模板關鍵字包括節(jié)點定義、單元定義、材料定義、屬性定義、邊界條件、載荷定義、分析控制。
14、所述的知識存儲模塊中,cae求解器文件格式常見的有.inp、.nas、.k、.mph等,通常包括節(jié)點坐標、材料屬性、邊界條件、載荷步信息、網格信息、求解控制參數、幾何模型、計算結果等;所述領域知識,包括數學模型、算法理論、學科知識、工程原理等;所述版本存檔指保存chatglm模型歷史的config文件與log文件,使開發(fā)人員能夠追溯并人工修正模型優(yōu)化效果。
15、轉換路徑,指目標文件模板存儲路徑、主題定位表;所述主題定位表中包含所有關鍵詞主題在模板中的相對位置,主題定位表中的相對位置在具體轉換任務中會隨著關鍵詞主題下轉換結果內容的填充而浮動。
16、有效轉換路徑指的是已經順利完成過,并且可以復刻的求解器格式轉換過程所記錄的文件模板路徑與主題定位表;在文檔知識圖譜中具有有效轉換路徑的格式文檔通過有向邊連接在一起。
17、所述的圖檢索模塊中,當下主題格式相關的文檔知識圖譜子圖用于為chatglm提供文件結構之間的復雜關系,緩解chatglm在求解器文件格式轉換任務中的幻覺現象,并在創(chuàng)建新的轉換路徑時提高效率;
18、快速索引需要結合文檔知識圖譜、待轉文件、目標文件格式模板及主題定位表根據轉換算法進行工作;所述主題定位表在轉換任務進行過程中,根據具體任務的轉換算法流程更新表中的相對位置。
19、所述的轉換算法模塊中,實現文檔知識圖譜中新轉換路徑的構建與存儲,包括:
20、轉換算法定位目標文件模板并記錄路徑;從目標文件格式模板相關的文檔知識圖譜中檢索具有最高相關性的子圖;在檢索到的最高相關性子圖的末梢節(jié)點獲取主題定位并記錄至主題定位表;創(chuàng)建待轉文件指向目標文件有向邊,并標記轉換路徑。
21、所述的轉換算法模塊中,結合圖檢索模塊實現轉換任務關鍵詞主題的確定與定位,對于存在有效路徑轉換的任務,包括:
22、由圖檢索所知有效路徑可得文件格式模板路徑,定位后創(chuàng)建副本,初始化模板主題計數器i、實際主題計數器j、內容計數器count;根據轉換路徑中的主題定位表所指示,指針定位至文件模板副本內部主題位置pi=pi+count,其中count用來彌補主題定位浮動;
23、對于不存在有效路徑轉換的任務,包括:
24、根據文檔名所在節(jié)點定位至目標文件格式模板所在路徑,并記錄路徑后創(chuàng)建副本,初始化內容計數器count,用來彌補定位浮動;從圖檢索的末梢節(jié)點獲取最小單位關鍵詞主題所在的文件模板相對位置,在模板副本中定位關鍵詞主題,并記錄主題位置為p=當時位置-count。
25、所述的轉換算法模塊中,完成轉化內容填充,對于存在有效轉換路徑的轉換任務,包括:
26、應用chatglm對待轉文件文本進行分析分類,若內容為主題,則先判斷初始化模板主題計數器i、實際主題計數器j是否指向同一個主題,若不是則報警等待人工交互處理;若是同一個主題,則提取主題結構示例至prompt限制chatglm行為,并在副本中刪除結構示例;若為內容,則應用chatglm根據轉換指令、知識存儲模塊知識與規(guī)則、相關子圖信息融合的prompt進行轉換,把生成的轉化結果內容填充至文件模板副本指針處;若為eof,則向llm分析轉換模塊發(fā)送完成指令;
27、對于不存在有效轉換路徑的轉換任務,包括:
28、用chatglm對待轉文本進行l(wèi)lm分析分類,若內容為主題,則進行圖檢索,獲取余弦相似度平均值最高子圖;從圖檢索的末梢節(jié)點獲取最小單位關鍵詞主題所在的文件模板相對位置,在模板副本中定位關鍵詞主題;提取結構示例至prompt,在副本中刪除結構示例;若為內容,應用chatglm根據據轉換指令、知識存儲模塊知識與規(guī)則、相關子圖信息融合的prompt進行l(wèi)lm轉換,并將生成的結果內容填充至文件模板副本指針處;若為eof,則向llm分析轉換模塊發(fā)送完成指令。
29、所述的轉換算法模塊中,串聯llm分析轉換模塊與圖檢索模塊,包括:
30、檢索文檔知識圖譜,確定是否存在一條由待轉文件格式至目標文件格式的有效轉換路徑,根據結果選擇不同算法過程進行主題定位;
31、主題定位成功后,算法調用chatglm對待轉文件文本進行分類分析,并根據結果選擇進行內容填充處理、繼續(xù)主題定位、向llm分析轉換模塊發(fā)出完成轉換信號。
32、與現有技術相比,本發(fā)明具有以下有益效果:
33、本發(fā)明通過結合chatglm、langchain、向量知識庫、知識圖譜進行cae求解器文件格式通用轉換,能夠提高cae求解器格式轉換工具的靈活性、降低cae求解器格式轉換工具二次開發(fā)門檻、適應1轉n與n轉1批量轉換任務。