長城汽車與中汽中心標準院聯(lián)合研發(fā)AutoS-GPT,引領(lǐng)汽車標準法規(guī)新變革
近日,長城汽車聯(lián)合中國汽車技術(shù)研究中心有限公司中國汽車標準化研究院(以下簡稱“中汽中心標準院”)自主研發(fā)的汽車行業(yè)標準知識問答大模型 AutoS-GPT 圓滿完成第一階段研發(fā)工作,即將重磅開放。在汽車產(chǎn)業(yè)加速向數(shù)字化、智能化轉(zhuǎn)型的關(guān)鍵時期,將為汽車行業(yè)標準法規(guī)領(lǐng)域帶來前所未有的創(chuàng)新活力與發(fā)展機遇。
AutoS-GPT
強強聯(lián)合,共研AutoS-GPT
長城汽車在汽車制造領(lǐng)域的深厚底蘊與在 AI 大模型及應(yīng)用產(chǎn)品開發(fā)的先進實踐經(jīng)驗,為此次合作注入了強大的技術(shù)動能。其成熟的基于 AI 大模型構(gòu)建的 AI 知識問答系統(tǒng)已在企業(yè)內(nèi)部關(guān)鍵部門廣泛應(yīng)用,超 90% 的文本問答精度以及高達 10W + 次的累計問答次數(shù),充分驗證了其在數(shù)據(jù)處理與智能應(yīng)用方面的卓越能力,為 AutoS-GPT 的研發(fā)提供了堅實的技術(shù)支撐與寶貴的實踐參考。
中汽中心標準院作為汽車行業(yè)標準研究的核心機構(gòu),長期以來在國行標文檔數(shù)據(jù)的收集、整理與更新方面保持著領(lǐng)先地位,擁有著無可比擬的豐富且最新最全的資源庫。其發(fā)起的汽車標準數(shù)字化行動,彰顯了在推動行業(yè)標準現(xiàn)代化進程中的堅定決心與引領(lǐng)者風范,旨在通過前沿技術(shù)的應(yīng)用,重塑汽車標準知識服務(wù)生態(tài),提升整個行業(yè)的標準化水平與效率。
長城汽車與中汽中心標準院圍繞汽車標準大模型開展研究合作
更新的數(shù)據(jù)
行業(yè)標準數(shù)字化的建設(shè),需要持續(xù)更新完善的數(shù)據(jù)庫和全面完整的行業(yè)知識做數(shù)據(jù)積累。數(shù)據(jù)就像大模型的燃料,沒有高質(zhì)量的數(shù)據(jù),大模型只是一個華麗的空殼。
長城汽車與中汽中心標準院合作的AutoS-GPT 采用RAG架構(gòu)(大模型外掛知識庫),可以實時接收最新最全的汽車行業(yè)國家標準、行業(yè)標準。目前AutoS-GPT知識庫已接入近萬份正版權(quán)威的國行標文件,并通過預(yù)處理,將知識轉(zhuǎn)化為可計算的數(shù)據(jù)。
在未來,更多更新的國行標文件發(fā)行之后,也會源源不斷地、實時地更新在知識庫中,利用汽車垂域GPT的總結(jié)分析能力,持續(xù)為汽車行業(yè)專家提供高效便捷的知識服務(wù),為整個行業(yè)的知識積累與知識流轉(zhuǎn)提供數(shù)據(jù)與能力的完美結(jié)合。
AutoS-GPT
更流暢的問答
汽車工程師在獲取國家行業(yè)的標準法規(guī)的文件時,往往存在數(shù)量多不易找、檢索方式單一、信息獲取不全等問題。而有了知識問答大模型,工程師可以直接在問答界面,輸入自己的問題,知識大模型會理解問題的內(nèi)容,然后從數(shù)據(jù)庫中調(diào)取對應(yīng)的材料,生成答案,反饋給工程師們。不僅如此,點擊答案內(nèi)容,可以直接為工程師提供準確的答案出處,精準鎖定國行標文件里對應(yīng)的知識段落,方便工程師查看源文件。
那么,AutoS-GPT是怎么準確理解工程師的問題,并將數(shù)據(jù)庫中的知識轉(zhuǎn)化為恰如其分的答案呢?
一方面,研發(fā)團隊從汽車工程師的日常工作出發(fā),將工程師的提問習慣、提問內(nèi)容投喂給大模型,讓大模型深度學習、理解更符合工程師邏輯的問答習慣;另一方面,AutoS-GPT采用數(shù)據(jù)飛輪的方式,不斷收集用戶反饋,完成從收集數(shù)據(jù)-模型訓(xùn)練-用戶反饋的完整閉環(huán),使模型不斷更新優(yōu)化,在使用過程中不斷學習以提供更優(yōu)的用戶體驗。
因此,在接收到工程師的問題時,AutoS-GPT能夠快速從向量數(shù)據(jù)庫中找出對應(yīng)的知識,再按照問答邏輯,將答案回復(fù)給工程師,從而為行業(yè)提供更自然、更流暢的知識問答體驗。
AutoS-GPT問答演示
更高的準確率
其他的問答大模型進入汽車行業(yè),很難提供高質(zhì)量的知識服務(wù)。一是行業(yè)數(shù)據(jù)缺少積累,二是專業(yè)“把關(guān)人”的角色缺失。知識文件的格式包括文檔、表格、PDF、圖片等,問答大模型的提取總結(jié)能力容易出現(xiàn)生成錯誤答案、召回不準、文本塊拆分較粗等問題。
AutoS-GPT在問答流程中,就為知識設(shè)置了一個專業(yè)“把關(guān)人”的角色,在知識內(nèi)容和大模型之間進行強有力的把關(guān)。AutoS-GPT的“把關(guān)人”角色由知識解析+語義檢索構(gòu)成。而決定知識解析的關(guān)鍵因素,就是數(shù)據(jù)標注的精確度。
為此,長城汽車打造了行業(yè)首套標準解析工具,可以一鍵解析標準文檔,包括標題、段落、表格、頁眉頁腳等,識別準確率接近99%。同時,打造了標準領(lǐng)域第一個語義檢索工具doc-embedding模型,準確率較業(yè)內(nèi)同級提升了20%。
此外,設(shè)置人類專家介入數(shù)據(jù)標注,作為自動標注的裁判,來對機器標注的結(jié)果進行專業(yè)判定,提高知識精度;而機器標注也同時提高著標注效率,由此能夠為行業(yè)、企業(yè)、高校和用戶提供更準確、更便捷的汽車行業(yè)標準知識問答服務(wù)。
與中汽中心標準院合作共推汽車標準數(shù)字化行動,交付AutoS-GPT大模型助力汽車行業(yè)標準知識問答服務(wù),是長城汽車在AI時代的使命與擔當。未來,我們期望與更多行業(yè)伙伴一起,以科技創(chuàng)新為驅(qū)動,深度挖掘汽車標準法規(guī)數(shù)據(jù)價值,進一步推動汽車行業(yè)標準數(shù)字化進程;同時,將這些知識轉(zhuǎn)化為數(shù)據(jù),再以數(shù)據(jù)賦能我們的汽車產(chǎn)品與汽車服務(wù),最終為用戶的日常出行帶來更多可能。