5月9日消息,阿里巴巴達摩院(湖畔實驗室)、新加坡南洋理工大學等聯(lián)合提出了大模型知識鏈(CoK)框架。相比傳統(tǒng)的檢索增強生成(RAG)技術,該框架可實時檢索異構知識源并逐步糾正推理錯誤,進一步提高大模型問答知識型問題的準確率,降低幻覺現(xiàn)象。相關論文入選正在奧地利維也納舉行的國際表征學習大會(ICLR 2024)。
“執(zhí)導了《El Tio Disparate》的阿根廷演員出生于哪一年?”面對此類需要多步推理的知識型問題,大模型可能會“胡言亂語”,給出看似符合邏輯,實則錯誤或并不存在的回答。這個問題被稱作大模型“幻覺”,極大制約了大模型的應用場景。學界也在重點研究給大模型“外掛知識庫”的RAG等技術路線。
在論文《Chain-of-Knowledge: Grounding Large Language Models via Dynamic Knowledge Adapting over Heterogeneous Sources》中,達摩院領銜的聯(lián)合研究團隊提出了一種名為“知識鏈”(Chain-of-Knowledge, CoK)的新框架,包括推理準備、動態(tài)知識適應和答案整合三個步驟。對于知識密集型問題,知識鏈先確定知識領域,并準備若干中間推理步驟和相應答案。如若這些初步結論沒有共識,知識鏈將實時檢索相應知識領域內(nèi)的不同知識源,逐步生成、糾正推理步驟,給出最終答案。
圖說:“知識鏈”(CoK)框架包括(I)推理準備(II)動態(tài)知識適應和(III)答案整合
與傳統(tǒng)的RAG相比,知識鏈框架創(chuàng)新性地設計了對推理分析過程的逐步糾錯,最大程度地防止錯誤層層傳導。有別于此前的大模型知識增強方案主要使用非結構化數(shù)據(jù)源,知識鏈框架同時支持結構化數(shù)據(jù)源,并引入了經(jīng)過指令微調(diào)的自適應查詢生成器,從而更精準地生成查詢語句,從知識源提取到有效信息。
在通用知識、醫(yī)學、物理、生物等多個領域的實驗結果顯示,相比起思維鏈(Chain-of-Thought, CoT)方法,知識鏈框架可將大模型的回答準確率平均提高4.3%。對比ReAct、Verify-and-Edit等RAG方法,知識鏈也表現(xiàn)出穩(wěn)定的優(yōu)勢。據(jù)論文介紹,知識鏈有望連接各類大模型和不同格式的知識源,幫助解決隱私保護、知識源可靠性和快速信息更新等關鍵問題。
據(jù)介紹,ICLR由圖靈獎得主、深度學習領軍人物Yoshua Bengio和Yann LeCun牽頭舉辦,是國際AI頂級學術會議之一。達摩院共有三篇大模型研究論文入選,另外兩篇涉及大模型推理長度外推、多語言安全等課題。