當前位置:首頁 > 物聯(lián)網(wǎng) > 智能應用
[導讀]恢復增強一代 RAG已經(jīng)成為一種主要的模式,以消除幻覺和其他影響大型語言模型內容生成的不準確。然而,RAP需要圍繞它的正確的數(shù)據(jù)體系結構來有效和高效地擴展。數(shù)據(jù)流方法為向LLMS提供大量不斷豐富、可信的數(shù)據(jù)以產生準確結果的最佳架構奠定了基礎。這種方法還允許數(shù)據(jù)和應用程序團隊獨立工作和規(guī)?;?以加快創(chuàng)新。

恢復增強一代 RAG已經(jīng)成為一種主要的模式,以消除幻覺和其他影響大型語言模型內容生成的不準確。然而,RAP需要圍繞它的正確的數(shù)據(jù)體系結構來有效和高效地擴展。數(shù)據(jù)流方法為向LLMS提供大量不斷豐富、可信的數(shù)據(jù)以產生準確結果的最佳架構奠定了基礎。這種方法還允許數(shù)據(jù)和應用程序團隊獨立工作和規(guī)?;?以加快創(chuàng)新。

基礎性LMS,如GTPT和LMA,接受了大量數(shù)據(jù)的培訓,通常能夠對廣泛的主題做出合理的回應,但確實產生了錯誤的內容。正如福雷斯特最近指出的那樣,公共LLMS"經(jīng)常產生不相關或完全錯誤的結果",因為他們的培訓數(shù)據(jù)側重于公開的互聯(lián)網(wǎng)數(shù)據(jù)。此外,這些基本LMS完全無視鎖定在客戶數(shù)據(jù)庫、企業(yè)資源規(guī)劃系統(tǒng)、企業(yè)維基和其他內部數(shù)據(jù)源中的企業(yè)數(shù)據(jù)。必須利用這些隱藏數(shù)據(jù)來提高準確性,并釋放實際業(yè)務價值。

RAG允許數(shù)據(jù)團隊將提示與特定領域的公司數(shù)據(jù)實時化。有了這個額外的上下文,LLS更有可能在數(shù)據(jù)中識別正確的模式,并提供正確的、相關的響應。這對于流行的企業(yè)使用案例(如語義搜索、內容生成或復制)至關重要,在這些案例中,輸出必須基于準確的、最新的信息才能是可信的。

為什么不僅僅訓練一個關于公司特定數(shù)據(jù)的LLM呢?

目前生成性人工智能的最佳做法往往要求通過培訓大量數(shù)據(jù)上的十億節(jié)點變壓器來創(chuàng)建基礎模型,使這種方法對大多數(shù)組織來說成本過高。比如說,他說?超過1億美元去訓練GTP-4。研究和工業(yè)界已開始為小型語言模型和較便宜的培訓方法提供有希望的結果,但這些還沒有被推廣和商品化。對現(xiàn)有模式進行微調是另一種資源密集程度較低的方法,將來也可能成為一種好的選擇,但這一方法仍然需要大量的專門知識才能正確。LLMS的好處之一是,他們使對AI的訪問民主化,但不得不雇傭一個博士團隊來微調一個模型,這在很大程度上否定了這種好處。

RAG是當今最好的選擇,但它的實施方式必須能夠提供準確和最新的信息,并以一種可以跨應用程序和團隊進行擴展的管理方式。為了了解為什么事件驅動的體系結構最適合于此,我們可以看看四個熱奈應用程序開發(fā)模式。

1.數(shù)據(jù)增強

應用程序必須能夠提取相關的上下文信息,通常是通過使用向量數(shù)據(jù)庫來查找語義相似的信息,通常編碼在半結構化或非結構化文本中。這意味著從不同的操作庫中收集數(shù)據(jù),并將其"分塊"到可管理的部分,從而保留其含義。然后將這些信息塊嵌入到向量數(shù)據(jù)庫中,在那里它們可以與提示符耦合。

事件驅動的體系結構在這里是有益的,因為它是一種有效的方法,可以實時集成來自整個企業(yè)的不同數(shù)據(jù)源,提供可靠和可信的信息。相比之下,使用級聯(lián)批處理操作的更為傳統(tǒng)的ETL(提取、轉換、負載)管道不太適合使用,因為當信息到達LLP時,它通常會失效。事件驅動的體系結構確保在對操作數(shù)據(jù)存儲進行更改時,這些更改會被轉移到將用于上下文化提示的向量存儲中。將這些數(shù)據(jù)組織成流數(shù)據(jù)產品也有助于可重用性,因此這些數(shù)據(jù)轉換可以被看作是可組合的組件,可以支持多個使用LLP的應用程序的數(shù)據(jù)增強。

2. Inference

推斷涉及到工程提示和先前步驟中準備的數(shù)據(jù)和處理來自LOM的響應。當用戶發(fā)出提示時,應用程序從向量數(shù)據(jù)庫或對等服務中收集相關上下文,以生成盡可能好的提示。

像Tg-1這樣的應用程序通常需要幾秒鐘的時間來響應,這是分布式系統(tǒng)中的永恒。使用事件驅動的方法意味著這種通信可以在服務和團隊之間異步進行。有了事件驅動的體系結構,服務可以按照功能專業(yè)進行分解,這使應用程序開發(fā)團隊和數(shù)據(jù)團隊能夠分別工作,以實現(xiàn)其性能和準確性目標。

此外,通過提供分解的、專門的服務而不是單一的服務,這些應用程序可以獨立地部署和擴展。這有助于減少進入市場的時間,因為新的推理步驟是消費者群體,并且組織可以模板基礎結構快速實例化這些。

3. Workflows

推理代理和推理步驟通常被鏈接到序列中,其中下一個LLM調用基于以前的響應。這在復雜任務的自動化中是有用的,在這些復雜任務中,單個LRAM調用將不足以完成流程。將代理分解為調用鏈的另一個原因是,當我們提出多個更簡單的問題時,如今流行的LLMS往往會返回更好的結果,盡管這種情況正在發(fā)生變化。

下面的示例工作流說明,通過數(shù)據(jù)流平臺,Web開發(fā)團隊可以獨立于后端系統(tǒng)工程師工作,允許每個團隊根據(jù)自己的需要進行規(guī)?;?shù)據(jù)流平臺能夠實現(xiàn)技術、團隊和系統(tǒng)的脫鉤。

4. Post-Processing

盡管我們盡了最大努力,LLMS仍然可以產生錯誤的結果,所以我們需要一種方法來驗證輸出和執(zhí)行業(yè)務規(guī)則,以防止這些錯誤造成損害。

通常情況下,LLS工作流和依賴項的變化要比決定輸出是否可以接受的業(yè)務規(guī)則快得多。在上面的例子中,我們再次看到了與數(shù)據(jù)流平臺脫鉤的很好的應用:通過合規(guī)團隊驗證LLS輸出,可以獨立地操作來定義規(guī)則,而不需要與構建LOM應用程序的團隊進行協(xié)調。

結論

RAG是一個強大的模型,可以提高LLMS的準確性,并使生成的AI應用程序在企業(yè)用例中可行。但破布不是銀子彈。它需要被一個架構和數(shù)據(jù)傳遞機制所包圍,這些架構和機制允許團隊構建多個生成的AI應用程序,而不需要重新設計車輪,并以符合企業(yè)數(shù)據(jù)治理和質量標準的方式進行。

數(shù)據(jù)流模型是滿足這些需求的最簡單和最有效的方式,它使團隊能夠釋放LLMS的全部能量,從而為其業(yè)務帶來新的價值。隨著技術成為業(yè)務,人工智能提高了這項技術,那些有效競爭的公司將合并人工智能,以增加和簡化越來越多的流程。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉