大語言模型時代來臨,交互式對話搜索如何落地
傳統的搜索模式有諸多受限,隨著互聯網的發展進步,帶來了AI對話式搜索,這一搜索模式為用戶帶來了更好的搜索體驗,其發展機遇是可見的,但是在未來AI對話將面臨什么挑戰呢?讓我們看看作者的觀點。
2022年11月30日:OpenAI發布ChatGPT,短短兩個月時間月活過億 ,預示著大模型時代的來臨!
2023年2月8日:微軟宣布上線 New Bing 和 Edge瀏覽器,整合 OpenAI 的 GPT 技術,可以與用戶進行對話式搜索、交互聊天。
2023年4月6日:《華爾街日報》報道稱,谷歌也計劃在其搜索引擎中,添加對話式AI功能。
業界大佬紛紛入局搶占先機,國內大廠也紛紛入場開啟“軍備競賽”。
今天小編就帶大家粗淺了解下什么是大模型,大模型未來對企業、人們的日常生活到底會有哪些顛覆和影響。各行業又能將LLM大語言模型應用到哪些業務中去。
一、什么是LLM大語言大模型?
LLM=Large Language Model 大語言模型,是一種基于深度學習的自然語言處理模型。它能夠學習到自然語言的語法和語義,從而可以生成人類可讀的文本。
所謂“語言模型”,就是只用來處理語言文字(或者符號體系)的AI 模型,發現其中的規律,可以根據提示(prompt),自動生成符合這些規律的內容。
簡言之:能夠理解輸入的文字、語言,并給出相應回答。
典型代表有ChatGPT(OpenAI)、通義千問(阿里)、文心一言(百度)、ChatGLM(清華)、Chatlaw(北大)。
二、大模型訓練門檻有多高?
- 需要大量的數據進行訓練
- 非常大的參數數量的人工神經網絡(數十億)
- 需要投入大量的機器資源進行優化和調整
- 技術團隊的工程實現能力要求非常高
總結下來就是財力及投入意愿、工程能力、技術熱情,都有極高的要求,目前市面上能支撐上述要求的機構少之又少。
并且這些模型訓練數據來自世界知識,無論是多強大的LLM,能壓縮的知識量仍然是有限的。當遇到企業專屬知識時,這些模型也很難給出準確答案。
舉一個例子,下圖中的問題是關于阿里巴巴內部的技術產品,屬于企業專屬知識,就算是強大的ChatGPT模型給出的答案也是完全錯誤不相關的。
針對這個問題,OpenAI提出了chatgpt-retrieval-plugin、WebGPT,開源社區提出了DocsGPT、ChatPDF、基于langchain的檢索增強chatbot等等一系列解決方案,足以證明業界對如何在個人/企業專屬數據上結合LLM需求強烈。
三、傳統搜索VS對話式搜索
下面舉幾個例子給大家直觀感受下對話式搜索的的優勢:
1. 傳統的客服問答
下面畫面常常發生在我們線上購物和機器人客服的對話,答案分散,不能快速抓到用戶的搜索意圖,用戶體驗較差。
同理,這也是很多人打銀行客服電話還是喜歡轉人工處理的原因。
2. 傳統搜索引擎搜索
傳統搜索引擎的沒有目共睹。即時通信已經取代搜索引擎成為移動互聯網時代新的核心流量入口。即使是全球市場占有率最高的谷歌搜索,其用戶量也面臨著被社交網站、短視頻APP瓜分的危機。
傳統搜索引擎的痛點首先是信息過剩,不能直接召回到用戶搜索意圖,需要在信息網里自行查找篩選,耗時耗力也不一定找到問題的解。其次信息壁壘。
從PC互聯網時代走入移動互聯網時代,信息散落到了各個App當中,用戶隨之流向其內部的搜索。
3. AI對話式搜索
更快、更準、更豐富,給予用戶有建設性、拓展性的答案。將用戶獲取信息和服務的方式從輸入冰冷的關鍵詞轉向人機“多輪對話”。
四、對話式搜索在業務中的應用
- 電商:用戶答疑、直播選品、售前咨詢、售后服務等
- 內容:IT、文娛、專業領域等個性化場景
- 企業知識庫:企業內部資料、產品文檔、技術資料等
- 教育:知識總結、搜題生成答案
AI對話式搜索在這些場景的應用可以有效提升用戶信息獲取效率、產品體驗、業務轉化、用戶粘性、用戶活躍。有效降低人工成本,運營成本。
目前這些典型場景卻無法直接使用ChatGPT等大模型,實際用于到自身業務中去。
首先是數據問題,大模型來自公網數據,無法滿足企業業務搜索需要。其次存在安全風險,生成內容不可控,風險較高。
企業需要基于自身數據構建垂直領域問答式搜索。
五、是機遇也是挑戰
目前雖然大模型熱度高,很多企業也關注到了對話式搜索給業務帶來的機遇,但實際能應用起來的還很少。
一是落地難度大,技術能力要求高;二是缺乏場景,除頭部客戶以外,業務需求還未達到這個層次,處于觀望了解階段。
那如果是創業公司在選擇大模型接入時,是選開源還是閉源呢?
各有優勢。開源你只需要買TOKEN就好了,再加上 Prompt engineering和向量數據庫等。閉源的優勢在于,保護數據隱私,并且可以不斷用數據填充完善自己的模型。
給大家介紹下市面接入較多的兩種方案
1)企業自建方案:基于開源大模型,企業自行微調自建。
- 需要使用A100卡或單機多卡支持
- 專業的算法研發人員,數據處理→開發調試→訓練模型→模型部署
- 對企業數據質量有要求,否則影響訓練效果
- 涉及圖文、音視頻數據,需要轉為向量化數據
2)產品化方案:阿里云OpenSearch LLM問答版端到端方案,可以構建企業專屬模型。
- 基于阿里模型+企業自有數據進行模型微調拓展,自動生成Query對應的問答搜索結果,接入門檻較低
- 問答結果基于業務數據搜索生成,保證問答結果穩定性與數據安全性
- 支持圖文多模態信息搜索,支持問答結果的人工干預
六、AI對話式搜索行業應用展望
1)助力企業創新能力
LLM可根據大量數據進行預測分析,為企業提供有針對性的戰略建議,提供新的創新途徑;開展垂直領域或行業子模型的研究,做應用場景和用戶數據反哺、調優,實現企業定制化搜索。
2)優化客戶支持和服務
智能客服可根據客戶輸入的問題,提供即時、準確的解答,減輕傳統客服壓力;對于復雜問題,LLM可為技術支持團隊提供問題解決方案,提高問題解決效率。
3)復雜信息提煉,提升信息獲取效率
利用LLM數據整合與分析能力,將復雜信息進行要點提煉,觀點的歸納整理,節省用戶信息獲取效率,從而有更多的時間進行深度和系統的思考。
4)低代碼應用
通過API融入到產品的標準模塊里,更低的開發成本、更少的時間投入,來滿足日益增長的客戶個性化需求。
本文由 @KKai 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!