解鎖企業潛能助力知識管理轉型:RAG AI 建構企業私有知識庫
中國生產力中心 黃建邦 協理
傳統知識管理(Knowledge Management, KM)主要依賴於人工收集、整理和分享知識。通常也包括文件、資料庫和內部網路等工具的應用,原來的KM在企業組織內部知識的保存和傳遞擴散上確實產生了效果,但無可厚非地也存在一些挑戰,例如資訊過載、知識更新效率、難以取得有用或有效的知識,用戶體驗感受不佳。
檢索增強生成(以下簡稱RAG,Retrieval-Augmented Generation)AI技術應用則提供了一種更先進的解決方案,為知識管理帶來新的希望。RAG AI結合了資訊檢索和語言生成的優點,能夠從企業內部大量資料中,即時且快速檢索相關資訊,並動態生成具邏輯、有意義的知識回覆,協助員工作業及企業主管決策,成為產業轉型升級的重要基礎應用。
壹、什麼是RAG AI?
RAG AI(檢索增強生成人工智慧,Retrieval-Augmented Generation AI)是一
種結合檢索和生成技術的人工智慧系統。其核心概念是解析求問者的發問後,通過檢
索企業提供的數據資料,作為提示語基礎,交由大型語言模型LLM來動態生成知識內
容。
這不僅能快速擷取準確的資訊,還能根據具體需求生成回答,最重要的是,整體運作
上,可限縮僅檢索企業所提供的知識範疇,且其機密文件無需要公開在網路上。
一、RAG AI 的核心技術
1. 檢索(Retrieval)
RAG AI 系統首先會從預先建立的知識庫中檢索出與查詢相關的資訊。這些資料
可以是文件電子檔、資料庫、網頁內容等。檢索技術通常使用自然語言處理
(NLP)和資訊檢索(IR)技術來確保檢索結果的相關性和準確性。
2. 生成(Generation)
在擷取相關資訊後,RAG AI 系統會利用語言生成模型(如 Llama、
ChatGPT、Gemini或其他大型語言模型)來生成最終的知識內容。生成模型即
根據檢索到的資訊和查詢內容,動態生成符合語境且有意義的語言文字。
二、RAG AI 的優勢
1. 具備語言解析能力
針對求問者以自身語言的發問,RAG AI系統可透過語言模型,解析問題需求的意
涵,進行更廣泛的檢索,以取得更多可能性的知識物件。
2. 高效能的知識檢索
RAG AI 能夠快速從大量數據中建立關聯,檢索出相關資訊,極大地提高了知識檢
索的效率。傳統的知識管理系統往往需要手動搜尋和篩選,而 RAG AI 可以自動完
成這一過程,節省了大量時間和人力。
3. 動態生成內容
RAG AI 不僅能夠檢索資訊,還能根據求問的需求動態產生內容。這意味著它可以
提供更準確和個性化的回答,以滿足不同用戶的需求。
例如應用在客服中,RAG AI 可以針對客戶的問題生成特定的解答回應,而不只是
提供預設的罐頭回答。
4. 提升知識管理效率
傳統的知識管理系統往往面臨更新不及時、資訊過載等問題。RAG AI 能夠確保知
識庫中的資訊始終保持最新狀態,能快速回應查詢需求,提升了知識應用整體效
率。
5. 私有知識應用領域
企業保護自身的智慧財產不遺餘力,RAG AI 可限制僅針對內部知識文件進行擷
取,管控外部存取權限使用,並可透過自建大型語言模型LLM,確保所有內部資訊
不外洩,建置專屬企業的私有知識庫AI應用。
貳、企業私有知識庫應用
近年來企業界都了解知識管理的重要性,且願意投入持續精進內部的知識管理能量,
以下說明各領域如何透過RAG AI技術的廣泛應用,進而提升強韌企業的競爭力。
1.製造業中的知識管理
製造企業利用 RAG AI 技術建立了私有知識庫,主要整合了來自不同部門的技術文
件、操作手冊和故障排除指南。藉由建置完成的系統平台,員工可以快速檢索到所
需的知識資訊,顯著提高了生產效率和問題解決的速度。
另外,系統還能動態地產出員工培訓資料,因人制宜提供所需要的知識,降低學習
門檻,協助新進員工快速上手。
2. 醫療業的臨床決策
醫療機構整合最新的醫學研究、臨床指南和病患資料,建立了一套臨床決策支持系
統。藉由系統能夠提供醫生於診斷和治療過程中的即時建議,明顯提高診斷的準確
性,降低誤判機率。
3.金融業的客戶服務
金融業銀行業務經常面對許多客戶,整合銀行業及公司的內部外金融管理知識文
件、常見問題解答和客戶歷史記錄等,建立一個提供客戶服務的系統平台。系統得
以能夠快速回答客戶的查詢,並提供個性化的建議,顯著提升了客戶滿意度和服務
效率。
叁、RAG AI建置企業私有知識庫
企業在建立私有知識庫之前,首先應先明確企業的知識管理需求,就如同舊有的知識
管理盤點程序一般,其中包括了解企業組織的業務流程、辨識出關鍵的知識領域,確
定哪些資訊知識對於企業營運至關重要。
透過各部門的溝通,收集部門特殊的需求和建議,確保知識庫內提供檢索的知識文
件,足以滿足企業需求。一旦需求確定後,下一步開始進入建置的作業程序。
一、選擇合適的RAG AI 平台組合
1. 目前市場上有多種 RAG AI 工具可供選擇,首先需要一個支援RAG技術、提供對
話介面功能的LLM大語言模型知識庫應用工具,如:基於Python 框架的
LangChain,開源且方便建構的Open WebUI、Dify、AnythingLLM 等等。
2. 其次需要的就是LLM大語言模型,無論是雲端服務的OpenAI GPT、Google
Gemini、Anthropic Claude 等,或是開源可下載建置於企業內部的 Meta
Llama、Google Gemma、Mistral、甚至是國內本土的 TAIDE。
3. 這些工具平台模型各有優勢,企業可以根據自身需求及硬體設備環境,選擇合適的
模型版本運行,提供以下4個考慮因素參考:
. 性能和準確性:檢索和生成能力是否能滿足企業的需求。
. 可擴展性:是否能夠隨著企業的發展進行擴展和升級。
. 易用性:使用是否簡單直觀,操作是否順暢,員工是否容易上手。
. 營運成本:購買建置和後續維護成本是否在企業的預算範圍內。
二、知識資料收集與準備
1. 收集知識數據資料
建立私有知識庫,不能靠自動文字生成或無中生有,需要以既有資料為基礎。因此
企業需要收集內部的各類知識資料數據文件等,包括技術文件、操作手冊、培訓講
義、客戶服務記錄等。這些來自不同的部門和系統的資料,需要進行統一的蒐集和
整理。
2. 資料清理與標註
蒐集到的資料可能存在錯誤、冗餘、不合時宜或不一致的問題,需要以企業知識保
存傳承的角度進行清理和標註。資料清理包括去除重複、修正錯誤、統一資料格式
等。資料標註則是對知識內容進行分類和標記,強化後續的資料檢索和應用。
三、著手建置私有知識庫
1. 知識庫架構規劃
在資料準備完成後,需要規劃設計知識庫的架構。包括確定知識庫的層級結構、數
據資料儲存方式、檢索機制等。其中重點應考慮到數據資料的類型和使用場景,確
保其能夠有效率地運行。
2. 導入數據與建立索引
根據設計好的架構,將清理和標註後的數據實際導入知識庫中。為了提高檢索效
率,需要建立適合 RAG 的索引方式。索引內容可以根據數據的關鍵詞、類別、時
間或採用問答FAQ方式進行建置,提供系統快速找到所需知識的模式。
四、系統整合與測試
1. 整合現有企業內部系統
私有知識庫需要與企業現有的系統進行整合,如 ERP 系統、CRM 系統等。整合過
程中需考量數據連通管道機制、建立API界面及妥善處理系統權限管理等問題。
2. 系統測試與優化
在系統上線前,需要進行全面的測試。測試內容包括功能測試、性能測試、安全測
試等,透過測試發現並解決問題,確保系統的穩定性和可靠性。系統上線後,還需
要根據用戶意見進行持續的優化和改進。
達成最終整合企業資料文件,串聯實現知識的共享和互通,提升企業整體營運效能
的目標。
肆、總結
1. RAG AI 在知識管理中的重要性
RAG AI 技術在新一代的知識管理中扮演著至關重要的角色。通過結合檢索和生成
技術,RAG AI 能夠快速、準確地提供所需的資訊,並根據需求生成相對應的知識
內容,提升了知識管理的效率和準確性。不僅幫助企業解決了傳統知識管理系統中
的諸多挑戰,如資訊孤島、數據過載和更新困難等問題,還促進了知識的共享和跨
部門協作。
2. 私有知識庫對企業的長遠影響
建立私有知識庫對於企業有長遠的影響。首先在於,能夠保留和傳承企業的核心知
識,減少因員工流動而造成的知識流失;其次,私有知識庫能夠提高員工的工作效
率和生產力,幫助企業在競爭激烈的市場中保持領先地位。最後,通過自動化的知
識更新和維護,企業能夠始終保持知識庫的最新狀態,確保決策與作業的準確性和
時效性。
淺談台積電的成功之道
中國生產力中心 廖伊涵 副理
台灣積體電路製造股份有限公司(台灣證券交易所代碼:2330),簡稱台積電,是台灣一家從事晶圓代工的公司,成立於民國76年,創辦人為張忠謀先生,在半導體產業中首創專業積體電路製造服務模式。
民國112年,台積電為528個客戶提供服務,生產11,895種不同產品,被廣泛地運用在各種終端市場,例如高效能運算、智慧型手機、物聯網、車用電子與消費性電子產品等;同時,台灣積體電路製造股份有限公司及其子公司所擁有及管理的晶圓出貨量達1,200萬片十二吋晶圓約當量。
台積電為全球市佔率第一的半導體製造廠,並為目前全亞洲市值排名第一的公司,總部位於台灣新竹科學園區,主要廠房則分布於台灣的新竹、臺中、臺南等科學園區。
在台灣設有四座十二吋超大晶圓廠、四座八吋晶圓廠和一座六吋晶圓廠,並擁有一家百分之百持有之海外子公司-台積電(南京)有限公司之十二吋晶圓廠及二家百分之百持有之海外子公司-WaferTech美國子公司、台積電(中國)有限公司之八吋晶圓廠產能支援。
民國111年12月,台積電宣布其位於亞利桑那州的晶圓廠開始興建第二期工程,預計於民國115年投入3奈米製程技術生產;此外,該廠第一期工程已接近完工,預計於今年上半年開始生產N4製程技術。同時,台積電亦持續推進於日本熊本縣設立晶圓廠的計畫,該廠預計於去年(民國113年)年底投入生產。
在疫情逐漸趨緩的同時,全球經濟也逐步復甦。隨著筆電與顯示器需求大增、5G滲透率提升,以及車用與物聯網應用對半導體元件需求回溫,資策會產業情報研究所統計,2021年全球半導體市場成長10.9%,達到4,883億美元,且此一成長態勢延續至2022年,年成長率達12.7%。其中,台灣半導體產值也持續提升至1,268億美元,占全球產值的26%,成長率達18%,表現優於全球半導體業的平均水準。
台積電在晶圓代工領域有三大優勢,使得其他競爭對手難以超越,說明如下:
步驟1. 投資成本塑造進入門檻
台積電每年在晶圓代工領域的投資約為三星電子(Samsung Electronics)的三倍,而
投資金額直接影響製程技術的發展。台積電於民國112年宣布當年度資本支出達304.5億
美元,為因應當時日益嚴重的晶片短缺問題,並於同年進一步宣布,未來三年將投入
1,000億美元大舉擴產。
反觀位居晶圓代工產業第二的三星電子,儘管其半導體業務的投資規模大於台積電,但若
未進一步加大對晶圓代工領域的投入,將難以穩固其在全球晶片市場的競爭地位。
步驟2. 專業技術領先、先進製程領先全球
台積電在高階晶片領域(10奈米以下的先進製程)始終保持絕對領先地位,展現卓越的研
發與量產能力。無論是在7奈米或5奈米製程方面,台積電都是全球首家成功量產的晶圓代
工廠,先進製程技術有效降低晶片功耗,同時大幅提升效能,鞏固其在全球半導體供應鏈
中的核心地位。
儘管三星電子曾於111年對外宣布成功量產5奈米製程,實際市場反應卻相對冷淡。主因
在於三星的5奈米製程良率偏低,難以滿足高端應用的嚴格標準,因此未能取得蘋果與高
通等關鍵客戶的採用與信任。反觀台積電憑藉穩定的製程良率與高度可靠性,成為全球一
線晶片設計大廠的首選合作夥伴。
步驟3. 純晶圓代工定位,獲得客戶信賴
台積電始終堅持不與客戶競爭,專注於純晶圓代工的商業模式,全力投入先進製程與先進
封裝技術的研發,憑藉卓越的技術實力穩居全球超過 50% 的市場占有率。其規模不僅超
越三星電子與英特爾,作為純粹的晶圓代工廠,更讓客戶能夠放心地將訂單交由台積電承
製,建立起長期穩固的合作關係。
在全球局勢日益分裂、各國國安意識不斷升高的情況下,台灣當前最重要的課題是保持沉
著冷靜,穩住外界對台灣的信心,避免引發全球的不安與疑慮。這正是當前最大的挑戰之
一。
在此背景下,台積電與客戶共同打造的「開放創新平台(OIP)」持續擴大技術合作與創新
能量,致力於推動先進製程與封裝技術,並為全球AI應用釋放更大的創新潛能。
台積電不僅是AI技術的應用者,更透過AI來提升生產效率與晶片開發速度,成為引領創新
的重要推動者。目前,台積電一方面持續深化與客戶間的合作關係與信任,另一方面也回
應客戶對供應鏈韌性的關注,積極擴大全球布局,在多個地區建立製造基地,以支撐未來
成長動能。同時,公司也更加重視全球人才的招募與培育,強化企業的國際競爭力。
【參考資料】
台積電官網
TSMC 2022年報
經理人月刊
天下雜誌