
內容簡介
這是一本係統梳理並深入解析大模型的基礎理論、算法實現、數據構造流程、模型微調方法、偏好對齊方法的著作,也是一本能手把手教你構建角色扮演、信息抽取、知識問答、AI Agent等各種強大的應用程序的著作。
本書得到了零一萬物、麵壁智能、通義千問、百姓AI、瀾舟科技等國內主流大模型團隊的負責人的高度評價和鼎力推薦。具體地,通過本書你能了解或掌握以下知識:
(1)大型語言模型的基礎理論,包括常見的模型架構、領域大型語言模型以及如何評估大模型的性能。
(2)大模型微調的關鍵步驟:從數據的收集、清洗到篩選,直至微調訓練的技術細節。
(3)大模型人類偏好對齊方法,從基於人工反饋的強化學習框架到當前主流的對齊方法。
(4)通過GPTs快速搭建個性化的專屬ChatGPT應用。
(5)通過開源模型在多種場景下搭建大模型應用,包括:表格查詢、角色扮演、信息抽取、知識問答、AI Agent等。
(6)掌握大模型Agent方法以及Agent常用框架。
(7)基於LangChain框架構建一個AutoGPT應用。
本書集大模型理論、實踐和場景落地於一體,提供大量經詳細注釋的代碼,方便讀者理解和實操。總之,不管裏是想深入研究大模型本身,還是進行大模型相關應用搭建,本書都應該能給你頗具價值的技術啟發與思考,讓你在大模型的路上快速前行,少走彎路。
作者簡介
劉聰
資深NLP技術專家和AI技術專家,南京雲問科技首席算法架構師,MLNLP(機器學習算法與自然語言處理)社區學術委員。主攻文本向量表征、問答係統、AIGC等技術方向,是大模型領域的先驅者和布道者。開源了首個中文Unilm預訓練模型、中文GPT2、誇誇閑聊機器人(ChatBot)、大模型微調等項目。作為主要負責人,在多項自然語言處理比賽中獲得前三名,在中文核心期刊和SCI發表多篇論文,有多項發明專利。知乎ID“劉聰NLP”,擁有公眾號“NLP工作站”,撰寫書籍《ChatGPT原理與實戰》。
沈盛宇
資深算法工程師,南京雲問網絡技術有限公司算法組負責人。擅長結合用戶業務場景,針對性設計知識圖譜、問答、檢索、多模態、AIGC等的相關算法和落地方案。在結合客戶現有產品體係,推動數據中台和算法平台結合,從而提升服務質量方麵,有豐富實戰經驗。曾獲得多項國家專利,參與製定和撰寫《IDP術語標準》《人工智能-智能助理能力等級評估標準》《人工智能標準化與開源研究報告》《ChatGPT原理與實戰》等多項國家級人工智能標準和書籍。
李特麗
資深大模型應用專家,LangChain中文社區聯合創始人,開發Langchain等多個大模型開發框架的中文網,幫助中國開發者快速學習AI開發框架,撰寫書籍《LangChain入門指南》。
杜振東
資深NLP技術專家和AI技術專家,南京雲問科技NLP研究院院長,國家人工智能標準委專家、AIIA 人工智能技術專家、CCF智能機器人專業組首批委員。擁有10年機器學習與文本挖掘經驗,8年中文自然語言處理實戰經驗,參與製定6項國家人工智能總體組標準,編寫書籍《會話式AI》《人工智能實踐錄》《ChatGPT原理與實戰》等。
