《AI工程》封麵

AI工程 內容簡介

本書是學習與實踐AI工程的權威指南,覆蓋AI應用開發全流程 ,由業內知名AI專家、暢銷書作者Chip Huyen撰寫。 全書係統闡述了“AI工程”的核心方法——如何基於現成的基礎模型(LLM、LMM)構建高效、實用的AI應用。書中提供了完整的AI工程框架,涵蓋模型選擇與評估、提示工程、RAG與智能體、微調策略、數據集工程、推理優化及AI工程架構等關鍵環節,幫助開發者在複雜的AI生態中做出科學的技術決策。作者結合豐富的業界經驗,通過大量真實案例與可操作的方法,展示了如何讓AI應用更快、更可靠、更具擴展性。

AI工程 作者簡介

奇普·萱(Chip Huyen)

計算機科學家、作家,深耕於AI、數據與敘事藝術的跨界地帶。畢業於斯坦福大學,並曾在該校教授“Machine Learning Systems Design”(CS 329S)課程。創立了一家AI基礎設施初創公司(後被成功收購)。此前曾就職於Snorkel AI和NVIDIA。

著有《機器學習係統設計》(Designing Machine Learning Systems,O’Reilly),已被翻譯成十餘種語言,長居Amazon人工智能圖書暢銷榜榜首,在全球開發者中擁有廣泛的影響力。新作《AI工程》已經成為當前AI領域最有影響的圖書之一,AI工程師必讀。

AI工程 目錄

目錄
譯者序
前言
第1章使用基礎模型構建AI應用入門
1.1AI工程的興起
1.1.1從語言模型到大型語言模型
1.1.2從大型語言模型到基礎模型
1.1.3從基礎模型到AI工程
1.2基礎模型的應用場景
1.2.1編程
1.2.2圖像和視頻製作
1.2.3寫作
1.2.4教育
1.2.5對話機器人
1.2.6信息聚合
1.2.7數據組織
1.2.8工作流自動化
1.3規劃AI應用
1.3.1用例評估
1.3.2設定目標
1.3.3裏程碑規劃
1.3.4維護
1.4AI工程技術棧
1.4.1AI技術棧的三個層次
1.4.2AI工程與ML工程
1.4.3AI工程與全棧工程
1.5小結
第2章理解基礎模型
2.1訓練數據
2.1.1多語言模型
2.1.2特定領域模型
2.2建模
2.2.1模型架構
2.2.2模型規模
2.3後訓練
2.3.1監督微調
2.3.2偏好微調
2.4采樣
2.4.1采樣基礎知識
2.4.2采樣策略
2.4.3測試時計算
2.4.4結構化輸出
2.4.5AI的概率特性
2.5小結
第3章評估方法論
3.1評估基礎模型的挑戰
3.2理解語言建模指標
3.2.1熵
3.2.2交叉熵
3.2.3BPC與BPB
3.2.4困惑度
3.2.5困惑度的解釋與應用場景
3.3精確評估
3.3.1功能正確性
3.3.2與參考數據的相似度測量
3.3.3嵌入簡介
3.4AI當裁判
3.4.1為什麼用AI當裁判
3.4.2如何用AI當裁判
3.4.3以AI為裁判的局限性
3.4.4哪些模型可以作為裁判
3.5使用比較評估對模型進行排名
3.5.1比較評估麵臨的挑戰
3.5.3比較評估的未來
3.6小結
第4章評估AI係統
4.1評估標準
4.1.1領域特定能力
4.1.2生成能力
4.1.3指令遵循能力
4.1.4成本和延遲
4.2模型選擇
4.2.1模型選擇工作流
4.2.2模型的自建與購買
4.2.3利用公開基準測試
4.3設計你的評估流程
4.3.1第一步:評估係統中的所有組件
4.3.2步驟2:創建評估指南
4.3.3步驟3:定義評估方法和數據
4.4小結
第5章提示工程
5.1提示詞簡介
5.1.1上下文學習:零樣本和少樣本
5.1.2係統提示詞和用戶提示詞
5.1.3上下文長度與上下文效率
5.2提示工程最佳實踐
5.2.1撰寫清晰明確的指令
5.2.2提供充足的上下文
5.2.3將複雜任務拆分為更簡單的子任務
5.2.4給模型更多思考時間
5.2.5對提示詞進行迭代優化
5.2.6評估提示工程工具
5.2.7提示詞的組織與版本管理
5.3防禦性提示工程
5.3.1專有提示詞與反向提示工程
5.3.2越獄與提示詞注入
5.3.3信息提取
5.3.4針對提示詞攻擊的防禦措施
5.4小結
第6章RAG與智能體
6.1RAG
6.1.1RAG架構
6.1.2檢索算法
6.1.3檢索優化
6.1.4超越文本的RAG
6.2智能體
6.2.1智能體概述
6.2.2工具
6.2.3規劃
6.2.4智能體的故障模式與評估
6.3記憶
6.4小結
第7章微調
7.1微調概述
7.2何時進行微調
7.2.1進行微調的原因
7.2.2不進行微調的原因
7.2.3微調與RAG
7.3內存瓶頸
7.3.1反向傳播與可訓練參數
7.3.2內存計算
7.3.3數值表示
7.3.4量化
7.4微調技術
7.4.1PEFT
7.4.2模型合並與多任務微調
7.4.3微調策略
7.5小結
第8章數據集工程
8.1數據策展
8.1.1數據質量
8.1.2數據覆蓋度
8.1.3數據量
8.1.4數據獲取與數據標注
8.2數據增強與數據合成
8.2.1為什麼要進行數據合成
8.2.2傳統的數據合成方法
8.2.3AI驅動的數據合成方法
8.2.4模型蒸餾
8.3數據處理
8.3.1數據檢查
8.3.2數據去重
8.3.3數據清理與過濾
8.3.4數據格式化
8.4小結
第9章推理優化
9.1理解推理優化
9.1.1推理概述
9.1.2推理性能指標
9.1.3AI加速器
9.2推理優化的實現
9.2.1模型優化
9.2.2推理服務優化
9.3小結
第10章AI工程架構與用戶反饋
10.1AI工程架構
10.1.1增強上下文
10.1.2設置防護措施
10.1.3添加路由器和網關
10.1.4通過緩存技術降低延遲
10.1.5添加智能體模式
10.1.6監控與可觀測性
10.1.7AI流水線編排
10.2用戶反饋
10.2.1提取對話反饋
10.2.2反饋設計
10.2.3反饋的局限性
10.3小結
······

最後修改:2026 年 03 月 23 日