ChatGPT 開發手冊:用 OpenAI API‧LangChain‧Embeddings 設計 Plugin、LINE/Discord bot、股票分析與客服自動化助理

ChatGPT 開發手冊:用 OpenAI API‧LangChain‧Embeddings 設計 Plugin、LINE/Discord bot、股票分析與客服自動化助理 pdf epub mobi txt 电子书 下载 2025

施威銘研究室
图书标签:
  • ChatGPT
  • OpenAI API
  • LangChain
  • Embeddings
  • Plugin
  • Bot
  • LINE
  • Discord
  • 股票分析
  • 客服自动化
  • Python
想要找书就要到 小特书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

  ChatGPT 熱潮之後, 就是語言模型開發應用的時代, 如何將語言模型融入各式各樣的應用當中, 就是開發者接下來面臨的挑戰。利用語言模型理解文意與能言善道的超強特性, 迎來『自然語言就是程式語言』的新世代, 終端用戶使用自然語言讓語言模型自主理解規劃邏輯流程, 我們的程式做為語言模型與外界的橋樑, 串接成完整的應用。本書將帶你:
 
  □ 【詳解 OpenAI API 個別參數】:想要善用語言模型, 就必須瞭解 API 的個別參數, temperature 到底什麼意思?怎樣可以讓語言模型生成內容避開不想要出現的字詞?怎樣可以讓語言模型選用偏好的字詞?為什麼生出內容有怪怪的東西?這些都可以透過 API 的參數控制, 如果不瞭解參數, 就只能任由語言模型恣意亂為了。
 
  □ 【仿照 ChatGPT 設計會記憶的聊天機器人】:使用 ChatGPT 太習慣, 就會誤以為語言模型會幫你記錄一切, 沒考慮這一點, 利用 API 寫出來的程式就會變成金魚腦, 剛剛對答過的內容通通不記得。本書設計一個簡單的記憶架構, 可以像是 ChatGPT 一樣記錄對話, 即使程式結束重新啟動還是可以記得住。
 
  □ 【利用 function calling 機制建置外掛系統】:OpenAI 語言模型受限於 2021 年 9 月的時空限制, 而且不能連網, 所以新資訊通通不知道, 也沒有辦法與外界介接。透過最新的 function calling 機制, 我們可以撰寫各式各樣的函式作為延伸語言模型能力的小工具, 讓語言模型自主判斷要使用哪些函式來達成任務, 等於是幫語言模型建立了外掛系統, 不管是搜尋網路、介接其他 API 或是服務, 通通都可以辦到, 就算是今天才發生的事也能暢所欲言。
 
  □ 【設計串流輸出的 AI 聊天架構】:使用 ChatGPT 可以看到非常流暢地逐漸顯示生成的內容, 但是你寫的應用程式卻要等語言模型完整生出內容才能秀出來?本書會教你如何設計出類似 ChatGPT 的效果, 再也不用痴痴等完整結果, 呼叫 API 之後就會開始看到片段生成內容, 給使用者最即時的體驗。
 
  □ 【整合 LINE/Discord bot】:實踐多年來大家夢想的 CUI(Conversation User Interface), 以自然語言控制系統。本書會帶大家整合 OpenAI API 與 LINE/Dicord bot, 除了基本的讓即時通訊軟體變身小助理, 還能理解文字幫你創意生圖/改圖/修圖, 也能幫你搜尋股市資訊, 分析股市。
 
  □ 【使用 Embeddings 設計專屬知識的自動諮詢客服】:許多人都想要讓語言模型變成自己專屬的客服, 不但能言善道, 而且 24×7 不用休息。要做到這一點, 如果要靠輸入大量資料訓練新模型, 不但耗時耗力, 效果還不一定好。本書會帶大家透過 Embeddings 的方式彙整你的專屬文件, 用最有效率的方式搜尋到文件中相關的內容, 再由語言模型統合內容生成回覆, 快速又有效。
 
  □ 【引入 LangChain 框架】:使用 OpenAI API 固然能夠控制最細微的功能, 不過只要善用已經幫你統整好底層 API 的高階框架, 開發起來就能事半功倍, LangChain 就是其中的佼佼者。LangChain 幫你將語言模型、提示模板、對談記錄、外部工具以及能理解推斷邏輯流程的代理元件串起來, 自動將使用者輸入的文句分解成細部工作再一一完成, 用最快的速度開發出能以自然語言操控自動生成產品文、上傳社群的自動代理系統 (agent)。
 
  □ 【ChatGPT 外掛開發】:ChatGPT 目前最重要的就是外掛系統, 讓語言模型可以和外界接軌, 儼然建構起 ChatGPT 生態系。本書會帶大家用真實上架 Plugin store 的台鐵時刻表查詢外掛當範例, 手把手教你設計 ChatGPT Plugin, 還會帶你走一遍上架 Plugin store 流程, 讓你的應用程式與服務順暢介接進入 ChatGPT 家族。
  
  本書的目標, 就是在【自然語言就是程式語言】的時代, 為各位奠定開發程式做為語言模型感官與外界溝通的基礎, 我們寫好各式各樣的外部工具聽任語言模型調用, 終端使用者就可以『說』得一口好程式了!
 
本書特色
 
  □ 解析 Plugin store 上架的台鐵時刻表外掛教你設計 ChatGPT Plugin
  □ 善用 OpenAI API 設計 Discord 股票分析機器人
  □ 利用 LangChain 製作行銷文宣自動生成上傳社群服務
  □ 結合 Embeddings×LangChain 設計台灣旅遊自動諮詢客服機器人
  □ 利用 function calling 設計突破時空限制的 LINE AI 聊天機器人
  □ 整合 OpenAI Image API 設計 AI 文字生圖/改圖/修圖工具
  □ 透過 Gradio 設計可分享的 AI 網頁應用
  □ 詳解 OpenAI API 參數/掌握語言模型輸出變化
深入解析 LLM 的前沿应用与架构设计 一本面向技术实践者、架构师与创新者的深度指南 本书旨在为读者提供一套全面、深入、实用的 LLM(大型语言模型)应用开发框架与实践指南。我们不再仅仅关注 API 的调用,而是深入探讨如何构建健壮、高效、可扩展的 AI 驱动系统。全书聚焦于如何将 LLM 从一个“黑箱”工具转化为企业级应用的核心驱动力,涵盖从基础的数据结构处理到复杂的系统集成、性能优化与部署策略。 第一部分:现代 LLM 应用的核心基石——上下文理解与知识检索 在应用程序中,仅依靠模型本身的参数知识是远远不够的。本部分将引导读者掌握构建“有记忆、能检索”的智能体的关键技术——向量嵌入(Embeddings)的深度应用与检索增强生成(RAG)架构的精细化调优。 1. 向量嵌入的高级原理与实战 超越基础: 详细解析不同类型嵌入模型(如 Sentence Transformers、Contriever 等)的内在工作原理、适用场景及性能权衡。我们不仅展示如何生成向量,更深入探讨如何评估向量空间质量、处理高维数据降噪以及选择最优的度量标准(如余弦相似度、欧氏距离)。 Chunking 策略的艺术: 探讨文本切块(Chunking)策略对检索性能的决定性影响。内容将涵盖基于语义边界的切块、滑动窗口技术、父文档-子文档(Parent-Child)检索模式,并提供代码实践,以应对代码、表格、复杂文档等非标准文本的切分难题。 多模态嵌入的初步探索: 介绍如何将图像、音频等非文本数据转化为向量,为构建跨模态检索系统打下理论基础。 2. 检索增强生成(RAG)的系统化构建 构建高效的向量数据库: 对比分析主流向量数据库(如 Pinecone, Weaviate, ChromaDB 等)的架构差异、索引优化技术(如 HNSW 算法的参数调优)以及在不同数据规模下的性能表现。 高级检索策略: 深入讲解如何优化检索流程,包括混合检索(Hybrid Search,结合关键词与向量)、重新排序(Re-ranking)机制的集成,以及如何利用查询重写(Query Rewriting)来提升用户意图的准确性。 失败模式诊断: 建立一套 RAG 系统性能评估框架,着重于识别“幻觉”产生的原因——是召回不足、排序偏差,还是生成阶段的上下文丢失,并提供针对性的改进方案。 第二部分:流程编排与工具调用——Agentic Workflow 的设计与实现 本书的核心在于将 LLM 从单一的问答接口升级为能够自主规划、执行多步骤任务的智能体(Agent)。 1. 现代 Agent 框架的核心架构 工具定义与描述: 详细阐述如何清晰、精确地定义 LLM 可以使用的外部工具(Tools/Functions)。重点在于编写高质量的工具描述(Docstrings),这是模型进行有效规划的关键输入。 规划与推理引擎: 探讨 ReAct、CoT(Chain-of-Thought)等推理范式的底层逻辑。我们将侧重于实现更复杂的规划模式,如树状搜索(Tree of Thoughts, ToT)和图论优化,使 Agent 能够在复杂任务中进行回溯和自我修正。 记忆管理系统: 区别短期上下文记忆、长期知识记忆与会话历史记忆。介绍如何设计一个分层的记忆结构,确保 Agent 在长时间交互中保持一致性和上下文相关性。 2. 复杂流程的编排与状态管理 多步骤工作流的构建: 教授如何使用状态机(State Machines)来管理 Agent 执行过程中的不同阶段(例如:规划 -> 搜索 -> 执行 -> 验证)。这对于确保关键业务流程的可靠性至关重要。 Error Handling 与容错机制: 编写健壮的 Agent 需要预见到外部工具调用失败、API 超时等问题。本书提供了一套成熟的错误捕获、日志记录与自动重试机制的设计方案。 第三部分:构建可信赖的生产级系统 本书将目光投向真实世界的部署挑战,关注系统的安全性、成本效益与持续优化。 1. 数据安全与隐私保护 输入/输出清洗与验证: 实施强大的输入验证层,防御提示词注入(Prompt Injection)攻击。讨论数据脱敏(Data Masking)技术在 LLM 输入输出流中的应用,确保敏感信息不会被意外泄露或记录。 模型评估与偏见缓解: 介绍如何构建黄金标准数据集(Golden Datasets)来持续监测模型在关键业务指标上的表现漂移(Drift)。探讨减轻模型偏见(Bias)的后处理技术。 2. 性能优化与成本控制 高效的提示工程(Prompt Engineering): 探索如何通过动态模板、Few-Shot 示例的智能选择来减少上下文长度,从而显著降低 Token 消耗和延迟。 延迟优化策略: 讨论流式(Streaming)输出的最佳实践、批处理请求(Batching)在特定场景下的应用,以及模型服务层(如 vLLM 或 TensorRT-LLM)的选型与部署考量。 3. 系统集成与运维 微服务架构中的 LLM 封装: 将 LLM 能力封装为标准化的 gRPC 或 RESTful 服务,便于传统 IT 部门进行集成和监控。 可观测性(Observability): 设计详细的 LLM 调用追踪系统,记录每一个决策点、使用的 Token 数、延迟时间以及检索到的文档片段,为后续的审计和优化提供数据支撑。 本书不是对现有 API 文档的简单复述,而是一份指导开发者跨越“概念验证”阶段,迈向构建可信赖、可扩展、高性能的 AI 驱动型软件的实践蓝图。 读者将学会如何系统地设计、实施和维护下一代智能应用。

著者信息

图书目录

第 1 章 OpenAI API 入門
1-1 有了 ChatGPT 為什麼還要寫程式?
流程自動化
客製化聊天內容 
延伸聊天範圍
整合 AI 功能
1-2 註冊 OpenAI API 帳戶
檢查目前用量
成為付費會員
限制使用額度
1-3 利用 Playground 熟悉 API
可用的 API 模式與模型
認識 chat 模式的三種角色
保持對答脈絡

第 2 章 使用 Python 呼叫 API
2-1 使用官方 openai 套件
安裝與使用 openai 套件
傳遞多筆訊息
設定與隱藏金鑰的方法 
2-2 認識 token 
使用 tokenizer 頁面檢視 token
使用 tiktoken 套件計算精確 token 數
token 切割視覺化工具
ChatML 標記語言
2-3 使用 Python requests 模組呼叫 API
OpenAI API 的 HTTP 規格
使用 Python requests 模組
利用 curl 工具快速測試 API

第 3 章 API 參數解析與錯誤處理
3-1 事前準備
3-2 控制生成訊息與 token 數量
指定生成的訊息數量 - n
設定詞彙黑名單 - stop 
設定回覆語句的 tokens 數量上限 - max_tokens 
3-3 控制回覆內容的變化性
讓回覆更具彈性 - temperature
控制詞彙的豐富度 - top_p
控制詞彙的重複性 - presence_penalty 與 frequency_penalty
調整特定 token 的分數 - logi-bias
3-4 串流輸出
可循序傳回結果的生成器 (generator) - stream
串流多個語句
3-5 錯誤處理與使用限制
使用例外機制處理錯誤
API 存取限制

第 4 章 打造自己的 ChatGPT
4-1 文字模式簡易聊天程式
4-2 加入聊天記錄維持聊天脈絡
4-3 串流版本的聊天程式
4-4 儲存歷史紀錄下次繼續聊
掛接 Google 雲端硬碟 
製作復原/儲存歷史紀錄的函式

第 5 章 突破時空限制 – 整合搜尋功能
5-1 用搜尋網頁幫 AI 補充知識
使用 Google 搜尋 
5-2 整合搜尋結果讓 AI 跟上時代
5-3 使用 Google Search JSON API
建立搜尋引擎 ID
取得 API Key
使用 HTTP API 取得搜尋結果
使用客製模組

第 6 章 讓 AI 幫 AI – 自動串接流程
6-1 從 ChatGPT 外掛得到的啟示
準備工作 
搭配串流/非串流模式的工具函式 
6-2 由 AI 自動判斷要額外進行的工作
讓 AI 自行決定是否需要搜尋 
撰寫判斷是否需要搜尋的工具函式 
可自行判斷是否進行網路搜尋的聊天程式
6-3 可建構外掛系統的 Function Calling 機制
告知語言模型可用的外部工具函式
取得語言模型的建議
執行函式並傳回結果
以串流方式使用 function calling
6-4 建立 API 外掛系統 
建立外部工具函式參考表
建立協助 function calling 的工具函式
建立 function_calling 版的 get_reply_f() 函式
建立 function calling 版本的 chat_f() 函式
6-5 迭代式 function-calling 機制
gpt-4 模型真的比較厲害
驗證答案必要時強制進行第二輪

第 7 章 網頁版聊天程式與文字生圖 Image API
7-1 準備工作
7-2 使用 gradio 套件快速建立網頁程式
安裝與使用 gradio 
使用串流方式顯示輸出 
客製使用者介面
7-3 使用 DALL‧E 的 Image API 
Image API 用法
建立文字生圖像網址的函式
包裝成生成 markdown 語法的函式

第 8 章 設計 LINE AI 聊天機器人
8-1 設計簡易的 LINE 聊天機器人
Messaging API
Replit 線上開發環境
實作 LINE 聊天機器人
設定環境變數
執行程式
串接程式與通道
測試聊天機器人
8-2 升級為 AI 聊天機器人
設定環境變數
修改程式碼
執行與測試
8-3 OpenAI 變化圖像的功能 
8-4 可控制變化內容的 create_edit 函式
ChatGPT code interpreter 模型來幫忙
讓 LINE 也能變化圖像背景

第 9 章 自媒體業者必看!使用 AI 自動生成高品質字幕
9-1 使用 PyTube 套件輕鬆下載 YouTube 檔案
複製 Replit 專案:輕鬆下載 YouTube 檔案
程式碼詳解:輕鬆下載 YouTube 檔案 
9-2 使用 Whisper「語音轉文本」模型轉出字幕檔
複製 Replit 專案:從音訊檔轉出字幕檔
程式碼詳解:從音訊檔轉出字幕檔
9-3 影片不是中文的?讓 AI 變出中文字幕! 
複製 Replit 專案:讓 AI 變出中文字幕
程式碼詳解:讓 AI 變出中文字幕

第 10 章 把 AI 帶到 Discord
10-1 建立第一個 Discord 機器人
前置作業
建立 Discord 開發者應用程式
取得 TOKEN
將 Discord 機器人加入伺服器
10-2 建立回聲機器人
複製 Replit 專案:回聲機器人
程式碼詳解:回聲機器人
10-3 讓 Discord 機器人只處理指名給自己的訊息
複製 Replit 專案:指名道姓機器人 
程式碼詳解:指名道姓機器人 
10-4 加入 AI 的 Discord 機器人
複製 Replit 專案:加入 AI 大腦的機器人
程式碼詳解:加入 AI 大腦的機器人 

第 11 章 AI 客製化投資理財應用實戰
11-1 能抓取證交所資料的 Discord 機器人 
複製 Replit 專案:能抓取證交所資料的 Discord 機器人
抓取大盤資料
抓取個股股價資料
抓取個股本益比、殖利率及淨值比資料
斜線指令:main.py
11-2 StockGPT:專業的證券分析機器人
複製 Replit 專案:StockGPT
抓取新聞資料
AI 幫你來分析 
StockGPT 主程式:main.py 
11-3 加入按鈕指令來優化使用者體驗
複製 Replit 專案:按鈕版的 StockGPT
按鈕指令:main.py

第 12 章 用 LangChain 實作新書宣傳自動小編
12-1 認識 LangChain 
12-2 熟悉 LangChain 基本功能 
使用 ChatOpenAI
提示模板 (PromptTemplate)
建立 LLMChain
對話記憶 Memory
12-3 串接 Google search 及 Agent 代理運用
建立 LangChain 代理 (Agent) 
建立工具組
建立 Agent
12-4 實戰演練:用 LangChain 在社交軟體上宣傳新書
建立 Chain 元件 
使用爬蟲 
建立可取得單一書籍文案的函式 flag_book
宣傳文修改程式 
前往 IFTTT 連接 FB
宣傳文編碼與上傳

第 13 章 用 Embeddings 實作台灣旅遊客服機器人
13-1 Embeddings 簡介 
主要功能及應用
如何轉成向量
模型與花費
13-2 實作 Embeddings 
建立環境
文字轉向量
比較關聯性 - 餘弦相似度
13-3 向量資料庫
動手操作
查詢資料 
13-4 台灣旅遊客服機器人
快速建立資料庫 
使用 RetrievalQA 
使用 Gradio 建立網頁程式 

第 14 章 ChatGPT Plugin 開發
14-1 火車時刻表查詢外掛簡介
14-2 使用 TDX 平台查詢台鐵資訊 
查詢所有車站基本資料
指定起迄站代號查詢時刻表 
取得驗證資訊
以驗證身分方式使用 API
14-3 ChatGPT 外掛實作入門 - 以查詢台鐵車站代號為例
ChatGPT 外掛基本架構
外掛描述檔
API 規格檔
後端程式 
測試外掛 
14-4 ChatGPT 外掛開發 - 加入時刻表查詢功能
修改外掛描述檔 
修改 API 規格檔 
修改後端程式
測試外掛 
14-5 身分驗證
設定存取令牌
取得驗證令牌
修改後端程式
測試外掛 
14-6 協同測試與上架 Plugin store
請其他開發者測試外掛 
提交外掛 

图书序言

  • ISBN:9789863127628
  • 規格:平裝 / 416頁 / 17 x 23 x 2.7 cm / 普通級 / 全彩印刷 / 初版
  • 出版地:台灣

图书试读

用户评价

评分

我作为一个对自动化流程深感兴趣的业余爱好者,对书中提到的“客服自动化助理”部分抱有极高的期望。现有的客服系统往往只能处理预设的 FAQ,一旦用户提出稍微偏离预设脚本的问题,就立刻转人工。我希望这本书能揭示如何利用 LangChain 构建一个能够理解上下文、具备推理能力,并且能够安全地访问内部知识库的智能体。尤其关注如何设计一个有效的“护栏”(Guardrails)机制,以确保机器人不会产生幻觉或泄露敏感信息。此外,如何进行小样本学习(Few-shot learning)或微调(Fine-tuning)特定领域的知识,从而让助理的回答更贴合企业文化和专业术语,也是我希望书中能深入探讨的环节。这本书如果能提供一个完整的、可部署的客服工作流示例,那对我来说将是无价之宝。

评分

拿到这本书后,我立刻翻阅了目录,发现它涵盖的范围非常广,从基础的 API 调用到利用 Embeddings 进行高级检索增强生成(RAG),再到构建 Plugin 和各种自动化助理。这种全景式的介绍让我感到非常振奋。我最感兴趣的是关于构建“股票分析助理”的部分。金融领域的应用对准确性和时效性要求极高,我非常好奇作者是如何利用 LLM 来处理非结构化的财经新闻、研报,并将其转化为可操作的洞察的。如果书中能详细讲解如何构建一个可靠的评估指标体系,来判断这个助理的分析结果是否真的比传统方法更优,那这本书的价值就非常高了。此外,对于如何有效管理和版本控制 Agent 的记忆(Memory)和工具(Tools),也是我非常关注的重点,希望书中能给出一些生产环境下的最佳实践。

评分

这本书的标题《ChatGPT 開發手冊:用 OpenAI API‧LangChain‧Embeddings 設計 Plugin、LINE/Discord bot、股票分析與客服自動化助理》一下子就抓住了我眼球。我一直很想知道,如何才能真正地将这些前沿的技术从概念变成可以落地的应用。市面上很多教程总是停留在理论层面,或者只是做一些非常基础的“Hello World”级别的演示,让人学完后依然感觉遥不可及。我特别期待这本书能在实际操作上给出更深入的指导,比如在设计一个复杂的企业级应用时,如何处理数据隐私、如何优化响应速度,以及如何构建一个既智能又稳定的系统架构。我希望它能像一本实战指南,而不是一本概念的集合。如果它能提供一些处理真实世界复杂场景的案例,比如如何用 LangChain 连接不同的外部数据源,或者如何在 Discord 上部署一个能处理用户情绪的机器人,那就太棒了。我希望这本书能真正地教我如何从一个有想法的开发者,蜕变成一个能用 LLM 解决实际问题的工程师。

评分

这本书的排版和行文风格给我留下了深刻印象,它不像传统的技术手册那样枯燥乏味,反而有一种清晰的脉络感和实战的热情。我特别欣赏作者在讲解复杂概念时,总是能用非常直观的例子来辅助说明。例如,在讲解如何设计一个健壮的 Plugin 时,我期待看到的是如何优雅地处理用户意图的歧义,以及如何通过结构化的输出(Schema)来确保 LLM 返回的数据是程序可以无缝解析的。对于 LINE 和 Discord bot 的开发部分,我更希望看到如何处理用户会话的连续性,以及如何安全地集成第三方服务。总而言之,我希望这本书能像一个经验丰富的导师,在我遇到困难时,能提供明确的指引,而不是仅仅罗列 API 文档。

评分

这本书的覆盖面从基础搭建到高级应用场景的跨度非常大,这本身就是一种挑战。我认为,衡量一本技术书好坏的关键在于其对“为什么”(Why)和“怎么做”(How)的平衡把握。对于 LangChain 的讲解,我期待的不仅仅是流程的堆砌,而是对不同 Chain 类型(如 Sequential, Conversational, Retrieval)的适用场景进行深刻的对比分析。例如,在构建一个需要多步骤思考的股票分析任务时,应该选择哪种 Chain 组合才是最高效的?此外,Embeddings 部分如果能深入探讨不同向量数据库(Vector DBs)的性能差异以及如何针对特定数据类型(文本、代码、或时间序列数据)选择合适的模型和索引策略,那就真的体现了“手册”的深度与广度了。我希望读完后,我能对 LLM 应用的工程化设计有一个全新的、更加成熟的认识。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 ttbooks.qciss.net All Rights Reserved. 小特书站 版权所有