描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302676157丛书名: 跟我一起学人工智能
本书从生成式AI的基础知识到LangChain框架的高级应用,无论是新手还是经验丰富的开发者都能从中获益。通过深入浅出的解释、实际案例分析及详细的步骤指导,本书旨在帮助读者理解并掌握LangChain的强大能力,进而开发出更智能、更高效的应用。
本书全面深入地探讨了AI生成大模型的领域,从AI的历史探源、生成式模型在不同领域的应用(文本、图片、声乐、视频及多模态模型),到大型语言模型(如GPT)的运作机制、预训练、可扩展架构及其适应性。通过详细介绍LangChain的概念、应用、安装方法及如何利用LangChain进行软件开发和数据科学,本书为读者提供了一个关于AI生成大模型应用的全景视图。
本书共11章,覆盖了AI生成大模型的理论基础、LangChain的初识与入门、进阶使用、在软件开发和数据科学中的应用及生成式AI的未来展望等多个方面。第1~3章介绍AI生成大模型的基础知识,如AI历史、生成式模型在不同领域的应用、大型语言模型如GPT的基础和LangChain的初识与入门。第4~6章深入LangChain的进阶使用,探讨Agent构建、文档查询工具、聊天机器人开发,提供实战案例和技术细节。第7~9章聚焦LangChain在软件开发和数据科学的应用及定制LLM输出的策略,介绍编程、自动化软件开发、数据探索技术方法及LLM输出优化。第10章和第11章讨论LLM在生产环境的应用、监控、回调处理,以及生成式AI的未来展望,包括其潜力、社会影响和挑战,旨在为读者提供从入门到进阶的全面知识,适合不同背景的读者深入学习和应用。
本书特色在于其理论与实践相结合的方法论,适合对AI生成大模型感兴趣的学生、研究人员和软件开发者。书中不仅详细介绍了AI生成大模型的基础知识和前沿技术,还提供了丰富的实践指导和案例分析,帮助读者掌握如何在实际项目中应用这些技术。此外,配套资源丰富,包括示例代码、工具安装指南和案例研究,极大地增强了本书的实用性和指导性。无论是AI领域的新手还是有经验的开发者都能从中获得必要的知识和灵感。
第1章什么是AI生成大模型1
1.1AI历史探源1
1.1.1生成式模型2
1.1.2生成式模型在文本领域3
1.1.3生成式模型在图片领域4
1.1.4生成式模型在声乐领域5
1.1.5生成式模型在视频领域6
1.1.6多模态模型6
1.2LLM简介6
1.2.1潮流涌现8
1.2.2GPT的运作机制10
1.2.3模型的预训练12
1.2.4可扩展架构12
1.2.5模型的适应性13
1.2.6上手GPT13
1.3图像模型13
1.3.1图像模型工作原理14
1.3.2图像模型的不同版本15
1.3.3图形模型的调节性16
1.4总结16
第2章初识LangChain17
2.1LLM的局限性17
2.2LLM应用介绍19
2.3LangChain介绍21
2.3.1LangChain的必要性23
2.3.2LangChain支持的应用23
2.4LangChain的工作机制24
2.4.1初识Agent24
2.4.2初识链27
2.4.3初识记忆28
2.4.4LangChain中的工具28
2.5总结29
第3章LangChain入门30
3.1安装LangChain方法30
3.1.1安装Python30
3.1.2Jupyter Notebook和JupyterLab30
3.1.3环境管理32
3.2导入模型34
3.2.1虚拟LLM(Fake LLM)35
3.2.2OpenAI36
3.2.3HuggingFace37
3.2.4微软云38
3.2.5谷歌云38
3.2.6Jina AI40
3.2.7Replicate42
3.2.8本地模型42
3.3模型输出解析45
3.3.1列表解析器47
3.3.2日期解析器48
3.3.3自动修复解析器49
3.3.4Pydantic(JSON)解析器51
3.3.5重试解析器53
3.3.6结构化输出解析器55
3.3.7XML解析器57
3.4LangChain表达式语言59
3.4.1LCEL接口简介60
3.4.2绑定运行时参数75
3.4.3运行自定义函数77
3.4.4流式传输自定义生成器函数78
3.4.5并行化步骤80
3.4.6根据输入的动态路由逻辑82
3.5链86
3.5.1链接口中的方法调用88
3.5.2自定义链的创建89
3.5.3几种常见的链92
3.6实战案例: 客户服务助手应用程序开发109
3.7总结113
第4章LangChain进阶: Agent114
4.1构建自己的第1个Agent115
4.2LangChain中的常见Agent类型121
4.2.1Zeroshot ReAct122
4.2.2Structured Input ReAct124
4.2.3OpenAI Functions128
4.2.4Conversational130
4.2.5ReAct Document Store133
4.3迭代器运行Agent135
4.4让Agent返回结构化输出138
4.5处理Agent解析错误143
4.6将Agent构建为图144
4.6.1快速开始144
4.6.2流式输出147
第5章使用LangChain工具进行文档查询153
5.1幻觉现象153
5.2文档总结156
5.3信息提取159
5.4使用工具161
5.5解剖LLM推理的底层策略165
5.6总结168
第6章聊天机器人170
6.1聊天机器人简介170
6.1.1历史溯源171
6.1.2上下文和记忆173
6.1.3意识性与主动性174
6.2检索和向量174
6.2.1嵌入176
6.2.2存储嵌入的方式179
6.2.3索引179
6.2.4向量库180
6.2.5向量数据库181
6.2.6文档加载器184
6.2.7LangChain中的检索器184
6.3实战案例: 实现一个聊天机器人187
6.4LangChain中的记忆机制191
6.4.1快速开始192
6.4.2LangChain中基础的记忆类型194
6.4.3其他高级记忆类型211
6.4.4记忆和LLM链225
6.4.5记忆和Agent228
6.4.6自定义会话记忆233
6.4.7自定义记忆237
6.4.8聊天机器人的记忆240
6.5内容监管245
6.6总结246
第7章LangChain和软件开发248
7.1步入新时代248
7.1.1AI在软件领域的最新进展249
7.1.2代码生成LLM250
7.1.3未来展望253
7.2使用LLM编程254
7.3LLM自动化软件开发260
7.4总结265
第8章LangChain和数据科学266
8.1自动化数据科学简介266
8.1.1数据收集268
8.1.2可视化和探索性数据分析270
8.1.3数据预处理和特征提取270
8.1.4自动化机器学习271
8.1.5生成式AI对数据科学的变革274
8.2使用Agent276
8.3数据探索和LLM279
8.4总结282
第9章绽放LangChain的魅力: 定制LLM输出283
9.1调整与对齐283
9.1.1对齐的方法284
9.1.2变革者: InstructGPT286
9.1.3LLM推理过程的调整方法287
9.1.4效果评估288
9.2实战案例: LangChain微调LLM288
9.3提示词工程295
9.3.1提示词的结构295
9.3.2提示模板297
9.3.3高级提示词工程298
9.4总结301
第10章生产环境LLM303
10.1引言303
10.2LLM应用评估305
10.2.1比较两个输出306
10.2.2基于标准的比较307
10.2.3字符串和语义比较308
10.2.4基准数据集309
10.3部署LLM应用312
10.3.1FastAPI314
10.3.2Ray316
10.4监测LLM应用320
10.4.1跟踪和追踪321
10.4.2可观测性工具323
10.5LangChain回调324
10.5.1异步回调325
10.5.2自定义回调处理程序327
10.5.3记录到文件328
10.5.4多个回调处理程序330
10.5.5Token计算333
10.6LangSmith334
10.6.1LangSmith调试334
10.6.2LangSmith样本收集335
10.6.3LangSmith测试评估336
10.6.4LangSmith人工评估336
10.6.5LangSmith监控336
10.6.6LangSmith实战演示337
10.7总结344
第11章生成式AI的未来展望346
11.1当前的生成式AI346
11.2未来的能力349
11.3AI的社会影响351
11.3.1AI和创意行业353
11.3.2AI和社会经济354
11.3.3AI和教育354
11.3.4AI和就业355
11.3.5AI和其他行业357
11.3.6AI和网络安全357
11.4应用难题探索358
11.5写在最后359
参考文献361
随着人工智能技术的突飞猛进,生成式AI大模型,特别是像GPT这样的语言模型和图像生成模型,在众多领域的应用已经成为一种革命性的力量。这些模型不仅改变了我们与文本、图像和视频进行交互的方式,还为自动化、创造性解决方案和智能系统的开发开辟了新的可能性。从业界到学术界,对这些技术的探索和应用已经超越了初期的好奇,步入了深度整合和创新应用的新阶段。
目前笔者在一家全球500强外企担任AI工程师,作为一名早期开始研究AI的工程师,笔者亲历了生成式AI从理论概念到实际应用的全过程。在这个过程中,笔者目睹了LangChain框架的诞生和发展,它不仅解决了大型语言模型(Large Language Model,LLM)的局限性,还开启了通过AI增强软件工具的新纪元。LangChain的出现,标志着构建和利用AI模型的重大转变,尤其是在提升AI应用的复杂度和效率方面。
本书旨在为读者提供从生成式AI的基础知识到LangChain框架的高级应用的全面指南,通过深入浅出的解释、实际案例分析及详细的步骤指导,帮助读者理解并掌握LangChain的强大功能,进而开发出更智能、更高效的应用。
在编写本书的过程中,笔者不仅回顾了自己在AI研究和应用开发中的经验,也深入研究了最新的技术进展和实际案例。这一过程不仅加深了笔者对生成式AI技术潜力的认识,也让笔者对其未来的社会影响和发展前景有了更深刻的思考。笔者希望通过分享这些知识和见解,能够激发读者对AI技术的热情,推动更多的技术创新和应用,共同探索生成式AI的未来。
无论是对AI技术充满好奇的初学者,还是希望深入理解和应用LangChain框架的开发者,笔者相信本书都能为读者提供宝贵的信息和启发。让我们在这个充满无限可能的新时代一起探索AI技术。
本书主要内容
第1章介绍AI生成大模型的基础,涉及生成式模型在多个领域的应用,如文本、图像和视频等。本章还解释了LLM(如GPT)的核心机制和图像模型的工作原理,为读者提供AI生成技术的基础知识。
第2章讲解LangChain框架,包括其背景、必要性及工作机制。介绍了LangChain如何突破LLM的局限性,其支持的应用,以及核心组件(如Agent、Chain和Memory)的功能。
第3章介绍安装LangChain的步骤,模型导入方法,以及模型输出解析技巧。讲解LangChain表达式语言和链的创建,结合客户服务助手案例展示了LangChain的实际应用。
第4章深入探讨LangChain中Agent的构建和运用,包括常见Agent类型及其实际应用。讨论了如何使Agent返回结构化输出和如何构建为图,提升LangChain应用的复杂度和效率。
第5章专注于使用LangChain进行高效文档查询,包括文档总结、信息提取等。本章解释了LLM推理的策略,为文档处理提供实用指南。
第6章探讨聊天机器人的开发过程,从基础概念到检索和向量的具体实现。介绍了LangChain在聊天机器人记忆管理中的应用,以及内容监管的重要性。
第7章讲解LangChain在软件开发领域的应用,从AI的最新进展到使用LLM进行编程和自动化软件开发的方法,提供了将LangChain集成到开发流程中的指南。
第8章介绍LangChain在数据科学中的应用,包括数据收集、处理和自动化机器学习。探讨了使用Agent进行数据探索的方法,展示了生成式AI如何改变数据科学。
第9章深入讨论如何调整和微调LLM输出,包括对齐方法和效果评估。介绍了LangChain微调LLM的技巧,以及提示词工程的高级应用。
第10章关注于LLM在生产环境的应用,包括部署、监测和LangChain回调使用。探讨了提高LLM应用可观测性的方法,以及LangSmith工具的实战应用。
第11章展望生成式AI的未来,讨论其潜力、社会影响及面临的挑战。本章为读者提供了对生成式AI未来走向的全面理解,探索了AI在多个领域的应用难题。
阅读建议
为了最大程度从本书中获益,笔者建议读者按照以下几点阅读建议进行学习。
(1) 基础知识建立: 对于初学者来讲,第1章是构建生成式AI技术基础知识的关键。通过理解AI生成大模型的基础概念,包括文本、图像和视频等多个领域的应用,以及LLM(如GPT)和图像模型的工作原理,读者可以获得对AI生成技术的初步了解。
(2) 框架理解: 第2章对LangChain框架进行了全面介绍,包括背景、必要性及工作机制。深入理解LangChain如何解决LLM的局限性及其支持的应用,对于想要在AI领域进一步深造的读者来讲至关重要。
(3) 实操演练: 从第3章开始,书中逐渐转向实操,介绍了安装LangChain、模型导入方法及模型输出解析技巧。笔者建议读者跟随书中的步骤进行实际操作,通过实践来加深对理论知识的理解和应用。
(4) 专题深化: 第4~10章覆盖了LangChain的高级应用,包括Agent的构建和运用、高效文档查询、聊天机器人开发、软件开发和数据科学应用等。读者应根据个人兴趣和专业需求选择重点阅读和深入研究的章节。
(5) 未来趋势与挑战: 第11章对生成式AI的未来进行了展望,讨论了其潜力、社会影响及面临的挑战。笔者建议所有读者都阅读本章,以获得对AI技术未来走向的全面理解,同时思考如何在未来的技术浪潮中定位自己。
(6) 动手实践与反复阅读: AI是一个快速发展的领域,理论与实践紧密相连。笔者鼓励读者在阅读的同时,积极动手实践书中的案例和练习,甚至尝试自己的项目。同时,对于一些复杂的概念和技术,反复阅读和实践会有助于深化理解。
资源下载提示
素材(源码)等资源: 扫描目录上方的二维码下载。
由于时间仓促,书中难免存在不妥之处,请读者见谅,并提宝贵意见。
陆梦阳2024年9月
评论
还没有评论。