
会员
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程
程戈更新时间:2024-04-25 18:20:57
最新章节:封底开会员,本书免费读 >
这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程最新章节
查看全部- 封底
- 作者简介
- 11.5 小结
- 11.4.3 ChatGPT for Robotics
- 11.4.2 PaLM-E
- 11.4.1 具身智能的挑战
- 11.4 具身智能
- 11.3 自回归模型的局限性
- 11.2 数据资源枯竭
- 11.1 强人工智能之路
程戈
主页
最新上架
- 会员
中国人形机器人创新发展报告2025
作为一本技术性很强的书,《中国人形机器人创新发展报告2025》覆盖人工智能、大模型、视觉捕捉、自动化控制等一些列技术和学科。本书系统性梳理了《人形机器人创新发展指导意见》发布以来中国人形机器人产业在关键技术、产品培育、场景应用、生态营造、支撑能力以及保障措施等多方面的发展态势,通过多角度案例研究,全面解析了中国在这一领域的成果与经验,力图展示中国人形机器人产业的全貌,洞察人形机器人产业未来发展的新计算机9万字 - 会员
AI爆款文案:巧用AI大模型让文案变现插上翅膀
本书通过对10款人工智能应用的介绍及调试,帮助读者快速掌握人工智能辅助文案变现的方式。本书共10章,分别讲解AI智能创作,AI爆款文案写作工具,人工智能辅助泛流量文案、泛商业文案、私域文案创作,利用人工智能实现文案变现的底层逻辑,以及在今日头条、百家号、小红书、知乎等平台及不同展示形式下进行文案创作的实战案例等。计算机12.2万字 - 会员
深入浅出人工智能:原理、技术与应用
本书旨在帮助读者从零开始学习人工智能,掌握人工智能的原理、技术和应用。本书共10章,首先是人工智能概述,接着深入浅出地讲解人工智能的原理和技术,包括数据预处理、数据可视化、机器学习基础、监督学习模型、无监督学习算法、神经网络基础、训练深度神经网络等内容,最后讲解人工智能的应用,包括智能对话和知识图谱。本书适合想要学习并掌握人工智能技术和应用的零基础读者阅读,还可以作为高等院校人工智能相关课程的教材计算机11.3万字 - 会员
巧用ChatGPT轻松玩转新媒体运营
本书从ChatGPT的基础知识讲起,针对运营工作中的各种痛点,结合实战案例,如文案写作、图片制作、社交媒体运营、爆款视频文案、私域推广、广告策划、电商平台高效运营等,教会读者如何使用ChatGPT进行智能化工作;还介绍了通过ChatGPT配合Midjourney、D-ID等AI软件的使用,进一步帮助提高运营工作的效率。计算机11.3万字 - 会员
人工智能数学基础与Python机器学习实战
本书分为3个部分:第1章和第2章是人工智能的数学基础,主要介绍了机器学习的概念、Python开发环境的搭建、机器学习bibei的数学知识,以及线性代数和概率论的相关知识;第3~12章主要介绍了回归模型、分类模型、聚类模型、半监督模型的建立和相关算法的理论,以及如何使用sklearn具体实现相关算法模型的搭建;第13章介绍了Spark机器学习,笔者认为对于机器学习,不能只限于Python中的skle计算机0字 - 会员
社交网络信息传播模型、算法及应用
本书系统地阐述信息传播问题中所涉及的各种传播模型、数学优化方法以及计算方法等,并通过对大量信息传播的实际问题进行了建模与分析。该著作将为人工智能、大数据、管理科学、运筹学、人文社会科学等领域开展相关研究的本科生、研究生以及学者提供重要的参考。计算机16万字 - 会员
DeepSeek原理与项目实战:大模型部署、微调与应用开发
DeepSeek是一种基于Transformer架构的生成式AI(ArtificialIntelligence)大模型,融合了MoE架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章,涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合计算机17.1万字 - 会员
人工智能治理研究
本书从技术和规制两个角度入手,以人工智能治理的法律、公共政策以及伦理规范等相关社会行为和社会关系的规则建立和运行为主要思考方向和研究进路,在梳理人工智能发展情况、欧盟及其他国家人工智能立法与政策发布现状的基础上,对人工智能治理的基础、基本路径及我国人工智能产业、政策与规制思路进行了全面和有益的探索。计算机23.9万字 心与芯:我们与机器人的无限未来
我们当下正在经历一场AI革命。现在有创纪录的310万个机器人在工厂工作,从事从组装电脑到包装货物以及监测空气质量等各种工作。数量庞大的智能机器以各种各样的方式影响着我们的生活,如提高外科医生的手术精确度,清洁我们的家等等,我们正处于机器智能带来的令人兴奋的可能性当中。下一个万亿规模的企业,也许正在AI机器人领域诞生。当下的机器人产业,远远超出常人的想象。你会看到全世界最先锋的机器人研究团队如何开发计算机13.5万字