新書推薦:
《
创客精选项目设计与制作 第2版 刘笑笑 颜志勇 严国陶
》
售價:NT$
281.0
《
佛山华家班粤菜传承 华家班59位大厨 102道粤菜 图文并茂 菜式制作视频 粤菜故事技法 佛山传统文化 广东科技
》
售價:NT$
1010.0
《
武人琴音(十周年纪念版 逝去的武林系列收官之作 形意拳一门三代:尚云祥、韩伯言、韩瑜的人生故事 凸显百年武人命运)
》
售價:NT$
199.0
《
剑桥斯堪的纳维亚戏剧史(剑桥世界戏剧史译丛)
》
售價:NT$
704.0
《
禅心与箭术:过松弛而有力的生活(乔布斯精神导师、世界禅者——铃木大拙荐)
》
售價:NT$
301.0
《
先进电磁屏蔽材料——基础、性能与应用
》
售價:NT$
1010.0
《
可转债投资实战
》
售價:NT$
454.0
《
王氏之死(新版,史景迁成名作)
》
售價:NT$
250.0
|
編輯推薦: |
1. 一本书带你读懂生成式人工智能,从技术、功能、逻辑到前景商业应用。帮 助我们了解未来趋势、寻找个人发展机会。
2、作者丁磊,拥有雄厚专业背景(美国俄亥俄州立大学人工智能专业博士,人工智能商业化落地先行者,曾为硅谷明星公司PayPal创立了人工智能平台并担任负责人,后在百度、腾讯均任高级职务),分析视角专业,兼顾通俗易懂。
3、香港科技大学讲席教授,加拿大皇家科学院、加拿大工程院院士杨强,加拿大圭尔夫大学教授、先进机器人及智能系统实验室主任杨先一,微软中国CTO韦青,戴尔原全球副总裁、大中华区总裁杨超,富士康科技集团首席数字官、智能制造平台负责人史喆,从知名教授到科技企业高管、人工智能技术践行者,联袂推荐。
|
內容簡介: |
ChatGPT一经问世,在全球范围内引起巨大轰动,GPT-4接入未来办公软件更是让人震惊,而且技术正在以前所未有的速度快速迭代。那么,以这些技术为代表的生成式人工智能(AIGC)是否为新一轮的技术革命?它到底能做什么,具有哪些优势和场景应用趋势?面对新技术,未来商业的机会在哪里,对我们个人又有着什么样的影响?这些问题对于我们理解当下,面向未来都十分重要。本书基于作者的专业背景和长期实践,系统介绍生成式人工智能的内在逻辑与应用,并将其与产业发展,理论和实际相结合,帮助读者从本源了解生成式人工智能,结合未来趋势和发展为读者指明方向。
|
關於作者: |
丁磊
美国俄亥俄州立大学人工智能专业博士,美国哥伦比亚大学博士后。
人工智能商业化落地先行者,曾为PayPal创立人工智能平台,历任百度金融首席数据科学家、PayPal全球消费者数据科学部创始负责人等职务,曾在IBM Watson研究院和美国伊利诺伊大学贝克曼研究所从事研究。在IEEE会刊等发表高质量论文20余篇,获授权专利30余项。
帮助企业运用人工智能提升效益,与中国农业银行、中国电信、万科集团、联合利华、亿客行等行业巨头深度合作,推动人工智能落地。领导研发的营销和风控决策系统、精准服务智能机器人平台在多个行业成功应用。2018年被财经评为中国“数据科学50人”。
|
目錄:
|
前言
章 初识生成式人工智能
纵观 AI 产业版图 003
聚焦 AIGC:内容皆可生成 017
生成式 AI 的核心价值 031
里程碑式的存在——ChatGPT 041
第二章 AIGC 的底层逻辑
生成式模型基础 059
Transformer 和 ChatGPT 模型 073
Diffusion 模型 087
第三章 功能分析:AIGC 能生成什么内容?
生成文字: 新闻、报告、代码都可一键生成? 101
描绘图片: 分辨率、清晰度、真实性与艺术性 111
音频制作:精准还原、实时合成 127
影视创作:海量场景任你选 137
互动娱乐:游戏中的生成式 AI 革命 149
第四章 商业落地:AIGC 的产业应用与前景
研发设计:设计能力样样俱全 163
生产制造: “L4 级别”的智能控制 179
市场营销:营销文案不再发愁 191
供应链管理: 库存计划可自动编程? 201
客户服务:贴心服务打动客户 211
第五章 主动还是被动?决胜 AIGC
展望未来: AIGC 是否是新一轮的技术革命? 225
智能并非:AIGC 的优势与瓶颈 235
我们的工作机会还在吗? 247
后记 259
参考文献
|
內容試閱:
|
人类从出生开始,就在不断通过视觉、听觉、嗅觉、味觉、触觉等各种方式认识这个世界。我们通过不停地与外界接触、学习,逐渐长大成人,再通过专业课程的学习在某些方面获得一技之长从而立足于社会,并试图改造世界。
“硅基”的AI(人工智能)也按照类似的模式成长,但是在速度方面极具优势。人工智能经历了从初的机器学习到神经网络,再到Transformer模型的发展,2022年底ChatGPT以及2023年初GPT—4横空出世,引燃了公众对生成式AI的关注,其中让人激动的就是AI大模型已经初步具备了人类的通识和逻辑能力——这恰恰是之前的AI所缺失的。此前,无论是AlphaGo还是AlphaFold,多只能称作其各自领域的“专家”,而ChatGPT是通用的。
正如OpenAI首席科学家、ChatGPT背后的技术大佬伊利亚·苏茨克维(IlyaSutskeve)所说,GPT学习的是“世界模型”。他将互联网文本称作世界的映射,因此,将海量互联网文本作为学习语料的GPT学习到的就是整个世界。在我们认识世界的同时,GPT模型也同样以惊人的算力,快速地获取我们数年,甚至数十年才能拥有的认知,即将成为一位成年人所具有的认知的“世界模型”。
不仅如此,已具备了“世界模型”能力的GPT还能够生成“万物”。当然,苏茨克维所说,这里的万物指的是世界万物在数字空间的映射,包括文本、图片、音频、视频、剧本、代码、方案、设计图等一切和我们生产、生活息息相关的事物。因为GPT模型在一定程度上可能已经具备了成年人的通识和逻辑,所以我们只需要拿特定专业领域的数据对其再做训练(称为“微调”),GPT模型就可以成为独当一面的专业人才,它可能成为艺术家、设计师、程序员、工程师或广告优化师、供应链专家、客服人员等。这也许就是生成式AI或者说AIGC,带给我们的核心价值。
在AI技术大爆炸的今天,生成式AI处在高速发展阶段,技术和应用领域日新月异,因此我们非常有必要系统地了解生成式AI。在这样的背景下,本书将系统介绍生成式AI的原理与模型,同时也将对其在行业场景中的应用展开论述,理论和实际相结合,让大家从本源上了解ChatGPT里程碑式存在的意义。结合作者二十余年AI领域研究与工作的经验,本书会为读者指明方向。尤其值得一提的是,本书既在理论上解释了数字媒体即虚拟世界的生成式AI,又探讨了生成式AI如何服务和赋能实体经济。在当前的存量经济时代,通过生成式AI重新定义生产力,助力行业更新发展,在存量里促增长,具有尤为重要的意义。
如图0—1所示,我们用图表明本书所覆盖的知识领域:X轴是生成式大模型的维度,对应的是第二章“AIGC的底层逻辑”,我们将了解“用什么去生成”;Y轴是数字媒体形态的维度,对应的是第三章“AIGC能生成什么内容?”,我们将了解“生成什么”;Z轴是行业职能的维度,对应的是第四章“AIGC的产业应用与前景”,我们将了解用生成式AI可以“做什么事”。三个轴所形成的空间里的每个点都有其特定含义,例如:通过GPT—4模型生成代码用在生产上,通过StableDiffusion模型生成图片用在营销上。除了这三章,章会带领读者初识生成式AI,第五章则探讨生成式AI是否会取代大量的工作岗位,以及我们应该如何主动应对。
希望任何一个不想在生成式AI时代落伍的人,在阅读本书之后,都能理解生成式AI的底层逻辑和实际应用,也希望本书对他们的工作和生活有所助益。“万物皆可生成”的时代已经来临,理解AI、训练AI、使用AI,甚至和AI一起工作,对每个人来说或将无法避免。未来已来,让我们一起出发!
章初识生成式人工智能
现象级产品ChatGPT的“横空出世”,带火了AIGC和它背后的生成式AI,也让不少人对使用AI工具跃跃欲试。在本章,我们会一起进入AI的产业“国度”,从决策式AI跃迁至生成式AI,对比这两种人工智能模型的异同,深度挖掘它们的应用场景和商业潜力,同时还会探讨“内容皆可生成”的生成式AI及其核心价值。在概览生成式AI后,我们会把视角转向具体,深入解析大众已经熟知的ChatGPT,了解这项“奇妙工具”背后的原理和发展历程。若你对生成式人工智能一知半解,可以在本章的内容中初步认识AIGC,也能了解到近期值得关注的AIGC工具。
纵观AI产业版图
如果要选出2023年热的几个话题,ChatGPT一定榜上有名。2023年初,ChatGPT席卷全球并成为流量热点,人们都在前赴后继地挖掘ChatGPT的各种潜能,探讨其未来发展趋势,甚至是与人类的关系。作为“人工智能家族”的大热应用,以ChatGPT为首的各大人工智能应用开始被越来越多的人关注,也引发了人们的更多思考。
人工智能(AI)技术被称为当代三大尖端技术之一,近年来在人们生活中的“存在感”也越来越强,这都是产业飞速发展的结果。想要清晰地了解以ChatGPT为代表的新兴智能技术,完整地认识人工智能,我们可以先从其产业版图的发展和现状入手。
其实,人工智能的发展、传播和被接受是经过了一段漫长的寒冬的。十多年前,它还只是一个不被人看好的小众领域,但是现在,它却已经成了街头巷尾的热点谈资,几乎任何事情都可以和人工智能联系在一起。短短十多年间,世界发生了天翻地覆的变化,新数据不断涌现,各种问题层出不穷,直到现在,人工智能的春天才算是真的到来了,各个领域都亟需人工智能的帮助。这也是为什么人工智能的行业应用范围如此广阔,人工智能市场更是如一块等待开垦的处女地一般。如图1—1,这是一份人工智能的行业应用版图,不同的行业领域(零售、金融、医疗和教育等)与不同的职能方向(营销、风控和安全等)共同构成了一个人工智能应用矩阵,对于每个行业中的相关职能,人工智能都可以找到应用场景,例如在零售行业的供应链、营销、客服等方面以及金融行业的研发、营销、客服、风控等方面都已经有人工智能落地实践(图中蓝色表示)。但是,现在的人工智能只填充了广阔的行业领域中的一部分,还有更多没尝试和拓展的行业以及职能中的应用场景。
从产业的视角来看,人工智能包括基础层、技术层和应用层。其中,基础层是人工智能产业的基础,为人工智能提供数据及算力支撑;技术层是人工智能产业的核心,主要包括各类模型和算法的研发和升级;应用层则是人工智能面向特定场景需求而形成的软硬件产品或解决方案。那么,人工智能的产业规模发展至何种程度了呢?英国德勤(Deloitte)的报告中预测,世界的人工智能产业规模会从2017年的6900亿美元增长至2025年的64000亿美元,2017—2025年的复合增长率将达到32.10%,整体呈现出飞速攀升的趋势。另外,人工智能近几年成了各个行业在进行投资的热门选择。人工智能完全称得上是风头正劲,万人追捧,为经济带来了十分显著的增量。
在产业应用上,人工智能发展到今天,我们能看到其在各个行业都有用武之地:制造业、零售业、金融业、医疗卫生行业它在一定程度上改变了组织的运转方式,使其可以更快更好地解决遇到的问题,并压低各类成本。站在消费者的角度,人工智能的出现也为广大的用户群体带来了更多的选择。总的来说,人工智能可以看作一块已开始被打磨的原石,露出了它璀璨的一角,它在推动世界经济发展的同时,也将深层次地改变人类的生活。为了进一步了解AI产业版图,下面我们从两种不同的AI——决策式AI和生成式AI谈起。
决策式AI和生成式AI
人工智能可从不同的维度进行划分。如果按其模型来划分(人工智能是由模型支撑的)可以分为决策式AI和生成式AI。
决策式AI是学习数据中的条件概率分布,即一个样本归属于特定类别的概率,再对新的场景进行判断、分析和预测。决策式AI有几个主要的应用领域:人脸识别、推荐系统、风控系统、其他智能决策系统、机器人、自动驾驶。例如在人脸识别领域,决策式AI对实时获取的人脸图像进行特征信息提取,再与人脸库中的特征数据匹配,从而实现人脸识别。再例如,决策式AI可以通过学习电商平台上海量用户的消费行为数据,制订合适的推荐方案,尽可能提升平台交易量。
生成式AI则是学习数据中的联合概率分布,即数据中多个变量组成的向量的概率分布,对已有的数据进行总结归纳,并在此基础上,使用深度学习技术等,创作模仿式、缝合式的内容,相当于自动生成全新的内容。生成式AI可生成的内容形式十分多样,包括文本、图像、声音和视频等。例如,我们输入一段小说情节的简单描述,生成式AI便可以帮我们生成一篇完整的小说内容;再例如,生成式AI可以生成人物照片,而照片中的人物在现实世界中是完全不存在的。如图1—2,它展示的是国外一个网站生成的“不存在”的人的照片。
总的来说,不管是哪种类型的模型,它的基础逻辑是一致的:AI模型从本质上来说是一个函数,要想找到函数准确的表达式,只靠逻辑是难以推导的,这个函数其实是被训练出来的。我们通过喂给机器已有的数据,让机器从数据中寻找符合数据规律的函数。所以当有新的数据需要进行预测或生成时,机器就能够通过这个函数,预测或生成新数据所对应的结果。
|
|