新書推薦:
《
大国脊梁:漫画版
》
售價:NT$
374.0
《
跟着渤海小吏读历史:大唐气象(全三册)
》
售價:NT$
989.0
《
心智的构建:大脑如何创造我们的精神世界
》
售價:NT$
352.0
《
美国小史(揭秘“美国何以成为美国”,理解美国的经典入门读物)
》
售價:NT$
352.0
《
中国古代北方民族史丛书——东胡史
》
售價:NT$
576.0
《
巨人传(插图珍藏本)
》
售價:NT$
3289.0
《
地下(村上春树沙林毒气事件的长篇纪实)
》
售價:NT$
332.0
《
偿还:债务与财富的阴暗面
》
售價:NT$
347.0
|
內容簡介: |
《基于深度学习的社会信息挖掘应用实例分析》综合了大量国内外的**资料和作者的研究成果,以应用实践中的若干问题为研究对象,探索了基于深度神经网络的分析和建模过程,列举了深度神经网络在若干社会信息挖掘的应用;以**资料案例为例进行社会信息分析和模型构建,给出了实践指导策略;给出了不同机器学习方法的特点与适用场景,并以实际应用场景为例,分析了深度学习的应用。
|
目錄:
|
目录
前言
第1章 绪论 1
1.1 人工智能 1
1.2 机器学习 6
1.3 深度学习 10
第2章 神经网络 14
2.1 神经元 14
2.2 损失函数 15
2.3 激活函数 16
2.4 参数学习 19
2.5 梯度下降法 20
2.6 全连接神经网络 24
2.7 BP神经网络 25
2.8 优化方案 28
2.9 注意力机制 31
2.10 本章小结 32
第3章 深度神经网络 33
3.1 卷积神经网络 33
3.2 简单循环神经网络 34
3.3 深层循环神经网络 36
3.4 本章小结 37
第4章 基于启发知识的学习方法 38
4.1 兄弟学习 38
4.2 顿悟学习 40
4.3 本章小结 43
第5章 极限学习机 44
5.1 引言 44
5.2 *小二乘拟和及Moore-Penrose广义逆 45
5.3 标准SLFN数学模型 48
5.4 ELM学习算法 50
5.5 ELM的特征映射和特征空间 53
5.6 ELM、RVFL及其一般化结构 56
5.7 ELM的理论基础 58
5.8 本章小结 61
第6章 基于深度学习的网站智能信息挖掘 62
6.1 引言 62
6.2 网站信息的计算机自动获取 63
6.3 基于深度学习的网站相似度研究 64
6.4 网站内容丰富度研究 67
6.5 面向任务的兴趣推送 69
6.6 本章小结 71
第7章 基于卷积神经网络的甲骨文异体字识别 72
7.1 引言 72
7.2 相关研究 74
7.3 符号定义及概念 76
7.4 甲骨文异体字识别方法 76
7.5 实验及分析 85
7.6 总结与展望 92
第8章 基于LSTM 的小说情节高潮识别 94
8.1 引言 94
8.2 相关概念 96
8.3 情节高潮识别方法 100
8.4 算法实现 102
8.5 实验及分析 104
8.6 总结与展望 110
第9章 大规模复杂异质图动态的构建 111
9.1 引言 111
9.2 大规模复杂异质图举例 112
9.3 国内外现状及发展动态 115
9.4 大规模复杂异质图学习的研究内容 121
9.5 本章小结 123
第10章 基于深度学习的大规模复杂异质图动态分析 124
10.1 复杂异质动态图数据的采集与存储管理 124
10.2 复杂异质动态图的构建与表示 125
10.3 动态图的演变模式分析 127
10.4 大规模复杂异质图动态变化的优化 129
10.5 大规模复杂异质图学习的实现 130
10.6 大规模复杂异质图学习算法 135
10.7 本章小结 140
参考文献 141免费在线读第1章 绪论
1.1 人工智能
1. 什么是人工智能
人工智能已存在几十年,为何*近如此火热?事实上,人工智能artificial intelligence,AI在1956年就被首次提出了,其主要目的为“用计算机模拟人的智能”。人工智能共经历了三次浪潮。20世纪50~60年代,伴随着通用电子计算机的诞生,人工智能在大学实验室崭露头角。1956年的达特茅斯会议标志着人工智能的诞生。以艾伦麦席森图灵Alan Mathison Turing提出图灵测试为标志,数学证明系统、知识推理系统、专家系统等里程碑式的技术和应用掀起了**波人工智能热潮。但由于计算机运算速度的限制和程序设计算法的局限,这股热潮渐退。
图灵是英国数学家、逻辑学家,被称为计算机科学之父、人工智能之父。图灵测试和图灵完备性是人工智能的重要概念。图灵测试是一个思想模型,它指测试者人与被测试者一个人和一台计算机被一个不泄露测试内容以外信息的实体如房间隔离开的条件下,通过一些无智能的装置如键盘向被测试者随意提问图1-1。进行多次测试后,如果有超过30%的答案,人类测试者不能确定出被测试者是人还是计算机,那么这台计算机就通过了测试,并被认为具有人类的智能。在可计算性理论里,如果一系列操作数据的规则如指令集、编程语言、细胞自动机可以用来模拟单带图灵机,那么它是图灵完备的。一个有图灵完备指令集的设备被定义为计算机,一台计算机也是一个图灵机。一个语言是图灵完备的,意味着该语言的计算能力与一个图灵机相同,一个图灵完备的语言意味着该语言可以借助计算机完成任何计算机可以完成的任务,即完全利用计算机的所有能力。
20世纪80~90年代,基于统计模型的技术逐渐取代传统的符号主义学派,并在语音识别、机器翻译等领域有所建树。此外,人工神经网络在模式识别等应用领域有不俗的进展,再加上1997年IBM“深蓝”计算机打败国际象棋棋王卡斯帕罗夫使得人工智能走进大众视野。但是,当时的人工智能技术还不够成熟,且计算耗时太长,人工智能再次陷入低潮。
2006年,Geoffrey Hinton和他的学生R. R. Salakhutdinov在《科学》杂志上发表题为“Reducing the dimensionality of data with neural networks”的文章,掀起了深度学习在学术界和工业界的研究热潮,这次以深度学习为代表的人工智能在多个相关领域达到了社会上大多数人所认可的性能或效率,因此被成熟的商业模式接受,开始在产业界发挥出真正的价值。
2012年,在“21世纪计算大会”上,微软首席研究官Rick Rashid借助自动同声传译系统实时将英文翻译成与其音色相近的中文演讲,自动同声传译系统主要是语音识别、机器翻译和语音合成。
2014年,日本软银集团发布了一款名为“胡椒”的机器人。能对周围环境综合考虑,并积极地做出反应。并且能利用表情和声调识别技术,与人类进行交流,善于理解人类情感,其上市时引起极大轰动。
不得不说另外一个更具有跨时代意义的案例是Google旗下DeepMind公司研发的人工智能围棋——阿尔法围棋AlphaGo,亦称阿尔法狗。AlphaGo以人工智能技术为程序基础,构建了多层人工神经网络,通过大量输入对神经网络模型进行训练,并在较短的时间内完成大量学习。2015年,AlphaGo在人机大战中凭借其强大的计算能力战胜了世界**围棋选手,以5:0的总比分击败了欧洲围棋冠军樊麾。2016年3月,又以4:1压倒性的总分战胜了世界**围棋冠军、职业九段旗手李世石,震惊世界。
2. 人工智能主要应用领域
人工智能是一门自然科学和社会科学交叉的学科,其研究涉及数学、神经生理学、哲学、认知科学、计算机科学等。人工智能就其本质来说就是对人类思维信息过程的模拟。目前,人工智能的研究更多的是结合具体的实际应用领域来进行的,这里主要介绍几种常用的研究应用领域。
1自然语言理解
自然语言理解是一门计算机科学、语言学、心理学交叉的学科。自然语言是人类信息交流的重要媒介。由于语言学能描述我们内心的思想,同时人类具有很强的理解自然语言的能力,因此,人们互相间的信息交流轻松自如。虽然自然语言处理只是人工智能的一部分人工智能研究还包括计算机视觉等,但它也是非常独特的一部分。地球上很多生物都拥有超过人类的视觉、听觉、嗅觉等各种系统,然而只有人类才拥有这么高级的语言。
自然语言处理的目标是让计算机处理和“理解”自然语言,以完成各种指令和任务。但是,目前计算机系统和人类的交流几乎还只能使用十分严格限制的非自然语言。完全理解和完全表达语言是极其困难的,因此研究自然语言理解是一个非常重要的人工智能领域的课题。
2计算机视觉
计算机视觉computer vision又称为机器视觉machine vision,是一门“教”计算机如何“看”世界的学科。计算机视觉实际上是一个跨领域的交叉学科,包括计算机科学、数学、工程学、物理学、生物学和心理学等。许多科学家认为,计算机视觉为人工智能的发展开拓了道路。计算机视觉是对图像中客观对象构建明确而有意义的描述,从一个或多个数字图像中计算三维世界的特性,基于感知图像做出对客观对象和场景合理的决策。
计算机视觉的目标是使计算机具备人类的视觉能力,并且希望超过人类的识别能力,看懂图像内容,理解动态场景,同时能自动提取图像、视频等视觉中蕴含的层次化语义概念,以及其时空的关联等。目前,计算机视觉已经进入了一个新的阶段,是人工智能研究领域的一个热点。
3机器人学
机器人学也是人工智能的一个重要研究领域。随着工业自动化和计算机技术的快速发展,机器人已经大量生产并且进入了实际应用的阶段,生活中会有越来越多的机器人和智能化设备出现。机器人作为集机械、电子、控制、计算机、传感器、人工智能等多学科先进技术于一体的现代制造业重要的自动化装备,已经对我们的生产、生活产生了变革性的影响。这一课题的研究有利于促进各个学科的相互结合和渗透,大大地推动人工智能领域的发展。
我们的生活正朝着智能化的方向不断发展,机器的智能化给人们的生活带来了极大的便利,机器人也不可避免地向着智能化发展,智能机器人将是大势所趋。机器人学的研究推动了许多人工智能思想的发展,有一些技术可在人工智能研究中用来建立世界状态的模型和描述世界状态变化的过程。在大数据时代下,智能机器人将成为继智能手机之后又一个行业的独角兽产业,并将带动其他相关链条产业的快速爆发。
4大数据技术
“大数据”是一个题量特别大、数据特别大的数据集。大数据技术包括数据收集、数据存取、基础架构、数据处理、统计分析、数据挖掘、模型预测、结果呈现。大数据科学家约翰劳萨John Rauser对大数据进行了简单的定义:大数据就是任何超越了一台计算机处理能力的庞大数据量。大数据无处不在,应用于包括金融、汽车、餐饮、电信、能源、体育和娱乐等在内的社会各行各业。
作为人工智能技术的核心,大数据技术收集、处理与分析海量数据,探索数据中存在的潜在规律,并利用该规律进行有效预测,从而实现智能化的要求。在大数据技术的支持下,人工智能在丰富人们生活的同时,将人们从繁重的工作中解放出来,降低了工作、学习压力,提高了工作和学习效率。然而,在人工智能与大数据技术的融合过程中,应注意防范相关安全风险,从而更好地推动人类社会的发展。
5语音识别
语音识别是一项古老的研究课题,很早之前IBM就花费了大量的资源研究语音识别系统。目前世界上*成功的语音识别技术就是使用深度学习的端到端框架,并且在较为理想的环境下无强噪声、标准语言等达到近乎人类语音识别能力的水准。语言识别技术已经深入我们的生活,比如手机中自带的智能助手、各种输入法的语音输入、聊天软件中的语音转文字等都是语言识别技术的具体应用。
6文本表示
文本表示*经典的应用是Word2Vector。2003年,Bengio构建神经网络语言模型,被推崇为深度学习应用在NLP方向的开山之作。2013年,Google Mikolov基于此模型提出Word2Vector。不同于one-hot编码,Word2Vector使用分布式也称嵌入式的向量编码模式,迭代训练将文本的内容转化成稠密低维的实数向量形式。此外,文本向量之间的相似性也可由欧氏距离或者余弦相似度来计算,因此体现了单词之间潜在的语义关联关系,极大提高了向量语义表示上的准确度,并且维度灾难难题也迎刃而解。
7机器翻译
机器翻译也是一个长期处于研究热点的领域。使用机器替代人工进行翻译,可以极大程度地降低不同文明之间的文化和知识交流的难度。机器翻译技术在深度学习时代是进展*为迅速的几个领域之一。机器翻译存在着大量的高质量的平行语料库,这正是深度学习技术所需要的。机器翻译技术和语言识别从技术层面来说,都是编码解码的过程,机器通过读源语言编码,对源语言进行理解后,通过中间编码解码得到目标语言,这也是端到端的深度学习框架的核心原理。Google翻译引擎也是基于端到端深度学习框架,并且在其github官方账号上开源了该模型的代码和结构。此外,RNNrecurrent neural network模型和LSTMlong short-term memory模型等神经网络模型擅长处理大量的序列数据,目前也已经广泛用于文本分类任务中。
3. 人工智能的分类
在1956年首次提出人工智能后,人工智能就得到了迅速发展,解决了科学界很多的问题。这让当时的科学家以为,以当前的人工智能发展的节奏,计算机能在20年左右就可以达到正常人类的水平。但是,半个多世纪以后的今天,我们还处于弱人工智能阶段。
在本书中,我们根据人工智能的适用性暂时将其粗略地分为三个大类,分别为弱人工智能、强人工智能及超人工智能。当然,学术界对这样定义和分类有不同观点,本书这么做只是为了方便叙述。
1弱人工智能artificial narrow intelligence,ANI
弱人工智能是三个人工智能级别中*低级,却是应用*多的一个大类。弱人工智能只专注于某个特定的任务,例如,语音识别、图像翻译等,是擅长于单个方面的人工智能。这些机器只是看起来像智能,但是并不拥有智能,也不会有自主意识。因为比较“弱”,很多人没有意识到它们就是人工智能,如邮箱的自动拦截广告程序。但是弱人工智能在某个领域中超常能力令人叹为观止,例如,著名的人工智能产品AlphaGo,是一个战胜了世界围棋冠军的机器人。有人就有疑问,机器人AlphaGo如此智能,怎么就弱呢?实际上,AlphaGo只专注于围棋,在围棋领域中暂无对手,但是如果让AlphaGo去翻译文章或者去识别动物类别,AlphaGo就会不知所措。因此,现在我们实现的基本都是弱人工智能。
2强人工智能artificial general intelligence,AGI
强人工智能是人类级别的人工智能,在各个方面的能力都可以跟人类比肩,这就是所说的类人脑智能。人类能干的事情,强人工智能都可以胜任。强人工智能能进行思考,能够快速学习,拥有计划,具有像人类一样独立思考的能力。但是这样的强人工智能,目前人类还无法实现。
目前常常说到的狭义人工智能基本在一部分弱人工智能和强人工智能这个范畴,但它更强调能完成自学习这个功能,而广义人工智能主要处于弱人工智能范畴。
3超人工智能artificial super intelligence,ASI
超人工智能,顾名思义,就是几乎在所有的领域都比人类更智能、更创新、更领先。超人工智能阶段,其计
|
|