新書推薦:
《
可转债——新手理财的极简工具
》
售價:NT$
296.0
《
新加坡教育:神话与现实
》
售價:NT$
439.0
《
“口袋中的世界史”第一辑·冷战中的危机事件
》
售價:NT$
1326.0
《
绝美的奥伦堡蕾丝披肩编织
》
售價:NT$
806.0
《
狂飙年代:18世纪俄国的新文化和旧文化(第二卷)
》
售價:NT$
806.0
《
万有引力书系 纳粹亿万富翁 德国财富家族的黑暗历史
》
售價:NT$
500.0
《
中国常见植物野外识别手册:青海册
》
售價:NT$
347.0
《
三星堆对话古遗址(从三星堆出发,横跨黄河流域,长江流域,对话11处古遗址,探源多元一体的中华文明)
》
售價:NT$
398.0
|
內容簡介: |
本书主要介绍了什么是Python,Python的主要特点和优势,在此前提下,介绍了该技术的主要应用场景,并对一些不适合使用该技术的情况进行了分析。本书结构清晰、严密,理论方面涉及了数据素养的基本概念、模型,国内外数据素养教育的现状分析,以及数据素养中不可忽略的各种算法介绍。
|
關於作者: |
范美英,北京信息职业技术学院副教授,软件与信息学院骨干教师,北京市高等学校青年英才,高级教师创新团队成员。主要研究领域为Web前端开发技术、移动应用开发技术、软件开发技术、软件UI设计等。曾主持有关部门职业教育计算机应用技术专业教学资源库 “Android移动应用开发” 课程子库建设,荣获优秀项目奖。近年来,在各级教师教学能力大赛中屡获奖项。
|
目錄:
|
第1章数据素养概述1
11数1
12数据8
13数据的价值16
14数据的演变与进化19
15什么是数据素养(Data Literacy)25
16本章小结32
第2章国内外DL教育的现状分析33
21现阶段高校数据素养的涉及领域33
22我国数据素养教育现存问题49
23国外数据素养教育现状72
24本章小结90
第3章迈向DL的第一步:走近Python91
31什么是Python91
32何时用Python97
33何时不该用Python102
34如何用Python103
35Python中的重要概念112
36本章小结125
第4章实践Python与DL的千丝万缕关系127
41在文件中存取数据127
42用Beautiful Soup从网页中读取数据136
43Pandas:分析数据的利剑150
44NumPy & Matplotlib:可视化数据的“宝刀”173
45本章小结198
第5章DL行而不辍,DT未来可期199
51不可不谈的理论199
52不可不知的探索分析方法207
53不可不会的智能计算211
54不可不察的智能计算214
55本章小结226
参考文献227
附录1Python中字符串的常用方法231
附录2Python中列表对象的常用方法235
附录3Python中字典对象的常用方法239
附录4Python 3中的内建函数241
附录5Python 3中有关文件处理的常用方法246
附录6xlrd和xlwt库文件中的常用函数250
附录7正则表达式中的普通字符252
附录8正则表达式中的元字符254
附录9正则表达式中的常用函数258
附录10Series数据对象的常用函数261
附录11DataFrame数据对象的常用函数263
附录12ndarray对象的常用属性268
|
內容試閱:
|
“小爱同学!”“我在。”“今天天气怎么样啊?”“今天气温……”若干年以前,很难想象,一位毕生都与黄土打交道的67岁老人,在早上起床后会第一时间与一个“盒子”有这样的一段对话。然而,在21世纪20年代的当下,类似的事情屡见不鲜。
以5G ABC为代表的“智慧未来”已悄然到来。其中,5G并不仅仅指带宽的增加,其更是互联网基础建设完善化的代名词,它也是未来超级信息化社会基建工程的标的物;ABC则分别指代人工智能(AI)、大数据(Big Data)和云计算(Cloud Computing)。
如果说ABC是个组织结构,那么组成这个庞大、高效“巨无霸”的基元就是数据。在这个时代,数据不仅是资源,更是资产,身居这个时代的人们,要学着去组织和管理这些无形的独立实体。世界经济论坛报告曾经预测,未来的大数据将成为新的财富高地,其价值可能堪比石油,而“大数据之父”维克托也乐观地表示,把数据列入企业资产负债表只是时间问题。企业已经意识到要实现数字化转型,那么个人如何才能在这个风口展翅翱翔?毫无疑问,提升个人的数据素养是唯一的途径。只有如此,人们才能坦然面对ABC给我们带来的一切好与不好,才能找到自己在未来中的角色和位置。
本书是陆红教授主持的北京市教育委员会科技计划立项课题“基于机器学习方法的房价大数据分析模型构建研究”的研究成果之一,主要由“数据素养概述”“国内外DL教育的现状分析”“迈向DL的第一步:走近Python”“实践Python与DL的千丝万缕关系”“DL行而不辍,DT未来可期”五部分组成。
第1章主要介绍了数据素养相关的概念,包含数、数据、大数据以及数据素养。在每个概念的阐述中引用了大量前人的研究成果和网络上提供的史料图片,再现了各个概念出现的背景和发展历程。除此之外,还运用了多个官方网站的数据资源,对数据的类别以及数据与信息、知识、智慧之间的关系进行了诠释。最后通过分析、概括、总结本书对数据素养内涵的定义,建立了数据素养内涵模型。
第2章主要分析了国内现阶段高校数据素养涉及的领域,分析了我国数据素养教育现存的问题。通过对比国外数据素养教育现状,如美国、欧盟、日本等国家和地区在数据素养教育过程中国家战略实施的过程,总结得出了在我国实施数据素养教育需要共建数据素养教育生态圈,只有在以个人需求为导向、以学校教育为基础、社会实践相融合、政策有力支持保障的情况下才能将数据素养教育推向新层次的结论。
第3章主要介绍了什么是计算机程序设计语言,什么是Python,Python的主要特点和优势。在此前提下,介绍了Python的主要使用场景,并对一些不适合使用Python的情况进行了简略分析;详细介绍了在Windows操作系统中如何配置Python开发环境,并以“你好,Python”为例说明了如何创建Python项目和程序,以及如何运行Python程序和查看程序运行结果;系统阐述了Python中变量、对象、基本数据类型、组合对象、自定义函数、流程控制、异常及异常处理、注释等重要内容。
第4章主要介绍了如何运用Python及其常见的工具库实现数据存取、数据清洗和数据可视化,进一步体现了Python在提升数据素养中的重要价值。其中,数据存取部分根据数据存取位置,分别对各类方法做了详细介绍;在数据清洗中对如何使用正则表达式、如何处理数据缺失值、如何使用Beautiful Soup做了详细说明。在这两个前提下,分别介绍了Pandas和NumPy & Matplotlib等在数据分析和可视化中的应用方式。
第5章主要介绍了在大数据时代研究数据素养所必须知道的数学理论,包括统计学、信息论和混沌理论等。在此前提下,介绍了探索性数据分析的工作方式,包括异常值分析、对比分析和回归分析等;详细介绍了在大数据领域常用的智能算法,比如降维算法、遗传算法、RBM算法和AdaBoost元算法等;系统阐述了模式识别、机器学习和深度学习等方面的应用场景和常用的算法;提出在大数据时代,运用数据素养相关方法搞清“问题是什么”是第一步,分辨“问题在哪里”是第二步,衡量“问题的大小或数量多少”是第三步,找到“问题如何解决”才是终极目标。
本书结构清晰、简约、严密,理论方面涉及数据素养方面的基本概念、模型(第1章),国内外数据素养教育的现状(第2章),以及数据素养中不可忽略的各种算法(第5章)等;实践方面则详细介绍了使用Python完成数据读取、数据处理、数据分析和数据可视化等的具体方法和步骤(第3章和第4章)。有志于在数据素养方面有所研究和突破的读者,通过阅读本书,不仅可以学习数据素养的相关理论,还可以完成一些有利于提升数据素养的实践项目。
本书在撰写过程中,得到了陆红、刘瑞新等同人的帮助,书中的部分插图由李子豪绘制,在此特别感谢。另外,如果没有家人的支持,没有父亲、母亲无微不至的关心,也许本书还需要更长时间才能与读者见面,在此一并感谢。
由于Python及其插件不断升级,加之数据素养涉及的领域比较广泛,也许书中处理某些问题的途径有更优的替代方案,这都有待于日后不断深入研究,真诚希望读者能够提出宝贵的建议。
作者
2021年2月(除夕)
|
|