新書推薦:
《
我从何来:自我的心理学探问
》
售價:NT$
545.0
《
失败:1891—1900 清王朝的变革、战争与排外
》
售價:NT$
390.0
《
万千心理·我的精神分析之道:复杂的俄狄浦斯及其他议题
》
售價:NT$
475.0
《
荷马:伊利亚特(英文)-西方人文经典影印21
》
售價:NT$
490.0
《
我的心理医生是只猫
》
售價:NT$
225.0
《
股权控制战略:如何实现公司控制和有效激励(第2版)
》
售價:NT$
449.0
《
成吉思汗传:看历代帝王将相谋略 修炼安身成事之根本
》
售價:NT$
280.0
《
爱丁堡古罗马史-罗马城的起源和共和国的崛起
》
售價:NT$
349.0
|
內容簡介: |
本书为新文科教育指导思想下的金融科技编程教材,通过示例讲解Python编程在审计行业的具体应用。作者基于20多年的大学计算机教学经历与行业大数据人工智能软件开发经验,从基本的概念开始,逐步深入地介绍清洗表格数据、采集网络信息、手写票据的光学字符识别、财经文本的量化、知识图谱自动构建等热门知识要点,并通过实例给出算法原理与实现路径,同时详细介绍了代码生成的过程和结果,有助于读者真正掌握大数据审计中的Python编程思想与技术,并将其应用于自己的生产实践中。本书可作为高等院校审计、财经和金融科技等专业相关课程的教材,也可作为财经和金融科技等方面从业人员的培训用书和参考书。
|
目錄:
|
第1章 审计基础与审计报告的构成1 1.1 审计概述1 1.1.1 审计概念1 1.1.2 审计目的1 1.1.3 审计风险2 1.1.4 审计证据2 1.2 会计概述2 1.2.1 会计的概念及基本假设3 1.2.2 会计信息质量要求4 1.2.3 财务会计报告简述4 1.2.4 会计科目简述5 1.3 审计报告的构成8 1.3.1 审计意见8 1.3.2 形成审计意见的基础9 1.3.3 关键审计事项10 1.3.4 其他信息10 1.3.5 管理层和治理层对财务报表的责任11 1.3.6 注册会计师对财务报表审计的责任11 1.4 智能审计国内外研究现状12 1.4.1 国外研究现状12 1.4.2 国内研究现状12 1.5 如何构建人工智能审计规则13 1.5.1 基于法律法规构建规则库14 1.5.2 基于专家经验构建规则库14 参考文献15 第2章 Python语法基础17 2.1 Python开发环境安装17 2.1.1 Anaconda的安装17 2.1.2 PyCharm的安装配置17 2.2 数据类型19 2.2.1 数字19 2.2.2 字符串19 2.2.3 列表与元组20 2.2.4 字典与集合22 2.3 语句语法24 2.3.1 变量、行、缩进与注释24 2.3.2 运算符25 2.3.3 布尔值和空值26 2.3.4 if条件语句27 2.3.5 for循环语句27 2.3.6 while循环语句28 2.3.7 break与continue29 2.4 函数与库29 2.4.1 函数的定义与调用29 2.4.2 函数的返回值与作用域30 2.4.3 常用基本函数介绍31 2.4.4 库32 2.5 文件的读与写33 2.5.1 input()函数与print()函数33 2.5.2 文件的写操作34 2.5.3 文件的读操作35 2.6 类36 2.6.1 类和对象的基本概念36 2.6.2 面向对象的特征36 2.6.3 type和isinstance37 2.7 读写数据库MySQL38 2.7.1 MySQL的安装配置38 2.7.2 Python与MySQL的交互39 参考文献41 第3章 Python科学计算与表格处理42 3.1 Python科学计算42 3.1.1 Pandas库42 3.1.2 NumPy库44 3.1.3 Pipeline44 3.2 表格处理45 3.2.1 读取表格文件45 3.2.2 表格数据的合并与拼接51 3.2.3 输出到表格文件53 第4章 数据预处理:清洗表格数据55 4.1 数据背景55 4.2 数据清洗55 4.2.1 内容替换55 4.2.2 数据类型转换58 4.2.3 删除无效数据61 4.2.4 数据创造64 4.2.5 DataFrame转换68 第5章 数据预处理:采集网络信息70 5.1 爬虫基础知识70 5.1.1 网页源代码70 5.1.2 正则表达式72 5.2 爬虫基础方式74 5.2.1 提取搜狗资讯标题、网址、日期和来源74 5.2.2 获取百度翻译结果75 5.2.3 Selenium库详解77 5.2.4 BeautifulSoup库详解80 5.3 爬虫处理方法88 5.3.1 处理数据乱码88 5.3.2 数据清洗与筛选88 5.3.3 生成数据文本文件91 5.3.4 批量爬取多家公司多页资讯91 5.3.5 基础爬虫实践92 5.3.6 Python与MySQL的交互实践93 参考文献95 第6章 数据预处理:解析财经报告96 6.1 批量下载PDF文件至指定位置96 6.2 解析单个PDF文件信息98 6.2.1 解析PDF文件的文本内容98 6.2.2 解析PDF文件的表格内容99 6.3 批量提取PDF文件信息100 6.3.1 批量输出PDF文件的文本内容100 6.3.2 筛选并转移PDF文件101 参考文献103 第7章 数据预处理:手写票据的光学字符识别104 7.1 问题场景104 7.2 表格和单元格定位108 7.2.1 解析PDF文件108 7.2.2 表格定位110 7.2.3 表格自动旋转112 7.2.4 单元格定位115 7.3 单元格配准117 7.3.1 DBSCAN聚类118 7.3.2 描述性统计120 7.3.3 模板可视化121 7.4 单元格内容识别122 7.4.1 图片预处理123 7.4.2 LSTM-RNN-CTC模型124 第8章 自然语言处理:财经文本的量化127 8.1 自然语言处理127 8.1.1 自然语言处理概述127 8.1.2 机器学习127 8.1.3 语料库128 8.1.4 HanLP环境搭建128 8.2 中文分词129 8.2.1 中文分词129 8.2.2 词典分词130 8.2.3 二元语法分词131 8.2.4 词典的构建132 8.3 命名实体识别135 8.3.1 命名实体识别135 8.3.2 基于规则的命名实体识别135 8.3.3 基于预训练模型的实体关系抽取136 8.3.4 基于依存句法分析的实体关系抽取136 8.3.5 财经文本命名实体识别137 8.4 信息提取138 8.4.1 关键词提取138 8.4.2 关键句提取139 8.4.3 情感分析140 8.5 综合训练141 参考文献142 第9章 自然语言处理:金融文本摘要143 9.1 文本摘要自动生成概述143 9.1.1 研究背景与问题定义143 9.1.2 技术分类与实现方法143 9.1.3 评价指标与数据集144 9.2 偏好构建模块145 9.2.1 获取偏好文本145 9.2.2 文本预处理145 9.2.3 LDA主题模型147 9.2.4 构建偏好语料库148 9.3 锁定段落中心句149 9.3.1 获取偏好文本关键词149 9.3.2 相似度计算150 9.3.3 提取携带偏好的段落中心句151 9.4 摘要生成模块154 9.4.1 依存句法分析154 9.4.2 结构树剪枝157 参考文献159 第10章 自然语言处理:抽取实体关系161 10.1 知识抽取任务概述161 10.1.1 知识抽取任务定义161 10.1.2 知识抽取任务分类162 10.1.3 审计领域知识抽取任务162 10.2 面向结构化数据的知识抽取163 10.3 面向非结构化数据的知识抽取164 10.3.1 深度学习与神经网络164 10.3.2 基于BERT模型的实体抽取方法165 10.3.3 关系抽取方法179 10.3.4 实体消歧186 10.3.5 实体关系抽取结果保存186 参考文献189 第11章 审计知识图谱自动构建190 11.1 知识图谱190 11.1.1 Neo4j介绍191 11.1.2 Neo4j安装教程192 11.1.3 Neo4j启动与服务器连接194 11.2 Python操作Neo4j196 11.2.1 安装py2neo包196 11.2.2 py2neo的基本用法197 11.2.3 简单图数据库编程实践分析203 11.3 审计知识图谱的实现205 11.3.1 案例分析1——读取MySQL内容创建知识图谱206 11.3.2 案例分析2——读取Excel文件数据创建审计知识图谱209 11.3.3 案例分析3-读取结构化财经文本创建审计知识图谱214 11.3.4 案例分析4-多表信息创建知识图谱219 11.3.5 案例分析5-根据原始文本自动生成知识图谱231 参考文献233 第12章 审计应用:审计规则知识库234 12.1 用一阶谓词逻辑表示法表示知识234 12.1.1 谓词逻辑概述及其特点234 12.1.2 谓词、个体和量词235 12.1.3 联结词236 12.1.4 谓词公式定义及一阶谓词逻辑表示法的特点236 12.1.5 谓词公式表示知识的步骤及方法236 12.2 审计规则知识库的设计237 12.2.1 审计规则表238 12.2.2 新审计规则表238 12.2.3 谓词逻辑表238 12.3 程序示例239 12.3.1 程序整体流程239 12.3.2 制定规则的谓词逻辑表达式239 12.3.3 设计数据表240 12.3.4 连接数据库241 12.3.5 更新替换数据表242 12.3.6 查询数据库中的数据表243 12.3.7 判断数据表中的数据是否为正确规则243 12.3.8 更新、清洗、合并数据表中的审计规则245 12.3.9 完整代码246 参考文献252 第13章 实践:综合风险审计253 13.1 审计语义网络构建253 13.1.1 审计实体定义253 13.1.2 审计关系定义254 13.2 传统审计中的逻辑推理256 13.3 审计推理机256 13.4 审计风险路径探索实战259 参考文献268 第14章 实践:审计报告自动生成270 14.1 python-docx的基础知识270 14.1.1 python-docx的下载与使用270 14.1.2 python-docx的基础操作270 14.2 审计报告中字体的设置273 14.2.1 设置中文字体273 14.2.2 设置字号与字体颜色274 14.2.3 段落中新增文字274 14.3 审计报告中段落的修改275 14.3.1 对齐方式275 14.3.2 缩进方式275 14.3.3 行距与段落间距275 14.3.4 编号与项目符号276 14.4 自动生成审计报告的实战演练276 参考文献279
|
|