|
編輯推薦: |
特征工程是数据科学和机器学习流水线上的重要一环,包括识别、清洗、构建和发掘数据的特征,为进一步解释数据并进行预测性分析做准备。 本书囊括了特征工程的全流程,从数据检查到可视化,再到转换和进一步处理等,并给出了大量数学工具,帮助读者掌握如何将数据处理、转换成适当的形式,以便送入计算机和机器学习流水线中进行处理。后半部分的特征工程实践用Python作为示例语言,循序渐进,通俗易懂。 - 识别和利用不同类型的特征 - 清洗数据中的特征,提升预测能力 - 为何、如何进行特征选择和模型误差分析 - 利用领域知识构建新特征 - 基于数学知识交付特征 - 使用机器学习算法构建特征 - 掌握特征工程与特征优化 - 在现实应用中利用特征工程
|
內容簡介: |
本书将带你了解特征工程的完整过程,使机器学习更加系统、高效。你会从理解数据开始学习,机器学习模型的成功正是取决于如何利用不同类型的特征,例如连续特征、分类特征等。你将了解何时纳入一项特征、何时忽略一项特征,以及其中的原因。你还会学习如何将问题陈述转换为有用的新特征,如何提供由商业需求和数学见解驱动的特征,以及如何在自己的机器上进行机器学习,从而自动学习数据中的特征。
|
關於作者: |
锡南厄兹代米尔(Sinan Ozdemir) 数据科学家、数学家、约翰霍普金斯大学讲师,Kylie.ai公司联合创始人、CTO,在应用数据挖掘、功能分析和算法开发做出基于数据和知识的决策方面拥有丰富的经验。 迪夫娅苏萨拉(Divya Susarla) 在利用数据方面经验丰富,在包括投资管理、社会企业咨询和红9营销的各个产业和领域里实现并应用过相应的策略。Kylie.ai公司产品经理,目前专注于自然语言处理和生成技术。
|
|