本书是一本面向数据分析初学者、进阶从业者及管理者的实用指南。本书通过系统化的学习路径和丰富的案例,全面介绍了DeepSeek这款AI工具在数据分析中的应用。书中从数据分析的基础概念入手,详细讲解了数据分析的目的、流程和常用工具,强调了数据分析在企业决策中的重要性。通过实际案例分析,展示了DeepSeek如何通过自
本书主要介绍数据科学中数据准备阶段常用的数据处理方法。全书内容分为五个部分:数据准备概览、数据清理、数据变换、数据归约和案例分析。本书注重方法的原理及其应用,在方法原理引介部分强调重要的统计学思想,在方法应用部分强化数据思维和数据处理规范。
本书以Python为基础,深入讲解HDFS分布式文件系统和PySpark3编程。全书共9章,内容包括Docker环境下Hadoop与Spark的配置、HDFS操作技巧、RDD编程方法、SparkSQL应用、Spark架构及运行机制、PandasonSpark使用及SparkML编程实践。本书通过实际操作案例,帮助读者掌
内容简介这是一本指导各类型组织科学构建数据体系,并通过对数据体系的管理和运营让数据实现价值转化的实战性著作,是作者在数字化领域近20年工作经验的总结。本书深度剖析了数字化时代数据体系建设的关键要素与实施路径,系统而全面地介绍了数据体系建设的方法论、框架与实战案例。从全面认识数据与数据要素的价值出发,逐步深入探讨了数据管
本书是校企合作的成果,以大数据平台运维岗位的实际工作为核心,采用任务驱动方式,全面介绍了Hadoop集群的安装、监控和优化等关键技能。内容涵盖了从集群搭建到节点维护、分布式文件存储操作、计算资源管理,再到集群调优和应用组件调优,以及应用组件的安装与检验等多个方面。本书遵循“实践为主、理论为辅、注重实用性”的教育理念,在
本书从学生的认知规律出发,“由简单到复杂、由单一到综合”循序渐进地编排项目,第一部分为智能控制系统方案设计;第二部分为单机智能控制系统开发,共设有SEEElectrical软件应用、MCGS应用、变频器应用、步进电动机及伺服电动机应用等6个学习型项目;第三部分为联网智能控制系统设计,共设有智能饲喂控制系统安装与调试等6
本书系统地介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。全书共13章,内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink
本书是基于SparkML和Scala语言编写的机器学习实战书籍。基于目前新版本的Spark框架展开,首先是机器学习准备部分,分别介绍了Spark与大数据技术的基础知识、Spark环境的安装与配置、Scala编程基础、Spark数据结构基础。然后是机器学习核心部分,分别介绍了机器学习基础、线性回归、分类算法及应用、数据降
本书共10章,第1-3章详细说明CyberChef工具使用方法,从搭建CyberChef的使用环境开始,逐步深入介绍编码和解码、数据处理模块的相关内容。第4-10章将介绍使用CyberChef工具实战分析恶意样本的案例,包括批处理BAT、PowerShell、CobaltStrike、VBS、ShellCode、Jav
本书聚焦于模因计算,将其视为下一代搜索和优化设备的黄金标准,为读者提供过去四十年间模因计算不同发展阶段的客观评价。本书分为两部分。第一部分包括第二、三章,给出模因算法的整体概况,以人们最认可的形式,也就是将进化算法与一种或多种搜索机制相结构,形成的混合优化算法。第二部分包括第四至六章,着重关注最新视角和理论进展,其目标