►最好玩、最棒的Python入门书◄
透过50个趣味游戏,发挥Python无限创意!
◆ Amazon儿童程式设计类销售第一名
◆ Amazon读者与Goodreads书评网站4.5颗星好评推荐
◆ 戴志洋(资深黑客、PTT水球发明人),专序推荐
◆ 胡崇伟(台湾Python年会前任总召),专业审订
◆ 吴郁芬、洪旭亮、赖以威、赖岳林、魏玮志(泽爸)、苏文钰,好玩推荐
人人Coding的时代已经来临,「自学程式」浪潮袭来,而学习Python是步入程式设计领域的绝佳途径,也是人工智慧(AI)时代必学的基础工具!
学习写程式就像运动或演奏乐器,没有什么特别的──你只需要付诸行动!但是,关于Python语言的学习书籍大多乏味无趣,读起来像传统教科书没什么两样,无法引起太大的学习兴趣。透过本书,将确保你的学习过程轻松且富趣味。
★ 好玩有趣的Python语言入门书 本书旨在让你以好玩又简单的方式,从程式码的基础架构开始,无负担地学习全球当今最热门的Python语言,并打造出50个属于你的创意游戏!在编写本书50种游戏的同时,你将学习到程式设计技能,有效强化逻辑思考力与创意思维。
完全没有程式设计基础的读者也可以!作者以直白、幽默的叙述;清楚、简单的指示,引领你认识程式设计的基础概念,随着基础逐渐累积,再带入Python语言的特色和功能,学习必备的基础函数、编写程式区块及使用海龟绘图创作出各种游戏程式。
★ 培养108年新课纲资讯科技的「运算思维」能力 全体高中生最新必修「程式设计」,此举主要是着眼于培养学生利用运算思维与资讯科技解决问题之能力。
透由本书,你将学会Python语言必备的基础函数与模组,并利用习得的知识设计出指定的游戏。在过程中,以程式码推理、解决问题,将强化「运算思维」能力,培养新课纲必备的逻辑思考、系统化思考等运算思维,并激发学生深入探索科技知识、增进对科技之兴趣,发展未来生涯所需之科技专业知能。
★ 本书能够带来什么帮助? ◎ 学习最基本也最重要的程式设计基础概念。
◎ 透过有趣的范例学习Python语言的基础函数和模组。
◎ 实作练习难度分为基础与进阶,鼓励你多方尝试与挑战。
◎ 建立50种可以实际与朋友玩的游戏。
◎ 培养108年新课纲资讯科技课程的运算思维素养。
本书特色 【特色1】游戏式学习Game-based Learning 借由投入50个创新的游戏专题,熟悉程式设计观念与技巧。
【特色2】创意专题Creative Projects 借由独创性的游戏专题,培养逻辑思考力与创意思维。
【特色3】轻易上手的指示Easy-to-follow Guidance 以简单且清晰的解说方式,带你逐步熟悉Python程式语言。
专序推荐 戴志洋|资深黑客、PTT水球发明人
好玩推荐 吴郁芬|ACTC亚洲儿童程式教育协会祕书长
洪旭亮|教育噗浪客共同创办人
赖以威|台师大电机系助理教授数感实验室
赖岳林|橘子苹果儿童程式学苑创办人、董事长
魏玮志(泽爸)|亲职教育讲师
苏文钰|成大资工系教授、PTWA发起人
(依姓氏笔画排序)
各界好评 「非相关科系毕业的我,也是以自学方式学习Swift,在初学Swift时,我深刻体会,有一本架构详细、内容系统化、活泼有趣且具挑战性习题的书,可以很快引导读者进入自己与电脑的对话,并设计出自己的程式,对于程式学习有很大的帮助。自学程式非难事,只要有适当的工具。诚挚推荐您这套书籍,做为踏入程式领域的第一步。」──吴郁芬/ACTC亚洲儿童程式教育协会祕书长
【美国亚马逊读者5颗星好评】
「书中的指示明确,可以非常轻易地操作,丰富的插画也让本书更生动。」
「一本优秀的Python入门书籍。」
「提供有趣且简单的方法让我们一头栽入Python的世界。」
「我在学校的程式设计社团中使用这本书教学,孩子们都超爱!」
「本书不仅适合孩子阅读,即使成年人眼睛也会为之一亮。」
精通数据科学与机器学习的实战指南 深度挖掘数据的潜力,构建下一代智能应用 在信息爆炸的时代,数据已成为驱动创新的核心资产。本书旨在为渴望在数据科学和机器学习领域建立坚实基础,并将其应用于实际问题的读者提供一条清晰、深入的学习路径。我们不会停留于基础语法的罗列,而是聚焦于如何利用先进的工具和算法,从海量数据中提取有价值的洞察,并构建出具有实际预测和决策能力的智能系统。 本书覆盖了数据科学与机器学习流程的完整生命周期,从数据采集、预处理,到模型选择、训练、评估,最终到部署和监控。我们假定读者已具备一定的编程基础(但不限于特定的语言),并希望快速掌握专业领域的核心技术栈。 第一部分:数据科学基础与高效数据处理 本部分将带领读者深入理解现代数据科学工作的基石——高效的数据处理与探索性分析(EDA)。我们将重点关注如何驾驭行业标准库,实现数据的快速清洗与转换。 1. 现代数据栈解析与环境搭建: 我们首先会详细介绍Python生态系统中,处理大规模数据集的关键工具链,包括高性能数组计算库NumPy的底层机制,以及灵活高效的数据结构Pandas的内部工作原理。重点讲解Series和DataFrame的矢量化操作如何显著提升计算效率,并探讨内存管理和大数据集加载策略。 2. 精准的数据清洗与特征工程: 真实世界的数据充满了噪声、缺失值和异常点。本章将系统讲解处理这些问题的专业技术: 缺失值处理策略: 不仅仅是简单的均值或中位数填充,我们将深入探讨基于模型预测的插补方法(如MICE)以及如何评估不同插补方法对下游模型性能的影响。 异常值检测与处理: 介绍基于统计学(如Z分数、IQR)和基于隔离森林(Isolation Forest)等机器学习方法的异常值识别,并讨论如何权衡移除异常值与数据保留的利弊。 特征工程的艺术与科学: 深入剖析特征构造的核心技巧。这包括时间序列特征的提取(如滞后特征、滚动窗口统计量)、文本数据的特征化(如TF-IDF的高级应用、词嵌入的初步概念),以及如何利用领域知识创造出具有高区分度的特征。 3. 探索性数据分析(EDA)的深度洞察: EDA是连接原始数据与模型构建的桥梁。我们将超越基础的直方图和散点图,转向更具洞察力的可视化技术: 多变量关系分析: 掌握如何使用Pair Plots、热力图(Heatmaps)有效地展示特征间的相关性矩阵,并利用Facet Grids等工具对不同子群体进行分组对比分析。 维度约减的可视化应用: 在初步接触主成分分析(PCA)等降维技术后,我们将使用t-SNE和UMAP将高维数据投影到二维或三维空间,直观地观察数据的内在聚类结构和分离度,为后续模型选择提供依据。 第二部分:机器学习核心算法与模型构建 本部分是全书的核心,专注于讲解主流监督学习、无监督学习算法的数学原理、实践应用以及调优策略。 4. 线性模型与正则化的深入理解: 虽然线性模型看似基础,但其背后的正则化理论是理解更复杂模型的基础。我们将详细解析Lasso、Ridge和Elastic Net回归,不仅讲解它们如何防止过拟合,更重要的是理解它们在特征选择和模型稀疏性控制中的作用。此外,还将探讨逻辑回归在处理高维分类问题时的优化技巧。 5. 树模型:从决策树到集成学习的飞跃: 决策树的易解释性是其优势,但其不稳定性是短板。本书将重点讲解如何通过集成学习解决这一问题: Bagging与随机森林(Random Forests): 深入剖析Bootstrap聚合(Bagging)的工作机制,以及随机森林如何通过特征随机性进一步增强模型的鲁棒性。 Boosting算法的精髓: 详尽阐述AdaBoost、梯度提升机(GBM)的工作流程,并重点介绍现代工业界广泛使用的XGBoost、LightGBM和CatBoost的优化策略,包括如何处理类别特征、定制损失函数以及并行化计算。 6. 支持向量机(SVM)与核方法的实战应用: 我们将深入探索SVM如何利用核技巧(Kernel Trick)将数据映射到高维空间以实现线性可分,并比较不同核函数(多项式核、RBF核)的选择对模型复杂度和泛化能力的影响。 7. 无监督学习:聚类与密度估计: 无监督学习是发现数据隐藏结构的关键。我们会详细对比K-Means、DBSCAN(基于密度的聚类)和层次聚类(Hierarchical Clustering)的适用场景和局限性。对于DBSCAN,我们将重点讲解如何选择核心点和邻域半径参数,以适应不同形状的簇。 第三部分:模型评估、调优与前沿技术 构建模型只是第一步,如何科学地评估和优化模型性能,是区分初学者和专业人士的关键。 8. 科学的模型评估与交叉验证: 我们将跳出准确率(Accuracy)的局限性,深入探讨适用于不平衡数据集的评估指标,如精确率(Precision)、召回率(Recall)、F1分数和ROC曲线下的面积(AUC)。重点讲解Stratified K-Fold交叉验证的必要性,以及如何利用混淆矩阵进行细致的错误分析。 9. 超参数优化的高级策略: 手动调参效率低下且容易遗漏最优解。本书将教授自动化优化技术: 网格搜索(Grid Search)与随机搜索(Random Search): 分析它们的优缺点及适用场景。 贝叶斯优化(Bayesian Optimization): 介绍如何利用概率模型(如高斯过程)指导搜索过程,以更少的迭代次数找到全局最优解,实现高效的模型调优。 10. 深度学习基础与迁移学习入门: 虽然本书聚焦于传统机器学习,但理解深度学习的基本框架至关重要。我们将简要介绍多层感知机(MLP)的结构和反向传播原理。更重要的是,我们将重点讲解如何利用预训练模型(如使用TensorFlow/PyTorch框架加载的经典图像或文本模型)进行迁移学习,快速将前沿AI能力集成到自己的数据项目中,无需从零开始训练庞大网络。 第四部分:模型的可解释性、部署与工程化 一个成功的模型不仅要准确,还必须能够被理解和投入生产环境。 11. 模型可解释性(XAI):洞察“黑箱”: 在金融、医疗等高风险领域,决策过程必须透明。我们将介绍当前最前沿的可解释性工具: 局部解释: 详细演示LIME(局部可解释模型无关解释)和SHAP(Shapley Additive Explanations)的原理和应用,展示如何解释单个预测结果。 全局解释: 利用Permutation Importance等方法来评估特征对模型整体预测能力的贡献度。 12. 模型部署与性能监控: 介绍如何将训练好的模型封装成API服务,使其能够被Web应用或其他系统实时调用。我们将探讨使用轻量级框架(如Flask或FastAPI)进行服务化,并讨论模型在生产环境中可能遇到的漂移(Drift)问题,以及如何设置基础监控指标来确保模型的长期有效性。 通过系统地学习和实践本书中的所有主题,读者将能够自信地处理复杂的数据集,选择并优化最适合当前业务问题的机器学习模型,并将其转化为实际可用的智能解决方案。本书的重点在于深度理解原理,强调实战应用的连贯性与专业性。