官方服务微信:dat818 购买与出租对接

数据分析实战课程:零基础学Python、方法论与数据处理技法全解析

2万

主题

2

回帖

8万

积分

管理员

积分
84318
发表于 2025-3-9 00:45:40 | 显示全部楼层 |阅读模式
    第一天上午

    数据分析实战

    第一讲 零基础学

    讲解以下内容:背景、国内的发展状况、基础语法、数据结构以及绘图操作等。尤其针对向量计算这部分,着重对其在这方面的优势和用法进行介绍。

    第二讲 数据分析方法论

    讲解统计学的基础内容,包含统计学的基本概念。还会讲解假设检验以及置信区间等基础部分。并且会结合数据案例来阐述它们的使用场景和运用方法。会介绍数据分析的流程以及常见的分析思路,同时也会结合案例进行讲解。

    第三讲 数据处理技法

    讲解从数据接入、数据统计、数据转换等几个方面展开。其中,数据接入涵盖接入 MySQL 等常见数据库的操作;数据统计包括包的具体用法及讲解;数据转换包含对数据集进行关联、合并、重塑等操作。另外,在面对海量数据时,会介绍在 Spark 平台上的数据处理技术,并结合真实环境进行操作讲解。

    第一天下午

    数据挖掘理论及核心技术

    第四讲 认识数据挖掘

    结合业界经典场景,讲解数据挖掘的方法体系。

    第五讲 数据挖掘核心技术

    详细讲解数据挖掘的核心技术原理,包括抽样、分区、样本平衡、特征选择、训练模型、评估模型等。同时结合案例讲解这些技术的具体实现和用法。对于样本平衡,着重讲解人工合成、代价敏感等算法。对于特征选择,着重讲解其核心思路,并结合案例进行演示。

    第二天上午

   


    大数据算法原理及案例实现

    第六讲 特征降维算法及实现

    降维是大数据分析中极为重要的一种算法。它能够在减少极少信息量的同时,大幅度地缩减数据规模。主要对主成分、LDA 以及 t-SNE 的原理进行讲解,并将其与案例相结合来实现。尤其针对海量数据所处的应用场景,讲解实现的思路以及相关案例。

    第七讲 决策树算法及实现

    决策树是很经典的算法,通常在小数据的挖掘中较为常见。因为决策树具有很强的可解释性,所以在面对海量数据时依然有着非常重要的实用价值。主要讲解 ID3 决策树算法的实现原理,同时讲解 C4.5、C5.0 以及 CART 决策树算法的实现原理,并结合案例来实现这些算法。

    第八讲 好莱坞百万级影评数据分析与电影推荐实现

    实战部分:以好莱坞百万级的影评数据为基础,先对数据进行建模,接着进行清洗,再进行透视表操作。之后依据用户画像来分析不同用户的喜好,利用机器学习算法针对不同性别、年龄阶段的用户进行定制化的电影推荐,最后把推荐的电影进行可视化展示操作。

    第二天下午

    大数据算法原理及案例实现

    第九讲 因果推理算法及实现

    大数据分析技术有助于我们发现并解决一些业务问题。然而,要判断我们的改进是否生效,以及是否在业务指标上呈现出一定的因果逻辑,这是一个重要的问题和分析方向。本节主要对因果推理算法进行介绍,其中包含贝叶斯推理、状态空间模型以及相关工具等内容,并且会结合案例来实现这些内容。

    第十讲 深度学习算法及实现

    对于大数据的建模任务,我们能够通过深度学习来达成。它不但可以对海量数据进行建模,并且效果相当不错。本节主要是讲解深度学习的发展历程,像 DBN、DNN 等这些经典的深度学习算法,还有深度学习的优化算法以及一些技巧。与此同时,会介绍 Keras 库的使用方法,并结合案例来实现。

    第十一讲 采用YOLO实现计算机视觉技术

    基于 YOLO 面部模型,要完成对图片和视频的人脸识别。在实战过程中,会讲解 YOLO 的重要类和函数。主要涵盖的内容有 YOLO 库的安装与部署,以及图像增强、像素操作、图形分析等各类技术。同时,还会详细介绍怎样处理来自文件或摄像机的视频,以及怎样检测和跟踪移动对象。

    第三天上午

    可视化应用实战

   


    第十二讲 数据分析图表及案例

    数据可视化是大数据分析的重要手段。通过合理运用图表,既能简洁地表达数据含义,又能高效地发现问题,还能为报告编写和数据分析 web 应用增添光彩。本节重点讲解常用的数据分析图表及其使用场景,介绍数据可视化的方法论,要避免生搬硬套使用图表,需针对不同的业务场景和需求,合理选择可视化方法。介绍的工具包括但不限于 pycha、Bokeh、mpld3、pygal 等常用可视化库。

    第十四讲 使用编写数据分析报告

    数据分析报告在大数据分析进程中有着重要价值。它展现了大数据分析的目的、过程以及结果,还包含对发现问题的解读以及改进方案等内容。本节重点讲解编写数据分析报告的具体方式,以及编写数据分析报告的方法论,并且会结合案例来讲解其使用方法。

    第十五讲 可视化开发实战

    它是一款较为不错的可视化框架,与[某框架]一样是构建在[某种基础]之上的。能够依据[相关条件]快速开发出一个轻量级的数据分析 web 应用。可以在网页中嵌入图表、数据以及分析的算法,十分适合打造企业内部的敏捷数据分析工具集。本节主要介绍 Pie 等各种可视化解决方案,还讲解了一个实现数据分析功能(兼图表)的实际案例,包括搭建服务器,以便在企业内部实现轻量级数据分析应用。

    第三天下午

    职场赋能

    第十六讲 GPT4 Plus 快速入门

    首先要了解以某种模型为代表的大语言模型的原理,接着对比着介绍 GPT3 和 GPT4 的不同之处。然后阐述在国内的环境中怎样能够方便且稳定地使用。最后演示在使用 GPT 的过程中,怎样高效地运用提示词,以及 GPT4 的新特性,即与角色设置相关的内容。

    第十七讲 GPT4 Plus 提高办公效率

    介绍 Excel 安装 GPT 插件的方法,以及如何通过它自动编写函数来提升表格的处理效果。接着说明如何调用 GPT API ,并介绍关于 Token 计算、字数限制以及内容乱码的解决方案。最后讲解 Plus 如何自动完成数据挖掘流程以及生成分析报告,还有 Store 第三方插件的安装与使用。

    第十八讲 文案、短视频、AI主播的定制化生成

    首先介绍如何通过 GPT 生成高质量的文案,以及如何通过 AI 来优化已有的文案。接着利用百度旗下的 AI 工具自动生成高质量的短视频。最后借助阿里的语言训练模型,打造属于自己或者公司的数字人。

更多帖子推荐

您需要登录后才可以回帖 登录 | 立即注册

Archiver|手机版|小黑屋|关于我们

Copyright © 2001-2025, Tencent Cloud.    Powered by Discuz! X3.5    京ICP备20013102号-30

违法和不良信息举报电话:86-13718795856 举报邮箱:hwtx2020@163.com

GMT+8, 2025-4-21 07:00 , Processed in 0.082490 second(s), 17 queries .