技能训练
一、文生图(请用文生图的方式来完成,看谁的图片最能反映以下成对概念的核心,最能体现两者之间的差异)
1. 机器学习、深度学习 2. 监督学习、无监督学习 3. 训练集、验证集、测试集 4. 离散型随机变量、连续型随机变量
二、选择题
1. 为了评估有监督算法的区分度、稳定性、鲁棒性等模型效果,往往会将样本拆分为( )。
2. 大数据分析是指对规模巨大的数据进行分析。大数据可以概括为5V,分别是( )。
3. 常见的离散型随机变量的分布有( )。
4. 常见的连续型随机变量的分布有( )。
三、简答题
1. 机器学习与深度学习、监督学习与无监督学习各有什么意义?
2. 简述训练集、验证集和测试集的含义。
3. 大数据分析流程、方法和工具有哪些?
4. 简述常见的离散型随机变量分布的应用场景:等概率分布、伯努利分布、二项分布、几何分布、 超几何分布、泊松分布。
5. 简述常见的连续型随机变量分布的应用场景:正态分布、指数分布。
3. 概率分布基本参数操作及图形变化操作实践。
1)作业目的
旨在让学生了解离散型概率分布与连续型概率分布的图形表现,对各主要类型概率分布
的关键参数进行调节,并观察变化;理解概率质量函数、概率密度函数的内涵及各种不同的
计算区间所对应的函数关系。对几种主要分布,正态分布、指数分布、二项分布及泊松分布
的性能及应用场景深度理解,从而为后续课程的学习打下基础。
2)作业准备
Geogebra 软件下载并安装,或在以下笔记本中操作。

这幅作品由DeepSeek完成,采用梵高标志性的漩涡笔触与浓烈色彩,钴蓝夜空中的橙色数据流象征神经网络,旋转的蓝绿色星云代表聚类算法,起伏的绿色波形是分类边界,紫罗兰色鸢尾花造型演绎关联规则。请感受后印象派与数据科学的奇妙碰撞吧!