Data Mining 2021 Fall

— A Course for Graduates in HZAU.


Syllabus:

  1.  Preface
  2. Introduction to This Course
  3. 入手数据挖掘算法,朴素贝叶斯 (Slides download)
  4. 最优化的语言体系——《最优化理论与算法之 1,引言》
  5. 典型的经典最优化方法——线性回归,LOSS 函数与范数 (Slides download)
  6. 最优化的语言体系——《最优化理论与算法之 7,最优性条件》 (
  7. 典型的经典最优化算法——SVM,超平面上的咏唱(
  8. 神经网络,从传统到摩登 (Slides download)
  9. 高维数据下的优化算法观点,从 SVD 到 PCA 到 LSA (Slides download)
  10. 特征约简,各类方法交汇处
  11. 从矩阵分解到张量分解,知识推理的一种方法 (
  12. 隐变量和贝叶斯推断,EM 算法 (Course note chapter download)
  13. 若干与贝叶斯推断有关的概率统计基础 (Course note chapter download)
  14. 隐变量和贝叶斯推断,变分推断 VI (
  15. 隐变量和贝叶斯推断,VI 下的 LDA 主题模型 ()
  16. 漫谈流行,神经网络、强化学习、VAE 和 GAN ()

长文(初稿-纸质版)提交截止时间:2021年12月7日,5:00 pm。逸夫楼C610。

长文(终稿-pdf电子版)提交截止时间2021年12月21日,23:59 pm. 请发送到该邮箱。 ouyangsizhuo@foxmail.com

(注:标注的“详”、“略”系比较今年与往年在某些章节的讲授差异)


Course Note Available upon Request:

Link to the request page.


课程论文Template

课程论文请使用下述指定的Tex模板进行撰写:Tex模板 Download


推荐的网络视频资源

所推荐资源来自哔哩哔哩,版权归原视频制作团队所有,仅供参考。

EM算法 Link
EM算法 Link
变分推断及其变种 Link
变分推断 及其应用 Link
变分推断和LDA模型 Link
变分推断和LDA模型(34:36) Link
变分自编码机 Link
变分自编码机 Link

学生课堂笔记和自学补充

鲁基圣笔记 11Mb (Download)

论文初稿修订意见

论文题目修改意见
朴素贝叶斯算法及算法实现研究1、文章要求12-15页,该文章只有10页。
2、关键字中出现XXX。
3、只需要在Subsection注明章节作者,不需要在Subsubsection中注明章节作者,本文中所有的Subsubsection都写了章节作者。
4、2.2.6节只有标题,没有内容。
5、后记内容至少要一整页,该文章只有三分之二页。
6、文章里的表和图片都没有title,并且表没有标注来源,图片来源应该写到参考文献中并按照引用格式引用。
7、1.5.1节计算步骤编号格式不对,2.1节对于样本的计数请使用下标。
8、3.2节模板内容没有删除。
9、缺少参考文献,缺少代码。
10、2.2.5节,请用自己的语言介绍代码, 当前copy痕迹过重。
11、3.1节最后几句,交论文事宜与论文撰写无关。
朴素贝叶斯和支持向量机在文本分类中的应用及效果对比(1)请指明图片的出处。
(2)请补全实验代码。
(3)请修订第一页1.1段中的‘?’改为正确的引用。
线性回归及其算法实现研究1、作者来自同一个单位,只需要一个编号,并且只需要写单位名称即可,文中写成姓名加单位。
2、1.2节,Section 2 中对样本计数请用下标,不要写到一起。
3、公式(2),公式(13) argmin写法错误,下面不要有大标题,公式(44) min写法错误,下面不要有大标题。
4、只需要在Subsection注明章节作者,不需要在Section和Subsubsection注明作者,2.3节缺少作者,2.3.1,2.3.2,2.3.3不要写作者。
5、Section 3 必须是后记,且后记内容至少一页,本文后记写到了Section 4并且大概差7行到一页,请按照模板要求修改,将后记之前的内容全部放在Secition 2。
6、本文所有的图和表都没有标注来源,请指出来源。
7、公式(35)和公式(36)中间的推导过程argmax写法全部错误,应该与后面式子隔开并且参数写在argmax下面,不是下标。
8、3.2节中的代码链接请放在附录部分。
9、3.3节中有三处缩写用的小写,请全部改成大写。
10、参考文献的引用格式全部错误,请按照正确的引用格式引用。
Logisitic回归在检测基因相互作用方向的应用 1、作者同一个单位,名字后标号应该都是上标1,单位前只有上标1。
2、图一,四缺少引用。
3、 图二,三,五,六应该是表格。
4、图片,表格最多分别三个。
5、后记最少是一页,差两行。
6、后记中少人员分工。
7、3.2主成分分析**改进不该在后记中。
8、3.3所参考主要资源应该和参考文献分开。
9、 长文需要12-15页 论文页数只有11页。
10、参考文献格式不对,
11、 题目应该是 *相互作用研究方向的应用。
 SVM及其算法实现研究1、章节错误,文中编号到第六节,请按照模板要求撰写。
2、作者来着同一个单位,只需要一个编号。
3、只需要在Subsection注明章节作者,不需要在Section注明作者。文中Section 1,Section 3,4,5都不要写作者,这些章节下的Subsection请全部标注作者.
4、文章中所有的图和表都请注明来源。
5、公式(12),(13)偏导号写错,公式(15)下标符号不一致,请订正。
6、参考文献不需要在‘所参考主要资源’中重复出现。
7、缺少代码。
 SVM及其算法实现研究1、作者来自同一个单位,只需要一个编号即可。
2、公式(9)下标符号不一致,请订正。
3、文章中所有的图和表都没有来源,请注明。
4、2.3.3节不需要注明章节作者。
5、后记至少需要写一页,文中只有半页,并且缺少人员分工部分。
矩阵分解算法在推荐系统中的应用1、作者同一个单位,名字后标号应该都是上标1,单位前只有上标1。
2、图一实验结果请用表格敲出来,别用截图。
3、 附录4.1源码请加一段文字 提示是自己开发的代码。
4、 题目应该是 *推荐系统研究方向的应用。
5、argmin写法不对 下面不要有大标题
非负矩阵分解在链路预测研究方向的应用1、图一缺少引用,如果是自己绘图,请标注说明。
2、Section 3,4,5,6分配错误,Section3,4,5应该归到Section2,Section6应该为模板中的Section3后记。
3、 后记至少一页, 差半页。
4、Section2,3,4,5中本章节作者应该写到二级标题之后。
5、Sction6.3缺少本章节作者。
PCA及其算法实现研究1、作者来自同一个单位只需要一个编号即可。
2、Section 1必须是概况,Subsection1.1必须是选题说明,Subsection1.2必须是该算法基本原理,文中Section 1 是选题说明,格式错误并且缺少其他模块,请按照模板要求修改。
3、只需要在Subsection部分标注作者,不需要在Section和Subsubsection注明作者,文中2.4.1,2.4.2,2.4.3,3.3.1,3.4.1,3.4.2。Section 1 和Section 3 注明了作者。
4、Section 3必须是后记,并且后记至少需要一页内容,文中只有不到半页内容。
5、参考文献没有删除模板内容,并且引用格式错误。
6、Section 2 中出现多处将‘主成分分析’写成‘主成成分分析’。
7、模板要求文中的图片不超过3张,表格不超过3个,本文一共出现了六张图,四个表格,且没有说明来源。
8、2.4.2节中的‘LeastSquaredError’,‘scattermatrix’,3.3.1节中的‘LinearDiscriminantAnalysis’请用空格隔开。
9、图5 矩阵请用latex格式,不要使用图片。
10、公式(38),(39)的编号位置错误,并且公式(38)中括号位置也错误。
11、无代码。
PCA及其推广算法的算法实现研究1、标题格式错误,请按照模板要求的三种格式命名。
2、作者来自一个单位只需要用一个编号。
3、关键字请按照要求用逗号隔开,不要用空格。
4、专有名词第一次出现的时候需要全称和缩写,后面都不需要同时出现,文中很多处书写不规范,请修改。
5、1.3节在介绍推广算法时请统一格式,第三个算法缺少一个括号,第二个算法需要回车一行。
6、2.2.2节引用文献[3]请在句子最后引用,不要在句子开头引用。
7、表一和表二请按照要求使用三线表,并且注明来源。图3 请注明来源。
8、2.3.2节LRR模型与RPCA模型后面括号内的数字意味不明,请尽量按照自己的理解描述。
9、后记至少写一页,本文缺少两行。
BP神经网络及其算法实现研究(1)表1、2横着排列并使用三线表,表3使用三线表,并注明来源。
(2) 图1、2、3若为引用则注明参考,若为实验自制图,也请注明。
(3)第三节必须为后记,主题内容请全放在第二节。
(4)请将作者的单位2、3合并为2(来自同一个单位)。
(5)可以在附录附上部分关键代码。
神经网络在作物表型研究方向的应用(1)图1请注明来源。
(2)表1请注明来源并使用三线表。
(3)1.3节算法过程段首应空格,同时第一步句尾缺失句号。
(4)第六页第三段段位缺失句号。
(5)5.2.1节无需写作者。
(6)第三节必须为后记,主题内容全放在第二节,因此就需调整作者的写法,且后记必须满一页(只写了1/2页)。
卷积神经网络在农业病虫害领域的发展与应用①论文题目命名请参考模板;
②作者的来源一致,单位标号无需重复;
③第一节的标题一定要与模板的一致;
④图片引用错误;
⑤3必须为后记,并且后记差半页,后记的作者请写在子标题中,后记中的代码来源请放在附录;
⑥内容太少页数不足;
⑦参看文献的[8]乱码
卷积神经网络理论发展①打印不清晰,论文题目请参考模板;
②作者的来源一致,单位标号无需重复;
③Section后不写作者名字;
④代码及其链接放在附录,并标记代码是自己写的还是他人写的;
⑤图片引用及不需要对图片进行描述说明;
⑥大写transformer的T;
⑦3为后记;
⑧1.2的标题一定要与模板一致;
卷积神经网络的提出、发展与应用的研究①论文题目错误,请参考模板的题目;
②Section后不接作者名字,作者名字放入子标题后;
③图和表引用错误,表用三线表,请参考模板;
④3必须为后记,并且子标题与模板一致,后记缺半页;
⑤3.1节的引用格式不对,请放入参考文献;
⑥11页最后一行书写错误;
CNN算法及其最近理论发展①作者单位格式错误;
②2.1.1等后无需添加作者,仅在2.1、2.2等后面标注作者(后面几章节也出现同样的问题),2.1节的子标题内容过于冗长;
③3必须为后记,格式请参考模板后记缺半页,3.3和3.4节copy痕迹过重,请多描述自己的理解;
④4、5、6、7章节编号请删除调整,请参考模板;
⑤、6.1节receptivefield没有用空格隔开
注意力机制在机器翻译研究方向的应用1、作者同一个单位,名字后标号应该都是上标1,单位前只有上标1。
2、 Section2,的本节作者需要标注到二级标题之后。
3、图1,2,3的图片来源注释引用格式应该用[1],[2],[3]。
4、2.1,2.2节过于冗长,Copy痕迹过重,请用自己的语言理解介绍。
5、Section3,4分配错误,Section3应该归入Section2,Sction4应该改为模板中的Sction3后记。
6、后记最少一页,差半页。
7、论文页面不够,只有11页,长文12-15页。
Transformer在图像处理中的应用1、作者同一个单位,名字后标号应该都是上标1,单位前只有上标1。
2、图1,2图片质量需要提高。
3、 Section3,4,5分配需要调整,Section3,4需要归入Section2,Section5需要改为模板中Section3后记。
4、 后记页面至少一页,缺两行。
5、题目应该是 *处理研究方向中的应用。
用户可信度滤波驱动在虚假新闻检测中的应用1、作者同一个单位,名字后标号应该都是上标1,单位前只有上标1。
2、 图一,二,三缺少引用,如果是自己绘图,请标注说明。
3、 表1,2,3的title需要按照模板写在表的下方。
4、题目应该是虚假新闻检测研究方向的应用
贝叶斯网络及其算法研究①论文题目请参考模板;
②作者的单位来源一致,则无需重复;
③关键词用逗号;
④1.2应该为算法基本原理;
⑤3为后记,子标题请参考模板;
⑥图和表的引用错误,并且一定要是三线表;
⑦伪代码不允许出现在正文,应放到附录。
GAN在图像风格迁移研究方向的应用(1)图1、2、3请注明来源。
(2)1.2.1节第三段请将引用’?’修订。
(3)公式5、6尾无需加’.’。
(4)2.4节请注明作者。
GNN基本原理及其最新理论发展(1)第二、三节主标题无需写作者。
(2)图1、2、3无论是参考还是自制均请注明来源。
(3)请将图4转化为表,不能截图,并使用三线表,并注明来源。
(4)第三节必须为后记,主题内容全放在第二节,且后记的内容必须满一页(只写了3/4页)。
(5)请将来自同一单位的作者来源合并。

2021年《课程论文精编》下载(Download)


课后答疑 联络我们

教师办公室 C610

助教: 欧阳思卓,彭钱钱


课堂掠影


Resources:

2020 Autumn course. Link

回到 我的本科生课程列表



%d bloggers like this: