本仓库记录的是中国科学技术大学大数据专业刘淇老师的数据分析课程的所有内容,欢迎本校及其他学校学生共同学习探讨。
下面对本仓库进行一些介绍。
记录数据分析课中所有的实验
exp1主要是熟悉python的使用,用python实现一些基本的程序设计,具体实验要求请见exp1中的FirstExp.pdf
文件,其他.py
文件是需要实现的程序设计代码,里面记录了题目与解答。
exp2主要是学习使用python爬虫,具体实验要求见.pdf
文件,代码在main.py
文件中,提交结果压缩在.zip
文件中。
exp3是对数据进行特征工程,用jupyter notebook实现,实验要求见.pdf
文件,exp3.csv
是初始给出的原始数据,exp3Data.csv
与exp3ChapionData.csv
是数据经过一些处理后的数据,具体处理方式见report3
文件(有pdf与md两种文件格式)。提交结果可直接通过.zip的同名文件夹查看。
与exp3一样,可先忽略其他文件直接查看exp4.pdf
与提交结果(.zip的同名文件夹),主要两个part分别实现KDKNN算法以及对EXP3中的数据进行一场数据比赛,具体要求见exp.pdf
。
包含课程中所用ppt。
课程期中左右需要提交一份文献的调研报告(具体要求见调研报告.pdf
文件),里面列出了一些调研过程中我看过的文献。最终我选择GAN作为我的调研报告对象,最终调研报告见report
文件。
本repo的所有内容仅供同学之间相互交流使用,所有的PPT及实验数据都是老师与助教辛勤劳动得到的结果,不得私自盗用或商用,如有任何问题,欢迎联系我或在本仓库提交issue。
如果本仓库的内容对你的学习有所帮助,请顺手star一下本项目,你的star就是对我最大的支持与认可。