编 号:10 姓 名:王紫晨
年 级:2015 专 业:信息管理与信息系统
学 历:大学本科
刚开始听说老师要找一些同学进行数据清洗工作的时候,就很想加入了。老师说数据清洗任务一半是自动的,而另一半必须人工完成,需要大家的帮助,宿舍里的大家不约而同地报了名,想要出一份力,也想体验一下这是怎样一个过程,觉得一定能够学到些什么。
我们带着电脑来到了至善楼,加入数据清洗小队。义博学长先给大家讲解了数据清洗的大概操作流程,需要注意的一些问题,并给大家现场演示了数据清洗需要配置的电脑环境,具体怎样设置。接下来便是安装啦,在学长的指导下,一步步的安装软件,我也帮助了很多同学,心里非常开心。
拥有了数据清洗需要的环境,领取了自己的数据,在学长耐心地讲解下,便开始了工作。虽然工作内容不是很复杂,但是大家也都出现了或多或多好的问题,一开始工作运行的非常缓慢,但后来大家都能及时或提前完成自己的任务。感觉自己为有意义的事情除了自己的一份力是一件非常开心的事情。同时也认识了很多老师和同学,是一次很丰富的经历。虽然工作不难,但需要认真和耐心,也磨了磨自己的性子,在课余时间做了一项有意义的工作。
在这次数据清洗过程中,还初步接触了python语言,了解了他的强大功能,他变得不再那么陌生,我也开始对python感兴趣了,在之后的接触中,也会感到 python是个熟悉的存在。
感谢这次经历~

第一步出错啦,因为第一个数据是错的,把错误数据放到其他文件夹里,继续运行就好啦。

第二步是提取,出错就要把这个解压过的文件放到错误文件夹里,再继续~

没有新建genes文件夹~

又是错误数据哦,保存起来!