编 号:11 姓 名:刘晶
年 级:2015 专 业:信息管理与信息系统
学 历:大学本科
在第一次在群里看到老师发的通知,问有没有同学感兴趣做数据清洗,当时并不懂什么叫做数据清洗。觉得数据清洗的工作可以了解一些相关的软件和操作,所以当时有此机会时,便抱着试试看的心情开始了。
第一次学长将我们参与数据清洗的同学们召集起来,让我们电脑上一步一步安装软件,由于我的电脑不兼容,无法安装,所幸找到了解决办法。不过就只是安装软件也是状况百出,学长很有耐心,都一一为我们解决了。安装好软件后,学长教会我们如何运行软件,告诉我们会出现的种种情况,以及解决办法,告诉我们每一步都应该怎么做。之后我们就各自领了任务,开始了数据清洗过程。
领取任务后,就开始了数据清洗工作,看似简单的操作,但会出现各种各样的问题,导致程序运行失败。利用“0”“1”代码就可以区分出有用和无用数据,由于我并不懂这是一个什么样的程序,只是觉得很厉害,也不懂其中内涵,慢慢这种机械单一的操作家开始觉得枯燥乏味。后来了解到这项工作如果成功,会是一个很大的突破,并且会对治疗疾病有极大的帮助,后来又接触到Python这个软件,又对这项数据清洗工作产生了新的认识。
这算是大学第一次参加科研活动吧,虽然我只是做了项最简单的工作,但是我感到非常的满足。在对任务熟悉之后,一切就非常顺利的进行着。在这个过程中并不是所有数据都是有用的,在收集的数据中,把不符合的数据去掉,有用的留下。面对庞大的数据,Python的优点就体现出来,也使我对python有了强大的兴趣,在此次数据清洗工作结束后,也用课余时间学习了python基础知识,也逐渐了解到了python工具的强大之处。