ACTIVITIES我们

创新创业平台

感悟与反思┃“数据清洗”,我的心路历程——刘晶

 编 号:11     姓 名:刘晶

年 级:2015 专 业:信息管理与信息系统

学 历:大学本科

在第一次在群里看到老师发的通知,问有没有同学感兴趣做数据清洗,当时并不懂什么叫做数据清洗。觉得数据清洗的工作可以了解一些相关的软件和操作,所以当时有此机会时,便抱着试试看的心情开始了。

第一次学长将我们参与数据清洗的同学们召集起来,让我们电脑上一步一步安装软件,由于我的电脑不兼容,无法安装,所幸找到了解决办法。不过就只是安装软件也是状况百出,学长很有耐心,都一一为我们解决了。安装好软件后,学长教会我们如何运行软件,告诉我们会出现的种种情况,以及解决办法,告诉我们每一步都应该怎么做。之后我们就各自领了任务,开始了数据清洗过程。

领取任务后,就开始了数据清洗工作,看似简单的操作,但会出现各种各样的问题,导致程序运行失败。利用“0”“1”代码就可以区分出有用和无用数据,由于我并不懂这是一个什么样的程序,只是觉得很厉害,也不懂其中内涵,慢慢这种机械单一的操作家开始觉得枯燥乏味。后来了解到这项工作如果成功,会是一个很大的突破,并且会对治疗疾病有极大的帮助,后来又接触到Python这个软件,又对这项数据清洗工作产生了新的认识。

这算是大学第一次参加科研活动吧,虽然我只是做了项最简单的工作,但是我感到非常的满足。在对任务熟悉之后,一切就非常顺利的进行着。在这个过程中并不是所有数据都是有用的,在收集的数据中,把不符合的数据去掉,有用的留下。面对庞大的数据,Python的优点就体现出来,也使我对python有了强大的兴趣,在此次数据清洗工作结束后,也用课余时间学习了python基础知识,也逐渐了解到了python工具的强大之处。



关注微信

获取电子资讯

版权所有©山西医科大学 2022

| 忘记密码
注册说明

您好!感谢您关注清华x-lab创意创新创业教育平台。

在填写之前,请确认您项目的核心团队至少有一名成员是清华的在校生、校友及教师