ACTIVITIES我们

创新创业平台

感悟与反思┃数据清洗心得——陈江华

 

编 号:06     姓 名:陈江华

年 级:2015 专 业:信息管理与信息系统

学 历:大学本科

大二时有幸听说学院正在组建大数据中心,名字叫“众创空间”,当时便心想要是能加入就好,哪怕只是做些简单工作。在平时上课过程中,也经常听见老师们提及一些概念诸如“大数据”,“数据挖掘”,“知识发现”,简单了解之后大数据便在我的心中扎下了根,有如一片神奇迷人的大海,等待我们去探索,但我们接触的往往是理论,受限于条件,大多数人难以直接接触它,在巧合之下,有幸接触了于琦老师的科研团队,恰巧他们需要帮助,于是便加入医学数据挖掘项目。

在刚刚开始时,只是粗浅的了解一些简单概念,至于如何实际操作却一无所知。在开始工作之前,老师和学长学姐们给我们进行了培训,详细的介绍了这个项目,让我们得知我们参与这个项目是有重大意义的,我们正在将新的技术运用于人类基因研究中,为更好的治疗和预防疾病做出新的贡献。听完我的内心充满激动,觉得自己从事的是一项有意义的工作,激情燃烧,干劲满满。随后我们从所使用的工具学起,安装程序,配置环境,调试运行,一步一步做好准备工作,正所谓“工欲善其事,必先利其器”,了解自己工具是良好的开展工作的前提。之后开始分配数据,试着开始清洗工作,数据挖掘的工作庞大,需要团队合作,从最初的收集,预处理,再到挖掘,每一步都很重要。我了解到我所承担的部分是预处理中的一小步,虽然只是一小步,却也为后续工作提供了重要保障。

工作期间也遇见了不少问题,程序异常时出现不同的错误提示是什么意思,为什么我们所选择的数据是运行后出现0和1的数据,代码是如何进行数据的清洗的等等,在求求知的好奇的驱使之下,自己也开始了解-一些相关信息,开始学习python语言,了解它的结构语法,以及功能强大的库,在这个过程之中又学到了新的东西,从这次的实践中我认识到,大数据有着无穷的魅力和能量,它也并不是遥不可及的概念,我们人人都可以运用它,让我们的生活更好,这是一门十分实用的学科,与个人而言,在这次工作中也学会与她人的分工合作,是一次很好的锻炼机会,也拓展了自己课堂所学,与实战中活化知识,也将自己知识技能有进一步加强。这些经历对于以后的学习工作也会有所启发,只要我们努力去做,用心钻研就一定能有收获,一定可以成长。



关注微信

获取电子资讯

版权所有©山西医科大学 2022

| 忘记密码
注册说明

您好!感谢您关注清华x-lab创意创新创业教育平台。

在填写之前,请确认您项目的核心团队至少有一名成员是清华的在校生、校友及教师