ACTIVITIES我们

创新创业平台

感悟与反思┃数据清洗心得——张海瑞

 编 号:09     姓 名:张海瑞

年 级:2015 专 业:信息管理与信息系统

学 历:大学本科

python是一种编程语言,相比于c语言,它更加简洁,易懂,通俗。这仅仅是我停留在老师说,百度查的字面意思理解,然而在这次利用python编程的过程中,让我对他有了一个全新的认识。刚开始去的时候,我们啥也不懂,也不敢问,甚至不知道问啥,只是单纯的,机械的听学长的安排,结果,在安装的过程中,就遇到了问题,只能害羞的去问学长,之后在弄运行环境的过程中,也遇到了很多的问题,往往是按着操作步骤弄完了,结果发现,还不能用,问学长的时候也不知道问题出在哪,结果是前功尽弃,学长又重新安装了一遍。

我们主要做的是数据清洗工作,数据是我们自已拷贝的关于病历的,据老师说,这个工作非常有意义,他可以帮助老师的科研工作,甚至对病人的治疗也会有一定的影响,于是我就投入了十分的努力进去到了这项工作中,虽然完全看不懂代码。

边工作边意识到数据清洗就是筛选数据的过程。在U盘拷下来的千条数据目录下,利用老师编的Python代码,读取每条数据文档,利用0和1进行检查,运行结果正确的数据会自动集中到新文件下,而错误的数据文档需要我粘贴到另一个文件夹里。虽然我只接触到项目的冰山一角,但已经感觉到大数据的神奇和强大了。甚至由衷赞叹于琦老师的编程能力,这究竟是多大的工程让这些数据变成自己需要的信息的。

最后非常感谢老师能够给我们这样一次学习的机会。



关注微信

获取电子资讯

版权所有©山西医科大学 2022

| 忘记密码
注册说明

您好!感谢您关注清华x-lab创意创新创业教育平台。

在填写之前,请确认您项目的核心团队至少有一名成员是清华的在校生、校友及教师