ACTIVITIES我们

创新创业平台

组会文献分享┃文本特征抽取方法

分享人:董继宗、孙乙丹

分享时间:2021.11.26早9:00

地点:至善c304

参与人:高健、董继宗、孙乙丹、王欣瑶、王璐琦、吴佳辉、蒋环宇、来卓玉、陈浩然、梁雯琪、蒲虹君、田若楠等20余人

主要内容:TF-IDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF逆向文件频率(Inverse Document Frequency)。



关注微信

获取电子资讯

版权所有©山西医科大学 2022

| 忘记密码
注册说明

您好!感谢您关注清华x-lab创意创新创业教育平台。

在填写之前,请确认您项目的核心团队至少有一名成员是清华的在校生、校友及教师