分享人:董继宗、孙乙丹
分享时间:2021.11.26早9:00
地点:至善c304
参与人:高健、董继宗、孙乙丹、王欣瑶、王璐琦、吴佳辉、蒋环宇、来卓玉、陈浩然、梁雯琪、蒲虹君、田若楠等20余人
主要内容:TF-IDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF逆向文件频率(Inverse Document Frequency)。