简介 TF-IDF(Term Frequency-Inverse Document Frequency)是一种在信息检索和文本挖掘中广泛使用的统计方法,用于评估一个词在一个文档中的重要性。它结合了两个关键概念:词频(Term Frequency, TF)和逆文档频率(Inverse Document Frequency, IDF)。 词频 (Term Frequency, TF) 定义:词频是指某个词在文档中出现的次数。为了防止文档长度对结果的影响,通常会将词频进行归一...

BowmanJin 2024-10-23 125 0
没有账号? 注册  忘记密码?