AI
一个案例
tokenizer 说明
加载数据集
DatasetDict 类
logits 说明
langchain(一)
关键词提取
RAG与向量检索
RAG与向量检索(二)
TF-IDF 算法
本文档使用 MrDoc 发布
-
+
首页
TF-IDF 算法
`TF-IDF` - TF = Term Frequency,词频 - IDF = Inverse Document Frequency,逆文档频率(文档频率的倒数) TF(词频) = `单词w在所有文档中出现的次数` / `文档的总数` IDF(逆文档频率) = log(`语料库的文档总数` / `包含单词w的文档总数`) TF-IDF = TF*IDF 得到的结果越大,说明该词的重要性越高。
gaojian
2024年10月6日 11:15
分享文档
收藏文档
上一篇
下一篇
微信扫一扫
复制链接
手机扫一扫进行分享
复制链接
关于 MrDoc
觅思文档MrDoc
是
州的先生
开发并开源的在线文档系统,其适合作为个人和小型团队的云笔记、文档和知识库管理工具。
如果觅思文档给你或你的团队带来了帮助,欢迎对作者进行一些打赏捐助,这将有力支持作者持续投入精力更新和维护觅思文档,感谢你的捐助!
>>>捐助鸣谢列表
微信
支付宝
QQ
PayPal
Markdown文件
分享
链接
类型
密码
更新密码