
今天试了下 jieba 和 snownlp
jieba 使用自定义词典 权重不好控制
snownlp 貌似不支持自定义词典 需要自己训练文本
搜下了论坛里面的帖子 看到 @Livid 用的是 jieba 后面好像换了?
换的是什么工具 能说下吗?
大家推荐几个 我自己再去试试 找到个我自己合适的
1 xxm459259 2015 年 10 月 27 日 LDA? |
2 jimmyBrother 2015 年 10 月 27 日 你怎么定义关键词啊,是出现的次数比较多就算关键词么,还是有别的什么定义的方法; |
3 dai269619118 OP @jimmyBrother 匹配到词典里面的词 然后按权重排序 |
4 shoumu 2015 年 10 月 27 日 自己写一个 TF-IDF 吧,然后根据你的训练数据跑一个 IDF ,再根据你的效果调一下参数什么的就好了 |
5 dai269619118 OP @shoumu 嗯嗯 文本匹配字典 有什么算法吗? |
6 shoumu 2015 年 10 月 27 日 |
7 dai269619118 OP @shoumu 有思路了 谢谢啊 |
8 iewgnaw 2015 年 10 月 27 日 |
9 Gestalt 2015 年 10 月 28 日 V2EX 帖子的关键词提取目前是用我司的 API http://bosonnlp.com/ 之前在这个帖子里有提到: http://v2ex.com/t/147911#reply32 |
10 dai269619118 OP @Gestalt 测试了一个文本 分析的很准! 谢谢 |