
1 cevincheung 2015-03-01 23:35:15 +08:00 开源是王道 |
2 kslr 2015-03-02 00:19:18 +08:00 via Android Tag ? |
3 best1a 2015-03-02 00:22:16 +08:00 TF-IDF? |
4 xiaogui 2015-03-02 01:26:52 +08:00 分享下几年前借助淘宝 sdk 的做法,不一定是最准确的,但是挺取巧的。 1、对商品名称进行分词; 2、将分词后的内容使用淘宝 sdk 进行搜素; 3、将搜索后的结果取 top 100 ,然后对这 top 100 的分类进行类似 group by 的操作; 4、将分类占比率最大或者前两名作为该商品的商品分类。 备注: 1、此方法对特殊商品无效,比如药品类。 2、如果遇到淘宝 sdk 访问频率超限,可以通过建立授权池的方法进行解决。 |
5 RangerWolf 2015-03-06 16:56:39 +08:00 试了几个 感觉不错啊! 分享一下你的做法? |
6 llhh 2015-03-22 17:31:14 +08:00 楼主这是机器学习吗? |
7 kirch OP |