粗略来说,就是 Penn <-> 863/PKU 词性标准之间的相互转换。请问有没有现成公开的转换规范或者资料?
比如说:
- Penn :携程网 /NR 提供 /VV 了 /AS 很多 /CD 有用 /JJ 的 /DEG 信息 /NN
- 863/PKU :携 /v,程网 /nr,提供 /v,了 /ul,很多 /m,有用 /a,的 /uj,信息 /n
我想得到这两种标注之间的映射。
如果还可以的话,顺便请教一下大家,商业用途的情况下(目前搬砖 ing ),从方便好用和准确率上看,哪种分词/词性标注工具最好?(试了试感觉 CoreNLP 易用性很糟糕啊。)
非常感谢
