idea
【】表示inspired by
- 因为相似的前后缀,词根等对于英文的相似词非常有用,所以中文的象形文字的特性可以考虑使用CNN来进行,这个有相关的论文了已经【Efficient Estimation of WOrd Representations in Vector Space】
- 中文编码的时候,不一定非要切词或者直接用字,可以考虑字词混用。把一个词当成一个字来看待。例如信息和信以及息单独两个词看起来也是不一样的。【Distributed Representations of Words and Phrases and their Compositionality】 3.