阅读: 191
答案 1:
不好意思,没办法回答的非常详细。基本上是一个半监督的学习过程,会给每个博客计算profile确定分类,同时对博客里的文章再计算profile进行调整。豆瓣的一个优势是拥有比较完整的用户兴趣数据,因此可以不必局限于博客和文章的文本进行分类。把用户的兴趣数据利用起来可以收到比较好的效果。答案 2:
你说的两种方式都不是非此即彼的,完全切词后也需要特征提取(找一个特殊词词典),特定词是否出现其实就是决策树方法的一个特例,两个方式都需要机器学习,说到机器学习,那就是一个方法了,只是算法选择有差异罢了。分享常识给亲友.
下一篇:新浪 SAE 和 Google 的 GAE 哪个好? 下一篇 【方向键 ( → )下一篇】
上一篇:知乎的正文字号能不能大一号便于阅读? 上一篇 【方向键 ( ← )上一篇】
快搜