“我们现在的用户数据,几乎为零。”
陆奇很快回复了。
“数据确实很少,所以我用的不是复杂的协同过滤,而是最基础的内容推荐。”
“我写了个爬虫,抓取了你网站上所有文章的关键词,做了个简单的分词和权重计算。”
“然后,根据用户注册时选择的兴趣标签,去匹配相应关键词权重的文章。”
“算法非常简陋,而且计算资源消耗极小,几乎不增加服务器负担。”
“推荐的精准度肯定不高,可能刷十条,用户能对其中一两条感兴趣,就算成功了。”
“但……从无到有,这应该是最快的方式。”
群里,死一般的寂静。
所有人都被陆奇这番话给镇住了。
加班加点?
The content is not finished, continue reading on the next page