“一个网页被其他网页链接的次数越多,说明其越重要。来自高权重网页的链接比低权重网页的链接更有价值,这两点就是PageRank的核心”。
“简单来说,一个网页的PageRank值取决于指向它的所有网页的PageRank值之和,并且每个链接的贡献会根据源网页的总链接数进行归一化”。
“我们可以将互联网看作一个有向图,每个网页是一个节点,链接是有向边。给每个网页赋予初始值,按照开发出来的迭代计算公式不断迭代更新每个网页的PageRank值,直到收敛”。
“就像是一个巨大的迷宫,每个网页是个小房间,链接就是房间之间的门,不断用迭代计算公式更新每个房间的重要值,直到结果稳定”。
内普教授听得眼睛瞪得像铜铃,惊叹道“你说你不了解计算机,这专业名词说得让我产生质疑。你的一些想法,简直让人惊讶”。
哪有什么了解呀,不过是经过了信息时代的轰炸罢了。
恩斯特现在能理解了,为什么那些成功人士创业都能成功了,商场本身最重要的就是信息战,还有什么人能比一个能预知未来的重生者更熟知未来的信息的吗。
“恩斯特先生的PageRank算法,是通过迭代计算保证收敛到唯一解,但对于大规模网页图来说,计算成本是不是太高了?”
“还有就是内容质量,PageRank算法不能直接评估网页内容的质量,如果有人刷取访问量,就会导致低质量但高链接的网页排名靠前”。
这时,斯内普教授带来的两个年轻人突然插话,恩斯特转头看向对方,刚才只顾着结交斯内普这个计算机大拿了,都忘记了这两个吉祥物的存在。
斯内普则猛拍额头“真是不好意思,恩斯特先生。实在是你的新颖想法让我很着迷,都忘记了介绍。这是我最得意的两位学生,谢尔盖·布林和拉里·佩奇”。
内容未完,下一页继续阅读