201 秦雨诺：他把我当问答模型了？ (5 / 12)_

        周岩又对这段代码提出改进要求，包括词频可视化，把词频用云图展现出来，包括对词频进行文本训练，从而找出词与词之间的关联。

        这一回周岩提出的要求是对两本文本进行处理，两本分别是金庸老爷子的《神雕侠侣》和《射雕英雄传》。

        很快01给出了相应的代码修改，周岩复制粘贴之后，进行测试。

        其实需求也特别简单，就是找主角之间的人物关系。

        杨过对应小龙女，那么郭靖对应什么，结果：黄蓉。

        周岩又找了杨过和郭靖分别对应的关联词，同时让01局限在人物身上，自己设计一个人物词判定代码。

        这一回01终于出现了一点错误，比如人物切分上面，会把4个词的人物变成2个词输出。

        这就是细节上的毛病了，周岩现在也不是算法小白，知道怎么改进，不过周岩更期待01给出的结果。

        于是他把这个问题粘贴给了01，而01也给出了对词频进行判定，如果两个拆分的词同时出现多次，那么判定两个拆分的词合并成为同一个词，并在字典中删除前面两个拆分词，并对已经分词好的数据进行处理，合并两个拆分词，没有分词好的就以该拆分词作为分词依据，照着分词就行。

        粘贴进去以后，周岩发现效果意外的不错。

        只是之后人物判别上也出现了一些问题，会把武器什么的加进去。

        内容未完，下一页继续阅读