如何实现知识库自动爬取网站资讯并收集?

萌新求助,我想建立一个自动爬取几个在线网址上资讯的知识库,当我输入网址后,收集到的资讯看起来怪怪的,是正常的吗?

方便提供一下相关的截图呢