多项选择题
A.根据一定的搜索策略,从URL 队列中选择下一步要抓取的网页URLB.我们需要根据爬取需求定义聚焦爬虫的爬取目标,并进行相关的描述C.聚焦爬虫会根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接D.有用的链接会放入等待抓取的URL 队列
下列选项中,用于在robots.txt 文件中描述搜索引擎名字的是()A.DisallowB.AllowC.a...
单项选择题下列选项中,用于在robots.txt 文件中描述搜索引擎名字的是()
A.DisallowB.AllowC.acceptD.User-agent
用于robots.txt 文件中,标记不允许的是()A.disallowB.User-agentC.allow
单项选择题用于robots.txt 文件中,标记不允许的是()
A.disallowB.User-agentC.allow
下列选项中,被称为主题网络爬虫的是()A.聚焦网络爬虫B.深层网络爬虫C.通用网络爬虫D.增量式网络爬虫
单项选择题下列选项中,被称为主题网络爬虫的是()
A.聚焦网络爬虫B.深层网络爬虫C.通用网络爬虫D.增量式网络爬虫