多项选择题
A.表层爬虫B.聚焦网络爬虫C.通用网络爬虫D.深层爬虫
A.降低访问频率B.使用代理ipC.识别验证码D.伪装User-agent
A.IP地址B.服务器C.路径D.协议头
A.根据一定的搜索策略,从URL 队列中选择下一步要抓取的网页URLB.我们需要根据爬取需求定义聚焦爬虫的爬取目标,并进行相关的描述C.聚焦爬虫会根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接D.有用的链接会放入等待抓取的URL 队列
微信扫一扫,加关注免费搜题