网络爬虫开发知到智慧树答案满分完整版章节测试

第一章单元测试

1、下列不属于常见爬虫类型的是（）。

A:通用网络爬虫
B:增量式网络爬虫
C:浅层网络爬虫
D:聚焦网络爬虫
答案: 浅层网络爬虫

2、下列不属于聚焦网络爬虫的常用策略的是（）。

A:基于深度优先的爬取策略
B:基于内容评价的爬取策略
C:基于链接结构评价的爬取策略
D:基于语境图的爬取策略
答案: 基于深度优先的爬取策略

3、下列不属于常用反爬手段的是（）。

A:反爬频度
B:验证码校验
C:账号权限
D:人工筛选
答案: 人工筛选

4、下列属于反爬虫目的的是（）。

A:限制访问人数
B:防止网站信息被竞争对手随意获取
C:变换网页结构
D:限制用户访问权限
答案: 防止网站信息被竞争对手随意获取

5、下列属关于Python爬虫库的功能描述不正确的是（）。

A:通用爬虫库urllib3
B:通用爬虫库 Requests
C:HTML/XML解析器pycurl<br> D:爬虫框架 Scrapy<br> 答案: <span style="color:red">HTML/XML解析器pycurl

6、搜索引擎使用了网络爬虫不停地从互联网抓取网站数据，并将网站镜像保存在本地。（）

A:对
B:错
答案: 对

7、 robots.txt文件中，User-agent后面跟的是爬虫的名称，Disallow后面跟着的是可以爬虫的网页。（）

A:对
B:错
答案: 错

8、爬虫是手动请求万维网网站且提取网页数据的程序。（）

A:对
B:错
答案: 错

9、每个网站都有robots.txt文件。（）

A:对
B:错
答案: 错

10、爬虫爬取的是网站后台的数据。（）

A:对
B:错
答案: 错

第二章单元测试

1、吉多设计Python的灵感来源于（）。

A:C语言
B:Unix shell
C:ABC语言
D:Java语言
答案: ABC语言

2、下列关于Python语言的特点说法中，错误的是（）。

A:Python语言是非开源语言
B:Python语言是跨平台语言
C:ANSI C
D:Go
答案: Python语言是非开源语言

3、 Python源代码文件的后缀名是（）

A:pdf
B:doc
C:png
D:py
答案: py

4、列表list=[1,2,3,4,5]，下列选项中为空的是（）

A:ist[1:1]
B:list[1:-1]
C:list[1:]
D:list[:-2]
答案: ist[1:1]

5、 Python语言中用来定义函数的关键字是（）

A:return
B:def
C:function
D:class
答案: def

6、在安装Python时，需要根据已有的系统来选择相应的安装程序。安装后，也需要配置环境变量。（）

A:对
B:错
答案: 对

7、 elif语句可以单独使用。（）

A:对
B:错
答案: 错

8、元组的元素不能修改。（）

A:对
B:错
答案: 对

9、下列选项中，不能创建元组的语句是（）。

A:tup=[1,2,3]
B:tup=(2)
C:tup=tuple([1,2,3])
D:tup = (1,2,98)
答案: tup=[1,2,3]
tup=(2)

第三章单元测试

1、如果站点服务器支持安全套接层(SSL)，那么连接到安全站点上的所有URL开头是( )。

A:HTTP
B:HTTPS
C:SHTTP
D:SSL
答案: HTTPS

2、 body元素用于背景颜色的属性是( )。

A:alink
B:vlink
C:color
D:background-color
答案: background-color

3、为了标识一个HTML文件开始应该使用的HTML标记是 ( )。

A:
＜table＞
B:＜body＞
C:＜html＞
D:＜a＞
答案: ＜html＞

4、在HTML中，单元格的标记是( )。

A:＜td＞
B:＜span＞
C:＜tr＞
D:＜body＞
答案: ＜td＞

5、 CSS 中的选择器不包括包括（）

A:超文本标记选择器
B:类选择器
C:ID选择器
D:元素选择器
答案: 超文本标记选择器

6、 ( )是网页与网页之间联系的纽带，也是网页的重要特色。

A:导航条
B:表格
C:框架
D:超链接
答案: 超链接

7、在HTML中，下面是段落标签的是：（）。

A:＜html＞＜/html＞
B:＜head＞＜/head＞
C:＜body＞＜/body＞
D:＜p＞＜/p＞
答案: ＜p＞＜/p＞

8、（）标签可以应用于〈head〉中。

A:＜title＞
B:＜body＞
C:＜html＞
D:＜image＞
答案: ＜title＞

9、下列哪一项是css添加背景图片的正确语法构成？（）

A:background-position
B:background-color
C:background-image
D:background-size
答案: background-image

10、在HTML开发中,制作网站时首先需要考虑内容是( )

A:页面内容
B:页面布局
C:图片色彩
D:文字字体
第四章
答案: 页面布局

第四章单元测试

1、 HTTPError 是 URLError 的子类，专门用来处理 HTTP 请求错误，比如认证请求失败等。它有 3 个属性，下列选项哪一个不是它的属性（）。

A:code
B:reason
C:headers
D:Response
答案: Response

2、下列属于HTTP必须实现的请求方法的是（）。

A:POST与DELE
B:GET与HEAD
C:OPTIONS和CONNECT
D:TRACE和OPTIONS
答案: GET与HEAD

3、下列关于HTTP状态码类型描述错误的是（）。

A:4XX表示客户端可能发生错误
B:5XX表示服务器可能发生错误
C:1XX表示请求已被服务器接受，无须后续处理
D:3XX表示客户端的请求需采取进一步操作
答案: 1XX表示请求已被服务器接受，无须后续处理

4、通过加入特定的____，可以将爬虫发出的请求伪装成浏览器。（）

A:Request
B:opener
C:Headers
D:User_Agent
答案: User_Agent

5、 urlopen方法中的data 参数可以不是 bytes 类型。（）

A:对
B:错
答案: 错

6、 requests库中的requests.get(url)方法是请求目标网站，类型是一个HTTPresponse类型。（）

A:对
B:错
答案: 对

7、如果访问某网站的频率太高，则这个网站可能会禁止访问。（）

A:对
B:错
答案: 对

8、 requests库中的requests.get(url)方法中包括两个（对象）请求，其中一个为Request请求，即向服务器请求资源的request对象，第二个是Response请求，即包含从服务器返回的所有资源。（）

A:对
B:错
答案: 对

9、 Response类用于动态地响应客户端的请求，控制发送给用户的信息，并且将动态地生成响应，包括状态码、网页的内容等。（）

A:对
B:错
答案: 对

上方为免费预览版答案，如需购买完整答案，请点击下方红字

点击这里,购买完整版答案

点关注，不迷路，微信扫一扫下方二维码

关注我们的公众号：阿布查查 随时查看答案，网课轻松过

为了方便下次阅读，建议在浏览器添加书签收藏本网页

电脑浏览器添加/查看书签方法

1.按键盘的ctrl键+D键，收藏本页面

2.下次如何查看收藏的网页？

点击浏览器右上角-【工具】或者【收藏夹】查看收藏的网页

手机浏览器添加/查看书签方法

一、百度APP添加/查看书签方法

1.点击底部五角星收藏本网页

2.下次如何查看收藏的网页？

点击右上角【┇】-再点击【收藏中心】查看

二、其他手机浏览器添加/查看书签方法

1.点击【设置】-【添加书签】收藏本网页

2.下次如何查看收藏的网页？

点击【设置】-【书签/历史】查看收藏的网页

范唉沁剁譬郸概跑丧同兑继菊

第一章 单元测试

第二章 单元测试

第三章 单元测试

第四章 单元测试

第一章单元测试

第二章单元测试

第三章单元测试

第四章单元测试