大数据选择题牛刀小练2

大数据选择题牛刀小练2


1、下列哪个属性是hdfs-site.xml中的配置?
A、dfs.replication

2、Hadoop-2.6.5集群中的HDFS的默认的数据块的大小是?
C、128M

3、Hadoop-2.6.5集群中的HDFS的默认的副本块的个数是?
C、3

4、如果我们现有一个安装2.6.5版本的hadoop集群,在不修改默认配置的情况下存储200个每个200M的文本文件,请问最终会在集群中产生多少个数据块(包括副本)?
D、1200

5、以下哪个不是HDFS的守护进程?
C、mrappmaster/yarnchild

6、请问以下哪个命令组成是错误的?
B、sbin/hdfs dfsadmin -report
start, stop相关的命令都在sbin中,
hadoop, hdfs, mapred, yarn 这些集群使用操作命令都在bin目录中

7、以下哪种不是Hive支持的数据类型?
D、Long

8、现在在hadoop集群当中的配置文件中有这么两个配置,请问假如集群当中有一个节点宕机,主节点namenode需要多长时间才能感知到?

dfs.heartbeat.interval
3


heartbeat.recheck.interval
2000

B、34秒

9、下面关于使用hive的描述中不正确的是?
D、hive支持数据删除和修改

10、HDFS集群中的namenode职责不包括?
C、负责保存客户端上传的数据

11、关于HDFS集群中的DataNode的描述不正确的是?
A、DataNode之间都是独立的,相互之间不会有通信
C、一个DataNode上存储的所有数据块可以有相同的

12、HDFS集群中的DataNode的主要职责是?
C、负责保存客户端上传的数据

13、MapReduce的Shuffle过程中哪个操作是最后做的?
D、合并

14、下面关于MapReduce的描述中正确的是?
D、MapReduce程序的默认数据读取组件是TextInputFormat

15、MapReduce编程模型中以下组件哪个是最后执行的?
C、Reducer
MapReduce编程模型中的执行顺序是:
recordReader --> mapper --> partitioner --> reducer

16、在MapReduce中,哪个组件是用户不指定也不会有默认的?
A、Combiner

17、下列哪种类型的文件不是HDFS集群的元数据存储格式?
D、blk_000003425

18、YARN的调度算法不包括以下哪种?
D、Stack Scheduler

19、关于SecondaryNameNode哪项是正确的?
C、它对目的是帮助NameNode合并编辑日志,减少NameNode的负担和冷启动时的加载时间

20、下列关于使用MapReduce编程模型实现SQL中的join操作错误的是?
C、MapJoin也适合各种join场景,也能实现内连接和各种外链接

21、下列哪种业务场景中,不能直接使用Reducer充当Combiner使用?
D、avg求平均

22、下列关于配置机架感知的相关描述哪项不正确?
B、写入数据的时候多个副本会写到不同机架的 DataNode 中

23、Client端上传文件的时候下列哪项正确?
B、Client端将文件切分为 Block,依次上传

24、下列关于HDFS的描述正确的是?
C、NameNode磁盘元数据不保存Block的位置信息

25、一个MapReduce程序中的MapTask的个数由什么决定?
C、FileInputFormat.getSplits(JobContext job)计算出的逻辑切片的数量

26、以下描述错误的是?
D、TextInputFormat的key是指该记录在文件中的行号

27、以下关于新旧 MapReduce API 的描述错误的是?
B、新API倾向于使用接口方式,而旧API倾向于使用抽象类

28、以下描述错误的是?
D、ReduceTask需要等到所有的map输出都复制完才进行Merge

29、以下哪个组件可以指定对key进行Reduce分发的策略?
C、Partitioner

30、执行一个job,如果这个job的输出路径已经存在,那么程序会?
C、抛出一个异常,然后退出

31、HDFS的是基于流数据模式访问和处理超大文件的需求而开发的,默认的最基本的存储单位是64M,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是?
C、一次写入,多次读写

32、Namenode在启动时自动进入安全模式,在安全模式阶段,说法错误的是?
D、文件系统允许有修改

33、MapReduce框架提供了一种序列化机制,支持这种序列化的类能够在Map和Reduce过程中充当键或值,以下说法错误的是?
C、Hadoop的基本类型Text并不实现WritableComparable接口

34、下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是?
B、为实现细粒度并行,输入分片(InputSplit)应该越小越好

35、有关MapReduce的输入输出,说法错误的是?
B、FileInputFormat中实现的getSplits()可以把输入数据划分为分片,分片数目和大小任意定义

36、关于HDFS的文件写入,正确的是?
C、默认将文件块复制成三份分别存放

热门文章

暂无图片
编程学习 ·

那些年让我们目瞪口呆的bug

程序员一生与bug奋战,可谓是杀敌无数,见怪不怪了!在某知识社交平台中,一个“有哪些让程序员目瞪口呆的bug”的话题引来了6700多万的阅读,可见程序员们对一个话题的敏感度有多高。 1、麻省理工“只能发500英里的邮件” …
暂无图片
编程学习 ·

redis的下载与安装

下载redis wget http://download.redis.io/releases/redis-5.0.0.tar.gz解压redis tar -zxvf redis-5.0.0.tar.gz编译 make安装 make install快链方便进入redis ln -s redis-5.0.0 redis
暂无图片
编程学习 ·

《大话数据结构》第三章学习笔记--线性表(一)

线性表的定义 线性表:零个或多个数据元素的有限序列。 线性表元素的个数n定义为线性表的长度。n为0时,为空表。 在比较复杂的线性表中,一个数据元素可以由若干个数据项组成。 线性表的存储结构 顺序存储结构 可以用C语言中的一维数组来…
暂无图片
编程学习 ·

对象的扩展

文章目录对象的扩展属性的简洁表示法属性名表达式方法的name属性属性的可枚举性和遍历可枚举性属性的遍历super关键字对象的扩展运算符解构赋值扩展运算符AggregateError错误对象对象的扩展 属性的简洁表示法 const foo bar; const baz {foo}; baz // {foo: "bar"…
暂无图片
编程学习 ·

让程序员最头疼的5种编程语言

世界上的编程语言,按照其应用领域,可以粗略地分成三类。 有的语言是多面手,在很多不同的领域都能派上用场。大家学过的编程语言很多都属于这一类,比如说 C,Java, Python。 有的语言专注于某一特定的领域&…
暂无图片
编程学习 ·

写论文注意事项

参考链接 给研究生修改了一篇论文后,该985博导几近崩溃…… 重点分析 摘要与结论几乎重合 这一条是我见过研究生论文中最常出现的事情,很多情况下,他们论文中摘要部分与结论部分重复率超过70%。对于摘要而言,首先要用一小句话引…
暂无图片
编程学习 ·

安卓 串口开发

上图: 上码: 在APP grable添加 // 串口 需要配合在项目build.gradle中的repositories添加 maven {url "https://jitpack.io" }implementation com.github.licheedev.Android-SerialPort-API:serialport:1.0.1implementation com.jakewhart…
暂无图片
编程学习 ·

2021-2027年中国铪市场调研与发展趋势分析报告

2021-2027年中国铪市场调研与发展趋势分析报告 本报告研究中国市场铪的生产、消费及进出口情况,重点关注在中国市场扮演重要角色的全球及本土铪生产商,呈现这些厂商在中国市场的铪销量、收入、价格、毛利率、市场份额等关键指标。此外,针对…
暂无图片
编程学习 ·

Aggressive cows题目翻译

描述&#xff1a; Farmer John has built a new long barn, with N (2 < N < 100,000) stalls.&#xff08;John农民已经新建了一个长畜棚带有N&#xff08;2<N<100000&#xff09;个牛棚&#xff09; The stalls are located along a straight line at positions…
暂无图片
编程学习 ·

剖析组建PMO的6个大坑︱PMO深度实践

随着事业环境因素的不断纷繁演进&#xff0c;项目时代正在悄悄来临。设立项目经理转岗、要求PMP等项目管理证书已是基操&#xff0c;越来越多的组织开始组建PMO团队&#xff0c;大有曾经公司纷纷建造中台的气质&#xff08;当然两者的本质并不相同&#xff0c;只是说明这个趋势…
暂无图片
编程学习 ·

Flowable入门系列文章118 - 进程实例 07

1、获取流程实例的变量 GET运行时/进程实例/ {processInstanceId} /变量/ {变量名} 表1.获取流程实例的变量 - URL参数 参数需要值描述processInstanceId是串将流程实例的id添加到变量中。变量名是串要获取的变量的名称。 表2.获取流程实例的变量 - 响应代码 响应码描述200指…
暂无图片
编程学习 ·

微信每天自动给女[男]朋友发早安和土味情话

微信通知&#xff0c;每天给女朋友发早安、情话、诗句、天气信息等~ 前言 之前逛GitHub的时候发现了一个自动签到的小工具&#xff0c;b站、掘金等都可以&#xff0c;我看了下源码发现也是很简洁&#xff0c;也尝试用了一下&#xff0c;配置也都很简单&#xff0c;主要是他有一…
暂无图片
编程学习 ·

C语言二分查找详解

二分查找是一种知名度很高的查找算法&#xff0c;在对有序数列进行查找时效率远高于传统的顺序查找。 下面这张动图对比了二者的效率差距。 二分查找的基本思想就是通过把目标数和当前数列的中间数进行比较&#xff0c;从而确定目标数是在中间数的左边还是右边&#xff0c;将查…
暂无图片
编程学习 ·

项目经理,你有什么优势吗?

大侠被一个问题问住了&#xff1a;你和别人比&#xff0c;你的优势是什么呢? 大侠听到这个问题后&#xff0c;脱口而出道&#xff1a;“项目管理能力和经验啊。” 听者抬头看了一下大侠&#xff0c;显然听者对大侠的这个回答不是很满意&#xff0c;但也没有继续追问。 大侠回家…
暂无图片
编程学习 ·

nginx的负载均衡和故障转移

#注&#xff1a;proxy_temp_path和proxy_cache_path指定的路径必须在同一分区 proxy_temp_path /data0/proxy_temp_dir; #设置Web缓存区名称为cache_one&#xff0c;内存缓存空间大小为200MB&#xff0c;1天没有被访问的内容自动清除&#xff0c;硬盘缓存空间大小为30GB。 pro…
暂无图片
编程学习 ·

业务逻辑漏洞

身份认证安全 绕过身份认证的几种方法 暴力破解 测试方法∶在没有验证码限制或者一次验证码可以多次使用的地方&#xff0c;可以分为以下几种情况︰ (1)爆破用户名。当输入的用户名不存在时&#xff0c;会显示请输入正确用户名&#xff0c;或者用户名不存在 (2)已知用户名。…