编辑: 5天午托 2018-09-17
CDA LEVEL II 大数据分析师模拟题 第1页,共29 页 版权所有,侵权必究 CDA LEVEL II 大数据分析师模拟题

一、单选题(每题 0.

5 分,共计

50 分) 1. 按下( A )键能终止当前运行的命令 A. Ctrl-C B. Ctrl-F C. Ctrl-B D. Ctrl-D 2. ls 命令有很多的参数,显示所有文件,包括隐藏文件的参数是( A ) A. -a B. -l C. Cr D. --help 3. 若要将鼠标从 VM 中释放出来,可按( A )键来实现 A. Ctrl + Alt B. Ctrl +Alt +Del C. Ctrl +Alt +Enter D. Ctrl +Enter 4. 除非特别指定,cp 假定要拷贝的文件在下面哪个目录下( D ) A. 用户目录 B. home 目录 C. root 目录 D. 当前目录 5. 用 rm -i ,系统会提示什么来让你确认( B ) A. 命令行的每个选项 B. 是否真的删除 C. 是否有写的权限 D. 文件的位置 6. 几位学生的某门课成绩分别是

67 分、

78 分、

88 分、

89 分、

96 分, 则 成绩 CDA LEVEL II 大数据分析师模拟题 第2页,共29 页 版权所有,侵权必究 是( B ) A. 品质标志 B. 数量标志 C. 标志值 D. 数量指标 7. 抽样调查与重点调查的主要区别是( D ) A. 作用不同 B. 组织方式不同 C. 灵活程度不同 D. 选取调查单位的方法不同 8. 先对总体中的个体按主要标志加以分类,再以随机原则从各类中抽取一定的 单位进行调查,这种抽样调查形式属于( D ) A. 简单随机抽样 B. 等距抽样 C. 整群抽样 D. 类型抽样 9. 统计指标按所反映的数量特征不同可以分为数量指标和质量指标两种.其中 数量指标的表现形式是( A ) A. 绝对数 B. 相对数 C. 平均数 D. 小数 10. HDfS 中的 block 默认保存几份?( C ) A.

1 份B.

2 份C.

3 份D.不确定 11.对某市全部商业企业职工的生活状况进行调查,调查对象是( B ) A. 该市全部商业企业 CDA LEVEL II 大数据分析师模拟题 第3页,共29 页 版权所有,侵权必究 B. 该市全部商业企业的职工 C. 该市每一个商业企业 D. 该市商业企业的每一名职工 12. 在抽样推断中,可计算和控制的误差是( D ) A. 登记误差 B. 系统性误差(偏差) C. 抽样实际误差 D. 抽样平均误差 13. 下面偏度系数的值表明数据分布形态是右偏的是( A ) A. 1.429 B.

0 C. -3.412 D. -1 14.( B )可以刻画离中趋势. A. 均值 B. 全距 C. 众数 D. 中位数 15. 正态分布有两个参数 ? 与s , ( C ) , 分布越集中, 正态曲线的形状越 扁平 . A. ? 越大 B. ? 越小 C. s 越大 D. s 越小 16. HBase 依赖( D )提供强大的计算能力 A. Zookeeper B. Chubby C. RPC D. MapReduce 17. HFile 数据格式中的 Data 字段用于( A ) CDA LEVEL II 大数据分析师模拟题 第4页,共29 页 版权所有,侵权必究 A. 存储实际的 KeyValue 数据 B. 存储数据的起点 C. 指定字段的长度 D. 存储数据块的起点 18. HFile 数据格式中的 Magic 字段用于( A ) A. 存储随机数,防止数据损坏 B. 存储数据的起点 C. 存储数据块的起点 D. 指定字段的长度 19. 默认情况下,YARN 支持下面哪个调度器. ( C ) A. Fair scheduler B. Capacity scheduler C. FIFO 调度器 D. DRT 调度器 20. HBase 虚拟分布式模式需要( A )个节点? A.

1 B.

2 C.

3 D.最少

3 个21. HBase 分布式模式最好需要( C )个节点? A.

1 B.

2 C.

3 D.最少 22. SQL 语句中的条件用以下哪一项来表达( C ) A. THEN B. WHILE C. WHERE D. IF CDA LEVEL II 大数据分析师模拟题 第5页,共29 页 版权所有,侵权必究 23. 下面哪项工作场景不是 MapReduce 计算框架擅长处理的?( B ) A. 分析 web 日志记录,分析用户的行为 B. 实时分析微博热词 C. 分析气象数据,找出有历史记录以来每年的最高气温 D. 购物篮分析,分析用户购买商品的关联度 24. 在Hadoop 客户端提交数据到 HDFS 上时,数据文件会被分片(split),最佳的 分片策略是( B ) A. 等于两个 HDFS 的block 块大小 B. 等于一个 HDFS 的block 块大小 C. 等于操作系统的文件块大小 D. 大小无所谓 25. SELECT 语句的完整语法较复杂,但至少包括的部分是( B ) A. 仅SELECT B. SELECT,FROM C. SELECT,GROUP D. SELECT,INTO 26. 子表中一个列族下的所有数据统一存放在一个物理文件中,该物理文件对应 于HRegion 中的一个( C ) A. StoreFile B. HFile C. Store D. MemStore 27. 向数据表中更新一条记录用以下哪一项( D ) A. CREATE B. INSERT C. SAVE D. UPDATE 28. 关于 Tableau,以下说法错误的是( D ) : A. Tableau 支持多种格式数据,包括平面文件(比如 Execl,txt 文本),或者是数据 CDA LEVEL II 大数据分析师模拟题 第6页,共29 页 版权所有,侵权必究 库(jdbc,odbc 均可) B.支持多表关联 C.使用 Tableau 分析数据,比传统的数据库查询快

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题