下列选项中 采用边界值平滑_数据挖掘期末考题(答案).doc

华南理工大学计算机科学与工程学院2012—2013学年度第二学期期末考试《数据仓库与数据挖掘技术》试 卷(假的)专业:计算机科学与技术 年级:2010 姓名: 学号:

注意事项:1. 本试卷共四大题,满分100分,考试时间120分钟;2. 所有答案请直接答在试卷上;

题号一二三四总分得分一.填空题(每空1分,共20分)1.数据仓库的特征包括_面向主题________、___集成_________、__时变_________和非易失性。2.数据仓库的三种数据模式包括_星形模式_、__雪花形模式__________、___事实星座形模式________。3.仓库数据库服务器、_OLAP服务器________、__前端客户__________为数据仓库的多层结构。4. OLAP技术多维分析过程中,多维分析操作包括?__上卷___、__下钻____、___切片____、__切块__________、__转轴_________等。5. 知识发现过程的主要步骤有:数据清理、__数据集成__________、__数据选择___、数据交换、_数据挖掘________、___模式评估_________、__知识表示_______。6. 数据仓库的视图的分类有:自顶向下视图、_数据源视图________、数据仓库视图、_商务视图_________。

二.简答题(每题6分,共42分)1.简述处理空缺值的方法。1、忽略该记录 2、手工填写空缺值3、使用默认值4、使用属性平均值5、使用同类样本平均值6、使用最可能的值2.挖掘的知识类型。1、概念/类描述:特征化和区分2、挖掘频繁模式、关联和相关3、分类和预测4、聚类分析5、离群点分析6、演变分析

何为OLTP与OLAP及他们的主要区别。联机事务处理OLTP (on-line transaction processing);联机分析处理OLAP (on-line analytical processing);OLTP和OLAP的区别:用户和系统的面向性:OLTP面向顾客,而OLAP面向市场;数据内容:OLTP系统管理当前数据,而OLAP管理历史的数据;数据库设计:OLTP系统采用实体-联系(ER)模型和面向应用的数据库设计,而OLAP系统通常采用星形和雪花模型;视图:OLTP系统主要关注一个企业或部门内部的当前数据,而OLAP 系统主要关注汇总的统一的数据;访问模式:OLTP访问主要有短的原子事务组成,而OLAP系统的访问大部分是只读操作,尽管许多可能是复杂的查询。

在数据挖掘之前为什么要对原始数据进行预处理?数据预处理对于数据仓库和数据挖掘都是一个重要的问题,因为现实中的数据多半是不完整的、有噪声的和不一致的。数据预处理包括数据清理、数据集成、数据交换和数据规约。

为什么需要构建单独隔离的数据仓库?使得操作数据库与数据仓库都获得高性能DBMS—OLTP: 访问方法, 索引, 并发控制, 数据恢复。Warehouse—OLAP: 复杂OLAP查询, 多维视图, 整理。对数据与功能的要求不同:丢失的数据: 决策支持需要历史数据,而传统数据库并不一定维护历史数据。数据整理: 决策支持需要对异构数据源进行数据整理 。数据质量: 不同的数据源常常具有不一致的数据表示,编码结构与格式。关联规则的确定性度量与实用性度量的分类及定义。支持度和置信度是关联规则的确定性度量与实用性度量。(1)支持度:事务包含XUY的概率,即support=P(XUY) 支持度计算: Support(X?Y) = P(X U Y )={XUY}的支持度计数(模式或项集在DB中出现的频率)/事务表中总的事务数(2)置信度:事务同时包含X与Y的条件概率:confidence=P(Y|X) 置信度计算:Confidence(X?Y) = P(Y|X)=P(XUY)/P(X) = {XUY}支持度计数/X支持度计数

简述分箱平滑的方法。对数据进行排序,然后把它们划分到箱,然后通过箱平均值,箱中值或者箱边界值进行平滑。分箱的方法主要有:① 等深分箱法 ② 等宽分箱法数据平滑的方法主要有:平均值法、边界值法和中值法

三.计算题(共38分)1.一个食品连锁店每周的事务记录如下表所示,其中每一条事务表示在一项收款机业务中卖出的项目,假定supmin=40%,confmin=40%,使用Apriori算法计算生成的关联规则,标明每趟数据库扫描时的候选集和大项目集。(10分)事务项目T1T2T3T4T5面包、果冻、花生酱面包、花生酱面包、牛奶、花生酱啤酒、面包啤酒、牛奶

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/304382.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

昨日搬至办公室的书籍

由于家里地方小,总有一部分书籍需要跟着我辗转至各公司。其中一些公司只能让我放抽屉(地方小)甚至地板上,而有一些公司就能让我把书都摞桌子上。昨天下午我特地来了一次办公室,只为搬运书籍。灭霍霍,可真是…

如何在 ASP.Net Core 中对接 WCF

在 REST API 出现之前,SOAP (Simple Object Access Protocol) 一直都是基于 web 的标准协议,虽然现在 REST 大行其道,但在平时开发中总会遇到对接第三方服务采用的是基于SOAP协议的场景,在这篇文章中,我们将会讨论如何…

什么是区块链? 区块链的入门教程~

区块链(blockchain)是眼下的大热门,新闻媒体大量报道,宣称它将创造未来。可是,简单易懂的入门文章却很少。区块链到底是什么,有何特别之处,很少有解释。下面,我就来尝试,…

linux提升权限命令提示符,win10如何直接使用命令提示符提高管理员权限?

原标题:win10如何直接使用命令提示符提高管理员权限?在使用普通的命令提示符时,如果遇到需要管理员权限的操作,往往需要重新打开一个具有管理员权限的命令提示符页面进行操作。而在Linux操作系统中,可以通过输入su来获取系统最高…

require引入js vue_请教 关于使用require 引入vue 和公共js的问题

移动端布局 计算font-size的1、引入公共样式失败。没有去计算2、aa 是vue 引入成功。 但是 我以后一个文件需要一个vue 文件 应该怎么引入好点啊。 怎么分解开进行引入?3、在vue的情况下。 引入Mint UI我理解是在main的文件里面加载vue Mint ui 和一些公共样式。 在页面引入ma…

探索 .NET Core 依赖注入的 IServiceProvider

在上一篇文章中,我们学习了Microsoft.Extensions.DependencyInjection中的IServiceCollection,包括服务注册转换为ServiceDescriptors,然后添加到集合中。探索 .NET Core 依赖注入的 IServiceCollection[1]在本文中,我们会学习 IS…

《WinForm开发系列之控件篇》Item1 BackgroungWorker

cranejuan的专栏 BackgroundWorker实现原理 winfom組件---BackgroundWorker转载于:https://www.cnblogs.com/Sue_/articles/1657254.html

如何快速高效地学习互联网新技术

我们生活在一个振奋人心的时代,区块链、人工智能、大数据,现在各种新技术层出不穷,那么如何快速高效地学习互联网新技术呢?我认为首先思想要主动求变,敢于跳出自己的舒适区,对任何技术都抱有开放的心态。贪…

linux上用的端口转发工具,linux下最简单好用的的端口转发工具

linux下最简单好用的的端口转发工具解压安装tar zxvf rinetd.tar.gzmakemake install编辑配置vi /etc/rinetd.conf0.0.0.0 8080 172.19.94.3 80800.0.0.0 2222 192.168.0.103 33891.2.3.4 80 192.168.0.10 80说明一下(0.0.0.0表示本机绑定所有可用地址)将所有发往本机8080端口的…

.NET Core用数据库做配置中心加载Configuration

本文介绍了一个在.NET中用数据库做配置中心服务器的方式,介绍了读取配置的开源自定义ConfigurationProvider,并且讲解了主要实现原理。1、 为什么用数据库做配置中心在开发youzack.com这个学英语网站的时候,需要保存第三方接口AppKey、JWT等配…

abaqus质量缩放系数取值_ABAQUS/Explicit质量缩放(MASS SCALING)使用心得  [转simwe]...

概要准静态分析或某些动态分析中,少数尺寸较小的单元控制稳态时间增量,为提高计算效率,ABAQUS/Explicit常采用质量缩放的方法。质量缩放可用于:1、缩放整个模型,单个单元或单元组的质量2、多步分析中,缩放每…

linux 修改默认脚本,linux环境初始脚本

#//把下面内容,做成init.sh文件,放到liunx任意目录下,用bash ./init.sh#//执行,或用chmod -R 777 init.sh#//赋权后,再用./init.sh#//执行#!/bin/bash## 初始centOS系统环境# 1. 在线安装一些编译环境# 2. 关闭防火墙#…

python lock_python lock一步步教你理解Python装饰器

请仔细看我们的decorator实例。我们定义了一个接受单个参数some_func的名为outer的函数。在outer内部我们定义了一个名为inner的嵌套函数。inner函数打印一个字符串然后调用some_func,在#1处缓存它的返回值。some_func的值可能在每次outer被调用时不同,但…

Abp Vnext Pro 的 Vue 实现版本

Abp Vnext Pro 的 Vue 实现版本开箱即用的中后台前端/设计解决方案知识点.Net Core5.0Abp Vnext 4.x ,Ant Design, Vue2.xMysql,Redis,Hangfire,ES(日志可选),Nocas(可选,未集成,计划中),RabbitMq(未集成,计划中)微服务架构设计, DDD 实践容器化 CI CD系统功能用户管理角色管理…

2018年,该转行AI工程师吗?

如此火爆的AI,会不会像Android和iOS一样,五年后归于平淡?转型AI真的有必要吗?2017年,AI就像一个点石成金的神器,所有的行业,任何的创业,抑或是职位背景,只要沾着这个词&a…

Exchange 2010 DAG转载

http://bisheng.blog.51cto.com/409831/270739转载于:https://blog.51cto.com/delkar/273586

linux tomcat8 启动慢,Linux系统下Tomcat8启动速度很慢的解决方法

前言最近在工作中遇到一个问题,在Linux下Tomcat 8启动很慢,且日志上无任何错误,在日志中查看到如下信息:Log4j:[2017-08-2715:47:11] INFO ReadProperty:172 - Loading properties file from class path resource [resources/jdbc…

使用 Tye 辅助开发 dotnet 应用程序

newbe.pro 已经给我们写了系列文章介绍Tye 辅助开发k8s 应用:使用 Tye 辅助开发 k8s 应用竟如此简单(一)使用 Tye 辅助开发 k8s 应用竟如此简单(二)使用 Tye 辅助开发 k8s 应用竟如此简单(三)使…

postgresql点云las_PostgreSQL 调研

摘要本文介绍了Postgresql的功能和集群构建方案,及集群读写分离、负载均衡和分库功能的实现方法。1. 简介PostgreSQL是一个功能强大的、可靠性高、能保证数据完整性和一致性对象的开源关系数据库系统。它可以运行在所有主流的操作系统上,包括Linux、UNIX…

如何正确执行碎片整理或在群集共享卷(CSV)上使用CHKDSK命令

在使用CHKDSK和碎片整理操作期间,需要将CSV设置为维护模式,此时只有协调器访问磁盘。微软提供了cmdlet的Repair-ClusterSharedVolume选项,该选项可以自动将某个磁盘设置为维护模式,并执行chkdsk /磁盘整理操作,然后再关…