第六章答案
第六章答案
该答案为重庆大学计算机学院Jack Channy所作,由于本人水平有限,难免有错误和不当之处,如有意见请评论或者发邮件至majiecqu@126.com。 6.1 假设有数据集
D
上所有闭频繁项集C,以及每个闭频繁项集的支持度计数。给出一个算法,确定给定的项集是否频繁,如果频繁的话,给出
X
的支持度。
对于该题目的解答,本文给出算法流程图,如下图所示。
6.3 Aprior算法使用子集支持度性质的先验知识。
(a).证明频繁项集的所有非空子集也一定是频繁的。
(b).证明项集s的任意非空子集
s′
的支持度至少与
s
的支持度一样大。
(c).给定频繁项集l和
l
的子集s,证明规则
s′=>l(s′)
的置信度不可能大于
s=>l(s)
的置信度。其中,
s′
是
s
的子集。
(d).Aprior算法的一种变形将事务数据库D中的事务划分成
n
个不重叠的分区。证明在D中频繁的项集至少在
D
<script type="math/tex" id="MathJax-Element-2166">D</script>的一个分区中是频繁的。
还会更新的……