数据挖掘中如何比较两组高维数据之间的相似度两组数据,分别都有十几个属性;两个数据组有属性重叠,如何用数据挖掘方法计算两组数据的相似度

来源:学生作业帮助网 编辑:作业帮 时间:2024/04/29 13:49:01
数据挖掘中如何比较两组高维数据之间的相似度两组数据,分别都有十几个属性;两个数据组有属性重叠,如何用数据挖掘方法计算两组数据的相似度

数据挖掘中如何比较两组高维数据之间的相似度两组数据,分别都有十几个属性;两个数据组有属性重叠,如何用数据挖掘方法计算两组数据的相似度
数据挖掘中如何比较两组高维数据之间的相似度
两组数据,分别都有十几个属性;两个数据组有属性重叠,如何用数据挖掘方法计算两组数据的相似度

数据挖掘中如何比较两组高维数据之间的相似度两组数据,分别都有十几个属性;两个数据组有属性重叠,如何用数据挖掘方法计算两组数据的相似度
看起来这个问题比较复杂,不是简单地分类、聚类就可以求解.
这个问题是否可以理解为比较两组数据的相似度?主要是比较对于决策变量D(“心脏病”)=Y/N的相似度?就是说两组不同的指标分别对于D的差异?
如果你能在两组数据中分别包含D(“心脏病”)的取值Yes、No,直接比较对于Yes的准确率,不就是两组数据的相似度了吗?
如果你是要做论文,可以将问题搞得复杂些,使其更加学术化;如果只是实际应用,不可以过分拘泥于漂亮的数学模型和复杂的求解过程,只要能够解决实际问题就可以了,对吧?