统计数据数据分析控制技术源自相同的自学应用领域,它互相重合,主要包括系统分析、机器自学(ML)和微积分。上面得出了许多实例。
关连准则发掘
关连准则发掘是搜寻三个相同的、貌似毫无关系的统计数据数据集间亲密关系的操作过程。If-then 句子证明了三个统计数据数据点间存有亲密关系的几率。统计数据数据生物学家采用全力支持度和概率密度国际标准来来衡量结论的精确性。全力支持度来衡量有关原素在统计数据数据分散再次出现的振幅,而概率密度则表示 if-then 句子精确的单次。
比如,当客人买回两件货品时,她们也时常会买回第三件有关的货品。分销商能透过对往后买回统计数据数据的关连发掘来辨识新顾客的浓厚兴趣。她们采用统计数据数据分析结论充填新浪网零售店的所推荐部份。
展开分类
展开分类是一类繁杂的统计数据数据分析控制技术,它体能训练 ML 演算法将统计数据数据展开分类为相同的类别。它采用计算机程序和前段时间邻等统计数据方式来辨识类别。在大部份那些方式中,演算法都是用未知的统计数据数据展开分类展开事先程式设计,以揣测新统计数据数据原素的类别。
比如,策略师能透过采用苹果公司和土豆的已标影像来体能训练统计数据数据分析应用软件。应用软件能精确地预估新相片是苹果公司、土豆却是其它蔬果。
集群
集群是根据多个统计数据数据点的相似性将其分在一组。它相同于展开分类,因为它不能按特定类别区分统计数据数据,但能从它的相似性中找到模式。统计数据数据分析结论是一组集群,其中每个集合都相同于其它组,但每个集群中的对象在某些方面是相似的。
比如,在处理调查的多元统计数据数据时,集群分析能帮助展开市场研究。市场研究人员采用集群分析将消费者划分为相同的细分市场,并更好地了解相同群体间的亲密关系。
序列和路径分析
统计数据数据分析应用软件还能寻找导致后续事件的特定事件或值集的模式。它能辨识定期发生的统计数据数据变化或随时间起伏的统计数据数据点。
比如,一家企业可能会采用路径分析来发现某些产品的销售在节假日前猛增,或者注意到天气变暖会使更多人访问其网站。