千文网小编为你整理了多篇相关的《数据挖掘实训总结五篇范文(优秀范文三篇)》,但愿对你工作学习有帮助,当然你在千文网还可以找到更多《数据挖掘实训总结五篇范文(优秀范文三篇)》。
题目:在火车货场车皮编解场,2条轨道连接到2条侧轨道,形成2个铁路转轨栈,其中左边轨道为车皮入口,编号为A;右边轨道为出口,编号为D;2个铁路转轨栈分别编号为C和D如下图所示。编号为a, b, c, ┅, n的各车皮依序停放在车皮的入口处,调度室要安排个车皮进出栈次序,使得在出口处各车皮按照预先制定的顺序依次出站。车皮移动时只能按照从左到右的方向移动。 组织与指导老师:
组长:*
成员:***
指导教师:*
完成时间、地点:
时间:第16周(6月6日~6月10日)
地点:南校区东教学楼2楼机房。
一、需求分析
1、问题描述
掌握队列、栈、树的结构以及基本操作,熟悉for循环语句,if条件语句的嵌套,结构体函数等,从而实现程序的功能。
例如:
typedef struct Stack
{
Data *data;
Data *end;
}Stack;
……
2、实现功能
(1) 对于给定的车皮数n,以及各车皮的出站顺序,编程计算最优调度方案,使得移动车皮的次数最少。
(2) 数据输入:由文件input.txt给出数据。第一行有1个正整数n,表示车皮数;接下来的1行是一个字符串,表示预先确定的车皮的出站顺序。
(3) 数据输出:将计算得到的最优调度方案输出到文件output.txt,文件的第一行使最少移动次数m,接下来的m行使对于最优方案的m次移动。每次移动用“cXY”的3个字符表示,其中c表示车皮编号,X表示其时栈号,Y表示目标栈号。如果无法调度则输出“No Solution!”
二、概要设计
1、抽象数据类型
void ReadData ( void )
{
int i;
FILE *fp;
fp = fopen ( "input.txt", "r" );
if ( fp == NULL )
exit ( __COUNTER__ );
fscanf ( fp, "%d", &total );
if ( total
{
fclose ( fp );
exit ( __COUNTER__ );
}
……、
void Show ( Stack a, char *s )
{
char *tmp, *pc;
char *p = (char*)a.data;
pc = tmp = (char*) malloc ( total + 1 );
while ( p
*pc++ = *p++;
*pc = 0;
printf ( "%s%s", tmp, s );
}
……
if ( d == end )
{
if ( min > count )
{
min = count;
strcpy ( res, tmp );
return;
}
}
count++;
if ( A.end >= A.data )
a = *A.end;
else
a = EOD;
……
2、程序中包含功能模块及模块间的调用关系
各个基本操作都通过公有成员函数实现,然后通过主程序调用来实现程序的功能。
例如:
void Init ( Stack *a, int len )
{
a->data = (Data*) malloc ( len * sizeof(Data) );
memset ( a->data, 0, len * sizeof(Data) );
a->end = a->data - 1;
}
……
void main ( void )
{
ReadData();
Calc( head );
End();
}
三、调试分析
完成情况说明:
编译程序的过程中发现了许多漏洞,调试起来很不方便,经过我和同学的共同努力,终于有了突破性的进展,程序按照预定的时间调试出来了,虽然当中还存在不少的漏洞,但不会影响程序的正常运行。
程序的性能分析:各个操作都是通过公有函数的调用来实现的,其中用到结构体函数,for循环,If语句的嵌套等,通过测试可以实现其预定的功能。 出现的问题及解决方案:
缺失头文件导致的定义无效错误,通过添加头文件即可解决问题;定义字符类型错误,使用正确的函数类型定义即可,for循环的循环语句语法使用不当,导致函数无法实现循环,if条件语句的应用还存在问题,以上所述的编译错误都通过我很同学的认真分析后纠正了。
四、用户使用说明
了解程序的执行过程,输入合法的数值是程序正常运行的关键,输入的数值和开始需要的字符的长度要符合
五、心得体会:
通过多次编写程序,我总结出来一条心得,程序不能写完才调试,而是应该写一个函数调试一个函数,这样才能缩小调试的范围,提高编程的效率,程序编完后在进行一次综合调试,将不完善的函数和功能处理好,才能将程序做到最好!而且,很多时候,一个大的工程并不是一个人就能完成,这就要求我们有团队精神。让我感受最深的是在我调试程序的时候,一个很细微的错误就可能导致程序的出错,正所谓的“细节决定成败”,不管是在学习中 ,生活中,我们都要有一颗善于发现问题,解决问题的新,除此之外,还要有乐于助人的精神。
数据挖掘实训总结
简单来说,数据挖掘是基于“归纳”的思路,从大量的数据中(因为是基于归纳的思路,因此数据量的大小很大程度上决定了数据挖掘结果的鲁棒性)寻找规律,为决策提供证据。从这种角度上来说,数据挖掘可能并不适合进行科学研究,因为从本质上来说,数据挖掘这个技术是不能证明因果的,以一个最典型的例子来说,例如数据挖掘技术可以发现啤酒销量和尿布之间的关系,但是显然这两者之间紧密相关的关系可能在理论层面并没有多大的意义。不过,仅以此来否定数据挖掘的意义,显然就是对数据挖掘这项技术价值加大的抹杀,显然,数据挖掘这项技术从设计出现之初,就不是为了指导或支持理论研究的,它的重要意义在于,它在应用领域体现出了极大地优越性。
现代的商业社会中,充斥着大量的信息,如何从这些信息中迅速的定位并找到有价值的信息显然可以成为企业制胜的关键,毕竟在这个信息过载的世界里,基于多少信息所做出的决策会显著的影响决策的质量和科学性,而数据挖掘技术就使这种归纳决策得到了实现。数据挖掘可以从企业数据仓库中定位有价值的、但是并未事先被企业员工或者高层管理者知道的信息,并对这些信息进行一些基本的分析(例如聚类、回归等)。从目前的应用来看,将数据挖掘技术应用在营销或企业决策方面,管理者遵循的逻辑是“消费者过去的行为会极大的影响甚至决定未来所做出的选择”,而过往真实的数据显然就是对消费者行为最真实的记录,从中挖掘出的规律对于企业决策自然是至关重要的。
一项好的技术并不一定要面面俱到,就像数据挖掘一样,目前来说,这项技术在理论研究中应用可能并不合适,但是用于实际决策或者企业营销的过程中,显然可以令过往数据完备的企业获益匪浅
下面是个人对数据挖掘技术的认识,和大家讨论一下:
1、数据挖掘是种知识发现,是种foresight(预见性)。它不同于数据分析的就是它从大量的数据中找到信息,信息中发掘出知识,拿这个知识来指导实践。而数据分析就是insight,找到这种现象的原因。
2、数据挖掘是一个过程,需要有反馈,验证,循环往复。不要期望很快就能得到一个好的模型或结论;不要期望一下找到最优。
3、数据挖掘是任务驱动的,不合适由研发来推动。商业数据挖掘应该由市场或销售来发起,他们会发现一些最根本的问题,而这些问题往往是用“提高”或“改善”这样的语言来描述的。并且他们能提供一些经验,有效帮助研发来明确关键的特征,需要特别关注反馈的特征。描述问题,准备数据是数据挖掘的关键。
4、常用的数据挖掘方法就这么几类,模型虽然有好有坏,但是原理是一样的。建议用通用的工具,最基本的方法先对数据进行一下分析,看看哪类模型是最适合的。常用的方法是聚类(K-means),分类(决策树),关联分析(Apriori)。常用的工具SPSS,Minitab,SAS.
如果你要成为一名研发人员,为了数据挖掘而数据挖掘是不合适的,为了测试某个模型而去用某个模型也是不合适的,一拿到任务就定制算法更是不合适的。分析要实现什么,能实现什么需要广泛收集大家的意见,特别是做决策的。我们要比决策者更关注得到结论的过程,并要想方设法努力展现。
第4章 无监督学习
4.1基本概念
图4.1数据点的三个自然
4.2k-均值聚类
4.2.1k-均值算法
图4.2k-均值算法
计算机组成原理(第三版)
图4.3k-均值算法的运行实例
4.2.2k-均值算法的硬盘版本
图4.4一个简单的k-均值算法硬盘版本
计算机组成原理(第三版)
3 4.2.3优势和劣势
图4.5存在和不存在异常值情况下的聚类
图4.6不理想的初始种子(聚类中心)
图4.7理想的初始种子(聚类中心) 4
计算机组成原理(第三版)
图4.8自然(不规则)聚类和k-均值聚类
4.3聚类的表示
4.3.1聚类的一般表示方法
图4.9聚类的规则描述
4.3.2任意形状的聚类
图4.10两个自然聚类以及
计算机组成原理(第三版)
5 4.4层次聚类
图4.11层次聚类的一个例子
图4.12合并层次聚类算法
图4.13合并层次聚类算法的工作
4.4.1单链接方法
图4.14单链接方法的连锁反应
计算机组成原理(第三版) 4.4.2全链接方法
图4.15采用全链接方法聚类
4.4.3平均链接方法 4.4.4优势和劣势
4.5距离函数
4.5.1数值的属性(Numeric Attributes) 4.5.2布尔属性和符号属性(Binary and Nominal Attributes)
图4.16两个只具有布尔属性数据点的混合矩阵
计算机组成原理(第三版)
7 4.5.3文本文档
4.6数据标准化 4.7混合属性的处理 4.8采用哪种聚类算法 4.9聚类的评估
图4.17带有熵和纯度值的混合矩阵
计算机组成原理(第三版) 4.10发现数据区域和数据空洞
图4.18用决策树来区分数据区域和空洞区域
推荐专题: 数据挖掘实训总结五篇范文