文本分类系统的设计与实现.doc


约38页编号:129-1470917DOC格式手机打开展开
文本分类系统的设计与实现,摘要 分类是数据挖掘中一项非常重要的任务,在现实生活中有着广泛的应用。构造分类器的方法很多,常见的有贝叶斯网络、决策树、基于实例的学习、人工神经网络、支持向量机等。虽然朴素贝叶斯分类器基于“在给定类标记时属性值之间相互条件独立”的假设不现实,但是有监督学习表明:其分类性能仍然可与决策树算法、k-...

内容介绍
文本分类系统的设计与实现
摘要 分类是数据挖掘中一项非常重要的任务,在现实生活中有着广泛的应用。构造分类器的方法很多,常见的有贝叶斯网络、决策树、基于实例的学习、人工神经网络、支持向量机等。虽然朴素贝叶斯分类器基于“在给定类标记时属性值之间相互条件独立”的假设不现实,但是有监督学习表明:其分类性能仍然可与决策树算法、k-近邻算法等经典算法相当。
虽然单分类器的性能不差,但在日益需求更高的性能的今天,单分类器已经不能够满足更高的需求。因此集成学习已经成为了机器学习和数据挖掘领域中的热门研究方向。
本文介绍和分析了文本分类中常用的分类算法,然后描述了一个基于朴素贝叶斯分类的集成学习方法的向量文本分类系统的基本组成,并给出了一个系统的基本构架。在此基础上设计并实现了一个基于朴素贝叶斯分类的集成学习的向量文本分类系统。
TA们正在看...
- db31-160-2005盒饭卫生和营养要求.doc
- db31-359-2006足浴服务卫生要求.doc
- db31405-2012上海市集中空调通风系统卫生管理规范.doc
- db33t1009-2001圆林绿化技术规程.doc
- db331055-2008环境照明工程技术规范.doc
- db33217.1-2007桑蚕种第1部分桑蚕种质量.doc
- db33250.1-2006无公害脐橙第1部分苗木.doc
- db33250.4-2006无公害脐橙第4部分质量安全要求.doc
- db33257.3-2005径山茶第3部分质量安全要求.doc
- db33261.4-2005笋竹两用毛竹林第4部分笋质量安全要...doc