专注收集记录技术开发学习笔记、技术难点、解决方案
网站信息搜索 >> 请输入关键词:
您当前的位置: 首页 > 企业开发

稿件的内容识别

发布时间:2010-06-06 16:56:41 文章来源:www.iduyao.cn 采编人员:星星草
文章的内容识别
假设现在有体育,娱乐,汽车等类别,那如何根据一篇文章的内容识别其类别呢?
(1)如果采用关键词方法,数据库如何设计?
(2)如何让程序具有人工智能?
(3)中文或者日文的话,怎样对文章进行分词啊?
------解决方案--------------------
建议你看一下Data mining: practical machine learning tools and techniques 和Data Mining: Concepts and Techniques这两本书,讲到了人工智能及数据挖掘的东西.关于多语言的问题,无论是关键词还是文章内容建议统一用unicode方式存取,这样比较的时候就不存在编码转化的问题了。
友情提示:
信息收集于互联网,如果您发现错误或造成侵权,请及时通知本站更正或删除,具体联系方式见页面底部联系我们,谢谢。

其他相似内容:

热门推荐: