简历搜索有关问题
发布时间:2010-05-20 14:01:29 文章来源:www.iduyao.cn 采编人员:星星草
简历搜索问题
开发平台式ASP.NET,使用数据库是Sql Server,现有数据2000W条,还在增加中。
一个简历包含个人信息、求职意向、工作经验等信息。
查询条件包含性别、期望工作城市、专业、工作年限等。
现在通过数据库分页查询需要30秒左右,数据表的字段相关索引基本上都加了。
想用Lucene.net实现搜索,或者通过Memcached把简历数据都放到缓存中,不知道哪种方式可行?
------解决思路----------------------
这种查询条件的数据不适合放到nosql中。你可以把“个人信息、求职意向、工作经验”按用户ID放到nosql中,每次SQL只查出用户ID,然后到nosql 中取出详细信息。
------解决思路----------------------
两类建议做法:
1、搜索引擎,搜索引擎也能支持多关键字检索;
2、内存够大的话,也可以考虑用CQEngine之类的内存数据库。
------解决思路----------------------
2000W依靠数据库原子搜索,任何数据库都解决了本质问题,楼主提到的两个方向是正确的,哪个最好还是看环境条件,也不排除两者组合架构。
1、Lucene搜索实用性较强,但2KW数据要亲测才有说服力。Solr分布式方案可能更优。
2、缓存设计得好,性能是最佳的。Memcached就算了吧,它缺乏灵活性。可以考虑使用Redis试试,假如服务提供10种组合查询(这已经很强大了),10*10*2000万个ID集合存入Redis的10*10个key中,假如简历ID是int型,大约占用不到800M内存(但实际情况会小得多,因为每个组合查询不可能都命中2千万条),假如每种组合查询的分页结果是20条,Redis查询此20个ID集合,估计能控制在100毫秒之内,楼主可以试试。
友情提示:
信息收集于互联网,如果您发现错误或造成侵权,请及时通知本站更正或删除,具体联系方式见页面底部联系我们,谢谢。
其他相似内容:
-
风生水起才知天高云淡,沧海横流方显英雄本色 百万商业圈云平台免费发布,几十万台电脑变成一台不是梦
百万商业圈分布式云平台功能...
-
登录问题
登录服务器为A 、代理服务器为B 、服务器资源为C.
http发送 验证成功 https请求资源
1.A<---...
-
集群的问题
看了网上很多文章,不是很理解怎么集群的,一下又memcache集群的,一下又mysql集群,还有什么nginx
。
具我了解nginx起的作用...
-
关于计费系统里面的预付费和后付费概念
由于本人刚接触计费系统,对里面的一些概念还有点模糊,特别是对预付费和后付费的理解,我的问...
-
很幽默的讲解六种Socket IO模型(转)
本文简单介绍了当前Windows支持的各种Socket I/O模型,如果你发现其中存在什么错误请务必赐教...
-
数据库读写分离时候可能碰到的问题
数据库读写分离后,如果碰到一种插入操作,是需要对数据做检索后再进行的
例如用户注册,需要检测用...
-
奇怪啊,为何我的一个SWF浏览器缓存文件会被自动清除
我已经设置了这个文件的max-age是100天,也就是说,这个文件会在浏览器缓存里放10...
-
Myfaces日历控件无法弹出
代码如下:
<x:inputCalendar monthYearRowClass="yearMonthHeader"
weekRowClass="w...
-
到底什么才是Web Services
我曾经做过一个android的软件,当时的思想是这样的,我用SSH框架做了一个Web服务端,这个服务端暴露了很多的...
-
Web服务和文件服务分离后的问题
(A是Web服务器,B是文件服务器)
1 A网络映射B,访问A上传文件到B通过映射的路径实现。显示B中的...