首页 > 代码库 > 【阿里云产品公测】OpenSearch初探

【阿里云产品公测】OpenSearch初探

作者:阿里云用户 yqzzzz

这两天在折腾站内搜索,下午照例上阿里云网站看看ECS,OSS情况,恰巧看到免费公测的活动,咦,OpenSearch,看起来这不就是我要找的东西么!
 
1分钟时间填完申请表,没想到阿里云这么快就给审核通过了,效率,赞!
 
之前考察了国外的Swiftype,还有百度的站内搜索,刚刚花了点时间看了一下OpenSearch集成的基本概念。比较不是很仔细,大致说说对这三者的基本感想。
 
Swiftype
 
硅谷出来的,功能强大,直接可以按照入口URL来索引比如:newooo.com , 会直接把所有的页面做个索引,而且可以设置各种include,exclude,这些不多说,监控搜索情况,关键字这些等都是基本功能也不展开了,这个比较牛的一点是可以调整各关键字的结果页面的显示顺序。不过最后没选择Swiftype,因为屌丝站长只能负担得起free plan,而这个有个硬伤就是做索引只能是7天一次,这个实时性太差了,然后又负担不起收费的plan,所以作罢。
 
百度站内搜索
 
很早就知道了,放弃了swiftype以后就开始看,基本能满足需求,有个特点,说是站内搜索的数据其实跟百度的收录是分开的,然后很搞笑的是sitemap.xml要提交两次,一个给百度的网站页面收录,一个给站内搜索的数据提交,而且两个xml的protocol还不一样,站内搜索的sitemap.xml加了个data的节点,用来标识文章的数据结构。跟OpenSearch的数据结构有点异曲同工。百度的好处是免费用,还能设置结果页广告来盈利。当然结果页的可定制性没OpenSearch高。
 
OpenSearch
 
由于没有正式集成,说得不对的地方请见谅。
基本功能这些不多说了,高大上,该有的都有。从小站的角度说几点感想:
1.用第三方站内搜索的绝大多数应该是微小站吧,大站很多都自己做搜索了,这里还有个数据敏感性的问题在。所以OpenSearch这个巨大数据量处理的卖点吸引力不是很大。小站希望的功能是一键生成数据源,然后简单易用。这个Swiftype做得比较好。
 
2.价格:不确定,这个是最大的问题,也是不想集成的原因,网站马上要上线了,等折腾完,公测结束,然后给个几百上千块一个月的收费方案,那我还不如用Swiftype。
 
3.数据源的问题,只能是OSS或者ODPS,有人说会考虑RDS,我目前在用OSS跟RDS,OSS主要用来放图片的,所以没存储结构化的数据,数据都在RDS,也就是说如果我要集成的话,得用程序把RDS表里的数据生成OSS的机构化数据。这个跟百度生成站内数据sitemap是一样的。至于ODPS,没用过,不多说。
 
最后,我还是再等等吧,等公测结束,看看要不要最终选用OpenSearch.

 

【阿里云产品公测】OpenSearch初探