$result是一个数组,其中
total是匹配到的数据总数量
matches是匹配的数据,包含id,attrs这些信息
words是搜索关键字的分词
你可能奇怪为什么没有邮件的内容这些信息,其实sphinx并不会返回像mysql那样的数据数组,因为sphinx本来就没有记录完整的数据,只记录被分词后的数据。
具体还要看matches数组,matches中的ID就是指配置文件中sql_querySELECT语句中的第一个字段,我们配置文件中是这样的
sql_query=SELECTemailid,fromid,toid,subject,content,sendtime,attachementFROMemail
所以matches中的ID是指emailid
至于weight是指匹配的权重,一般权重越高被返回的优先度也最高,匹配权重相关内容请参考文档
attrs是配置文件中sql_attr_中的信息,稍后会提到这些属性的用法
说了这么多,即使搜索到结果也不是我们想要的email数据,但事实sphinx是不记录真实数据的,所以要获取到真实email数据还要根据matches中的ID去搜索mysql的email表,但总体来说这样一来一回的速度还是远远比mysql的LIKE快得多,前提是几十万数据量以上,否则用sphinx只会更慢。
接下来介绍sphinx一些类似mysql条件的用法
可使用如下模式对搜索结果排序:
SPH_SORT_RELEVANCE模式,按相关度降序排列(最好的匹配排在最前面)
SPH_SORT_ATTR_DESC模式,按属性降序排列(属性值越大的越是排在前面)
SPH_SORT_ATTR_ASC模式,按属性升序排列(属性值越小的越是排在前面)
SPH_SORT_TIME_SEGMENTS模式,先按时间段(最近一小时/天/周/月)降序,再按相关度降序
SPH_SORT_EXTENDED模式,按一种类似SQL的方式将列组合起来,升序或降序排列。
SPH_SORT_EXPR模式,按某个算术表达式排序
如果你想一个免费、好用、极速的全文搜索引擎,sphinx无疑是最好的选择,但是不要忘记sphinx的目的:全文检索。不要去想那些乱七八糟条件。你想要把sphinx搜索变得像mysql那样灵活,可完全单独用在一些复杂的多条件搜索,像某些邮件的高级搜索,那么我你还是多花点时间在PHP或者mysql代码的优化上,因为那样可能会让你的搜索变得更慢。
最好的方法是以最简单的方法搜索到内容,将ID交还mysql数据库搜索。