1. 程式人生 > >Solr查詢語法總結-引數說明

Solr查詢語法總結-引數說明

1、常用查詢引數說明  
    q - 查詢字串,必須的。  
    fl - 指定返回那些欄位內容,用逗號或空格分隔多個。  
    start - 返回第一條記錄在完整找到結果中的偏移位置,0開始,一般分頁用。  
    rows - 指定返回結果最多有多少條記錄,配合start來實現分頁。  
    sort - 排序,格式:sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]… 。示例:(inStock desc, price asc)表示先 “inStock” 降序, 再 “price” 升序,預設是相關性降序。  
    wt - (writer type)指定輸出格式,可以有 xml, json, php, phps, 後面 solr 1.3增加的,要用通知我們,因為預設沒有開啟。  
    fq - (filter query)過慮查詢,作用:在q查詢符合結果中同時是fq查詢符合的,例如:q=mm&fq=date_time:[20081001 TO 20091031],找關鍵字mm,並且date_time是20081001到20091031之間的。官方文件:

http://wiki.apache.org/solr/CommonQueryParameters  
    不常用  
    q.op - 覆蓋schema.xml的defaultOperator(有空格時用"AND"還是用"OR"操作邏輯),一般預設指定  “OR”  
    df - 預設的查詢欄位,一般預設指定  
    qt - (query type)指定那個型別來處理查詢請求,一般不用指定,預設是standard。  
    其它  
    indent - 返回的結果是否縮排,預設關閉,用 indent=true|on 開啟,一般除錯json,php,phps,ruby輸出才有必要用這個引數。  
    version - 查詢語法的版本,建議不使用它,由伺服器指定預設值。  
    
    solrconfig.xml的配置例項  
查詢配置(以上引數項都可以配置到該配置檔案)  
<requestHandler name="/select" class="solr.SearchHandler">  
     <lst name="defaults">  
       <str name="echoParams">explicit</str>  
       <int name="rows">10</int>

       <str name="defType">edismax</str>   //使用的是solr 擴充套件的查詢解析器

      <str name="q.alt">*:*</str>  
      <str name="fq">sell_price:[1 TO *]</str>  
      <str name="hl">true</str>  
      <str name="hl.fl">room_name</str>  
           <str name="bf">sum(product(termfreq(room_status,"dzz"),1.2),1)</str> //額外的評分欄位,這個是可以影響score的打分的  
      <str name="pf">  //要查詢的欄位  
            room_name house_code room_code zr_house_code hire_commissioner_name broker_name rating_address resblock_name district_name subway_station_name subway_line_name  
      </str>  
      <str name="qf"> //各自段分配的權重  
            room_name^5 house_code room_code zr_house_code  hire_commissioner_name broker_name rating_address resblock_name^2 district_name subway_station_name subway_line_name  
      </str>  
     </lst>  
</requestHandler>

另外schema.xml的defaultOperator引數是個很重要的引數,預設是“OR”,意思是要查詢的關鍵詞做完分詞後的詞做 “OR”連線,然後再做查詢,而“AND”呢,要至少全包含要搜尋的關鍵詞才行。

2、Solr的檢索運算子 
     “:” 指定欄位查指定值,如返回所有值*:*²  
     “?”²表示單個任意字元的通配  
     “*” 表示多個任意字元的通配(不能在檢索的項開始使用*或者?符號)²  
     “~”²表示模糊檢索,如檢索拼寫類似於”roam”的項這樣寫:roam~將找到形如foam和roams的單詞;roam~0.8,檢索返回相似度在0.8以上的記錄。  
    ²鄰近檢索,如檢索相隔10個單詞的”apache”和”jakarta”,”jakarta apache”~10  
     “^”²控制相關度檢索,如檢索jakarta apache,同時希望去讓”jakarta”的相關度更加好,那麼在其後加上”^”符號和增量值,即jakarta^4 apache  
     布林操作符AND、||²  
     布林操作符OR、²&&  
     布林操作符NOT、!、-²(排除操作符不能單獨與項使用構成查詢)  
     “+” 存在操作符,要求符號”+”後的項必須在文件相應的域中存在²  
     ( ) 用於構成子查詢²  
    ² [] 包含範圍檢索,如檢索某時間段記錄,包含頭尾,date:[200707 TO 200710]  
     {}²不包含範圍檢索,如檢索某時間段記錄,不包含頭尾  
    date:{200707 TO 200710}  
     " 轉義操作符,特殊字元包括+ -² && || ! ( ) { } [ ] ^ ” ~ * ? : "  
     
非空資料的查詢 比如:fq=fcode:['' TO *] 查詢fcode非空的資料

取反例項:fq=!fstate:1

3、facet查詢

分類統計 facet  
    q=*:*&facet=true&facet.field=cat&facet.field=inStock  //按cat  inStock進行分類統計  
    
    q=ipod&facet=true&facet.query=price:[0 TO 100]&facet.query=price:[100 TO *]  //區間統計 價格在0-100 和100-無窮大的

--solr的分組查詢(facet)  
http://IP:port/solr/room/select?rows=0&q=bizcircle_code:XXXXXX&facet=on 
&facet.field=resblock_id&facet.field=resblock_name&facet.limit=3   //同一個bizcircle_code下的 前三個resblock 各自的文件數量

facet使用的參考例子