1. 程式人生 > >elasticsearch:搜尋常見相關度分數優化方法——筆記

elasticsearch:搜尋常見相關度分數優化方法——筆記

一、提權,又見boost

GET /forum/article/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "title": {
              "query": "java spark",
              "boost": 2
            }
          }
        },
        {
          "match": {
            "content": "java spark"
} } ] } } }

二、降分,你不要的也顯出來不過在後面

GET /forum/article/_search 
{
  "query": {
    "boosting": {
      "positive": {
        "match": {
          "content": "java"
        }
      },
      "negative": {
        "match": {
          "content": "spark"
        }
      },
      "negative_boost"
: 0.2 } } }

包含了negative term的doc,分數乘以negative boost,分數降低

三、不需要分數,直接走constant_score加filter,分數都是1

GET /forum/article/_search 
{
  "query": {
    "bool": {
      "should": [
        {
          "constant_score": {
            "query": {
              "match": {
                "title": "java"
              }
            }
          }
        },
        {
          "constant_score"
: { "query": { "match": { "title": "spark" } } } } ] } } }

四、重構,用處不大,注意第二個bool

GET /forum/article/_search 
{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "content": "java"
          }
        },
        {
          "match": {
            "content": "spark"
          }
        },
        {
          "bool": {
            "should": [
              {
                "match": {
                  "content": "solution"
                }
              },
              {
                "match": {
                  "content": "beginner"
                }
              }
            ]
          }
        }
      ]
    }
  }
}

相關推薦

elasticsearch搜尋常見相關度分數優化方法——筆記

一、提權,又見boost GET /forum/article/_search { "query": { "bool": { "should": [ {

27.四種常見相關度分數優化方法

什麽 OS -c ould ack 四種 AC 查詢語句 spark 對相關度評分進行調節和優化的常見的4種方法 一、query-time boost, 如果認為某一個term的比較重要,就把這個term的權重設的大一點,也就是把boost的值設的大一點。

常見的凸優化方法

本文轉載自多個地方,僅用作個人學習,如需刪除請見諒並聯系本人。 為什麼凸優化這麼重要?見知乎,寫的很好 https://www.zhihu.com/question/24641575 http://blog.csdn.net/zkq_1986/article/details/52317258

鎮江SEO搜尋優化百度秒收錄小方法

鎮江SEO搜尋優化的圈子相對較小,很多SEO人員喜歡追求極致的SEO策略,比如:百度秒收錄,而實際上,並沒有嚴格意義上的秒收錄。 所謂的百度秒收錄,只是一個形象的比喻,達到分鐘級的收錄,目前來看還是可以的。 那麼,鎮江SEO搜尋優化:百度秒收錄小方法有哪些? 根據以往鎮江SEO搜尋

機器學習中常見優化方法梯度下降法、牛頓法擬牛頓法、共軛梯度法、拉格朗日乘數法

機器學習中常見的優化方法: 梯度下降法、牛頓法擬牛頓法、共軛梯度法、拉格朗日乘數法 主要內容 梯度下降法 牛頓法擬牛頓法 共軛梯度法 拉格朗日乘數法   許多機器學習演算法,往往建立目標函式(損失函式+正則項),通過優化方法進行優化,根據訓練

MySQL性能優化方法緩存參數優化

內存大小 提高 算法 mysq 表數據 沒有 級別 data val 原文鏈接:http://isky000.com/database/mysql-perfornamce-tuning-cache-parameter 數據庫屬於 IO 密集型的應用程序,其主要職責就是數據的

MySQL性能優化方法索引優化

pan mysql- can 優化 一位 告訴 scan 圖書館 通過 原文鏈接:http://isky000.com/database/mysql-performance-tuning-index 大家都知道索引對於數據訪問的性能有非常關鍵的作用,都知道索引可以提高數據訪

MySQL性能優化方法表結構優化

嚴格 字符類 datetime 分時 問題: utf 重建表 數據類型 如果 原文鏈接:http://isky000.com/database/mysql-perfornamce-tuning-schema 很多人都將 數據庫設計範式 作為數據庫表結構設計“聖經”,認為只要

機器學習中常見優化方法匯總

bsp keep atl 之前 ima http bject ESS ati http://www.scipy-lectures.org/advanced/mathematical_optimization/index.html#a-review-of-the-differ

【8】Caffe學習系列solver優化方法

上文提到,到目前為止,caffe總共提供了六種優化方法: Stochastic Gradient Descent (type: "SGD"), AdaDelta (type: "AdaDelta"), Adaptive Gradient (type: "AdaGrad"),

elasticsearch 筆記十一搜尋請求和timeout

{ "took": 10, //花費多少ms "timed_out": false, "_shards": { "total": 9, //到多少shard "successful": 9, "failed": 0 }, "hits": {

elasticsearch(12)用function_score自定義相關度分數演算法

轉載自CSDN本文連結地址: ElasticSearch用function_score自定義相關度分數演算法 需求 在field: tile 和 content 中查詢 java spark 的doc 要求follower_num越多的 doc 分數越高。(看帖子的人越

Elasticsearch實踐(二)搜尋

本文以 Elasticsearch 6.2.4為例。 經過前面的基礎入門,我們對ES的基本操作也會了。現在來學習ES最強大的部分:全文檢索。 準備工作 批量匯入資料 先需要準備點資料,然後匯入: wget https://raw.githubusercontent.com/elastic/

leetcode的python實現 刷題筆記35搜尋插入位置的暴力解法和優化解法

  給定一個排序陣列和一個目標值,在陣列中找到目標值,並返回其索引。如果目標值不存在於陣列中,返回它將會被按順序插入的位置。 你可以假設陣列中無重複元素。 示例 1: 輸入: [1,3,5,6], 5 輸出: 2 示例 2: 輸入: [1,3,5,6],

tensorflow學習(4)損失函式+優化方法

一、損失函式 提起損失函式,大概最常用的就是交叉熵和均方誤差了。 1.交叉熵損失函式:針對分類問題 假設某個樣例的正確答案是(1,0,0),預測值是[0.5,0.4,0.1] 那麼其交叉熵為H((1,0,0),(0.5,0.4,0.1))=-(1log0.5+0log0.4+0*log

【計算機通訊】FTP伺服器主機環境配置+Serv-U安裝與破解+常見問題及解決方法

搭建FTP伺服器,這事並不困難,照著下述步驟做,你也可以成為伺服器大神!!! 第一步,瞭解FTP的功能以及工作原理 這位博主寫得很通俗易懂,我就不班門弄斧了 第二步,主機環境配置 1.控制面板>程式>啟用或關閉Windows功能>… 照

神經網路優化演算法從梯度下降到Adam方法

調整模型更新權重和偏差引數的方式時,你是否考慮過哪種優化演算法能使模型產生更好且更快的效果?應該用梯度下降,隨機梯度下降,還是Adam方法? 這篇文章介紹了不同優化演算法之間的主要區別,以及如何選擇最佳的優化方法。 什麼是優化演算法? 優化演算法的功能,

優化方法總結SGD,Momentum,AdaGrad,RMSProp,Adam

1.SGD Batch Gradient Descent 在每一輪的訓練過程中,Batch Gradient Descent演算法用整個訓練集的資料計算cost fuction的梯度,並用該梯度對模型引數進行更新: Θ=Θ−α⋅▽ΘJ(Θ)Θ=Θ−α⋅▽ΘJ(

移動端IM開發者必讀(二)史上最全移動弱網路優化方法總結

1、前言 本文接上篇《移動端IM開發者必讀(一):通俗易懂,理解行動網路的“弱”和“慢”》,關於行動網路的主要特性,在上篇中已進行過詳細地闡述,本文將針對上篇中提到的特性,結合我們的實踐經驗,總結了四個方法來追求極致的“爽快”:快鏈路、輕往復、強監控、多非同步,從理論講到實

大資料篇Elasticsearch分散式搜尋與分析引擎

Elasticsearch簡介 Elasticsearch是一個實時的分散式搜尋和分析引擎。它可以幫助你用前所未有的速度去處理大規模資料。 它可以用於全文搜尋,結構化搜尋以及分析,當然你也可以將這三者進行組合。 Elasticsearch是一個建立在全文搜尋引擎 Apa