1. 程式人生 > >(基礎:流程一)CDH Solr 一點通

(基礎:流程一)CDH Solr 一點通

流程一: 啟動 收集器 與 索引生成器

該流程內容包括

一:建立Hbase資料表

<Hbase shell>
<!--Hbase表開啟列簇REPLICATION複製功能-->
create 'test',{NAME => 'cf', REPLICATION_SCOPE => 1}
<!--如建表時已設定REPLICATION_SCOPE=>1 , 該步驟省略-->
disable 'test'
alter 'test',{NAME => 'cf', REPLICATION_SCOPE => 1}
enable 'test'

二:生成並設定Solr配置檔案:scheme.xml

(自定義域(名稱,型別,是否建索引,是否儲存),分詞 , 合併其他列等)

<Linux shell>
solrctl instancedir --generate ./test
vi ./test/conf/schema.xml
<!-- solr 索引定義-->
<!-- 
域名隨意,避免與該檔案預設field名字重複,預設有(id,title等)
名稱要與Morphline.conf檔案(該檔案在第四步生成配置)>中的outputField屬性值對應
**屬性多且有講究,該處不做描述
name:自定義域名稱
type:域型別
indexed:是否建索引
stored:是否儲存
-->
<!-- 在<fields>..</fields>中新增--> <field name="title_" type="string" indexed="true" stored="true" />

三:建立collection(收集器,個人理解),並將上一步生成設定的配置檔案上傳Zookeeper,供Solr叢集節點下載使用,然後啟動收集器

四:生成並配置Lily HBase Indexer配置檔案,用於註冊Hbase索引,並啟動該服務(個人理解:索引生成器)(啟動需指定收集器名)