(Translated by https://www.hiragana.jp/)
Lucene - 维基百科,自由的百科全书 とべ转到内容ないよう

Lucene

本页使用了标题或全文手工转换
维基百科ひゃっか自由じゆうてき百科ひゃっかぜん
Lucene
开发しゃApache软件基金ききんかい
くび发布1999ねん,​25ねんまえ​(1999
とうぜん版本はんぽん
  • 9.11.1 (2024ねん6がつ27にち;稳定版本はんぽん)[1]
编辑维基数据链接
原始げんし码库 编辑维基数据链接
编程语言Java
操作そうさけいまたが平台ひらだい
类型搜索そうさく全文ぜんぶん检索
许可协议Apache许可证 2.0
网站lucene.apache.org

Luceneいち套用于全文ぜんぶん检索搜索そうさくてき开放原始げんしほどじょゆかりApache软件基金ききんかい支持しじ提供ていきょう。Lucene提供ていきょうりょう一个简单却强大的应用程序接口,のう够做全文ぜんぶん索引さくいん搜索そうさく。Lucene广泛应用さく搜索そうさく应用てき标准もと础库[2][3][4]

Lucene现已移植いしょくいた其他编程语言,包括ほうかつObject PascalPerlC#C++PythonRubyPHP[5]

历史

[编辑]

Doug Cuttingざい1999ねん编写りょうLucene[6]一位资深的全文索引及检索专家,曾经V-Twin搜索そうさく引擎てき主要しゅよう开发しゃきさきざいExcite担任たんにんだか级系统架构设计师,目前もくぜん从事于一些互联网底层架构的研究。贡献Luceneてき标是为各种中小型こがた应用ほどしき加入かにゅう全文ぜんぶん检索こうのう。Lucene最初さいしょ以从SourceForge网站てきしゅ页下载,它于2001ねん9がつ加入かにゅうApache软件基金ききんかいてきJakarta开源Java产品家族かぞく,并于2005ねん2がつなり独立どくりつてき顶级Apache项目。Lucene这个名字みょうじDoug Cutting妻子さいし的中てきちゅう间名,也是她外祖母そぼてき名字みょうじ[7]

Lucene以前いぜん包含ほうがんりょう许多项目,れい如 Lucene.NET、Mahout、Tika and Nutch。这三个现在已经成为了独立的顶级Apache项目。

2010ねん3がつApache Solr搜索そうさく伺服さく为Lucene项目加入かにゅうごう并了开发しゃしゃ

4.0はん于2012ねん10がつ12にち发布[8]

2021ねん3がつ,Lucene更改こうかいりょうlogo,Apache Solrさいつぎなり为顶级Apache项目,独立どくりつ于 Lucene。

こうのうつね用途ようと

[编辑]

虽然论上Lucene适用于任なん需要じゅよう全文ぜんぶん索引さくいん搜索そうさくこうのうてき应用ほどしきただし其主よういん为在Internet搜索そうさく引擎和本わほん单站てん搜索そうさく实现ちゅうてき实用せい而受到认可[9][10]

Lucene包含ほうがんりょうもと编辑距离执行模糊もこ搜索そうさくてきこうのう[11]

Lucene也被よう于实现推荐系统[12]れい如,Luceneてき'MoreLikeThis'类可以生成せいせい相似そうじぶん档的推荐。ざいしょう“MoreLikeThis”もと于向量的りょうてき相似そうじせい方法ほうほうあずかもと引用いんようてきぶん相似そうじせい度量どりょうれい如共引和ども引邻ちかたび分析ぶんせき)进行较时,Luceneてき方法ほうほうざい推荐具有ぐゆう非常ひじょう相似そうじてき结构とくせいさら窄相关性てきぶん档上ひょう现出しょく[13]そうした引用いんようてきぶん相似そうじせい度量どりょう往往おうおうさら适合推荐さら广泛しょう关的ぶん[13]

もと于Luceneてき项目

[编辑]

Lucene本身ほんみただ一个索引和搜索库,包含ほうがん爬取かずHTML解析かいせきこうのうただし以下いかてき项目扩展りょうLuceneてきこうのう

  • Apache Nutch — 提供ていきょう成熟せいじゅく可用かようてき网络爬虫[14]
  • Apache Solrもと于Lucene核心かくしんてき高性能こうせいのう搜索そうさく伺服提供ていきょうJSON/Python/Ruby API[15]
  • CompassElasticsearchてき前身ぜんしん[16]
  • CrateDBもと于Lucene构建てき开源分布ぶんぷしきSQLすうすえ[17]
  • DocFetcher — またが平台ひらだいてきほんつくえぶんけん搜索そうさく桌面ほどじょ[らいみなもと请求][18]
  • Elasticsearchくわだて搜索そうさく平台ひらだい目的もくてき组织すうすえ并使其易于获取[19]
  • Kinosearch – ようPerlC语言[20]实现てきさがせ索引さくいん擎与Luceneてき移植いしょく[21]Socialtext wiki[20]MojoMojo wikiひとし使用しようりょう这一搜索そうさく引擎[22]。 它在じん类代谢物组数すえ库(HMDB)[23] かず毒素どくそあずか毒素どくそ标数すえ库(T3DB)[24]ちゅうまたゆう应用。
  • MongoDB Atlas Search – もと于MongoDBApache Luceneてきうん原生げんせいくわだて搜索そうさく应用ほどしき
  • OpenSearchもと于Elasticsearch 7てき开源くわだて业级搜索そうさく伺服
  • Swiftype — もと于Luceneてきくわだて业级搜索そうさく[25]
  • Lucene.NET — 提供ていきょう给.Net平台ひらだいよう户的Lucene类库てきふうそう[26]
  • Apache Lucy — 为动态语げん提供ていきょう全文ぜんぶん搜索そうさくてき能力のうりょくLucene Java 库的Cせっこう[27]
  • Luke — Java编写てきよう户界めんよう于编辑Luceneてき索引さくいん,此项やめ停止ていし开发[28]

まいり

[编辑]
  • Solr使用しようLuceneてきくわだて搜索そうさく伺服またゆかりApache软件基金ききん会所かいしょけん发。

参考さんこう资料

[编辑]
  1. ^ Release 9.11.1. 2024ねん6がつ27にち [2024ねん7がつ21にち]. 
  2. ^ Kamphuis, Chris; de Vries, Arjen P.; Boytsov, Leonid; Lin, Jimmy, Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo , 编, Which BM25 Do You Mean? A Large-Scale Reproducibility Study of Scoring Variants, Advances in Information Retrieval (Cham: Springer International Publishing), 2020, 12036: 28–34 [2021-06-07], ISBN 978-3-030-45441-8, PMC 7148026可免费查阅, doi:10.1007/978-3-030-45442-5_4 えい语) 
  3. ^ Grand, Adrien; Muir, Robert; Ferenczi, Jim; Lin, Jimmy, Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo , 编, From MAXSCORE to Block-Max Wand: The Story of How Lucene Significantly Improved Query Evaluation Performance, Advances in Information Retrieval (Cham: Springer International Publishing), 2020, 12036: 20–27 [2021-06-07], ISBN 978-3-030-45441-8, PMC 7148045可免费查阅, doi:10.1007/978-3-030-45442-5_3 えい语) 
  4. ^ Azzopardi, Leif; Moshfeghi, Yashar; Halvey, Martin; Alkhawaldeh, Rami S.; Balog, Krisztian; Di Buccio, Emanuele; Ceccarelli, Diego; Fernández-Luna, Juan M.; Hull, Charlie; Mannix, Jake; Palchowdhury, Sauparna. Lucene4IR: Developing Information Retrieval Evaluation Resources using Lucene. ACM SIGIR Forum. 2017-02-14, 50 (2): 58–75 [2022-07-25]. ISSN 0163-5840. doi:10.1145/3053408.3053421. (原始げんし内容ないようそん于2022-07-28) えい语). 
  5. ^ LuceneImplementations. apache.org. [23 September 2015]. (原始げんし内容ないようそん于6 October 2015). 
  6. ^ KeywordAnalyzer Better Search with Apache Lucene and Solr (PDF). 19 November 2007. (原始げんし内容ないよう (PDF)そん档于31 January 2012). 
  7. ^ Barker, Deane. Web Content Management. O'Reilly. 2016: 233. ISBN 978-1491908105. 
  8. ^ Apache Lucene - Welcome to Apache Lucene. apache.org. [4 February 2016]. (原始げんし内容ないようそん于4 February 2016). 
  9. ^ McCandless, Michael; Hatcher, Erik; Gospodnetić, Otis. Lucene in Action, Second Edition有限度免费查阅,超限则需付费订阅. Manning. 2010: 8. ISBN 978-1933988177. 
  10. ^ GNU/Linux Semantic Storage System (PDF). glscube.org. (原始げんし内容ないよう (PDF)そん档于2010-06-01). 
  11. ^ Apache Lucene - Query Parser Syntax. lucene.apache.org. (原始げんし内容ないようそん于2017-05-02). 
  12. ^ J. Beel, S. Langer, and B. Gipp, “The Architecture and Datasets of Docear’s Research Paper Recommender System,” in Proceedings of the 3rd International Workshop on Mining Scientific Publications (WOSP 2014) at the ACM/IEEE Joint Conference on Digital Libraries (JCDL 2014), London, UK, 2014
  13. ^ 13.0 13.1 M. Schwarzer, M. Schubotz, N. Meuschke, C. Breitinger, V. Markl, and B. Gipp, https://www.gipp.com/wp-content/papercite-data/pdf/schwarzer2016.pdf页面そん档备份そん互联网档あん) "Evaluating Link-based Recommendations for Wikipedia" in Proceedings of the 16th ACM/IEEE-CS Joint Conference on Digital Libraries (JCDL), New York, NY, USA, 2016, pp. 191-200.
  14. ^ dev@Nutch.apache.org. Apache Nutch™ -. nutch.apache.org. [2016-11-29]. (原始げんし内容ないようそん于2021-01-26). 
  15. ^ What are the main differences between ElasticSearch, Apache Solr and SolrCloud? - Quora. quora.com. [23 September 2015]. 
  16. ^ The Future of Compass & Elasticsearch. the dude abides. [2015-10-14]. (原始げんし内容ないようそん档于2015-10-15) えい语). 
  17. ^ Wayner, Peter. 11 cutting-edge databases worth exploring now. InfoWorld. [21 September 2015]. (原始げんし内容ないようそん于21 September 2015). 
  18. ^ Quang, Tran Nam. DocFetcher - Fast Document Search. docfetcher.sourceforge.net. [2016-11-29]. (原始げんし内容ないようそん于2021-01-13). 
  19. ^ Elasticsearch: RESTful, Distributed Search & Analytics - Elastic. elastic.co. [23 September 2015]. (原始げんし内容ないようそん于2015-09-21). 
  20. ^ 20.0 20.1 Natividad, Angela. Socialtext Updates Search, Goes Kino. CMS Wire. [2011-05-31]. (原始げんし内容ないようそん于2012-09-29). 
  21. ^ Marvin Humphrey. KinoSearch - Search engine library. - metacpan.org. p3rl.org. [23 September 2015]. 
  22. ^ Diment, Kieren; Trout, Matt S. Catalyst Cookbook. The Definitive Guide to Catalyst有限度免费查阅,超限则需付费订阅. Apress. 2009: 280. ISBN 978-1-4302-2365-8. 
  23. ^ Wishart, D. S.; et al. HMDB: a knowledgebase for the human metabolome. Nucleic Acids Res. January 2009, 37 (Database issue): D603–10. PMC 2686599可免费查阅. PMID 18953024. doi:10.1093/nar/gkn810. 
  24. ^ Lim, Emilia; Pon, Allison; Djoumbou, Yannick; Knox, Craig; Shrivastava, Savita; Guo, An Chi; Neveu, Vanessa; Wishart, David S. T3DB: a comprehensively annotated database of common toxins and their targets. Nucleic Acids Res. January 2010, 38 (Database issue): D781–6. PMC 2808899可免费查阅. PMID 19897546. doi:10.1093/nar/gkp934. 
  25. ^ Swiftype - Site search and enterprise search. Swiftype. [2016-11-29]. (原始げんし内容ないようそん于2021-02-05). 
  26. ^ Apache Lucene.Net. lucenenet.apache.org. [2016-11-29]. (原始げんし内容ないようそん于2020-12-31). 
  27. ^ Apache Lucy. lucy.apache.org. [2016-11-29]. (原始げんし内容ないようそん于2020-12-31). 
  28. ^ luke. GitHub. [2016-11-29]. (原始げんし内容ないようそん于2020-11-30). 

外部がいぶ链接

[编辑]