Groonga(3)
Groongaのポスティングリストの圧縮方法をPForDeltaからRoaring bitmapsに変更しようと検討したけどPForDeltaのままにした
全文検索エンジンGroongaを開発している須藤です。
爆速OLAPデータベースであるClickHouseが全文検索インデックスを実装したというブログ記事の中で「ポスティングリストの圧縮には最先端のRoaring bitmapsを使った」と書いていました。そんなによいものならGroongaのポスティングリストでも使おうかと思って検討してみたのですが、Groongaのユースケースではサイズ・速度ともに現在のPForDeltaの方が優れていたのでRoaring bitmapsは導入しませんでした。ただ、結果セットで使うにはよさそうな気がするので、おいおいそのユースケースでも検討したいです。
YAPC::Kyoto 2023:Perlと全文検索エンジンGroongaでMySQLのデータを高速に全文検索する #yapcjapan
2023年03月19日(日)にYAPC::Kyoto 2023が開催されます。 「Perlと全文検索エンジンGroongaでMySQLのデータを高速に全文検索する」という題名で、PerlとGroongaを使ってMySQLのデータを高速に全文検索する方法を紹介します。
SupabaseでマネージドなPGroongaを使える!
PGroongaはPostgreSQLで高速に全文検索するための拡張ですが、 Amazon RDS や Azure Database for PostgreSQL などのマネージドなPostgreSQLでは使えませんでしたが 2022-12-16 からSupabase がPGroongaをサポートしました。
これによって、マネージドなPGroongaを使うことができます!
Groonga delta - 差分ベースでMySQL/MariaDBのデータをGroongaに取り込むツール
Groonga deltaというMySQL/MariaDBのデータをリアルタイムでGroongaに同期するツールを開発した須藤です。どのような使い方・設計・実装になっているかを説明します。
PostgreSQL Conference Japan 2021:PGroongaを使って全文検索結果をより良くする方法 #pgcon21j
2021年11月12日(金)にPostgreSQL Conference Japan 2021が開催されます。 私は、「PGroongaを使って全文検索結果をより良くする方法」という題名で、PGroongaでより良い検索結果を得るのに使える機能を紹介します。
PostgreSQL Conference Japan 2021 招待チケットプレゼント!
クリアコードで、コードを書く以外の仕事をしてる吉本です。
クリアコードは、PostgreSQL Conference Japan 2021をシルバースポンサーとして応援しています。
明日(11月11日9時30分)までの応募で、1名様に招待チケットをプレゼントします!
Groongaのクエリーチューニングの方法
Groongaのサポートサービスを担当している1人の須藤です。
Groongaのサポートサービスでは、お客さんから高速化したいクエリーとデータを提供してもらい、より高速に結果を返すようにクエリーをチューニングするという作業もしています。必要であればインデックスの追加・変更やスキーマの変更、Groongaの改良なども実施して高速化します。
クエリーチューニングは長年のカンで実施しているのではなくチューニングを支援するための手法を整備しながら実施しています。この記事では私達がやっているクエリーチューニングの方法をまとめます。ツール類はGroonga本体同様に自由なソフトウェアとして広く公開しているのでサポートサービスを契約していないGroongaユーザーでも同じ方法を使えます。
そういう情報は秘密にしてもっとサポートサービスを利用するように促すほうがいいんじゃないの?と考える人もいるかとは思いますが、クリアコードは情報を独占することで稼ぐのではなく情報を広く共有しながら稼ぎたいのでいいのです。
Mroongaでlock failedとなったときの復旧方法2021 - clearlockしてはいけない!
Mroongaの開発をしている須藤です。
2013年に書かれたgroonga/mroongaの.mrnファイルがlock failedとなった場合の復旧方法 - Y-Ken Studioという記事があるのですが、この記事に書かれているようにclearlock
を使ってはいけません!