hibernate search case insensitive search is not corretly work with LowerCaseFilterFactory

Question

I have following configration for hibernate-search:

@AnalyzerDef(name = "autocompleteNGramAnalyzer",

// Split input into tokens according to tokenizer
        tokenizer = @TokenizerDef(factory = StandardTokenizerFactory.class),

        filters = {
                // Normalize token text to lowercase, as the user is unlikely to
                // care about casing when searching for matches
                @TokenFilterDef(factory = WordDelimiterFilterFactory.class,
                        params = @Parameter(name = "catenateAll", value = "1")),
                @TokenFilterDef(factory = LowerCaseFilterFactory.class),
                @TokenFilterDef(factory = EdgeNGramFilterFactory.class, params = {
                        @Parameter(name = "minGramSize", value = "2"),
                        @Parameter(name = "maxGramSize", value = "5")})})

The behaviour is really strange.

I have field with value George Cain

if I search by Ge - it returns value
if I search by GeO - it returns value
if I search by GeOR - it doesn't returns anything
if I search by GeoR - it returns value
if I search by GEOR - it returns value

What bad with GeOR ? How can I fix this?

Is it possible to debug this framework?

gstackoverflow · Accepted Answer

I customized WordDelimiterFilterFactory and now this works:

 @TokenFilterDef(factory = WordDelimiterFilterFactory.class,
                        params = {
                                @Parameter(name = "catenateAll", value = "1"),
                                @Parameter(name = "generateWordParts", value = "0")})//generateWordParts = 1 by default

hibernate search case insensitive search is not corretly work with LowerCaseFilterFactory

Answers (2)

Related Questions