Langchain - using filters in a Retriever

Question

Do any of the langchain retrievers provide filter arguments?

I'm trying to create an EnsembleFilter using a VectorRetriever (FAISS) and a normal Retriever (BM25), but the filter fails when combining them:

documents = [Document(page_content='The Celtics are my favourite team.', metadata={topic="sport"}),
     Document(page_content='The Boston Celtics won the game by 20 points', metadata={topic="sport"}),
     Document(page_content='This is just a random text.', metadata={topic="unknown"})]

# embeddings is any langchain embeddings
db = FAISS.from_documents(documents, embeddings) 
question = "Who is my favourite team?"
retriever = BM25Retriever.from_documents(documents)
faiss_retriever = db.as_retriever(search_kwargs={'filter': dict(topic="sport"), 'k': 4, 'fetch_k': 8})
er = EnsembleRetriever(retrievers=[retriever, faiss_retriever], weights=[0.3, 0.7])
results = er.get_relevant_documents(question)

How can I make sure the filter persists in the BM25 retriever?

Langchain - using filters in a Retriever

Answers (1)

Related Questions