SAP
diff --git a/‎README.md‎
Lines changed: 39 additions & 27 deletions b/‎README.md‎
Lines changed: 39 additions & 27 deletions
diff --git a/‎examples/hanavector_self_query.ipynb‎
Lines changed: 246 additions & 0 deletions b/‎examples/hanavector_self_query.ipynb‎
Lines changed: 246 additions & 0 deletions
@@ -13,7 +13,6 @@ Integrates LangChain with SAP HANA Cloud to make use of vector search, knowledge
 - **Python Environment**: Ensure you have Python 3.9 or higher installed.
 - **SAP HANA Cloud**: Access to a running SAP HANA Cloud instance.
 
-
 ### Installation
 
 Install the LangChain SAP HANA Cloud integration package using `pip`:
@@ -22,49 +21,62 @@ Install the LangChain SAP HANA Cloud integration package using `pip`:
 pip install -U langchain-hana
 ```
 
-### Setting Up Vectorstore
+### Vectorstore
 
 The `HanaDB` class is used to connect to SAP HANA Cloud Vector Engine.
 
+>[SAP HANA Cloud Vector Engine](https://help.sap.com/docs/hana-cloud-database/sap-hana-cloud-sap-hana-database-vector-engine-guide/sap-hana-cloud-sap-hana-database-vector-engine-guide) is
+> a vector store fully integrated into the `SAP HANA Cloud` database.
+
+See a [usage example](./examples/sap_hanavector.ipynb).
+
+```python
+from langchain_hana import HanaDB
+```
+
 > **Important**:  You can use any embedding class that inherits from `langchain_core.embeddings.Embeddings`—**including** `HanaInternalEmbeddings`, which runs SAP HANA’s `VECTOR_EMBEDDING()` function internally. See [SAP Help](https://help.sap.com/docs/hana-cloud-database/sap-hana-cloud-sap-hana-database-vector-engine-guide/vector-embedding-function-vector?locale=en-US) for more details.
 
-Here’s how to set up the connection and initialize the vector store:
+### Self Query Retriever
+
+>[SAP HANA Cloud Vector Engine](https://help.sap.com/docs/hana-cloud-database/sap-hana-cloud-sap-hana-database-vector-engine-guide/sap-hana-cloud-sap-hana-database-vector-engine-guide)
+> also provides a Self Query Retriever implementation using the `HanaTranslator` Class.
+
+See a [usage example](./examples/hanavector_self_query.ipynb).
+
+```python
+from langchain_hana import HanaTranslator
+```
+
+### Graph
+
+>[SAP HANA Cloud Knowledge Graph Engine](https://help.sap.com/docs/hana-cloud-database/sap-hana-cloud-sap-hana-database-knowledge-graph-guide/sap-hana-cloud-sap-hana-database-knowledge-graph-engine-guide)
+> provides support to utilise knowledge graphs through the `HanaRdfGraph` Class.
+
+See a [usage example](./examples/sap_hana_rdf_graph.ipynb).
 
 ```python
-from langchain_hana import HanaDB, HanaInternalEmbeddings
-from langchain_openai import OpenAIEmbeddings
-from hdbcli import dbapi
-
-# 1) HANA-internal embedding
-internal_emb = HanaInternalEmbeddings(internal_embedding_model_id="SAP_NEB.20240715")
-# 2) External embedding
-external_emb = OpenAIEmbeddings()
-
-# Establish the SAP HANA Cloud connection
-connection = dbapi.connect(
-    address="<hostname>",
-    port=3<NN>MM,
-    user="<username>",
-    password="<password>"
-)
-
-# Initialize the HanaDB vector store
-vectorstore = HanaDB(
-    connection=connection,
-    embedding=internal_emb,  # or external_emb
-    table_name="<table_name>"  # Optional: Default is "EMBEDDINGS"
-)
+from langchain_hana import HanaRdfGraph
+```
 
+### Chains
+
+A `SparqlQAChain` is also provided which can be used with `HanaRdfGraph` for SPARQL-QA tasks.
+See a [usage example](./examples/sap_hana_sparql_qa_chain.ipynb).
+
+```python
+from langchain_hana import HanaSparqlQAChain
 ```
+
 ## Documentation
 
-For a detailed guide on using the package, please refer to [Langchain Hana Docs](https://python.langchain.com/docs/integrations/providers/sap/).
+For a detailed guide on using the package, please refer to the [examples](./examples/) here.
 
 ## Support, Feedback, Contributing
 
 This project is open to feature requests/suggestions, bug reports etc. via [GitHub issues](https://github.com/SAP/langchain-integration-for-sap-hana-cloud/issues). Contribution and feedback are encouraged and always welcome. For more information about how to contribute, the project structure, as well as additional contribution information, see our [Contribution Guidelines](CONTRIBUTING.md).
 
 ## Security / Disclosure
+
 If you find any bug that may be a security problem, please follow our instructions at [in our security policy](https://github.com/SAP/langchain-integration-for-sap-hana-cloud/security/policy) on how to report it. Please do not create GitHub issues for security-related doubts or problems.
 
 ## Code of Conduct
 
@@ -0,0 +1,246 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "# SAP HANA Cloud Vector Engine\n",
+    "\n",
+    "For more information on how to setup the SAP HANA vetor store, take a look at the [documentation](/docs/integrations/vectorstores/sap_hanavector.ipynb).\n",
+    "\n",
+    "We use the same setup here:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "import os\n",
+    "\n",
+    "# Use OPENAI_API_KEY env variable\n",
+    "# os.environ[\"OPENAI_API_KEY\"] = \"Your OpenAI API key\"\n",
+    "from hdbcli import dbapi\n",
+    "\n",
+    "# Use connection settings from the environment\n",
+    "connection = dbapi.connect(\n",
+    "    address=os.environ.get(\"HANA_DB_ADDRESS\"),\n",
+    "    port=os.environ.get(\"HANA_DB_PORT\"),\n",
+    "    user=os.environ.get(\"HANA_DB_USER\"),\n",
+    "    password=os.environ.get(\"HANA_DB_PASSWORD\"),\n",
+    "    autocommit=True,\n",
+    "    sslValidateCertificate=False,\n",
+    ")"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "To be able to self query with good performance we create additional metadata fields\n",
+    "for our vectorstore table in HANA:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# Create custom table with attribute\n",
+    "cur = connection.cursor()\n",
+    "cur.execute(\"DROP TABLE LANGCHAIN_DEMO_SELF_QUERY\", ignoreErrors=True)\n",
+    "cur.execute(\n",
+    "    (\n",
+    "        \"\"\"CREATE TABLE \"LANGCHAIN_DEMO_SELF_QUERY\"  (\n",
+    "        \"name\" NVARCHAR(100), \"is_active\" BOOLEAN, \"id\" INTEGER, \"height\" DOUBLE,\n",
+    "        \"VEC_TEXT\" NCLOB, \n",
+    "        \"VEC_META\" NCLOB, \n",
+    "        \"VEC_VECTOR\" REAL_VECTOR\n",
+    "        )\"\"\"\n",
+    "    )\n",
+    ")"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Let's add some documents."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from langchain_community.vectorstores.hanavector import HanaDB\n",
+    "from langchain_core.documents import Document\n",
+    "from langchain_openai import OpenAIEmbeddings\n",
+    "\n",
+    "embeddings = OpenAIEmbeddings()\n",
+    "\n",
+    "# Prepare some test documents\n",
+    "docs = [\n",
+    "    Document(\n",
+    "        page_content=\"First\",\n",
+    "        metadata={\"name\": \"adam\", \"is_active\": True, \"id\": 1, \"height\": 10.0},\n",
+    "    ),\n",
+    "    Document(\n",
+    "        page_content=\"Second\",\n",
+    "        metadata={\"name\": \"bob\", \"is_active\": False, \"id\": 2, \"height\": 5.7},\n",
+    "    ),\n",
+    "    Document(\n",
+    "        page_content=\"Third\",\n",
+    "        metadata={\"name\": \"jane\", \"is_active\": True, \"id\": 3, \"height\": 2.4},\n",
+    "    ),\n",
+    "]\n",
+    "\n",
+    "db = HanaDB(\n",
+    "    connection=connection,\n",
+    "    embedding=embeddings,\n",
+    "    table_name=\"LANGCHAIN_DEMO_SELF_QUERY\",\n",
+    "    specific_metadata_columns=[\"name\", \"is_active\", \"id\", \"height\"],\n",
+    ")\n",
+    "\n",
+    "# Delete already existing documents from the table\n",
+    "db.delete(filter={})\n",
+    "db.add_documents(docs)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Self querying\n",
+    "\n",
+    "Now for the main act: here is how to construct a SelfQueryRetriever for HANA vectorstore:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from langchain.chains.query_constructor.schema import AttributeInfo\n",
+    "from langchain.retrievers.self_query.base import SelfQueryRetriever\n",
+    "from langchain_community.query_constructors.hanavector import HanaTranslator\n",
+    "from langchain_openai import ChatOpenAI\n",
+    "\n",
+    "llm = ChatOpenAI(model=\"gpt-3.5-turbo\")\n",
+    "\n",
+    "metadata_field_info = [\n",
+    "    AttributeInfo(\n",
+    "        name=\"name\",\n",
+    "        description=\"The name of the person\",\n",
+    "        type=\"string\",\n",
+    "    ),\n",
+    "    AttributeInfo(\n",
+    "        name=\"is_active\",\n",
+    "        description=\"Whether the person is active\",\n",
+    "        type=\"boolean\",\n",
+    "    ),\n",
+    "    AttributeInfo(\n",
+    "        name=\"id\",\n",
+    "        description=\"The ID of the person\",\n",
+    "        type=\"integer\",\n",
+    "    ),\n",
+    "    AttributeInfo(\n",
+    "        name=\"height\",\n",
+    "        description=\"The height of the person\",\n",
+    "        type=\"float\",\n",
+    "    ),\n",
+    "]\n",
+    "\n",
+    "document_content_description = \"A collection of persons\"\n",
+    "\n",
+    "hana_translator = HanaTranslator()\n",
+    "\n",
+    "retriever = SelfQueryRetriever.from_llm(\n",
+    "    llm,\n",
+    "    db,\n",
+    "    document_content_description,\n",
+    "    metadata_field_info,\n",
+    "    structured_query_translator=hana_translator,\n",
+    ")"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Let's use this retriever to prepare a (self) query for a person:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "query_prompt = \"Which person is not active?\"\n",
+    "\n",
+    "docs = retriever.invoke(input=query_prompt)\n",
+    "for doc in docs:\n",
+    "    print(\"-\" * 80)\n",
+    "    print(doc.page_content, \" \", doc.metadata)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "We can also take a look at how the query is being constructed:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from langchain.chains.query_constructor.base import (\n",
+    "    StructuredQueryOutputParser,\n",
+    "    get_query_constructor_prompt,\n",
+    ")\n",
+    "\n",
+    "prompt = get_query_constructor_prompt(\n",
+    "    document_content_description,\n",
+    "    metadata_field_info,\n",
+    ")\n",
+    "output_parser = StructuredQueryOutputParser.from_components()\n",
+    "query_constructor = prompt | llm | output_parser\n",
+    "\n",
+    "sq = query_constructor.invoke(input=query_prompt)\n",
+    "\n",
+    "print(\"Structured query: \", sq)\n",
+    "\n",
+    "print(\"Translated for hana vector store: \", hana_translator.visit_structured_query(sq))"
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": ".venv",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.10.14"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 2
+}