maumar
diff --git a/Diff for: ‎.github/workflows/python-integration-tests.yml
+12-4 b/Diff for: ‎.github/workflows/python-integration-tests.yml
+12-4
diff --git a/Diff for: ‎python/semantic_kernel/connectors/ai/google/google_ai/services/google_ai_chat_completion.py
-1 b/Diff for: ‎python/semantic_kernel/connectors/ai/google/google_ai/services/google_ai_chat_completion.py
-1
diff --git a/Diff for: ‎python/semantic_kernel/connectors/ai/ollama/ollama_prompt_execution_settings.py
+8 b/Diff for: ‎python/semantic_kernel/connectors/ai/ollama/ollama_prompt_execution_settings.py
+8
diff --git a/Diff for: ‎python/semantic_kernel/connectors/ai/ollama/services/ollama_chat_completion.py
+132-15 b/Diff for: ‎python/semantic_kernel/connectors/ai/ollama/services/ollama_chat_completion.py
+132-15
@@ -96,6 +96,8 @@ jobs:
         if: matrix.os == 'ubuntu-latest'
         run: |
           ollama pull ${{ vars.OLLAMA_CHAT_MODEL_ID }}
+          ollama pull ${{ vars.OLLAMA_CHAT_MODEL_ID_IMAGE }}
+          ollama pull ${{ vars.OLLAMA_CHAT_MODEL_ID_TOOL_CALL }}
           ollama pull ${{ vars.OLLAMA_TEXT_MODEL_ID }}
           ollama pull ${{ vars.OLLAMA_EMBEDDING_MODEL_ID }}
           ollama list
@@ -156,8 +158,10 @@ jobs:
           MISTRALAI_EMBEDDING_MODEL_ID: ${{ vars.MISTRALAI_EMBEDDING_MODEL_ID }}
           ANTHROPIC_API_KEY: ${{secrets.ANTHROPIC_API_KEY}}
           ANTHROPIC_CHAT_MODEL_ID: ${{ vars.ANTHROPIC_CHAT_MODEL_ID }}
-          OLLAMA_CHAT_MODEL_ID: "${{ matrix.os == 'ubuntu-latest' && vars.OLLAMA_CHAT_MODEL_ID || '' }}" # phi3
-          OLLAMA_TEXT_MODEL_ID: "${{ matrix.os == 'ubuntu-latest' && vars.OLLAMA_TEXT_MODEL_ID || '' }}" # phi3
+          OLLAMA_CHAT_MODEL_ID: "${{ matrix.os == 'ubuntu-latest' && vars.OLLAMA_CHAT_MODEL_ID || '' }}" # llava-phi3
+          OLLAMA_CHAT_MODEL_ID_IMAGE: "${{ matrix.os == 'ubuntu-latest' && vars.OLLAMA_CHAT_MODEL_ID_IMAGE || '' }}" # llava-phi3
+          OLLAMA_CHAT_MODEL_ID_TOOL_CALL: "${{ matrix.os == 'ubuntu-latest' && vars.OLLAMA_CHAT_MODEL_ID_TOOL_CALL || '' }}" # llama3.2
+          OLLAMA_TEXT_MODEL_ID: "${{ matrix.os == 'ubuntu-latest' && vars.OLLAMA_TEXT_MODEL_ID || '' }}" # llava-phi3
           OLLAMA_EMBEDDING_MODEL_ID: "${{ matrix.os == 'ubuntu-latest' && vars.OLLAMA_EMBEDDING_MODEL_ID || '' }}" # nomic-embed-text
           GOOGLE_AI_GEMINI_MODEL_ID: ${{ vars.GOOGLE_AI_GEMINI_MODEL_ID }}
           GOOGLE_AI_EMBEDDING_MODEL_ID: ${{ vars.GOOGLE_AI_EMBEDDING_MODEL_ID }}
@@ -232,6 +236,8 @@ jobs:
         if: matrix.os == 'ubuntu-latest'
         run: |
           ollama pull ${{ vars.OLLAMA_CHAT_MODEL_ID }}
+          ollama pull ${{ vars.OLLAMA_CHAT_MODEL_ID_IMAGE }}
+          ollama pull ${{ vars.OLLAMA_CHAT_MODEL_ID_TOOL_CALL }}
           ollama pull ${{ vars.OLLAMA_TEXT_MODEL_ID }}
           ollama pull ${{ vars.OLLAMA_EMBEDDING_MODEL_ID }}
           ollama list
@@ -292,8 +298,10 @@ jobs:
           MISTRALAI_EMBEDDING_MODEL_ID: ${{ vars.MISTRALAI_EMBEDDING_MODEL_ID }}
           ANTHROPIC_API_KEY: ${{secrets.ANTHROPIC_API_KEY}}
           ANTHROPIC_CHAT_MODEL_ID: ${{ vars.ANTHROPIC_CHAT_MODEL_ID }}
-          OLLAMA_CHAT_MODEL_ID: "${{ matrix.os == 'ubuntu-latest' && vars.OLLAMA_CHAT_MODEL_ID || '' }}" # phi3
-          OLLAMA_TEXT_MODEL_ID: "${{ matrix.os == 'ubuntu-latest' && vars.OLLAMA_TEXT_MODEL_ID || '' }}" # phi3
+          OLLAMA_CHAT_MODEL_ID: "${{ matrix.os == 'ubuntu-latest' && vars.OLLAMA_CHAT_MODEL_ID || '' }}" # llava-phi3
+          OLLAMA_CHAT_MODEL_ID_IMAGE: "${{ matrix.os == 'ubuntu-latest' && vars.OLLAMA_CHAT_MODEL_ID_IMAGE || '' }}" # llava-phi3
+          OLLAMA_CHAT_MODEL_ID_TOOL_CALL: "${{ matrix.os == 'ubuntu-latest' && vars.OLLAMA_CHAT_MODEL_ID_TOOL_CALL || '' }}" # llama3.2
+          OLLAMA_TEXT_MODEL_ID: "${{ matrix.os == 'ubuntu-latest' && vars.OLLAMA_TEXT_MODEL_ID || '' }}" # llava-phi3
           OLLAMA_EMBEDDING_MODEL_ID: "${{ matrix.os == 'ubuntu-latest' && vars.OLLAMA_EMBEDDING_MODEL_ID || '' }}" # nomic-embed-text
           GOOGLE_AI_GEMINI_MODEL_ID: ${{ vars.GOOGLE_AI_GEMINI_MODEL_ID }}
           GOOGLE_AI_EMBEDDING_MODEL_ID: ${{ vars.GOOGLE_AI_EMBEDDING_MODEL_ID }}
 
@@ -1,6 +1,5 @@
 # Copyright (c) Microsoft. All rights reserved.
 
-
 import logging
 import sys
 from collections.abc import AsyncGenerator, Callable
 
@@ -2,6 +2,8 @@
 
 from typing import Any, Literal
 
+from pydantic import Field
+
 from semantic_kernel.connectors.ai.prompt_execution_settings import PromptExecutionSettings
 
 
@@ -27,6 +29,12 @@ class OllamaTextPromptExecutionSettings(OllamaPromptExecutionSettings):
 class OllamaChatPromptExecutionSettings(OllamaPromptExecutionSettings):
     """Settings for Ollama chat prompt execution."""
 
+    tools: list[dict[str, Any]] | None = Field(
+        None,
+        max_length=64,
+        description="Do not set this manually. It is set by the service based on the function choice configuration.",
+    )
+
 
 class OllamaEmbeddingPromptExecutionSettings(OllamaPromptExecutionSettings):
     """Settings for Ollama embedding prompt execution."""
@@ -2,7 +2,7 @@
 
 import logging
 import sys
-from collections.abc import AsyncGenerator, AsyncIterator, Mapping
+from collections.abc import AsyncGenerator, AsyncIterator, Callable, Mapping
 from typing import TYPE_CHECKING, Any, ClassVar
 
 if sys.version_info >= (3, 12):
@@ -12,17 +12,33 @@
 
 import httpx
 from ollama import AsyncClient
+from ollama._types import Message
 from pydantic import ValidationError
 
 from semantic_kernel.connectors.ai.chat_completion_client_base import ChatCompletionClientBase
+from semantic_kernel.connectors.ai.completion_usage import CompletionUsage
+from semantic_kernel.connectors.ai.function_call_choice_configuration import FunctionCallChoiceConfiguration
+from semantic_kernel.connectors.ai.function_choice_behavior import FunctionChoiceType
 from semantic_kernel.connectors.ai.ollama.ollama_prompt_execution_settings import OllamaChatPromptExecutionSettings
 from semantic_kernel.connectors.ai.ollama.ollama_settings import OllamaSettings
 from semantic_kernel.connectors.ai.ollama.services.ollama_base import OllamaBase
+from semantic_kernel.connectors.ai.ollama.services.utils import (
+    MESSAGE_CONVERTERS,
+    update_settings_from_function_choice_configuration,
+)
 from semantic_kernel.contents import AuthorRole
 from semantic_kernel.contents.chat_history import ChatHistory
-from semantic_kernel.contents.chat_message_content import ChatMessageContent
+from semantic_kernel.contents.chat_message_content import ITEM_TYPES, ChatMessageContent
+from semantic_kernel.contents.function_call_content import FunctionCallContent
+from semantic_kernel.contents.streaming_chat_message_content import ITEM_TYPES as STREAMING_ITEM_TYPES
 from semantic_kernel.contents.streaming_chat_message_content import StreamingChatMessageContent
-from semantic_kernel.exceptions.service_exceptions import ServiceInitializationError, ServiceInvalidResponseError
+from semantic_kernel.contents.streaming_text_content import StreamingTextContent
+from semantic_kernel.contents.text_content import TextContent
+from semantic_kernel.exceptions.service_exceptions import (
+    ServiceInitializationError,
+    ServiceInvalidExecutionSettingsError,
+    ServiceInvalidResponseError,
+)
 from semantic_kernel.utils.telemetry.model_diagnostics.decorators import (
     trace_chat_completion,
     trace_streaming_chat_completion,
@@ -40,7 +56,7 @@ class OllamaChatCompletion(OllamaBase, ChatCompletionClientBase):
     Make sure to have the ollama service running either locally or remotely.
     """
 
-    SUPPORTS_FUNCTION_CALLING: ClassVar[bool] = False
+    SUPPORTS_FUNCTION_CALLING: ClassVar[bool] = True
 
     def __init__(
         self,
@@ -97,6 +113,36 @@ def service_url(self) -> str | None:
             return str(self.client._client.base_url)
         return None
 
+    @override
+    def _prepare_chat_history_for_request(
+        self,
+        chat_history: ChatHistory,
+        role_key: str = "role",
+        content_key: str = "content",
+    ) -> list[Message]:
+        return [MESSAGE_CONVERTERS[message.role](message) for message in chat_history.messages]
+
+    @override
+    def _verify_function_choice_settings(self, settings: "PromptExecutionSettings") -> None:
+        if settings.function_choice_behavior and settings.function_choice_behavior.type_ in [
+            FunctionChoiceType.REQUIRED,
+            FunctionChoiceType.NONE,
+        ]:
+            raise ServiceInvalidExecutionSettingsError(
+                "Ollama does not support function choice behavior of type 'required' or 'none' yet."
+            )
+
+    @override
+    def _update_function_choice_settings_callback(
+        self,
+    ) -> Callable[[FunctionCallChoiceConfiguration, "PromptExecutionSettings", FunctionChoiceType], None]:
+        return update_settings_from_function_choice_configuration
+
+    @override
+    def _reset_function_choice_settings(self, settings: "PromptExecutionSettings") -> None:
+        if hasattr(settings, "tools"):
+            settings.tools = None
+
     @override
     @trace_chat_completion(OllamaBase.MODEL_PROVIDER_NAME)
     async def _inner_get_chat_message_contents(
@@ -124,11 +170,9 @@ async def _inner_get_chat_message_contents(
             )
 
         return [
-            ChatMessageContent(
-                inner_content=response_object,
-                ai_model_id=self.ai_model_id,
-                role=AuthorRole.ASSISTANT,
-                content=response_object.get("message", {"content": None}).get("content", None),
+            self._create_chat_message_content(
+                response_object,
+                self._get_metadata_from_response(response_object),
             )
         ]
 
@@ -143,6 +187,11 @@ async def _inner_get_streaming_chat_message_contents(
             settings = self.get_prompt_execution_settings_from_settings(settings)
         assert isinstance(settings, OllamaChatPromptExecutionSettings)  # nosec
 
+        if settings.tools:
+            raise ServiceInvalidExecutionSettingsError(
+                "Ollama does not support tool calling in streaming chat completion."
+            )
+
         prepared_chat_history = self._prepare_chat_history_for_request(chat_history)
 
         response_object = await self.client.chat(
@@ -160,13 +209,81 @@ async def _inner_get_streaming_chat_message_contents(
 
         async for part in response_object:
             yield [
-                StreamingChatMessageContent(
-                    role=AuthorRole.ASSISTANT,
-                    choice_index=0,
-                    inner_content=part,
-                    ai_model_id=self.ai_model_id,
-                    content=part.get("message", {"content": None}).get("content", None),
+                self._create_streaming_chat_message_content(
+                    part,
+                    self._get_metadata_from_response(part),
                 )
             ]
 
     # endregion
+
+    def _create_chat_message_content(self, response: Mapping[str, Any], metadata: dict[str, Any]) -> ChatMessageContent:
+        """Create a chat message content from the response."""
+        items: list[ITEM_TYPES] = []
+        if not (message := response.get("message", None)):
+            raise ServiceInvalidResponseError("No message content found in response.")
+
+        if content := message.get("content", None):
+            items.append(
+                TextContent(
+                    text=content,
+                    inner_content=message,
+                )
+            )
+        if tool_calls := message.get("tool_calls", None):
+            for tool_call in tool_calls:
+                items.append(
+                    FunctionCallContent(
+                        inner_content=tool_call,
+                        ai_model_id=self.ai_model_id,
+                        name=tool_call.get("function").get("name"),
+                        arguments=tool_call.get("function").get("arguments"),
+                    )
+                )
+
+        return ChatMessageContent(
+            role=AuthorRole.ASSISTANT,
+            items=items,
+            inner_content=response,
+            metadata=metadata,
+        )
+
+    def _create_streaming_chat_message_content(
+        self, part: Mapping[str, Any], metadata: dict[str, Any]
+    ) -> StreamingChatMessageContent:
+        """Create a streaming chat message content from the response part."""
+        items: list[STREAMING_ITEM_TYPES] = []
+        if not (message := part.get("message", None)):
+            raise ServiceInvalidResponseError("No message content found in response part.")
+
+        if content := message.get("content", None):
+            items.append(
+                StreamingTextContent(
+                    choice_index=0,
+                    text=content,
+                    inner_content=message,
+                )
+            )
+
+        return StreamingChatMessageContent(
+            role=AuthorRole.ASSISTANT,
+            choice_index=0,
+            items=items,
+            inner_content=part,
+            ai_model_id=self.ai_model_id,
+            metadata=metadata,
+        )
+
+    def _get_metadata_from_response(self, response: Mapping[str, Any]) -> dict[str, Any]:
+        """Get metadata from the response."""
+        metadata = {
+            "model": response.get("model"),
+        }
+
+        if "prompt_eval_count" in response and "eval_count" in response:
+            metadata["usage"] = CompletionUsage(
+                prompt_tokens=response.get("prompt_eval_count"),
+                completion_tokens=response.get("eval_count"),
+            )
+
+        return metadata