Spaces:

MCP-1st-Birthday
/

pipV1

Running

App Files Files Community

Amit commited on 6 days ago

Commit

94db145

1 Parent(s): 46f47c4

Fix: Update docstring and Imagen 4.0 API usage

Browse files

Files changed (1) hide show

services/gemini_client.py +21 -30

services/gemini_client.py CHANGED Viewed

@@ -1,12 +1,11 @@
 """
 Google Gemini client for Pip.
 Handles: Text generation (emotion analysis, conversation) and image generation.
-Uses Gemini 2.5 Pro for complex reasoning, 2.5 Flash for fast responses.
 """
 import os
 import json
-import asyncio
 from typing import Optional, AsyncGenerator
 import google.generativeai as genai
 from google.generativeai import types
@@ -333,50 +332,42 @@ Generate the enhanced image prompt only, no explanation."""
     async def generate_image(self, prompt: str) -> Optional[str]:
         """
-        Generate an image using Gemini/Imagen.
-        Note: Imagen requires specific API access - this may not be available to all users.
         Returns base64 encoded image or None.
         """
         if not self.available:
             return None
         try:
-            # Try using Imagen 3 via the generate_images method
-            from google.generativeai import ImageGenerationModel
-            imagen = ImageGenerationModel.from_pretrained(self.IMAGE_MODEL)
-            response = await asyncio.get_event_loop().run_in_executor(
-                None,
-                lambda: imagen.generate_images(
-                    prompt=prompt,
-                    number_of_images=1,
-                    aspect_ratio="1:1"
                 )
             )
-            if response.images:
-                # Get the first image
-                image = response.images[0]
-                # Convert to base64
-                import io
-                buffer = io.BytesIO()
-                image._pil_image.save(buffer, format="PNG")
-                return base64.b64encode(buffer.getvalue()).decode('utf-8')
-            print("Gemini/Imagen: No image generated")
             return None
-        except ImportError:
-            print("Gemini: ImageGenerationModel not available in this version")
-            return None
         except Exception as e:
             error_str = str(e)
             if "429" in error_str or "quota" in error_str.lower():
-                print(f"Gemini rate limit exceeded: {e}")
             elif "not found" in error_str.lower() or "not supported" in error_str.lower():
-                print(f"Gemini Imagen not available: {e}")
                 return None
             else:
-                print(f"Gemini image generation error: {e}")
-            raise

 """
 Google Gemini client for Pip.
 Handles: Text generation (emotion analysis, conversation) and image generation.
+Uses gemini-flash-lite-latest for text, imagen-4.0-fast-generate-001 for images.
 """
 import os
 import json
 from typing import Optional, AsyncGenerator
 import google.generativeai as genai
 from google.generativeai import types
     async def generate_image(self, prompt: str) -> Optional[str]:
         """
+        Generate an image using Imagen 4.0.
         Returns base64 encoded image or None.
         """
         if not self.available:
             return None
         try:
+            # Use GenerativeModel with Imagen 4.0
+            imagen_model = genai.GenerativeModel(self.IMAGE_MODEL)
+            response = await imagen_model.generate_content_async(
+                prompt,
+                generation_config=types.GenerationConfig(
+                    temperature=1.0,
                 )
             )
+            # Check for image in response
+            if response.candidates:
+                for candidate in response.candidates:
+                    if hasattr(candidate, 'content') and candidate.content.parts:
+                        for part in candidate.content.parts:
+                            if hasattr(part, 'inline_data') and part.inline_data:
+                                # Return base64 encoded image
+                                return base64.b64encode(part.inline_data.data).decode('utf-8')
+            print("Imagen: No image in response")
             return None
         except Exception as e:
             error_str = str(e)
             if "429" in error_str or "quota" in error_str.lower():
+                print(f"Imagen rate limit exceeded: {e}")
             elif "not found" in error_str.lower() or "not supported" in error_str.lower():
+                print(f"Imagen not available: {e}")
                 return None
             else:
+                print(f"Imagen generation error: {e}")
+            return None