:::

雜談:Gemini可以免費繪圖,但不能用API畫 / TALK: We Can Draw on Gemini Webpage for Free, but Not With API

5月 16, 2025 , , 1 Comments Edit Copy Download

2025-0207-015908.png

畢竟是免費的AI功能,真的不能要求太多。


Gemini的繪圖功能 / Gemini’s Drawing Feature

2025-0207-013119.png

Gemini在很久以前就已經內建了繪圖功能。它背後使用的是Imagen系列的API。

2025-0207-013322.png

一開始的時候只能用英文指示Gemini繪圖,但是最近他也可以接受用中文指示繪圖了。

Imagen API

https://imagen.research.google/

https://imagen.research.google/ 

既然我們可以從網頁的Gemini使用Imagen繪圖,那我們能不能直接去呼叫Imagen API來繪圖呢?

2025-0207-013609.png

https://ai.google.dev/gemini-api/docs/imagen?hl=zh-tw 

搜尋一下,還真的有「Gemini API 中的圖片 3」的說明文件,告訴我們怎麽使用Python來產生圖片呢。

https://ai.google.dev/gemini-api/docs/api-key?hl=zh-tw

https://ai.google.dev/gemini-api/docs/api-key?hl=zh-tw 

取得Gemini API Key的方法很簡單,也是免費的。

2025-0207-013823.png

那我們就把它放到Colab來執行看看。結果出錯了。

/usr/local/lib/python3.11/dist-packages/pydantic/_internal/_generate_schema.py:502: UserWarning: <built-in function any> is not a Python type (it may be an instance of an object), Pydantic will allow any object with no validation since we cannot even enforce that the input is an instance of the given type. To get rid of this error wrap the type with `pydantic.SkipValidation`.

  warn(

---------------------------------------------------------------------------

AttributeError                            Traceback (most recent call last)

<ipython-input-1-cd70c68aff1a> in <cell line: 0>()

      6 client = genai.Client(api_key = "AIzaSyA6HuD-fGxE5Ayg7J-k_h5Kk1Gl8j8xJAo" )

      7 

----> 8 response = client.models.generate_image(

      9     model='imagen-3.0-generate-002',

     10     prompt='Fuzzy bunnies in my kitchen',



AttributeError: 'Models' object has no attribute 'generate_image'

錯誤訊息是client.models物件沒有generate_image屬性。怎麽回事,文件有錯嗎?

繪圖API似乎已經轉移到Vertex AI / Imagen API Seems to Have Moved to Vertex AI

2025-0207-014227.png

https://ai.google.dev/gemini-api/docs/imagen 

開發文件有提供Notebook範例。

2025-0207-014205.png

https://github.com/google-gemini/cookbook/blob/main/quickstarts/Get_started_imagen.ipynb 

不過打開的時候會發現它已經被移除了。

2025-0207-014413.png

https://stackoverflow.com/a/79105402/6645399

我嘗試了Linda Lawton - DaImTo的程式碼,但也是不行。

2025-0207-015258.png

https://cloud.google.com/vertex-ai?hl=zh_TW&_gl=1*1a4dngs*_ga*NDI3NjY0Nzg5LjE3MzU3NDc3NDY.*_ga_WH2QY8WWF5*MTczODg2NDI0MC4xMy4xLjE3Mzg4NjQzMDMuNjAuMC4w 

目前看起來,Google好像把Imagen API的功能轉移到Vertex AI API裡面了。那是需要註冊並付費的功能。從定價方式來看,價格是$0.0001美元,單位可能是每張圖?

2025-0207-014920.png

https://github.com/GoogleCloudPlatform/generative-ai/blob/main/vision/getting-started/imagen3_image_generation.ipynb

如果有設定好Vertex AI的話,就能在imagen3_image_generation.ipynb筆記本裡面使用Imagen 3來繪圖。不過看來我暫時是用不上了。

2025-0207-015632.png

到頭來,還是打開Gemini的網頁,用文字請它畫圖比較快。

2025-0207-015701.png

今天的嘗試就到這裡吧,晚安。

總共1 則留言 ( 我要發問 , 隱藏留言 顯示留言 )

  1. 在我寫這篇的時候,我們還沒辦法用Gemini的API功能來畫圖,不過這件事在最近變得可行了!

    https://github.com/langgenius/dify/releases/tag/1.4.0
    Dify 1.4.0支援使用Gemini 2.0 Flash Exp model來畫圖,就算不用SD也能順利產生圖片囉!

    有興趣的話務必嘗試看看吧!

    回覆刪除