:::

新的圖片索引工具:CLIP Interrogator / Can CLIP Interrogator be an AI Indexer?

2023-0206-165508.png

要如何用文字來描述一張圖片,這是一項非常困難的任務。現在有許多用提示詞產生圖片的AI繪圖,那自然也有用圖片來產生提示詞的AI圖片介紹囉。


圖片審查器 / CLIP Interrogator

https://huggingface.co/spaces/pharma/CLIP-Interrogator?fbclid=IwAR32gsHNiblu4FSPWdSNne7Z-Gl3LcHbhESuTcoEfGSsv8JH0BDdE1QQL_o

https://huggingface.co/spaces/pharma/CLIP-Interrogator?fbclid=IwAR32gsHNiblu4FSPWdSNne7Z-Gl3LcHbhESuTcoEfGSsv8JH0BDdE1QQL_o 

Sylvain Filoni釋出的CLIP Interrogator已經來到了第二代。CLIP Interrogator的用途是從既有的圖片中產生合適的提示詞(prompt)。在2.1版裡,他使用了Stable Diffusion 2.0中使用ViT-H-14 OpenCLIP模型的版本。

CLIP Interrogator的用法非常簡單,直接打開網頁、上傳圖片,等候一段時間就可以取得結果。

可是,這原本是設計給用AI繪圖的提示詞用的,那拿不是AI繪圖的照片的話,它也可以正常運作嗎?

答案是……當然可以!

2023-0206-164840.png

這張是隨手拍的午餐。用初代CLIP Interrogator去分析,得到的結果如下:

a wooden table topped with bowls of food, a stock photo, inspired by Yokoyama Taikan, gutai group, 2019 trending photo, crowded inn in the background, android close to camera, a photo of sephiroth, hoses:10, panoramic shot, yuruyuri, breakfast, trending on pixv, round-cropped

看起來好像多了很多奇妙的提示詞。

讓我們換CLIP Interrogator 2.1試試看,出來的結果如下:

a wooden table topped with bowls of food, a picture, by Nōami, noodles, 2 0 2 2 photo, unedited, drink

好像合理多了?你覺得呢?


快試試看CLIP Interrogator,把你的結果貼在下面留言吧!