新的圖片索引工具:CLIP Interrogator / Can CLIP Interrogator be an AI Indexer?
要如何用文字來描述一張圖片,這是一項非常困難的任務。現在有許多用提示詞產生圖片的AI繪圖,那自然也有用圖片來產生提示詞的AI圖片介紹囉。
圖片審查器 / CLIP Interrogator
Sylvain Filoni釋出的CLIP Interrogator已經來到了第二代。CLIP Interrogator的用途是從既有的圖片中產生合適的提示詞(prompt)。在2.1版裡,他使用了Stable Diffusion 2.0中使用ViT-H-14 OpenCLIP模型的版本。
CLIP Interrogator的用法非常簡單,直接打開網頁、上傳圖片,等候一段時間就可以取得結果。
可是,這原本是設計給用AI繪圖的提示詞用的,那拿不是AI繪圖的照片的話,它也可以正常運作嗎?
答案是……當然可以!
這張是隨手拍的午餐。用初代CLIP Interrogator去分析,得到的結果如下:
a wooden table topped with bowls of food, a stock photo, inspired by Yokoyama Taikan, gutai group, 2019 trending photo, crowded inn in the background, android close to camera, a photo of sephiroth, hoses:10, panoramic shot, yuruyuri, breakfast, trending on pixv, round-cropped
看起來好像多了很多奇妙的提示詞。
讓我們換CLIP Interrogator 2.1試試看,出來的結果如下:
a wooden table topped with bowls of food, a picture, by Nōami, noodles, 2 0 2 2 photo, unedited, drink
好像合理多了?你覺得呢?
快試試看CLIP Interrogator,把你的結果貼在下面留言吧!