為什麼 Google 圖搜不到台灣迷因(3 個替代方案)
Google 圖片搜尋怎麼運作的
Google 圖片排序的核心訊號有 4 個(依重要度排序):
- 檔名:
red-shiba-inu-shocked.jpg這種有語意的檔名、比HIHHJrabkAAyUkI.jpg強得多。 - alt 屬性:
<img alt="柴犬被閃電打到的反應圖">——直接告訴爬蟲圖片內容。 - 周圍文字:圖片標籤前後的段落、caption、figure 標題。
- 反向連結:有多少獨立網域連到這張圖、連結文字用什麼字眼。
這套機制對「商業網站的產品圖、攝影師作品、新聞圖」運作得很好——這些情境下檔名通常是英文、alt 是描述、周圍有 caption、有獨立網域連結指過來。但對台灣論壇圖、四個訊號每個都打不到。
為什麼台灣論壇圖每個訊號都失敗
拿一張典型的 PTT 表特板貼文當例子:
- 檔名:
imgur.com/HIHHJrabkAAyUkI.jpg——imgur 自動產生的 base32 亂碼、零語意。 - alt 屬性:空的。PTT 推文系統不支援 alt、發文者也沒辦法加。
- 周圍文字:「推文 1: 太正了吧」「推文 2: 想娶」——是討論不是描述。對 Google 來說這些是 noise、不是 signal。
- 反向連結:只有一個 PTT 文章連這張圖。沒有多個獨立網域給「authority」訊號。
Google 看完這張圖、能用來建索引的有效訊息趨近於 0。所以即使你用「柴犬 雷 反應」這種精確關鍵字搜、結果通常是商業 stock photo 網站的柴犬圖、不是 PTT 上那張你記得的。
替代方案 1:TWmeme(中文關鍵字反查)
TWmeme 的解法是反過來建索引——不依賴圖片本身的 metadata、改用論壇的中文標題和推文當作圖片描述。
- 每 4 小時爬 PTT 表特板和 C_Chat 板
- 把文章標題、推文摘要、發文日期跟圖片綁在一起存到資料庫
- 搜尋時、用 PostgreSQL trigram 索引比對中文標題、ILIKE 模糊匹配
- 結果按發文時間和熱門度排序
適用情境:「我記得那張圖在某個 PTT 文章看過、文章標題大概有 XXX 字眼」。命中率對台灣本土迷因很高、對國際梗圖(Drake meme 那類)幫助不大——那類圖 Google 反而做得好。
限制:
- 目前只收 PTT 表特板和 C_Chat(Dcard 穩定中)
- 新出來的迷因有 4-8 小時延遲(爬蟲頻率)
- 標題不在中文上下文裡的圖(純圖無敘述)找不到
替代方案 2:Yandex 以圖搜圖
Yandex 的 reverse image search 是業界公認最強的之一——準確度勝過 Google 的「以圖搜圖」、特別在臉部辨識和場景比對。
適用情境:你已經有那張圖檔案、想找原始出處或同一張圖在哪些網站出現過。
使用方式:yandex.com/images → 相機 icon → 上傳圖或貼 URL → Yandex 回傳所有它找到的相似圖。
限制:
- 必須已有圖檔案(網路上找不到的不能反查)
- 結果可能包含 Yandex 索引的俄語/英語網站、不一定能找到 PTT
- 對「我記得長什麼樣但沒檔案」的情境完全用不上
替代方案 3:SauceNAO(僅限二次元)
SauceNAO 是 ACG(動漫)插畫反查專用、強在找 pixiv / Twitter / Danbooru / Gelbooru 等動漫圖站的原作。
適用情境:你看到一張動漫人物的二創、想找原圖、原作者、是哪部作品。
使用方式:saucenao.com → 上傳圖或貼 URL → 回傳含原作 URL 的相似圖列表。
限制:
- 只索引動漫圖站、不收 PTT / Dcard
- 真實人物迷因、論壇反應圖完全找不到
- 需要已有圖檔案
選哪個?
| 情境 | 最佳工具 |
|---|---|
| 記得 PTT 表特板某張圖、文字描述記得 | TWmeme |
| 已下載某張圖、找原出處 | Yandex |
| 動漫角色二創、找原作 | SauceNAO |
| 商業攝影 stock photo | Google 圖搜 |
| 國際英文 meme(Drake、Distracted Boyfriend) | Google 圖搜 / imgflip |
| 記得只是個梗、不確定哪個來源 | 先 TWmeme、再 Google |
未來會改變嗎?
Google 圖片搜尋的核心訊號從 2015 年到現在沒有大改、近 10 年 Google 主要在投資 multimodal AI(Lens、Bard/Gemini 視覺理解)、而不是改傳統圖片排序。短期內、台灣論壇圖被 Google 索引得好的可能性低。
有可能改變的點是 AI 搜尋——ChatGPT、Perplexity、Gemini 用視覺模型直接「看懂」圖、而不是依賴 metadata。但這類工具目前還沒大規模索引台灣論壇。所以 5 年內、用中文上下文反查圖的需求仍會存在。