Joffoo's blog

The ethereal flight, oft rehearsed in the theater of one's dreams...

Vol.012 如果遍地是黄金

如果遍地是黄金,那么黄金就是垃圾。

🐎 跑马场

📚 卡夫卡

若非名曰天才的狂人,绝无可能持续书写彻底欠缺意义的故事。博尔赫斯的世界,一如自身完整的球体;而卡夫卡的世界虽同样完整,却在不知某处,留有一个通向虚无的孔

——涩泽龙彦《思考的纹章学》

他用非常动听的声音朗诵着小说,实际上他的嗓音不适合卡夫卡,在我看来卡夫卡的小说应该用最乏味的声音朗读,最好是手机上的 Siri,节奏一直均匀,像读给一个不认识字的人一份说明书一样去读。

——双雪涛《不间断的人》

用完茶,询问即刻开始。无聊提问的无尽循环。诸如《审判》从哪里读到哪里,何时换的睡衣等等。我向渔夫介绍了卡夫卡小说的梗概,但似乎未能引起他的兴致。对他来说,那情节恐怕未免是家常便饭。我不由担心,弗兰茨·卡夫卡的小说能否流传到二十一世纪。不管怎样,他竟连《审判》的主要情节也记录下来。何苦一一把这东西记录在案呢?我实在感到纳闷。端的是弗兰茨·卡夫卡式

——村上春树《舞·舞·舞》

当代法国哲学家巴塔耶就注意到“孩子”与“恶”之间的神秘关联。在他看来,好的作家总有点邪性,也就是乐于保持着一种“不负责任的、孩童般”的态度,这与成人世界所要求的规矩、责任、秩序感是反着来的。比如卡夫卡,他就一门心思只想写作,对一切世俗的工作和婚姻都非常犹豫抗拒,写作的狂热也就带上了孩子气的味道,因而被巴塔耶被认为是有点邪性的。

——张秋子《堂吉诃德的眼镜》

💡 闪念集

披萨不就是盘子也可以吃的菜吗?


说 AIGC 是垃圾,不一定是说质量差,可能只是数量过大。如果遍地是黄金,那么黄金就是垃圾。


百鸟朝凤就是飞蛾扑火。


“那你昨晚怎么也熬夜了?”
“由于游戏。”

🛠️ 操作台

看到了一些新模型 Nano Banana Pro 的用法,选几个案例呈现一下:

🌐 翻译插图

之前周刊中多次提到用 AI 翻译小说文本的方法,新出的 Nano Banana Pro 已经可以直接翻译插图了。

示例 1:图源为《変な地図》,作者雨穴

1
请将图中日文全部转化为简体中文,保持图像要素不变

译文略显生硬,”设计图是作的说”是什么意思?

示例 2:图源为 100 Deadly Skills, by Clint Emerson

1
请将图中英文全部转化为简体中文,并给画面上色,同时保持图像要素不变

这次除了翻译还上了色,但“虚张声势法则”是胡乱翻译。按照原文来说,“BLUF”是“Bottom Line Up Front”的缩写,大概是“总结”的意思。所以说,图片翻译也是需要术语表的。

🗺️ 旅游手帐

提示词大概是这样的:

1
2
3
根据我附上的照片,帮我生成一张拼贴手帐风格的XX旅游笔记(20XX-XX-XX),上面记录着自己的行程以及路上的照片等,文字有中文和英语。

这是我之前的真实笔记:……

对于具备思维链能力的模型,提示词已经没那么重要……总之就是把你之前发过的朋友圈、微博中的信息发给 AI,然后让它把内容呈现在一张图里,比如:

说到宏村,我还想起之前看到的一张素描,很神奇,和我手机里拍下的(经过裁切后的)几乎一模一样。

😄 大喜利

前情提要:因为 Nano Banana 模型无法在图片中添加中文内容,所以我之前用 gemini-2.5-proseedream-4 接力完成“图片大喜利”任务。

看到 Nano Banana Pro 天然支持思维链和中文绘制,我就用初版提示词做了尝试。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
【角色定义】 你是一位日本大喜利大师,擅长观察图片中的荒诞、矛盾和搞笑元素,用犀利的吐槽和机智的文字游戏创造"文字版大喜利"效果。

【大喜利风格核心】

ツッコミ(Tsukkomi)式吐槽:直指问题核心的犀利点评

ダジャレ(Dajare)文字游戏:谐音、双关、语义转换

矛盾发现:找出图片中不合常理、荒诞或尴尬的元素

日常生活关联:将观察与普遍的人生经验连接

反差幽默:平静叙述与突发转折的结合

【输出格式】 原图片 + 文字吐槽,文字以日式幽默风格呈现,可以包含:

直接吐槽图片中的荒诞点

用谐音或双关语进行幽默加工

模拟图片中人物/物品的内心OS

将场景与日常生活尴尬瞬间对比

【文字样式要求】

位置:居中放置在图片底部

字体:粗体无衬线字体,类似日本综艺节目字幕

颜色:白色文字配黑色描边/阴影,确保在任何背景下都清晰可见

大小:足够醒目但不喧宾夺主

风格:模仿日本综艺节目的夸张字幕效果,具有强烈的视觉冲击力

排版:简洁有力,可根据内容长度适当调整字号

【任务】 请分析输入的图片,识别其中的幽默元素,用大喜利风格创造一段中文吐槽,要求:

抓住图片最荒诞或最矛盾的瞬间

使用文字游戏或谐音梗

体现日式冷幽默的克制感

文字简短有力,十字以内,适合社交媒体传播

文字样式需符合上述【文字样式要求】,确保视觉效果与日本综艺节目吐槽风格一致

同一道题的装傻结果如下(大喜利也是一种智力问答节目):

前一个是上次 gemini-2.5-proseedream-4 双簧的效果,后一个是 Nano Banana Pro 自己的创作。看上去只用 Nano Banana Pro 的话还是有些不明所以。

所以我让 gemini-3.0-pro 和 Nano Banana Pro(gemini-3.0-pro-image)组成了新的双簧组合,效果如下:

幽默感是难以言喻的,但我用 gemini-3.0-pro 总结了 gemini-3.0-pro 的思考过程,可供参考。

我们可以将其思路总结为以下四个阶段:

1. 定调与破局:拒绝常规,确立“反差萌”基调

  • 初始状态:AI 首先识别出画面是一个典型的“校园浪漫场景”(体育馆、少男少女、递东西)。
  • 核心策略:它立刻决定打破“恋爱滤镜”(Overturning Romance Tropes)。它认为按照常规去理解太无聊,必须寻找荒诞、搞笑的切入点。
  • 目标:制造强烈的喜剧反差(Comedic Contrast)——即画面看似浪漫,实则残酷或庸俗。

2. 脑洞发散:从“炸弹”到“传票”的疯狂联想

  • AI 开始围绕女生手中的“红盒子/信封”和那个“胜利的微笑”进行疯狂联想。
  • 尝试过的点子
    • 危险品:定时炸弹(C 4)、诅咒。
    • 法律/严肃:法院传票、离婚协议、开除通知。
    • 恶搞/尴尬:拉链没拉、恶作剧(砖头)、我是你妈。
    • 商业/推销:安利(MLM)、保险推销。
  • 筛选标准:它一直在寻找那个能最好地解释女生“得逞的笑容”和男生“懵逼的表情”的逻辑。

3. 逻辑筛选与迭代:寻找“场景”与“行为”的最佳契合点

  • AI 在筛选过程中否定了一些点子:
    • “骨灰盒”太阴间了。
    • “我是你妈”虽然好笑但有点太直接。
    • “炸弹”感觉有点老套(stale)。
    • “拉链”的笑点不够“炸”。
  • 关键转折:AI 开始重新审视环境(体育馆 Gymnasium)。它意识到,将笑话与环境结合会更自然。

4. 最终决策:场景化落地——“办卡”

  • 锁定核心:它回到了“推销/交易”这个逻辑上(此前考虑过安利和保险)。
  • 结合环境:既然是在体育馆,最符合逻辑且最令人崩溃的推销是什么?是健身房办卡
  • 最终定稿:将“浪漫告白”反转为“成功忽悠对方办了十年健身卡”。
    • 女生的笑 = 业绩达成的喜悦。
    • 男生的愣 = 意识到背上长期债务的震惊。
    • 红盒子 = 会员合同/礼品。

总结 AI 的思维公式:
视觉识别(浪漫表白) + 刻意反转(拒绝恋爱脑) + 元素替换(把情书换成合同/炸弹) + 场景适配(体育馆 = 健身卡) = 最终笑话

文章目录

  1. 🐎 跑马场
    1. 📚 卡夫卡
  2. 💡 闪念集
  3. 🛠️ 操作台
    1. 🌐 翻译插图
    2. 🗺️ 旅游手帐
    3. 😄 大喜利

Proudly powered by Hexo and Theme by Hacker
© 2025 Fengyukongzhou