
如果遍地是黄金,那么黄金就是垃圾。
🐎 跑马场
📚 卡夫卡

若非名曰天才的狂人,绝无可能持续书写彻底欠缺意义的故事。博尔赫斯的世界,一如自身完整的球体;而卡夫卡的世界虽同样完整,却在不知某处,留有一个通向虚无的孔。
——涩泽龙彦《思考的纹章学》
他用非常动听的声音朗诵着小说,实际上他的嗓音不适合卡夫卡,在我看来卡夫卡的小说应该用最乏味的声音朗读,最好是手机上的 Siri,节奏一直均匀,像读给一个不认识字的人一份说明书一样去读。
——双雪涛《不间断的人》
用完茶,询问即刻开始。无聊提问的无尽循环。诸如《审判》从哪里读到哪里,何时换的睡衣等等。我向渔夫介绍了卡夫卡小说的梗概,但似乎未能引起他的兴致。对他来说,那情节恐怕未免是家常便饭。我不由担心,弗兰茨·卡夫卡的小说能否流传到二十一世纪。不管怎样,他竟连《审判》的主要情节也记录下来。何苦一一把这东西记录在案呢?我实在感到纳闷。端的是弗兰茨·卡夫卡式。
——村上春树《舞·舞·舞》
当代法国哲学家巴塔耶就注意到“孩子”与“恶”之间的神秘关联。在他看来,好的作家总有点邪性,也就是乐于保持着一种“不负责任的、孩童般”的态度,这与成人世界所要求的规矩、责任、秩序感是反着来的。比如卡夫卡,他就一门心思只想写作,对一切世俗的工作和婚姻都非常犹豫抗拒,写作的狂热也就带上了孩子气的味道,因而被巴塔耶被认为是有点邪性的。
——张秋子《堂吉诃德的眼镜》
💡 闪念集

披萨不就是盘子也可以吃的菜吗?
说 AIGC 是垃圾,不一定是说质量差,可能只是数量过大。如果遍地是黄金,那么黄金就是垃圾。
百鸟朝凤就是飞蛾扑火。
“那你昨晚怎么也熬夜了?”
“由于游戏。”
🛠️ 操作台

看到了一些新模型 Nano Banana Pro 的用法,选几个案例呈现一下:
🌐 翻译插图
之前周刊中多次提到用 AI 翻译小说文本的方法,新出的 Nano Banana Pro 已经可以直接翻译插图了。
示例 1:图源为《変な地図》,作者雨穴
1 | 请将图中日文全部转化为简体中文,保持图像要素不变 |
译文略显生硬,”设计图是作的说”是什么意思?

示例 2:图源为 100 Deadly Skills, by Clint Emerson
1 | 请将图中英文全部转化为简体中文,并给画面上色,同时保持图像要素不变 |
这次除了翻译还上了色,但“虚张声势法则”是胡乱翻译。按照原文来说,“BLUF”是“Bottom Line Up Front”的缩写,大概是“总结”的意思。所以说,图片翻译也是需要术语表的。

🗺️ 旅游手帐
提示词大概是这样的:
1 | 根据我附上的照片,帮我生成一张拼贴手帐风格的XX旅游笔记(20XX-XX-XX),上面记录着自己的行程以及路上的照片等,文字有中文和英语。 |
对于具备思维链能力的模型,提示词已经没那么重要……总之就是把你之前发过的朋友圈、微博中的信息发给 AI,然后让它把内容呈现在一张图里,比如:

说到宏村,我还想起之前看到的一张素描,很神奇,和我手机里拍下的(经过裁切后的)几乎一模一样。

😄 大喜利
前情提要:因为 Nano Banana 模型无法在图片中添加中文内容,所以我之前用 gemini-2.5-pro 和 seedream-4 接力完成“图片大喜利”任务。
看到 Nano Banana Pro 天然支持思维链和中文绘制,我就用初版提示词做了尝试。
1 | 【角色定义】 你是一位日本大喜利大师,擅长观察图片中的荒诞、矛盾和搞笑元素,用犀利的吐槽和机智的文字游戏创造"文字版大喜利"效果。 |
同一道题的装傻结果如下(大喜利也是一种智力问答节目):


前一个是上次 gemini-2.5-pro 和 seedream-4 双簧的效果,后一个是 Nano Banana Pro 自己的创作。看上去只用 Nano Banana Pro 的话还是有些不明所以。
所以我让 gemini-3.0-pro 和 Nano Banana Pro(gemini-3.0-pro-image)组成了新的双簧组合,效果如下:

幽默感是难以言喻的,但我用 gemini-3.0-pro 总结了 gemini-3.0-pro 的思考过程,可供参考。
我们可以将其思路总结为以下四个阶段:
1. 定调与破局:拒绝常规,确立“反差萌”基调
- 初始状态:AI 首先识别出画面是一个典型的“校园浪漫场景”(体育馆、少男少女、递东西)。
- 核心策略:它立刻决定打破“恋爱滤镜”(Overturning Romance Tropes)。它认为按照常规去理解太无聊,必须寻找荒诞、搞笑的切入点。
- 目标:制造强烈的喜剧反差(Comedic Contrast)——即画面看似浪漫,实则残酷或庸俗。
2. 脑洞发散:从“炸弹”到“传票”的疯狂联想
- AI 开始围绕女生手中的“红盒子/信封”和那个“胜利的微笑”进行疯狂联想。
- 尝试过的点子:
- 危险品:定时炸弹(C 4)、诅咒。
- 法律/严肃:法院传票、离婚协议、开除通知。
- 恶搞/尴尬:拉链没拉、恶作剧(砖头)、我是你妈。
- 商业/推销:安利(MLM)、保险推销。
- 筛选标准:它一直在寻找那个能最好地解释女生“得逞的笑容”和男生“懵逼的表情”的逻辑。
3. 逻辑筛选与迭代:寻找“场景”与“行为”的最佳契合点
- AI 在筛选过程中否定了一些点子:
- “骨灰盒”太阴间了。
- “我是你妈”虽然好笑但有点太直接。
- “炸弹”感觉有点老套(stale)。
- “拉链”的笑点不够“炸”。
- 关键转折:AI 开始重新审视环境(体育馆 Gymnasium)。它意识到,将笑话与环境结合会更自然。
4. 最终决策:场景化落地——“办卡”
- 锁定核心:它回到了“推销/交易”这个逻辑上(此前考虑过安利和保险)。
- 结合环境:既然是在体育馆,最符合逻辑且最令人崩溃的推销是什么?是健身房办卡。
- 最终定稿:将“浪漫告白”反转为“成功忽悠对方办了十年健身卡”。
- 女生的笑 = 业绩达成的喜悦。
- 男生的愣 = 意识到背上长期债务的震惊。
- 红盒子 = 会员合同/礼品。
总结 AI 的思维公式:
视觉识别(浪漫表白) + 刻意反转(拒绝恋爱脑) + 元素替换(把情书换成合同/炸弹) + 场景适配(体育馆 = 健身卡) = 最终笑话