
2026/01/17
菜单测试:为什么 GLM-Image 在清晰定价方面击败扩散模型
一个你可以在家运行的实用菜单基准测试——使用 GLM-Image 测试价格可读性、对齐和排版,使用清晰的评分标准。
真实世界问题:价格 + 对齐
菜单是残酷的测试:
- 大量小文本
- 货币 + 小数
- 紧密的列和间距
GLM-Image 专为处理信息密集型布局并通过其混合架构改善文本渲染而设计。(Hugging Face)
菜单基准测试(简单但具有启发性)
你生成的内容(3 种菜单类型)
- 咖啡店(简短)
- 小酒馆晚餐菜单(中等)
- 鸡尾酒菜单(密集)
评分标准(每项 0–5 分)
- 可读性:你能阅读每个项目和价格吗?
- 数字准确性:价格是否完全匹配?
- 列对齐:点/列是否一致?
- 层次结构:标题 vs 项目 vs 描述
- 无幻觉项目:它是否虚构了额外菜品?
3 个复制粘贴菜单提示词
提示:将所有需要的文本放在引号中。(GitHub)
A) 咖啡菜单
干净的咖啡馆菜单板,极简排版,白色背景。标题:"咖啡"。项目和价格完全准确:"浓缩咖啡 — $2.50"、"美式咖啡 — $3.00"、"拿铁 — $4.25"、"卡布奇诺 — $4.25"、"摩卡 — $4.75"。页脚:"燕麦奶 +$0.75"。完美的标点和数字,对齐的列。
B) 小酒馆菜单(两栏)
优雅餐厅菜单,纹理奶油纸。左栏标题"开胃菜"包含:"每日例汤 — $8"、"凯撒沙拉 — $12"。右栏标题"主菜"包含:"烤鸡 — $24"、"煎三文鱼 — $28"、"蘑菇烩饭 — $22"。使用一致的破折号和右对齐价格。
C) 鸡尾酒菜单(密集)
鸡尾酒菜单,深色背景,金色装饰,高对比度排版。标题:"鸡尾酒"。带价格的精确列表:"内格罗尼 — $14"、"古典鸡尾酒 — $15"、"玛格丽特 — $13"、"浓缩马提尼 — $16"、"帕洛玛 — $13"。保持每个字母可读,无额外文字。
如何与纯扩散模型比较
在以下模型中运行相同的提示词:
- SDXL / Flux / 任何你拥有的纯扩散模型 …并使用评分标准对它们进行评分。你通常会看到扩散模型将文本"风格化"为近似文本。
可发布的结果格式(用于你的博客)
- 每种菜单类型 1 个图像网格
- 评分表(GLM-Image vs 其他)
- 备注:错误发生的位置(价格、货币、对齐)
更多文章

EN
Transformers AR 阶段深度解析:256→4K Token 是什么?
GLM-Image 自回归生成图像 token——从约 256 个 token 开始,扩展到 1K–4K。这对布局、排版和控制意味着什么。


EN
GLM-Image 海报设计:10个真正能渲染文字的提示词模板
使用GLM-Image进行海报设计的实用提示词库——包含可清晰排版的布局方案、字体控制技巧和10个可直接复制的模板。


EN
Z.ai API快速开始 + 参数速查表
使用官方Z.ai API通过GLM-Image生成图像——包含curl和Python示例、尺寸规则、质量模式和最佳实践。

