Ideogram 4.0 开源发布，原生 2K 分辨率与文字渲染提升

Ideogram发布4.0版文生图模型，开源权重，原生2K分辨率，在DesignArena排名领先。

AI 图像生成领域的开源阵营迎来一次重要升级。Ideogram 正式发布其文本到图像模型的 4.0 版本，并以开放权重形式向社区提供。新模型最显著的特征是支持原生 2K 分辨率 输出，并引入了 边界框控制 功能，让用户能更精准地指定画面中物体的位置。同时，模型在文字渲染方面做了专项强化，解决了此前图像模型在生成清晰、准确文字时常出现的扭曲或模糊问题。

在衡量模型综合能力的 DesignArena 排行榜上，Ideogram 4.0 的表现引发了关注。它目前在所有开源模型中排名第一，将 Stability AI 等竞争对手甩在身后。不过，排在其前面的仍是来自 OpenAI 和谷歌的闭源系统，这表明顶尖闭源模型在整体质量上依然保有优势，但开源阵营的追赶速度不可小觑。

值得注意的是，尽管模型权重开放，Ideogram 对商业使用设置了付费门槛。这意味着开发者可以自由研究、微调模型，但如果要将它用于商业产品，必须购买许可证。这种“开放权重加商业授权”的模式，正成为越来越多 AI 公司平衡社区贡献与商业回报的选择。

从产业角度看，Ideogram 4.0 的发布直接作用于黄仁勋“五层蛋糕”框架中的 应用层。更强大的开源图像模型降低了高质量视觉内容创作的门槛，将推动广告、设计、媒体等下游应用的创新。同时，原生 2K 分辨率意味着单张图像生成需要更多计算资源，这对上游的 基础设施层 和 芯片层 构成持续的需求拉动。开源模型在特定指标上逼近闭源系统，也加剧了应用层创业公司的竞争——当基础能力不再是壁垒时，产品体验、工作流整合与垂直场景深耕变得更为关键。

Ideogram 4.0 开源发布，原生 2K 分辨率与文字渲染提升

延伸阅读

相关每日新闻