2025年3月26日,美国人工智能公司OpenAI宣布了一项重大更新,为其旗舰聊天机器人ChatGPT引入了全新的图像生成功能。这一功能是在GPT-4o模型的基础上开发的,标志着ChatGPT从单一的文本生成系统向全模态智能体的跨越。
据OpenAI介绍,现在用户可以在ChatGPT及Sora平台上直接通过自然语言指令生成和编辑图像。这一功能不仅支持用户创建全新的图像,还可以对现有的图像进行转换和二次创作。例如,用户可以通过详细的描述,让ChatGPT生成一幅符合要求的四宫格漫画,或者将一张普通的照片转换成具有特定风格的艺术作品。
OpenAI的首席执行官Sam Altman在视频直播中表示:“今天,我们推出了有史以来最有趣、最酷的产品之一——ChatGPT中的原生图像。这一功能将为用户带来前所未有的创作体验。”
此次更新的图像生成功能不仅提高了图像的分辨率和生成速度,还显著提升了图像的准确性和多样性。GPT-4o模型通过整合文本和图像数据,使得ChatGPT能够更好地理解图像的使用环境,并按照用户的提示在图像中呈现文本。这一功能在设计视频游戏角色、制作教育课件、职场可视化报告以及电商商品图生成等场景中有着广泛的应用前景。
值得一提的是,OpenAI在开发这一功能时,充分考虑了用户的安全和隐私。他们通过从训练数据中删除暴力、仇恨或少儿不宜的图像,限制了生成这类内容的能力,并使用了技术手段防止生成人脸的超写实照片,尤其是公众人物的照片。此外,OpenAI还制定了严格的内容政策,不允许用户生成暴力、成人或政治内容,以确保技术的合法和合规使用。
目前,这一全新的图像生成功能已经向ChatGPT Plus、Pro、Team以及免费用户开放。企业和教育级用户也将在不久的将来获得访问权限。OpenAI表示,他们将继续优化这一功能,并通过API接口向开发者开放,以推动更多创新应用的诞生。
此次OpenAI推出的图像生成功能,不仅展示了人工智能技术的最新进展,也为用户提供了更加便捷和高效的创作工具。随着技术的不断发展,我们有理由相信,未来的人工智能将为我们带来更多惊喜和可能。