致力打造国内好用的AI产品导航平台
在 Reddit 的“有问必答”活动中,OpenAI 首席执行官山姆·奥特曼承认,计算能力的缺乏是阻止该公司像期望的那样频繁推出产品的一个主要因素。 “所有这些模型都变得相当复杂,”他在回答关于 OpenAI 的下一个人工智能模型为何耗时如此之久的问题时写道。“我们在如何将我们的计算资源分配给众多好点子方面也面临很多限制和艰难的决策。”
许多报道表明,OpenAI 一直在努力确保有足够的计算基础设施来运行和训练其生成式模型。就在本周,路透社援引消息人士的话说,OpenAI 数月来一直在与博通合作开发一款用于运行模型的人工智能芯片,该芯片最早可能在 2026 年推出。 奥特曼说,部分由于能力紧张,OpenAI 为 ChatGPT 打造的逼真的对话功能“高级语音模式”不会很快获得 4 月份首次预告的视觉能力。
在 4 月份的新闻发布会上,OpenAI 展示了在智能手机上运行的 ChatGPT 应用程序,它能对手机摄像头视野内的视觉线索做出反应,比如某人穿的衣服。 《财富》杂志后来的报道透露,这个演示是匆忙推出的,目的是从同一周举行的谷歌 I/O 开发者大会上抢走注意力。OpenAI 内部的许多人认为 GPT-4o 还没有准备好公布——很能说明问题的是,仅语音版本的高级语音模式被推迟了数月。
在“有问必答”活动中,奥特曼表示,OpenAI 的图像生成器 DALL-E 的下一个主要版本没有发布时间表。(“我们还没有发布计划,”他说。)与此同时,OpenAI 的视频生成工具 Sora 因“需要完善模型、确保安全/防止假冒/处理好其他事情以及扩展计算能力”而被搁置,OpenAI 的首席产品官凯文·威尔写道,他也参加了这次“有问必答”活动。
据报道,Sora 遭遇了技术挫折,这使其在与来自 Luma、Runway 和其他公司的竞争系统的竞争中处于不利地位。据《信息》杂志报道,2 月份公布的原始系统制作一个 1 分钟的视频剪辑需要超过 10 分钟的处理时间。 在“有问必答”活动的后期,奥特曼说,OpenAI 仍在考虑“有朝一日”在 ChatGPT 中允许“不适合工作场合”的内容(“我们完全相信应该像对待成年人一样对待成年用户,”他写道),并且该公司的首要任务是改进其 o1 系列“推理”模型及其后续产品。
OpenAI 在本周于伦敦举行的开发日会议上预览了即将在 o1 中推出的一些功能,包括图像理解。 “我们今年晚些时候会有一些非常好的发布,”奥特曼写道。“不过,不会有我们称之为 GPT-5 的东西。”