OpenAI首届开发者大会：让每个用户都有机会成为开发者,行业新闻,上海聚盼湖教育交大慧谷中心-新闻中心

OpenAI首届开发者大会：让每个用户都有机会成为开发者

北京时间11月7日凌晨，OpenAI首次开发者大会举办。OpenAI首席执行官Altman 报告了 OpenAI 平台和产品的一些数据：每周使用量达到 1 亿人次, 开发者数量达到 200 万。

最受关注的是，OpenAI宣布要围绕GPT打造AI平台，推出GPT Store，并提出了GPTs的概念，用户可以利用GPT Builder工具，创建自己的GPT。

Sam Altman不仅要把ChatGPT做成下一个iOS，还要进一步加强与用户的绑定，让每个用户都有机会成为开发者。而且创建者还可以根据自己创建的 GPT 的使用人数获得一定分成。

本次大会上还推出了ChatGPT的最新版本GPT-4 Turbo，以及众多全新功能。

人人都可参与的 GPTs 和 GPT Store

本次发布最让人惊喜的莫过于 GPTs 的功能发布：任何人都可以创建 ChatGPT 的定制版本，服务于日常生活、工作或者家庭中。用户也可以将自己创建的 GPT 分享给别人，也可以创建仅限于个人或者公司内部使用的 GPT。

创建过程无需代码，使用自然语言交互，简单的指令配上需要额外提供的知识库文本，就可以快速创建一个可以进行网络搜索、制作图片或者分析数据的 GPT。

更重要的是，OpenAI 将在晚些时候推出 GPT Store，正如同 App Store 一样，商店将收录验证用户创建的 GPT 作品，可以被用户搜索到。商店也会推荐生产力、教育和好玩等类别的优秀作品，而且创建者还可以根据自己创建的 GPT 的使用人数获得一定分成。

与插件功能一样，用户创建的 GPTs 也支持集成外部数据、联网等功能，用户可以将 GPTs 连接到数据库、邮件或者购物助手等。借助 Zapier，用户搭建的 GPTs 可以轻松实现日历订阅、同步以及短信功能等。

ChatGPT 企业用户可以搭建仅供内部使用的 GPTs。据Altman报告，《财富》500强企业里92%是ChatGPT 企业用户。

一个真正的 OpenAI 开发者生态似乎指日可待。

据虎嗅科技介绍，本次发布的LLM（大语言模型）更新主要包括：

最新的GPT-4 Turbo，支持128k上下文窗口，且价格更低，输出更快。
全新的Assistants API，使开发人员更容易构建自己的人工智能应用程序。
新的多模态功能，包括视觉、图像创建（DALL·E 3）和文本转语音（TTS）。

OpenAI开发者大会的发布的重要更新

长上下文
长上下文正在成为百模大战的“主战场”。对比众多新模型，GPT-4的32k token上下文窗口已不那么出色。此次GPT-4 Turbo更新的上下文窗口达到128k，是GPT-4的四倍，且超过了竞对Anthropic此前推出的100k token的Claude 2。

Sam Altman在演示中称128k token大约相当于300页纸的文字量，英国版的《哈利·波特与魔法石》差不多就是300页，指环王三部曲平均每本是400页。
不过，GPT-4 Turbo的上下文长度也并非最长。一周前，百川智能发布的Baichuan2-192K，上下文窗口长度为192K，能够处理约35万个汉字。

开发助手
OpenAI此次更新中，着重面向开发者推出了Assistant API，使开发者能在应用中集成类似代理的AI体验。
这个API允许AI助手执行具体任务，调用模型和工具，并处理一些复杂的编程和数据处理工作。它支持多种用途，如自然语言数据分析、编码辅助、旅行规划等。
助手API具有持久化线程功能，简化了状态管理，并允许调用开发者定义的函数。此外，它还提供了代码解释器和检索工具，可在外部数据上运行和检索信息。数据保护方面，开发者可自主管理其传递给API的数据。现在，开发者可以通过助手API游乐场，无需编码进行测试。
此外，OpenAI对函数调用进行了更新，现在模型可以在单个消息中调用多个函数，并更准确地返回正确的函数参数。GPT-4 Turbo在遵循指令生成特定格式时表现更佳，并支持新的JSON模式以确保输出有效的JSON对象。新增的API参数response_format允许模型输出语法正确的JSON。此外，通过新的seed参数，模型可以产生可重现的输出，有助于调试和编写单元测试。OpenAI还计划推出返回输出令牌对数概率的功能，以便在构建“自动完成”等功能时使用。

新的多模态模型
在多模态能力方面，GPT-4 Turbo的API将集成DALL-E3，以及文生语音模型TTS（text-to-speech）。
开发者可以通过API直接调用GPT-4 Turbo with vision中的DALL-E3模型，进行图片识别和图片生成。事实上，DALL·E 3上线之后，ChatGPT Plus用户就已经可以在GPT-4模块下调用DALL·E 3进行图片创作，以及多模态的图片识别了。不过，这次是以API的形式，将多模态的能力开放给开发者。
此外，OpenAI还上线了新的TTS文生语音功能。类似能力，在ChatGPT手机端也已经上线了一段时间（不过目前实测中文还是有一点英语口语），此次也是针对开发者的API开放。目前TTS的语音包共有六种声音可选，可以输出Opus、AAC和FLAC三种格式，尚不支持自建声音。
价格更低，输出更快
“在模型持续的迭代中，我们的价格也在不断下降。”Sam Altman介绍说，相比于GPT-4，GPT-4 Turbo的输入价格只有1/3，0.01美元每1000 token；输出价格为0.03美元每 1000 token，只有原来的1/2。而内容生成的速度，提高了2倍。

关于版权

据极客公园报道，过去半年中，OpenAI的估值水涨船高，总融资超过140亿美元，但OpenAI的资金消耗速度惊人。一方面，OpenAI需要支付大量的算力和研发成本；另一方面，还要为未来不确定的法律问题做准备。本次大会，OpenAI推出了copyright shield功能，用于保护用户不受到版权问题困扰，不光从技术上规避版权风险，当用户遇到版权问题时OpenAI也会协助解决。

在开发者大会主题演讲的最后，Sam Altman 表达了他对开发者们想说的话：

我们做所有这些，因为我们相信，AI 会是一次科技和社会的革命。它会从很多层面上，改变这个世界。我们也很高兴，能够从事这些工作，能够为你们带来价值，再让你们为我们所有人创造更多的价值。

早先我们说过，如果你予以人们工具，他们就能够改变这个世界。我们相信，AI 会以一种前所未见的规模，予以个体和机构新的能力。这也将把整个人类提升到我们前所未见的规模。

（本文综合虎嗅、founder park、极客公园等报道）

——转载自财经ThinkTank微信公众号2023年11月7日发布文章

OpenAI首届开发者大会：让每个用户都有机会成为开发者

创新传承，铸就慧谷

联系我们