OpenAI首届开发者大会:让每个用户都有机会成为开发者

北京时间11月7日凌晨,OpenAI首次开发者大会举办。OpenAI首席执行官Altman 报告了 OpenAI 平台和产品的一些数据:每周使用量达到 1 亿人次, 开发者数量达到 200 万。



最受关注的是,OpenAI宣布要围绕GPT打造AI平台,推出GPT Store,并提出了GPTs的概念,用户可以利用GPT Builder工具,创建自己的GPT。


Sam Altman不仅要把ChatGPT做成下一个iOS,还要进一步加强与用户的绑定,让每个用户都有机会成为开发者。而且创建者还可以根据自己创建的 GPT 的使用人数获得一定分成。


本次大会上还推出了ChatGPT的最新版本GPT-4 Turbo,以及众多全新功能。



人人都可参与的 GPTs 和 GPT Store


本次发布最让人惊喜的莫过于 GPTs 的功能发布:任何人都可以创建 ChatGPT 的定制版本,服务于日常生活、工作或者家庭中。用户也可以将自己创建的 GPT 分享给别人,也可以创建仅限于个人或者公司内部使用的 GPT。


创建过程无需代码,使用自然语言交互,简单的指令配上需要额外提供的知识库文本,就可以快速创建一个可以进行网络搜索、制作图片或者分析数据的 GPT。


更重要的是,OpenAI 将在晚些时候推出 GPT Store,正如同 App Store 一样,商店将收录验证用户创建的 GPT 作品,可以被用户搜索到。商店也会推荐生产力、教育和好玩等类别的优秀作品,而且创建者还可以根据自己创建的 GPT 的使用人数获得一定分成。


与插件功能一样,用户创建的 GPTs 也支持集成外部数据、联网等功能,用户可以将 GPTs 连接到数据库、邮件或者购物助手等。借助 Zapier,用户搭建的 GPTs 可以轻松实现日历订阅、同步以及短信功能等。


ChatGPT 企业用户可以搭建仅供内部使用的 GPTs。据Altman报告,《财富》500强企业里92%是ChatGPT 企业用户。


一个真正的 OpenAI 开发者生态似乎指日可待。



据虎嗅科技介绍,本次发布的LLM(大语言模型)更新主要包括:

  • 最新的GPT-4 Turbo,支持128k上下文窗口,且价格更低,输出更快。

  • 全新的Assistants API,使开发人员更容易构建自己的人工智能应用程序。

  • 新的多模态功能,包括视觉、图像创建(DALL·E 3)和文本转语音(TTS)。


OpenAI开发者大会的发布的重要更新


  • 长上下文

  • 长上下文正在成为百模大战的“主战场”。对比众多新模型,GPT-4的32k token上下文窗口已不那么出色。此次GPT-4 Turbo更新的上下文窗口达到128k,是GPT-4的四倍,且超过了竞对Anthropic此前推出的100k token的Claude 2。

  • Sam Altman在演示中称128k token大约相当于300页纸的文字量,英国版的《哈利·波特与魔法石》差不多就是300页,指环王三部曲平均每本是400页。

  • 不过,GPT-4 Turbo的上下文长度也并非最长。一周前,百川智能发布的Baichuan2-192K,上下文窗口长度为192K,能够处理约35万个汉字。


  • 开发助手

  • OpenAI此次更新中,着重面向开发者推出了Assistant API,使开发者能在应用中集成类似代理的AI体验。

  • 这个API允许AI助手执行具体任务,调用模型和工具,并处理一些复杂的编程和数据处理工作。它支持多种用途,如自然语言数据分析、编码辅助、旅行规划等。

  • 助手API具有持久化线程功能,简化了状态管理,并允许调用开发者定义的函数。此外,它还提供了代码解释器和检索工具,可在外部数据上运行和检索信息。数据保护方面,开发者可自主管理其传递给API的数据。现在,开发者可以通过助手API游乐场,无需编码进行测试

  • 此外,OpenAI对函数调用进行了更新,现在模型可以在单个消息中调用多个函数,并更准确地返回正确的函数参数。GPT-4 Turbo在遵循指令生成特定格式时表现更佳,并支持新的JSON模式以确保输出有效的JSON对象。新增的API参数response_format允许模型输出语法正确的JSON。此外,通过新的seed参数,模型可以产生可重现的输出,有助于调试和编写单元测试。OpenAI还计划推出返回输出令牌对数概率的功能,以便在构建“自动完成”等功能时使用。


  • 新的多模态模型

  • 在多模态能力方面,GPT-4 Turbo的API将集成DALL-E3,以及文生语音模型TTS(text-to-speech)。

  • 开发者可以通过API直接调用GPT-4 Turbo with vision中的DALL-E3模型,进行图片识别和图片生成。事实上,DALL·E 3上线之后,ChatGPT Plus用户就已经可以在GPT-4模块下调用DALL·E 3进行图片创作,以及多模态的图片识别了。不过,这次是以API的形式,将多模态的能力开放给开发者。

  • 此外,OpenAI还上线了新的TTS文生语音功能。类似能力,在ChatGPT手机端也已经上线了一段时间(不过目前实测中文还是有一点英语口语),此次也是针对开发者的API开放。目前TTS的语音包共有六种声音可选,可以输出Opus、AAC和FLAC三种格式,尚不支持自建声音。

  • 价格更低,输出更快

  • “在模型持续的迭代中,我们的价格也在不断下降。”Sam Altman介绍说,相比于GPT-4,GPT-4 Turbo的输入价格只有1/3,0.01美元每1000 token;输出价格为0.03美元每 1000 token,只有原来的1/2。而内容生成的速度,提高了2倍。



关于版权


据极客公园报道,过去半年中,OpenAI的估值水涨船高,总融资超过140亿美元,但OpenAI的资金消耗速度惊人。一方面,OpenAI需要支付大量的算力和研发成本;另一方面,还要为未来不确定的法律问题做准备。本次大会,OpenAI推出了copyright shield功能,用于保护用户不受到版权问题困扰,不光从技术上规避版权风险,当用户遇到版权问题时OpenAI也会协助解决。


在开发者大会主题演讲的最后,Sam Altman 表达了他对开发者们想说的话:


我们做所有这些,因为我们相信,AI 会是一次科技和社会的革命。它会从很多层面上,改变这个世界。我们也很高兴,能够从事这些工作,能够为你们带来价值,再让你们为我们所有人创造更多的价值。


早先我们说过,如果你予以人们工具,他们就能够改变这个世界。我们相信,AI 会以一种前所未见的规模,予以个体和机构新的能力。这也将把整个人类提升到我们前所未见的规模。


(本文综合虎嗅、founder park、极客公园等报道)




——转载自财经ThinkTank微信公众号2023年11月7日发布文章
























创新传承,铸就慧谷

“慧谷教育培训”品牌于2004年在上海交大科技园成立,曾连续多年获得徐汇区优秀办学机构荣誉。“慧谷教育”是专注于IT高新技术和互联网职业技能的研发和成果转化的机构,目前联合上海交大教育集团智能信息技术研究院和新型人力资源服务公司--聚盼湖科技,为各大企业客户和社会精英人群提供优质培训和一站式人才职业规划咨询服务。

坐落于交大科技园,毗邻徐汇交大,交通便利

坐落于交大科技园,毗邻徐汇交大,交通便利

20年专注IT互联网职业技能发展和教育产品研发

20年专注IT互联网职业技能发展和教育产品研发

联合上海交大教育集团智能研究院,强强联手

联合上海交大教育集团智能研究院,强强联手

众多世界500强企业的指定合作伙伴

众多世界500强企业的指定合作伙伴