OpenAI开发者大会:定义未来AI的新功能、愿景和商业版图
OpenAI作为人工智能领域的领军企业,其每一次举措都引领着科技界的潮流。2023年11月6日举行的OpenAI开发者大会,毫无疑问成为了全世界科技行业的焦点所在。这次大会不仅展示了OpenAI在科技领域的最新突破,还向全球的开发者社区揭示了新的挑战和机遇。
GPT4-Turbo:更强大的GPT4
OpenAI在其开发者大会上发布了GPT-4 Turbo——这是GPT-4模型的最新升级,其强化了许多关键功能,标志性的提升包括扩大了上下文长度的处理能力、更新的数据库和多模态能力。
▋扩大了上下文长度的处理能力:
GPT-4 Turbo的上下文处理能力从8k token提升至128k token,这使得GPT-4 Turbo能在与人对话时记住更长的文本,从而提供更连贯和准确的交互体验。
▋更新的数据库:
GPT-4 Turbo的知识库扩展至2023年4月,得到了显著更新,让用户能获取到更准确的信息,改进了原模型在实时网络信息调用上的局限性。
▋多模态能力:
GPT-4 Turbo的一大亮点是多模态能力,现在开发者可以利用其新的文生图功能、文本到语音(TTS)能力,以及综合这些能力的GPT-4 Turbo with Vision,以识别图片和语音输入并产出相关内容。
控制性的提升为开发者提供了更精细的操作能力,GPT-4 Turbo支持多函数并行调用、更精确的指令跟随,以及通过种子参数实现可再现的输出,使得生成内容更一致且可靠。模型自定义能力同样得到了增强,现在开发者可以在GPT-4基础上进行定制化调试训练,尽管这需要更多的工作,但OpenAI提供了协助训练的内部工程师支持。
价格上的降低也是一大亮点,GPT-4 Turbo的使用成本大幅减低,相较于原版GPT-4,价格降低了2.75倍,并且API的token处理量提升了一倍,这将极大降低开发者的运营成本。
GPTs:个性化AI
本次大会的焦点莫过于GPTs的推出,它不仅扩展了GPT系列的功能,更引发了人机交互方式的革命性变化。GPTs是基于GPT-4 Turbo,可个性化定制的智能体。利用GPT Builder这一创新工具,即使是没有编程背景的用户也能通过简单的自然语言指令来构建具有各种功能的GPTs。GPT Builder的设计理念在于简化复杂性,它包含了指令设定、知识扩展和行为编程等功能,这使得用户不仅能构建会话AI,还能上传自定义数据,甚至整合外部服务以执行更复杂的任务。
这种由GPT Builder引入的全新交互模式如同为用户提供了一块白画布,用户可以通过语言的引导和知识的输入,塑造出具有特定技能的数字助手。就像一个婴儿,通过不断教育和训练,它便可以成长为能够独立完成复杂任务的伙伴。比如教育行业,GPTs能够化身为编程导师,将通常枯燥的编程概念通过生动的比喻和实例呈现,显著提高学生的学习效率并开拓教师的教学方法;设计行业,CanavaGPT使得设计师只需向GPT描述需求,便能借助外部资源如Canava这类设计平台,快速创造出满足用户期望的视觉作品,这不仅简化了设计流程,更为创意的实现提供了无限可能。
GPTs的诞生,在笔者看来不仅意味着将程序开发领域从专业程序员的固有领域转变为每个有创意想法的人都能参与的舞台,更意味着其我们的学习方式在未来可能会彻底改变。随着技术的成熟,我们可能会看到完全由AI驱动的课程,这些课程能够根据我们的学习速度和风格进行自我调整,从而使得“因材施教”真正得以实现。
GPT商店与助手API:构建生态与技术支撑
OpenAI还专为那些面临更为复杂需求的开发者和企业设计了GPT Builder的进阶版——助手API。这一API不仅具备更加强大的上下文处理能力,而且其功能调用能力也得到了显著加强,极大地简化了外部知识的整合过程。这一点也得到了OpenAI创始人之一Greg Brockman的强调,他在展示如何使用时分享了自己的亲身体验,突显了助手API在构建下一代用户界面中的巨大潜力。
同时,OpenAI在构建全面的AI应用生态方面迈出了重要一步——GPT商店。在我看来,这一平台并非集合了各种GPT模型的应用商店,而是一个创新的服务中心。在这里,用户可以订阅各式各样的GPTs,它们的服务范围从日常生活的小助手到专业领域的高级工具。例如,正如我们上文提到的,教师可以订阅专门为编程教学设计的GPT,然后通过GPT生动的语言和实例帮助学生更好地理解复杂的编程概念;而营销专业人员则可以依赖特制GPT来分析消费者数据,为市场策略提供深入的见解。
这些创新举措不仅显著提升了用户体验,还为OpenAI在应用发布和分发领域打下了坚实的基础。可以预见的是,这在未来可能会引发与现有应用分发巨头如苹果App Store或Google Play的激烈竞争。随着GPT商店的不断成熟,OpenAI有望在AI时代成为一个类似苹果或谷歌在移动互联网时代那样的一个关键平台,这不仅能改变人们获取和使用AI应用的方式,而且还可能重塑整个数字产品和服务的商业生态系统。
结语
OpenAI在开发者大会上的这些动作,不仅仅展示了其在技术层面的深厚积累和领先地位,也体现了其对开发者社区的重视和扶持。在AI技术日新月异的今天,OpenAI正通过其平台和工具,赋予开发者们更多的创造力和可能性,这在整个行业中都是值得关注和学习的典范。
当然,我们要看到的是,尽管OpenAI的这些举措为技术开发者们带来了新的契机,但也无可避免地对市场格局产生了冲击。价格的降低和技术的开放,可能会使得依赖于传统模式的小型创业公司感受到前所未有的压力。在笔者看来,这也是技术进步带来的市场自然选择过程,只有不断创新和适应,企业才能在这波AI技术的浪潮中立于不败之地。
总而言之,这次OpenAI开发者大会不仅展示了AI技术的最新成就,更向我们揭示了一个全新的智能化未来。我们站在技术变革的大门前,面对这些改变,我们每个人都有机会成为变革的提出者和参与者。随着AI技术的不断进步和普及,我们将如何利用这些工具来改善我们的工作、学习和生活?现在是时候开始思考这些问题,并准备好迎接一个全新的智能世界了。
本文在编者未观看OpenAI开发者大会的情况下,先由ChatGPT4和GPTs:Creative Writing Coach生成,后经编者整理、修改后成文;封面图由GPTs:DALL·E生成。
编者花费了2小时37分钟生成并修改好了这一文章,当然,这里面有大概一半的时间都是等待GPT4响应的垃圾时间,但是编者目前也不清楚这究竟是网络环境问题(VPN)还是大模型的响应问题,如果是网络环境问题,那么笔者认为改善网络环境后其花费的时间可以缩短到1小时30分钟左右。就笔者的使用体验来看:
-
新版的GPT4目前仍不能很好支持中文:用英文回答中文问题(指定GPT用中文回答的情况下)、翻译腔/机器腔、病句、无法指定中文词数(多次尝试指定中文1500词,但最多只有1000词左右)
-
新版的GPT4多模态输入能力有待加强,如果上传多个文件,有时可能会遇到只读取1-2个文件的情况;如果提问方式有问题,甚至会出现GPT不读取文件直接回答的情况。
-
GPTs在特定方面确实要比传统的GPT要强,如编者此次使用的Creative Writing Coach,其提出的文章修改意见以及观点要比传统GPT更加优秀(如本文最后一段以及GPTs诞生对学习的意义)。
-
制作GPTs的步骤很简单,但关键是如何让AI理解你的目的,从而达到特定用途的优化,否则制作出的GPTs可能和传统GPT没有太大差别。
参考
短短 45 分钟发布会,OpenAI 如何再次让 AI 圈一夜未眠
开发者大会上,OpenAI展示如何杀死所有寄生的小创业者们。。。
OpenAI再次颠覆行业!GPT4新版本,API降价2/3,还有AI版Appstore
“一夜回到解放前”,OpenAI正在摧毁创业公司?
https://www.toutiao.com/article/7298669664631341606/?app=news_article×tamp=1699363911&use_new_style=1&req_id=20231107213150719B11502C1BA41A2F3C&group_id=7298669664631341606&wxshare_count=6&tt_from=weixin_moments&utm_source=weixin_moments&utm_medium=toutiao_android&utm_campaign=client_share&share_token=e0b2fb52-f7e3-4bbb-a18d-1c5eaf3360fb&source=m_redirect&wid=1699804656896
现场直击一文总结!OpenAI开发者大会,史上最强GPT-4 Turbo发布,AI圈地震
https://www.woshipm.com/ai/5935954.html
看完OpenAI开发者大会,BAT都沉默了
https://new.qq.com/rain/a/20231107A04N2P00