不要花一分钱,GPT-4o微调限时免费开放,每天附送百万训练token

2024-08-23

一觉醒来,OpenAI又上了新功能:


GPT-微调功能4o正式上线。


此外,官方还提供了一波福利:每一个组织都可以在9月23日免费获得100万个训练token。


换言之,开发者现在可以使用自定义数据集微调GPT-4o,然后,低成本建立自己的应用程序。


要知道,OpenAI在公告中透露:


GPT-4o微调训练费用为每个100万tokene 25 美金(这意味着每天可以节省25美元)



收到电子邮件的开发者兴奋地跑来跑去,这么大的羊毛一定要赶紧去掉。


使用方法也很简单,直接访问微调仪表盘,点击“create”,然后从基本模型下拉列表中选择gpt-4o-2024-08-06


顺便说一下,OpenAI还提到,只需训练数据集。几十个示例可以产生良好的效果。


也晒出了经典案例


消息发布后,一群网友跃跃欲试,表示非常想知道模型微调后的效果。


OpenAI官方早就准备好了,合作伙伴微调GPT-4o的实际案例也随公告一起发布。


首先是一款Genie代码助手,Cosine,一家AI初创公司,专门为软件开发者设计。


根据Cosine官方的说法,Genie的开发过程采用了一个专有的过程,使用了数十亿个高质量的数据对非公开的GPT-4o组合进行了练习和微调。


这些数据包括JavaScript和Python21%。、TypeScript和TSX的14%,以及其它语言的3%(包括Java、C 还有Ruby)。


Genie上周二在OpenAI新发布的代码能力基准测试中进行了微调。SWE-Bench Verified上,获得了43.8%SOTA成绩。



同时,Genie仍然是SWE-Bench SOTA在Full上的分数已经达到30.08%,打破SOTA前19.27%的记录。


相比之下,Cognition的Devin部分SWE-Bench测试为13.8%。


另外一个案例来自Distyl,它是一家为财富500强企业提供AI解决方案的企业,最近在SQL基准检测BIRD-SQL的领先文本中,排名第一


经过微调,其模型已经在排行榜上实现。71.83%执行的准确性在查询重构、意图分类、思维链和自我修正等任务中表现突出,尤其是在SQL生成方面。


OpenAI除提供案例外,还在公告中特别强调资料隐私和安全问题,总而言之就是:


开发者的业务数据(包括输入和输出)不会被共享或用于培训其他模型。微调模型已经实施分层安全减轻措施,例如,不断对微调模型运行的自动安全性进行评估和监控。




网民:微调比不上提示词缓存。


在一片热闹的时候,有网友认为微调仍然不如提示词缓存。


微调很帅,但还是不如提示词缓存…



之前也介绍过量子位,提示缓存的作用,这是一次向模型发送大量的prompt,然后让它记住这些内容,并且在后期请求中直接重用,防止重复输入。


谷歌的Gemini今年五月已支持提示缓存,Claude也在上周更新了这个功能。


由于无需反复输入重复脚本,提示缓存具有速度快,成本低这些优点。


有些网民认为,提示词缓存功能对开发者比较友好(不需要异步微调),而且几乎可以获得和微调一样的好处。


提示缓存可以让你付出1%的努力,获得99%的好处。



然而,也有人打电话给微调,认为微调正在塑造。响应效率更高。例如,确保JSON格式正确,响应更简洁,或者使用表情符号等。


看到OpenAI的竞争者纷纷使用提示缓存,还有人好奇:


想知道OpenAI是否会坚持微调或转换为提示缓存(或两者兼而有之)。



对于这一问题,其他网友也嗅出了一些蛛丝马迹。


在其延迟提升指南中,OpenAI提到了缓存技术。



我们还在第一时间找到了指南原文,其中谈到了指南原文。怎样减少token的输入?时提到:


将动态部分(如RAG结果、历史记录等)放置在提醒中,最大化共享提醒前缀。因此,您的请求对KV缓存更友好,这意味着每一个请求处理的输入token更少。



但也有网友认为,仅根据这一段,OpenAI不能直接推出使用提示词缓存技术的OpenAI。


BTY,抛开争议不谈,OpenAI的羊毛还是要薅起来~


除GPT-4o外,GPT-4oo也可以免费微调 mini,OpenAI在9月23日前每天免费提供200万个训练token。


参考链接:


[1]https://openai.com/index/gpt-4o-fine-tuning/


[2]https://x.com/OpenAIDevs/status/1825938486568038569


[3]https://news.ycombinator.com/item?id=41301673


本文来自微信微信官方账号“量子位”,作者:一水,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com