OpenAI 推出 GPT-3.5 Turbo 微调版本,用户能够拥有专属模型
2023-08-23 18:26
DeFi之道
2023-08-23 18:26
订阅此专栏
收藏此文章
开发人员现在可以使用自己的数据来根据自己的用例定制 GPT-3.5 Turbo。


撰文:Kyle


图片来源:由无界 AI 生成


开发人员现在可以使用自己的数据来根据自己的用例定制 GPT-3.5 Turbo。


GPT-3.5 Turbo 的微调版本现已推出,GPT-4 的微调将于今年秋天推出。 这次升级更新使开发人员能够自定义更适合其用例的模型,并大规模运行这些自定义模型。 早期测试表明,GPT-3.5 Turbo 的微调版本在某些垂直应用任务上可以匹配甚至超越基本 GPT-4 级别的功能,这意味着 GPT-3.5-Turbo 现在能够像 GPT-4 一样高效,但成本要低得多。


隐私方面同样不用担忧,与所有的 API 一样,传入和传出微调 API 的数据归客户所有,OpenAI 或任何其他组织不会使用这些数据来训练其他模型。


GPT-3.5 Turbo 微调能够用来干什么?


开发人员和企业一直以来都有一个需求,那就是能够自定义自己的模型,从而根据自己的需求为自己用户创造独特且差异化的体验。 这次 GPT-3.5 Turbo 微调版本的推出就是为了满足这一需求。开发人员现在可以运行监督微调,以使该模型在其用例中表现更好。


微调通过训练超出提示范围的更多示例来改进小样本学习,让您在大量任务上取得更好的结果。 一旦模型经过微调,您就不需要在 Prompt 中提供那么多示例。 这可以节省成本并实现更低延迟的请求。微调 GPT 模型可以使其更好地适应特定应用。


微调可以改善一些模型生成结果:


  • 设置风格、基调、格式或其他定性方面
  • 提高产生所需输出的可靠性
  • 纠正未能遵循复杂提示的问题
  • 以特定方式处理许多边缘情况
  • 执行难以在提示中阐明的新技能或任务


在此前的测试中,用户已经能够在常见用例中有意义地提高模型性能,例如:


1) 提高可操纵性:


微调允许企业使模型更好地遵循指令,例如使输出简洁或始终以给定语言进行响应。 例如,开发人员可以使用微调来确保模型在提示使用德语时始终以德语进行响应。


2) 更可靠的输出格式:


微调提高了模型一致地格式化响应的能力——对于需要特定响应格式的应用程序(例如代码完成或编写 API 调用)来说,这是一个至关重要的方面。 开发人员可以使用微调来更可靠地将用户提示转换为可在自己的系统中使用的高质量 JSON 片段。


3) 自定义基调:


微调是磨练模型输出质量(例如基调)的好方法,因此它更适合企业品牌。 拥有知名品牌的企业可以对模型进行微调,使其与其基调更加一致。


4) 缩短 Prompt:


除了提高性能之外,微调还使企业能够缩短 Prompt ,同时确保类似的性能。 使用 GPT-3.5-Turbo 进行微调还可以处理多达 4k token——是之前的两倍。 早期测试人员通过对模型本身的指令进行微调,将 Prompt 大小减少了高达 90%,从而加快了每个 API 调用的速度并降低了成本。


当与其他技术(例如即时工程、信息检索和函数调用)结合使用时,微调的功能最为强大。 对函数调用和 gpt-3.5-turbo-16k 微调的支持将于今年秋季晚些时候推出。


哪些用例将能够从中受益?‍‍‍


GPT-3.5 的微调将改变游戏规则。哪些用例将能够从中受益:


  • 客户服务聊天机器人:


针对金融或医疗保健等特定行业的个性化聊天机器人,提供更准确、更相关的响应。


  • 内容创建:


针对特定类型(例如科幻故事或商业文章)量身定制的自定义内容生成器。


  • 语言翻译:


改进的翻译工具,可以针对小众语言或地方方言进行微调。


  • 教育平台:


针对特定课程或科目进行微调的交互式学习助手。


  • 游戏:


视频游戏中的 NPC(非玩家角色)对话可以根据特定的游戏传说或叙述进行定制。


  • 医疗诊断:


为医生提供的辅助工具,可根据特定的医疗数据提供潜在的诊断或治疗建议。


  • 法律研究:


经过微调的自动化系统,可解析和总结法律文件、法院判决或法规。


  • 代码完成工具:


辅助编码平台,提供针对特定编程语言或框架量身定制的建议。


  • 电子商务助手:


聊天机器人旨在理解和响应特定的产品查询,协助购物决策。


  • 食谱生成器:


根据特定饮食限制或美食偏好生成食谱的工具。


  • 心理健康平台:


专门为焦虑或抑郁等特定情况提供支持的虚拟治疗师或助理。


  • 财务分析:


经过微调的人工智能工具可以分析股票市场趋势、房地产价值或其他利基金融领域。


  • 创意艺术:


针对特定流派或风格量身定制的人工智能辅助音乐创作或艺术设计工具。


  • 旅行助手:


针对特定地区进行微调的虚拟旅行指南,提供当地见解、语言支持和旅行提示。


  • 家庭自动化:


语音助手经过微调,可以理解特定智能家居系统或电器的命令。


  • 技术支持:


定制的自动化系统可指导用户排除特定产品或软件的故障。


  • 房地产平台:


人工智能助手根据非常具体的用户偏好(从建筑风格到便利设施的接近程度)提供房产建议。


  • 天气预报:


专门为农业或活动策划等特定行业提供详细天气分析的人工智能工具。


  • 时尚和风格推荐:


人工智能造型师可以根据特定的流行趋势、体型或场合提供量身定制的服装建议。

【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

DeFi之道
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开