发布于 

OpenAI o1 ,我试用一周多所了解到的

1、OpenAI 在 9 月 13 日发布了 o1 的预览版。

2、o1 全称叫 OpenAI o1, 没有延续之前 GPT 系列,可见足够强大,当然也有一种说法是 o1 作为一个垂直基础模型为未来 GPT5 赋能。

3、o1 在推理方面变得更加强大了,特别擅长做数学题和写代码。在国际数学奥林匹克(IMO)资格考试中,GPT-4o 只正确解决了 13% 的问题,o1 的得分为 83%。

4、o1 分为两个版本:o1-preview 和 o1-mini,可能因为训练成本巨大或是其他原因(比如收集更高质量的问题),发布时 o1-preview 每周只能使用 30 次查询,o1-mini 是 50 次。GPT Plus 的付费用户才能使用。

5、9 月 17 号,OpenAI 发布消息,放宽了限额,o1-preview 现在为每周 50 次查询,o1-mini 改为每天 50 次查询。

6、o1 最特别的地方是能「思考」了,之前的版本都强调能快速给出结果,对 o1 来说「慢」是一种特点,当我们对 o1 提出问题时,内部会生成一个思维链来逐步推理问题,类似于人类解题时的思考过程,尝试不同的策略,并能认识到自己的错误。所以时间花的更长,通常几秒到几十秒不等。

7、o1 的慢和之前系列的快,就像丹尼尔·卡尼曼的《思考,快与慢》中写的快思考和慢思考:

  • 快思考:联想记忆,从已经训练的数据中快速获取,利用简化的决策规则解决问题,容易出现错误。
  • 慢思考:有逻辑性,能对提的问题进行反复推敲,自我监督和矫正,正确率较高。

8、正是因为 o1 能对问题进行推敲,就大大降低使用者的难度了,以前想要一个好的答案,需要写出好的提示词,现在 o1 经过推敲,更能理解提问者背后的意思。提升了易用性和效率。AI 发展太快,提示词工程师是不是刚要上岗就面临失业了呢?

9、和 GPT-4o 相比较,虽然推理能力强大很多,但功能还不算完善,比如不支持图像、不支持联网查询等,期待后续的版本。

10、对于编码来说,我们使用 o1-mini 就够了,因为 o1-mini 比 o1-preview 便宜 80%,每周有更多的查询次数,而且,编码仅需要推理不需要广泛的世界知识,非常适合 o1-mini。

11、我用 o1-mini,写了一个 License 生成工具,前端用 vue3、后端使用 .NET8,慢慢引导,从基本的功能到加上登录、加上鉴权等,周末一个上午时间就搞定了,基本没有出错,确实很强大。

12、AI 这么强大了,我们应该做更重要的事情。我觉得技术学习分为三层:

  • 架构层:架构层关注的是如何设计和构建系统的结构,确保系统的整体性和功能性,比如:单体、微服务、分布式、涉及模式、性能优化、扩展性、可维护性、安全性等。了解这些才能熟练驾驭 AI。
  • 工具层:编程语言、框架使用等,这部分可以 AI 代替。
  • 原理层:原理层是技术学习中最深入的一层,它关注的是底层原理和概念。了解这些,当 AI 抽风时不至于束手无策。

重要的事情就是指架构层和原理层的学习。