OpenAI新上线GPT太强了,服务器瞬间挤爆,马斯克:你们太沉迷了

2022-12-18 0 292

电脑之心报导

撰稿:朱锐、竹筏

打声和 ChatGPT 聊了几句话,它把我的难题化解了。

当每一人都在默默等候 GPT-4 正式发布时,OpenAI 却一直暂时没最新消息,仍在复原其创建者。另一家公司总部位于美国纽约的公司于昨日正式发布了两个名叫 ChatGPT 的新数学模型,它是 GPT-3 的派生产品,它以谈话的方式进行可视化。

这种谈话容许 ChatGPT 提问先期难题,认错,考验不恰当的大前提,并婉拒不适度的允诺。有别于别的词汇数学模型无中生有,比如说 Meta 的词汇数学模型 Galactica 因为可耻的无中生有,上架两天就停售了。ChatGPT 的不同点是,当它不晓得自己在说甚么时,它宣称不晓得。此外,ChatGPT 婉拒提问它没经验丰富体能训练的难题,比如说,它不能企图提问有关 2022 年之后出现的该事件的难题。它也不能提问有关对个人的难题。

那个数学模型究竟有多智能化?从前增容标识符的忍耐力活都得开发人员突发奇想,现在 ChatGPT 能揽下那个蠢事。

使用者表示:这段标识符没像我期许的那般运转,我该如何修正?

OpenAI新上线GPT太强了,服务器瞬间挤爆,马斯克:你们太沉迷了

ChatGPT:你给的语句重要信息不多了,无论如何出标识符的难题。你若想提供更多更多有关标识符的重要信息,比如说标识符用以干甚么的,这是整个标识符还是其中的一小部分?

使用者:这是标识符的一小部分。我认为 channel 出现了难题。

ChatGPT:如果没更多重要信息来表明标识符应该做甚么、继续执行时出现了甚么,那个难题就无论如何了。从你提供更多的重要信息能窥见,标识符的两个潜在性难题是 resultWorkerErr channel 从未关闭,这意味着如果从未写入 resultWorkerErr channel,标识符可能会挂起。如果 b.resultWorker 没返回错误或者它在有机会返回错误之前被取消,就会出现这种情况。

要化解此难题,你能在写入 resultWorkerErr channel 后将其关闭。比如说,你能在向 channel 发送错误的行之后添加以下标识符行:

OpenAI新上线GPT太强了,服务器瞬间挤爆,马斯克:你们太沉迷了

这将确保 resultWorkerErr channel 总是关闭的,即使 b.c retworker 从未返回错误。同样,如果没更多有关你所看到的难题的重要信息,很难判断这是否是你正在经历的难题。你能提供更多更多有关运转标识符时出现的细节吗?

以上就是 ChatGPT 修正 Bug 的两个过程,能说是刨根问底了。

在下面的示例中,ChatGPT 提供更多了对先期指令的响应。下图大概意思是说,使用者要求 ChatGPT 帮自己写个简短的介绍,好与邻居认识一下;ChatGPT 给出了一篇简短文字介绍,但使用者嫌弃不够正式,好脾气的 ChatGPT 又来了一版正式一点的;之后使用者又提了两个要求,让 ChatGPT 帮忙寄出去。最后 ChatGPT 提问:「很抱歉,我是两个基于文本的 AI 助手,没能力为你发送一封实体信件。我只能提供更多有关写甚么的建议。你能接受该建议并自己发送这封信。」

OpenAI新上线GPT太强了,服务器瞬间挤爆,马斯克:你们太沉迷了

看到这,你是不是也想尝试一番。不错,那个数学模型一经正式发布,让很多人沉迷于而无法自拔,就连特斯拉都来了一句:「很多人陷入了该死疯狂的 ChatGPT 循环中。」

OpenAI新上线GPT太强了,服务器瞬间挤爆,马斯克:你们太沉迷了

一时间,大家仿佛找到了两个新的乐子,纷纷和 ChatGPT 打开了谈话模式。「要求它解释两个没语句的复杂的正则表达式……」那个难题真是够难为人的,但是难不倒 ChatGPT。看这解释的篇幅,应该是解释清楚了。

OpenAI新上线GPT太强了,服务器瞬间挤爆,马斯克:你们太沉迷了

「ChatGPT 是两个很好的 debugging 伙伴,它不仅能解释 bug,还能复原 bug 并解释复原 bug 的方法。」网友表示。

OpenAI新上线GPT太强了,服务器瞬间挤爆,马斯克:你们太沉迷了

更有网友不可思议道:「天呐,ChatGPT 竟然晓得 AWS IAM 策略。」

OpenAI新上线GPT太强了,服务器瞬间挤爆,马斯克:你们太沉迷了

「ChatGPT 能生成数百行 Python 标识符,将 100 GB 的文件上传到 AWS S3 bucket 中,只需编写这样一句话即可「Write Python code to upload a file to an AWS S3 bucket(编写 Python 标识符,将文件上传到 AWS S3 bucket 中)。」

OpenAI新上线GPT太强了,服务器瞬间挤爆,马斯克:你们太沉迷了

由于大家太过热情,试用网站已经崩了:「我们的需求异常旺盛。请稍等,我们正在扩充我们的系统。」

OpenAI新上线GPT太强了,服务器瞬间挤爆,马斯克:你们太沉迷了

试用地址:chat.openai.com

方法

ChatGPT 使用与 InstructGPT 相同的方法——用人类反馈强化学习 (RLHF) 体能训练数学模型,但数据收集设置略有不同。ChatGPT 使用监督微调训

为了创建强化学习的奖励数学模型,该研究需要收集端策略优化算法(PPO)微调数学模型,并对整座过程进行了几次迭代。

ChatGPT 对 GPT-3.5 系列中的某个数学模型进行了微调,该数学模型于 2022 年初完成体能训练。ChatGPT 和 GPT 3.5 在 Azure AI 超级计算基础设施上进行了体能训练。

局限性

1. ChatGPT 有时会写出看似合理但不恰当或荒谬的答案。化解那个难题非常具有考验性,因为:

数学模型被体能训练得过于谨慎导致它婉拒提问能恰当提问的难题;(3) 监督体能训练会影响数学模型的性能,因为理想情况是数学模型晓得恰当答案是甚么,而不是人类演示者晓得是甚么。ChatGPT 对调整输入措辞或多次尝试相同的 prompt 很敏感。比如说,给定两个难题,数学模型能声称不晓得答案,但只要对难题稍作改写,数学模型就就能恰当提问。数学模型的提问通常过于冗长并过度使用某些短语,比如说重申它是 OpenAI 体能训练的词汇数学模型。这些难题源于体能训练数据(体能训练者喜欢看起来更全面的长答案)和过度优化。理想情况下,当使用者提供更多模棱两可的查询时,数学模型会提出质疑,然而 ChatGPT 目前是自行猜测使用者的意图。虽然该研究已努力使数学模型婉拒不当请

相比于 GPT-3 和 Codex,ChatGPT 作为 OpenAI 最新正式发布的数学模型,已经在安全性和可用性方面做出了诸多改进,汲取了先前数学模型的经验教训,并通过使用人类反馈强化学习 (RLHF) 大幅减少了数学模型的有害和不真实输出。

参考链接:

https://openai.com/blog/chatgpt/

https://twitter.com/search?q=ChatGPT&src=typed_query

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务