谈谈GPT-4模型的亮点


  欢迎关注微信公众号

专注于网络安全领域,跟踪漏洞动态,深耕互联网,做一个深谙攻防之道的公众号。
同时涉足多个领域,是哲学,抑或是文学与艺术,关注金融市场,研究全球市场经济发展方向。

01
开门见山
直观标题,今天要聊的依然是人工智能聊天机器人,也就是和ChatGPT有关的,与其说聊,不如说应该侃侃而谈。

相信各位长期混迹于各大短视频平台,也早已知道OpenAI在当地时间3月14日发布了GPT-4这个消息了吧。

所以我只做一些其他的补充,但是这个补充不会参考其他同主题的文章。

根据GPT-4模型的宣传片,GPT-4有以下三大特点: 图像识别、高级推理、庞大的单词掌握能力。

 

1.图像识别

简单来说,GPT-4能够分析你提供的图片,并给出一些与图片有关的信息。 需要注意的是,GPT-4的图像识别能力与DALL·E2模型所掌握的能力并不一样,前者是注重于识别,而后者是创建和扩展图像,也就是说一个是分析师,另外一个是画家。

 

比如下面的案例:

GPT-4可以根据你提供的冰箱食材图片,给你生成几份菜谱。 所以我的康帅傅和六个核弹……

以及OpenAI提供的一个我认为比较幽默的案例。

我来解说一下:首先是用户提供了三张图片,并问GPT-4这些图片有什么幽默之处,每张图片都描述一遍。

 

于是GPT-4是这么回答的:

当然,如果这个案例不是出于OpenAI团队,那么就是网友们为了调侃GPT-4而已,不过这也充分证明了GPT-4模型强大的图片识别能力。

 

2.高级推理

这里说的推理能力应该不是像柯南那样身体虽然变小,但是醒来发现自己的声优被换了人……而是说GPT-4能够回答上下文关联性比较复杂的问题,比如在各种专业测试以及相关学术考试评测中,成绩也把之前的GPT-3.5甩得远远的。

 

3.强大的单词掌握能力

在GPT-4模型中,单次提问的文字字数限制将提升到25000个单词,并且几乎支持所有的编程语言。

 

可能不同于让ChatGPT翻译一部短篇小说或者论文那样,因为在我看来,正常情况下一个人不会提问一个超过一万字的问题,即使内容有很大的关联性或者许多细节。 所以,这可能对于“你”写一份充满BUG的代码是有好处的,但前提是你得拥有它。

而且,要知道,在GPT-3模型中,中文所占训练语料的比例不到0.2%,英文却占了92%,这是惊人的,哪怕是这样,它也同样强大。 有一些专家还指出,在一些特殊的问题上,尽量使用英文去提问,可能效果会更好,比如各种编程难题。

 

在GPT-4开发者视频的结尾,OpenAI联合创始人兼总裁Greg Brockman说了一句话: “它并不完美,但你也一样。 ”

 

02
东郭先生

说完GPT-4,另外一边让人注意的是国内的“文心一言”,也就是百度在今年2月7日对外官宣的人工智能聊天机器人。 但是在前几天被网友传出取消了预约的直播发布会,具体原因未知。

 

明天是3月16日,很多人都想看看“文心一言”的表现。 GPT-4模型发布后,在各大平台的讨论中,会看到一些有趣的发言。

以及一张世界名画:

这个30秒看广告的确实很符合我对百度的印象,看看百度贴吧的个人主页就知道了,点开就是各种金融理财、贷款的广告,虽然不是弹出式或者嵌入式的,但是看着让人就以为是贷款APP。

 

我是真想不明白那些策划是怎么想的。 于是就有一张图片专门调侃“文心一言”的:

或者说类似于下面的前车之鉴。

又或者是这样的,当然肯定是假的:

狼来了的故事讲多了,再讲也不会有人信的。