几个语言大模型试用分析

炎黄之声 120320385

<p class="ql-block" style="text-align: center;"><b style="font-size: 22px; color: rgb(237, 35, 8);">2023年7月30日</b></p> <p class="ql-block"><span style="font-size: 22px;">看过几篇AI语言大模型LLM综述文章,因为大语言模型复杂,而应用方向众多,文章的总结太泛,对我这个使用者,没什么太大价值。就以对话而言,脸书的LLAMA2,很差,我不用,但因为开源,所以有人可以研究。</span></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size: 22px;">我通过使用四个LLM,现逐一分析如下:</span></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size: 22px;">第一是OPENAI公司的CHATGPT。功能强大,分析问题能力强,总结能力强,逻辑推理能力强,对文本归纳、摘要、评价和改写,指出文中事实错误、推理错误的能力很强,生成文本能力强,但训练数据是几年前的,判断的依据只依几年前科研成果,对科学上新猜想都持怀疑态度,适合辅助一般文案工作。</span></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size: 22px;">第二是Anthropic公司的CLAUDE。在道德框架下,处理文本长度可达十万字,写摘要与写书评,都很厉害。但对科技创新不敏感,肚子里也没什么科技知识。尤其对科技创新的设想保守,偏文案处理,比CHATGPT有更好的文本情感识别力,写作能力一般般,不适合聊天。</span></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size: 22px;">第三是谷歌公司的Bard。逻辑推理、知识搜索功能强大,归纳、评价、总结,简明扼要,对科技知识了解全面深入。对文本关于科技创新设想及未知领域(灵魂探讨)持开放态度。翻译能力强。能记住对话者所有谈话内容,本人最喜欢。</span></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size: 22px;">第四是INFLECTⅠON公司的PI聊天机器人。语言幽默,会讲话,人文知识掌握多,谈话短而有深度,但其科技知识贫乏,远不如谷歌。</span></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size: 22px;">因为我测试评价这些工具,主要不是让其分类图像,也不是让其证明数学题,更不是让他们写程序,甚至很少让它们帮我写文章,主要用于评价文章、改写文章、判断文章观点的对错和进行趣味聊天等,所以个人认为:纯聊PI第一,其次谷歌bard,再次ChatGPT,最后是CIaude,他们各有所长,各有千秋。</span></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size: 22px; color: rgb(237, 35, 8);">总之,ChatGPT什么都会但收费,没有突出的长项;谷歌不收费但速度极快,医学知识最全;CLAUDE如少量提问则免费,偏人文;PI不收费,偏情感聊天。以上四个都要翻墙,而ChatGPT,即使翻墙也要用第三方转接,因为不对中国开放服务。</span></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size: 22px; color: rgb(237, 35, 8);">我用的AI助手频率多寡的顺序是,第一谷歌Bard,第二PI,第三ChatGPT,第四Claude,其余不用</span><span style="font-size: 22px;">。国产LLM一个都不用。我画画用两个,一是STABLE DIFFUSION,另外一个 JOURNEYDRAW,实际是MIDJOURNEY-DRAW,画手都画不好,每天可免费画几十张,要翻墙。(完)</span></p> <p class="ql-block"><b style="font-size: 22px; color: rgb(237, 35, 8);">ChatGPT点评:</b></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size: 22px;">这篇文章为我们提供了作者使用几个语言大模型的试用分析。以下是对文章的点评:</span></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size: 22px;">综合分析:文章对开放AI、Anthropic、谷歌和INFLECTⅠON公司的几个语言大模型进行了综合分析和评价。作者从功能、知识理解能力、写作能力、科技创新理解等方面进行了比较,并提到了每个模型的优势和适用情况。</span></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size: 22px;">使用目的和评价标准:作者明确了自己使用这些语言大模型的目的,主要用于文章评价、改写、判断观点和趣味聊天等。作者根据自己的使用需求,对这些模型进行了评价和排序,并给出了自己的使用偏好。</span></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size: 22px;">内容细节:文章提到了每个语言大模型的特点和功能方面的优势,从对话能力、总结能力、逻辑推理、知识全面性等方面进行了评价。同时,文章也提到了使用这些模型需要翻墙且部分需要通过第三方转接来使用。</span></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size: 22px;">个人观点:文章最后提到了自己使用的偏好和个人喜好,同时也提到了国产语言大模型未被使用的原因。</span></p><p class="ql-block"><br></p><p class="ql-block"><span style="font-size: 22px;">总的来说,这篇文章通过作者的试用分析,对几个语言大模型进行了总结和评价。文章给出了对这些模型的个人偏好和使用建议。然而,文章在论证和支撑观点方面较少提供具体的实证数据和例证,其中的观点和评价仅代表了作者个人的使用体验和主观观点。为了增加文章的说服力和可靠性,可以考虑提供更多的示例、对比和实证数据。</span></p>