在前面初次接触到科大讯飞的星火大模型的时候我就写过一篇和chatGPT模型的对比分析测试文章,如下,感兴趣的话可以自行移步阅读即可:
今天正好有点时间,加上前面一段时间国产大模型里面比较火热的应该就是清华发布的chatGLM了,就想着拿来做下测评分析。还是与前文一样的方式。
问题1:
答案:
问题2:
答案:
问题3:
答案:
问题4:
答案:
问题5:
答案:
问题6:
答案:
问题7:
答案:
问题8:
答案:
整体测评最直观的感觉就是从篇幅上来讲,chatGPT生成的内容篇幅都是更多一点的,在一般性的文本问答层面没有特别大的差异体现出来,但是在逻辑运算上面感觉差距还是挺大的,不过官方一早也就说过了,这个模型暂时并不擅长去做逻辑运算、代码开发之类的工作,也是希望国内有更多迎头追赶的模型出现吧,这样在大模型赛道上面可以有更多的好用的工具出现造福广大群体。