【智能科技前沿】近期,AI大模型的发展如日中天,呈现出多样化与加速化的趋势。与早期厂商主要追求发布参数量庞大、功能强大的通用大模型不同,当前市场激烈的竞争和技术成熟,促使各大厂商开始寻求将AI的强大能力转化为商业价值和解决实际问题的具体途径。正值开学季,众多品牌纷纷推出优惠促销活动,数码产品品类更是享受国家补贴,许多消费者纷纷抓住机会进行选购。那么,借助大模型来组装电脑或推荐手机,这种做法是否靠谱?今天,我将挑选几家通用大模型进行实测。
我选择了近期崭露头角的DeepSeek(R1),以及市面上热门的文心一言(3.5)、豆包AI、通义千问和讯飞星火等五款大模型,均为免费版本。我对它们进行了相同的提问,每款大模型重复提问三次。
首先,以电脑装机为例,我提出的问题是:“预算5000元,帮我组装一台能畅玩《黑神话:悟空》的电脑,请给出具体配件型号。”接下来,我们将一一查看各模型的回答。
DeepSeek(深度思考,联网搜索)的三次回答如下:
1. 配置一:...
2. 配置二:...
3. 配置三:...
总结:...
豆包的三次回答如下:
1. 配置一:...
2. 配置二:...
3. 配置三:...
总结:...
通义千问的三次回答如下:
1. 配置一:...
2. 配置二:...
3. 配置三:...
总结:...
文心一言的三次回答如下:
1. 配置一:...
2. 配置二:...
3. 配置三:...
总结:...
讯飞星火的三次回答如下:
1. 配置一:...
2. 配置二:...
3. 配置三:...
总结:...
测试结果显示,DeepSeek在五款大模型中表现最佳,配置合理,给出了详细的推荐理由、参考价格及配置优化方向和购买建议,回答最为全面;豆包的表现也相当不错,提供了三套不同配置,且各配件选择合理,同样有参考价格;其他三款模型则存在较为明显的问题,如配件型号错误或缺失等。
接下来,我们来看看手机推荐方面的表现。
DeepSeek依旧表现出色,将推荐产品进行分类,总结核心配置和优缺点,回答简洁明了,并考虑了国补政策,推荐产品基本符合要求,且给出了补贴后的参考价格,非常细致。至于槽点,同样是不胜其烦的多次尝试。
豆包的三次回答结果如下:
1. 回答一:...
2. 回答二:...
3. 回答三:...
总结:...
通义千问的三次回答如下:
1. 回答一:...
2. 回答二:...
3. 回答三:...
总结:...
文心一言的三次回答如下:
1. 回答一:...
2. 回答二:...
3. 回答三:...
总结:...
讯飞星火的三次回答如下:
1. 回答一:...
2. 回答二:...
3. 回答三:...
总结:...
在手机推荐方面,DeepSeek的表现依旧最佳,会根据消费者侧重点对推荐产品进行分类,回答清晰明了,并考虑了国补政策;其次是豆包和文心一言,选择的产品基本符合要求,且给出了推荐理由和参考价格,文心一言在机型选择上更新一些;讯飞星火推荐的产品虽然较少,但基本符合要求,但出现了描述错误;通义千问给出的答案则有些滞后性,都是较老的机型,不太符合设置条件。
当然,以上内容仅基于我个人的使用体验和测试结果,仅供参考,如有雷同,纯属巧合。
写在最后
个人体验来看,借助大模型来装机或推荐手机具有一定的参考价值。如果你对相关产品有一定了解和关注,可以借助大模型辅助选择符合需求的产品,进行初步筛选,然后根据个人偏好进行详细搜索,最终购买合适的产品。同时,你也可以像我个人一样,咨询多家大模型,以获得更多参考信息,反正都是免费使用的。