【聊天机器人】为什么你不能信任聊天机器人——现在比以往任何时候都更重要即使在语言模型扩大之后,它们在简单的任务上也被证明是不可靠的
ChatGPT等人工智能聊天机器人和其他由大型语言模型驱动的应用程序已经得到了广泛的应用,但它们的可靠性却臭名昭著。一个常见的假设是,扩大驱动这些应用程序的模型将提高其可靠性,例如,通过增加它们训练的数据量或用于处理信息的参数数量。然而,根据一项新的研究,这些语言模型的更新和更大版本实际上变得更加不可靠,而不是更少。
大型语言模型(LLM)本质上是智能手机用来预测一个人正在键入的单词其余部分的自动补全功能的超级版本。ChatGPT,也许是最著名的LLM驱动的聊天机器人,已经通过了法学院和商学院的考试,成功回答了软件编码工作的面试问题,撰写了房地产清单,并开发了广告内容。
但法学硕士经常犯错误。例如,6月份的一项研究发现,ChatGPT在生成函数式代码方面取得了极其广泛的成功,成功率从微不足道的0.66%到89%不等,具体取决于任务的难度、编程语言和其他因素。
研究团队已经探索了一系列策略,使LLM更可靠。这些包括增加模型的训练数据量或计算能力,以及使用人类反馈来微调模型并提高其输出。随着时间的推移,LLM的性能总体上有所提高。例如,早期的LLM在简单的加法(如“20+183”)上失败了。现在LLM成功地执行了涉及50位以上数字的加法。
【聊天机器人】2024年最佳人工智能聊天机器人(七)
【聊天机器人】2024年最佳人工智能聊天机器人(六)
【聊天机器人】2024年最佳人工智能聊天机器人(五)
【聊天机器人】2024年最佳人工智能聊天机器人(四)
【聊天机器人】2024年最佳人工智能聊天机器人(三)
Grok
Tuned for straight answers (safety off)
Model: Grok-1
埃隆·马斯克已经在太空竞赛中了,为什么不加入人工智能竞赛呢?经过四个月闪电般的开发速度,从零到准备就绪,与领先的模型相比,Grok可以带来有希望的结果。但除了技术方面的东西,它真正吸引人的是细节。
让我首先说,我还没能测试它。我不太喜欢推特(或Xer),所以我不能订阅X Premium+计划,因为我已经很长时间没有活动了。你将要阅读的是我在网上消费的新闻和观点文章的综述。我强烈鼓励你也投身其中;非常有趣。
Grok应该尽可能直白地说出真相。撇开哲学问题不谈,这意味着人工智能不会像GPT或Claude那样受到同样的安全措施的阻碍。它不会回避回答你脑海中的任何问题。这是双向的,所以很难在这里做出判断。
【聊天机器人】2024年最佳人工智能聊天机器人(二)
【聊天机器人】2024年最佳人工智能聊天机器人(一)
为您的下一次AI聊天机器人冒险寻找一个ChatGPT替代方案。
ChatGPT是第一个广泛使用的人工智能聊天机器人,但现在竞争越来越激烈。其他模型也加入了这一场景,提供了更长的对话记忆、移情反应和基于自己的数据——以及许多其他可能性。
请允许我为您保存十几次谷歌搜索(或ChatGPT提示)。我花时间与一些最好的人工智能聊天机器人交谈,看看它们的效果如何。你会在这里找到很多东西,包括帮助你创建内容的ChatGPT替代品、可以搜索网络的人工智能聊天机器人,以及一些有趣的选择。如果你在这里找不到你想要的东西,你甚至会看到如何构建自己的人工智能聊天机器人。
从我写这篇文章到你读这篇文章,市场上可能会有更多的人工智能聊天机器人,但就目前而言,这里是最有趣的。
最好的人工智能聊天机器人
-
The original: ChatGPT
【LLM】用LangChain进行问答任务的自动评估
【Chatbot 】很棒的聊天机器人项目
ParlAI
A framework for training and evaluating AI models on a variety of openly available dialog datasets.
https://github.com/facebookresearch/ParlAI
stanford-tensorflow-tutorials
A neural chatbot using sequence to sequence model with attentional decoder.