大语言模型

Meet Gorilla:为API调用调优的完全开源LLM

developer.chat

12 April 2024

UC Berkley and Microsoft Research together came up with Gorilla, which specializes in API calls. This model is a 7b parameter model means consumer GPUs are in business. Let’s take a deeper dive!

Source: Gorilla paper

LLM驱动的自治代理

developer.chat

12 April 2024

Table of Contents

阅读更多关于 LLM驱动的自治代理
登录发表评论

最后7B参数模型胜过GPT-4！

developer.chat

22 March 2024

We are entering the era of small & highly efficient models!

阅读更多关于最后7B参数模型胜过GPT-4！
登录发表评论

【LLM】大型语言模型：2023年完整指南

pgmr.cloud

20 May 2023

Graph from Google Trends, displaying the search volume for "large language models"

Figure 1: Search volumes for “large language models”

近几个月来，大型语言模型（LLM）引起了很大的轰动（见图1）。这种需求导致了利用语言模型的网站和解决方案的不断开发。ChatGPT在2023年1月创下了用户群增长最快的记录，证明了语言模型将继续存在。谷歌对ChatGPT的回应Bard于2023年2月推出，这也表明了这一点。

语言模型也为企业带来了新的可能性，因为它们可以：

阅读更多关于【LLM】大型语言模型：2023年完整指南
登录发表评论

【LangChain】LangChain中的流支持

pgmr.cloud

11 May 2023

我们很高兴宣布在LangChain中提供流媒体支持。有很多关于LLM应用程序最佳用户体验的讨论，我们相信流媒体是其核心。我们还更新了chat langchain repo，以包括流和异步执行。我们希望这个回购可以作为开发人员构建一流聊天和问答应用程序的模板。

动机

开发人员在尝试构建有用的LLM应用程序时讨论的最大痛点之一是延迟；这些应用程序经常对LLM API进行多次调用，每次调用需要几秒钟的时间。盯着一个加载微调器看几秒钟以上可能会让用户感到非常沮丧。

流式处理通过逐个令牌而不是一次性返回LLM令牌的输出，有助于减少这种感知的延迟。在聊天应用程序的上下文中，当LLM生成令牌时，它可以立即提供给用户。虽然这不会改变从问题提交到完全响应的端到端执行时间，但它通过向用户显示LLM正在取得进展，大大减少了感知到的延迟。ChatGPT是利用LLM流的应用程序的一个很好的例子。我们构建了一个示例聊天机器人应用程序，该应用程序与ChatGPT一样使用流媒体（更多详细信息如下）：

https://www.loom.com/share/a64b1def314a4884ab0526bf77d9fa65

阅读更多关于【LangChain】LangChain中的流支持
登录发表评论

订阅大语言模型

热门内容

今日:

总体:

最近浏览：

标签（标签）

Meet Gorilla:为API调用调优的完全开源LLM

LLM驱动的自治代理

理解Mixtral中的稀疏专家混合（SMoE）层

最后7B参数模型胜过GPT-4！

【LLM】大型语言模型：2023年完整指南

【LangChain】LangChain中的流支持

动机