 开源中国 2023 大模型(LLM)技术报告有出色的表现。 GitHub Copilot 16 / 32 大模型应用现状:知名大模型 在全球范围内,已经发布了多款知名大模型,这些大模 型在各个领域都取得了突破性的进展。 处理文本数据的 GPT-4,能同时处理和理解多种类型数 据的多模态模型 DALL-E 3,以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户,构成了 大模型领域的「第一梯队」。 讯飞星火 17 Agent。在给定 AutoGPT 一个自然 语言目标后,它会尝试将其分解为多个子任务,并在自动循环中使用 互联网和其他工具来实现该目标。它使用的是 OpenAI 的 GPT-4 或 GPT-3.5 API,是首个使用 GPT-4 执行自主任务的应用程序实例。 AutoGPT 最大的特点在于能根据任务指令自主分析和执行,当收到 一个需求或任务时,它会开始分析这个问题,并且给出执行目标和具 体任务,然后开始执行。0 码力 | 32 页 | 13.09 MB | 1 年前3 开源中国 2023 大模型(LLM)技术报告有出色的表现。 GitHub Copilot 16 / 32 大模型应用现状:知名大模型 在全球范围内,已经发布了多款知名大模型,这些大模 型在各个领域都取得了突破性的进展。 处理文本数据的 GPT-4,能同时处理和理解多种类型数 据的多模态模型 DALL-E 3,以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户,构成了 大模型领域的「第一梯队」。 讯飞星火 17 Agent。在给定 AutoGPT 一个自然 语言目标后,它会尝试将其分解为多个子任务,并在自动循环中使用 互联网和其他工具来实现该目标。它使用的是 OpenAI 的 GPT-4 或 GPT-3.5 API,是首个使用 GPT-4 执行自主任务的应用程序实例。 AutoGPT 最大的特点在于能根据任务指令自主分析和执行,当收到 一个需求或任务时,它会开始分析这个问题,并且给出执行目标和具 体任务,然后开始执行。0 码力 | 32 页 | 13.09 MB | 1 年前3
 普通人学AI指南. . . . . . . . 12 2.6.1 AgentGPT . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.6.2 GPT-4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.6.3 Gemma . . . . . . . . . . . . 模型提示词的工具,旨在快速获取和使用最新的 AI 提示进行内容 创作。 2.6 AI 大模型 2.6.1 AgentGPT 一个基于浏览器的自主 AI 工具,专为交互式任务和自动化操作设计。 2.6.2 GPT-4 由 OpenAI 开发的最新大型语言模型,继承了 GPT-3 的能力,功能更加强大和 精确,但为闭源产品。 12 Figure 10: AI 大模型 2.6.3 Gemma 描述:谷歌推出的一款轻量级开源0 码力 | 42 页 | 8.39 MB | 8 月前3 普通人学AI指南. . . . . . . . 12 2.6.1 AgentGPT . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.6.2 GPT-4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.6.3 Gemma . . . . . . . . . . . . 模型提示词的工具,旨在快速获取和使用最新的 AI 提示进行内容 创作。 2.6 AI 大模型 2.6.1 AgentGPT 一个基于浏览器的自主 AI 工具,专为交互式任务和自动化操作设计。 2.6.2 GPT-4 由 OpenAI 开发的最新大型语言模型,继承了 GPT-3 的能力,功能更加强大和 精确,但为闭源产品。 12 Figure 10: AI 大模型 2.6.3 Gemma 描述:谷歌推出的一款轻量级开源0 码力 | 42 页 | 8.39 MB | 8 月前3
 Trends Artificial Intelligence
other leading models (GPT- 4o, Claude 3.5) on some reasoning tests 3/23: OpenAI releases GPT-4, a multimodal* model capable of processing both text & images 3/23: Google releases Bard concerns. Closed models follow a centralized, capital-intensive arc. These models – like OpenAI’s GPT-4 or Anthropic’s Claude – are trained within proprietary systems on massive proprietary datasets, requiring Models + Falling Token Costs = Explosion of Usage by Developers Using AI Closed-source models – like GPT-4, Claude, or Gemini – have dominated usage among consumers and large enterprises, largely because0 码力 | 340 页 | 12.14 MB | 4 月前3 Trends Artificial Intelligence
other leading models (GPT- 4o, Claude 3.5) on some reasoning tests 3/23: OpenAI releases GPT-4, a multimodal* model capable of processing both text & images 3/23: Google releases Bard concerns. Closed models follow a centralized, capital-intensive arc. These models – like OpenAI’s GPT-4 or Anthropic’s Claude – are trained within proprietary systems on massive proprietary datasets, requiring Models + Falling Token Costs = Explosion of Usage by Developers Using AI Closed-source models – like GPT-4, Claude, or Gemini – have dominated usage among consumers and large enterprises, largely because0 码力 | 340 页 | 12.14 MB | 4 月前3
 DeepSeek-V2: A Strong, Economical, and Efficient
Mixture-of-Experts Language Modeleconomical training and inference costs. The goal of our next step is to achieve performance on par with GPT-4 in our upcoming release. • Our alignment team continuously strives to enhance our models, aiming Model Name R Level Comp. Score Reas. Steps Score OvrAcc Score GPT-4-1106-Preview 5 90.71 91.65 89.77 GPT-4 5 88.40 89.10 87.71 DeepSeek-V2 Chat (RL) 5 83.35 85.73 84.54 Ernie-bot 4.0 5 85.60 86.82 84.38 Qwen-110B-Chat0 码力 | 52 页 | 1.23 MB | 1 年前3 DeepSeek-V2: A Strong, Economical, and Efficient
Mixture-of-Experts Language Modeleconomical training and inference costs. The goal of our next step is to achieve performance on par with GPT-4 in our upcoming release. • Our alignment team continuously strives to enhance our models, aiming Model Name R Level Comp. Score Reas. Steps Score OvrAcc Score GPT-4-1106-Preview 5 90.71 91.65 89.77 GPT-4 5 88.40 89.10 87.71 DeepSeek-V2 Chat (RL) 5 83.35 85.73 84.54 Ernie-bot 4.0 5 85.60 86.82 84.38 Qwen-110B-Chat0 码力 | 52 页 | 1.23 MB | 1 年前3
 清华大学第二弹:DeepSeek赋能职场通过该文案吸引潜在客户,促成消 费……通过该报告为相关企业管理 者提供……策略支撑 Objective(操作要 求) 字数要求、段落结构、用词风格、 内容要点、输出格式… CO-STAR提示语框架 新加坡 GPT-4 提示工程竞赛冠军提示词框架 "R",代表 "Response", 想要的回应类型。 一份详细的研究 报告?一个表格? Markdown格式? "C"代表 “Context(上 下文)” 相关的0 码力 | 35 页 | 9.78 MB | 8 月前3 清华大学第二弹:DeepSeek赋能职场通过该文案吸引潜在客户,促成消 费……通过该报告为相关企业管理 者提供……策略支撑 Objective(操作要 求) 字数要求、段落结构、用词风格、 内容要点、输出格式… CO-STAR提示语框架 新加坡 GPT-4 提示工程竞赛冠军提示词框架 "R",代表 "Response", 想要的回应类型。 一份详细的研究 报告?一个表格? Markdown格式? "C"代表 “Context(上 下文)” 相关的0 码力 | 35 页 | 9.78 MB | 8 月前3
 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502360联合北大研发:5%参数量逼近Deepseek-R1满血性能 18政企、创业者必读 DeepSeek出现之前的十大预判 之六 成本越来越低  过去一年,大模型成本「自由落体」  国外:GPT-4等效智能在过去18个月内价格下降240倍  国内:大模型「亏本」卖,可以「白嫖」大模型API能力 19政企、创业者必读 DeepSeek出现之前的十大预判 之七 多模态越来越重要  由0 码力 | 76 页 | 5.02 MB | 5 月前3 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502360联合北大研发:5%参数量逼近Deepseek-R1满血性能 18政企、创业者必读 DeepSeek出现之前的十大预判 之六 成本越来越低  过去一年,大模型成本「自由落体」  国外:GPT-4等效智能在过去18个月内价格下降240倍  国内:大模型「亏本」卖,可以「白嫖」大模型API能力 19政企、创业者必读 DeepSeek出现之前的十大预判 之七 多模态越来越重要  由0 码力 | 76 页 | 5.02 MB | 5 月前3
 DeepSeek从入门到精通(20250204)需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI0 码力 | 104 页 | 5.37 MB | 8 月前3 DeepSeek从入门到精通(20250204)需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI0 码力 | 104 页 | 5.37 MB | 8 月前3
 清华大学 DeepSeek 从入门到精通需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI0 码力 | 103 页 | 5.40 MB | 8 月前3 清华大学 DeepSeek 从入门到精通需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI0 码力 | 103 页 | 5.40 MB | 8 月前3
共 8 条
- 1













