-
14-48 剑和诗人22 – RAG 的主要痛点和解决方案
检索增强生成 (RAG) 模型已成为一种有前途的方法,它利用存储在文档中的外部知识来提高生成文本的准确性和相关性。通过检索和调节相关的上下文文档,与传统语言模型相比,RAG 模型可…
-
14-47 剑和诗人21 – 2024年如何打造AI创业公司
2024 年,随着人工智能继续快速发展并融入几乎所有行业,创建一家人工智能初创公司将带来巨大的机遇。然而,在吸引资金、招聘人才、开发专有技术以及将产品推向市场方面,人工智能初创公司…
-
14-46 剑和诗人20 – 减少幻觉的提示词工程
概述 幻觉或“编造”是大型语言模型 (LLM) 的常见故障模式,它们会产生事实上不正确或无意义的内容。幻觉背后的一些主要原因是: 通过精心设计我们提供给这些模型的提示,可以降低人工…
-
14-45 剑和诗人19 – 一个负责任的 AI 成熟度 端到端 框架
介绍 人工智能有望改变企业和社会,但如果部署不当也会带来风险。最近围绕有偏见和不可靠的人工智能系统的争议表明,需要严格的治理来建立公众信任。这对于语言模型尤其重要——语言模型是在大…
-
14-44 剑和诗人18 – 你想怎么应用 RAG 与微调
要充分发挥 LLM 的潜力,需要在检索增强生成 (RAG) 和微调之间选择正确的技术。 让我们研究一下何时针对 LLM、较小模型和预训练模型使用 RAG 而不是微调。我们将介绍: …
-
14-43 剑和诗人17 – ActiveRAG之主动学习
大型语言模型 (LLM) 的出现开启了对话式 AI 的新时代。这些模型可以生成非常像人类的文本,并且比以往更好地进行对话。然而,它们在仅依赖预训练知识方面仍然面临限制。为了提高推理…
-
14-42 剑和诗人16 – 如何从一个技术人员到CTO再到投资人的角色转变
我清楚地记得我的职业轨迹发生转变的那个关键时刻。当时,我正向整个执行领导团队和董事会成员介绍我们部门的技术路线图,感到说服这些有影响力的利益相关者资助一系列雄心勃勃的计划的压力。我…
-
14-41 剑和诗人15 – RLAIF 大模型语言强化培训
介绍 大型语言模型 (LLM) 在自然语言理解和生成方面表现出了巨大的能力。然而,这些模型仍然存在严重的缺陷,例如输出不可靠、推理能力有限以及缺乏一致的个性或价值观一致性。 为了解…
-
14-40 剑和诗人14 – 为什么机器学习需要合成数据
数据是人工智能的命脉。如果没有高质量、有代表性的训练数据,我们的机器学习模型将毫无用处。但随着神经网络规模越来越大、人工智能项目越来越雄心勃勃,人们对数据的需求也越来越大,我们面临…
-
14-39 剑和诗人13 – 顶级大模型测试,分析和建议
随着对高级语言功能的需求不断飙升,市场上涌现出大量语言模型,每种模型都拥有独特的优势和功能。然而,驾驭这个错综复杂的生态系统可能是一项艰巨的任务,开发人员和研究人员经常面临选择最适…
-
14-38 剑和诗人12 – RAG+ 思维链 ⇒ 检索增强思维(RAT)
在快速发展的 NLP 和 LLM 领域,研究人员不断探索新技术来增强这些模型的功能。其中一种备受关注的技术是检索增强生成 (RAG) 方法,它将 LLM 的生成能力与从外部来源检索…
-
14-35 剑和诗人9 – 普及 Agentic RAG
好吧,让我们直接进入正题——了解 Agentic RAG(检索增强生成)方法以及它如何彻底改变我们处理信息的方式。系好安全带,因为这将变得疯狂! Agentic RAG 的核心在于…
-
14-34 剑和诗人8 – 微调 LLM 的分块策略
介绍 使用大规模 LLM 会带来巨大挑战,特别是在内存管理和模型微调方面。一项可以缓解这些挑战的强大技术是分块,这是一种将大量输入或输出分解为更小、更易于管理的部分的策略。 让我们…
-
14-32 剑和诗人6 – GenAI 重塑 SRE 和云工程实践
在不断发展的软件开发和运营领域,各种学科的融合催生了新的范式和实践,旨在简化流程、加强协作和推动创新。DevSecOps、站点可靠性工程 (SRE)、平台工程和云工程已成为支持现代…
-
14-31 剑和诗人5 – 使用 AirLLM 和分层推理在单个 4GB GPU 上运行 LLama 3 70B
利用分层推理实现大模型语言(LLM) 大型语言模型 (LLM) 领域最近取得了显著进展,LLaMa 3 70B 等模型突破了之前认为可能实现的极限。然而,这些模型的庞大规模给其部署…
-
14-30 剑和诗人4 – 具有长上下文窗口的微调 LLM 的数据设计
LLM 中的长上下文窗口的挑战 微调大型语言模型 (LLM) 面临的最大挑战之一在于处理较长的上下文窗口。LLM 经过大量文本数据训练,能够理解和生成类似人类的语言。然而,在推理过…
-
14-29 剑和诗人3 – 利用知识图谱增强 LLM 推理能力
知识图谱提供了一种结构化的方式来表示现实世界的事实及其关系。通过将知识图谱整合到大型语言模型中,我们可以增强它们的事实知识和推理能力。让我们探索如何实现这一点。 知识图谱构建 在利…
-
14-28 剑和诗人2 – 高性能编程Bend和Mojo
介绍: 在不断发展的计算世界中,软件和硬件之间的界限变得越来越模糊。随着我们不断突破技术可能性的界限,对能够利用现代硬件功能的高效、可扩展的编程语言的需求从未如此迫切。 Bend和…
-
14-20 Vision Transformer用AI的画笔描绘新世界
概述 毫无疑问,目前最受关注且不断发展的最重要的主题之一是使用人工智能生成图像、视频和文本。大型语言模型 (LLM) 已展示出其在文本生成方面的卓越能力。它们在文本生成方面的许多问…
-
2024 年如何构建 AI 软件
人工智能 (AI) 是当今 IT 行业最热门的话题,受到大型科技公司、大型企业和投资者的青睐。如果有人不参与 AI,他们就出局了。虽然“AI 泡沫”一词尚未公开使用,但街上的每个人…