Type something to search...

Blog Posts

提升数据工程效率:使用generative Ai进行数据生成与增强的5个关键步骤

提升数据工程效率:使用generative Ai进行数据生成与增强的5个关键步骤

在本模块中 我们将探讨生成式人工智能和大型语言模型 (LLMs) 如何协助数据生成和增强。这是生成式人工智能最具影响力的用例之一,使我们能够从头创建合成数据或高效增强现有数据集。 作为数据工程师,我们通常需要生成或扩展数据集,原因包括:测试数据管道 避免暴露生产数据 处理边缘情况 修复不平衡的数据集本文将逐步讲解这些应用。 生成合成数据 合

阅读更多
解锁 Openai O3-mini:开发人员提高模型性能的 5 项关键功能

解锁 Openai O3-mini:开发人员提高模型性能的 5 项关键功能

模型低语 我记得是Michal Stanislawek创造了“模型低语”这个术语。我从对话中记得的是,**模型低语**是传递给模型的一个额外字段或参数,用于特定实例,以引导模型并在该特定实例中提供指导。 ![Image 2](https://wsrv.nl/?url=https://cdn-images-1.readmedium.com/v2/resize:fit:800/1*

阅读更多
加强聊天机器人对话:应用礼貌理论提高用户参与度

加强聊天机器人对话:应用礼貌理论提高用户参与度

聊天机器人、开发者和用户之间的关系 随着聊天机器人的发展,聊天机器人、其开发者和用户之间的关系变得复杂。当不同方之间的期望和现实不一致时,可能会导致各方的巨大挫折。 设计者和用户都可以达成一致的一个关键期望是聊天机器人需要反映某些人类特征,特别是在对话方面。这是一个机器人需要具备的显而易见的特征,但这些类人话语技能的实际实现仍然是一个非常棘手的难题,难以持续和成功地处理。 什么

阅读更多
重建ai语音助手:使用langgraph和whisper的5个关键步骤提升定制化能力

重建ai语音助手:使用langgraph和whisper的5个关键步骤提升定制化能力

在探索了ElevenLabs的AI agent功能并亲身体验了我如何快速构建一个功能齐全的voicebot而无需编写大量代码后,我不禁想——如果我从头开始构建它会怎么样? 在[我之前的文章](https://readmedium.com/how-i-built-a-customer-support-voicebot-in-no-time-using-elevenlabs-make-com

阅读更多
构建实时gemini 2.0移动应用:5个步骤实现语音聊天和图像共享功能

构建实时gemini 2.0移动应用:5个步骤实现语音聊天和图像共享功能

作者插图 在本教程中,我将分享我的最新项目,继续探索与 Gemini 2.0 及其 multi-modal live API 相关的实时应用。在通过多个网络应用项目深入了解 Gemini 2.0 的迷人实时能力后,包括摄像头聊天、屏幕共享互动画布和 RAG 助手,我花了一个周末构建了一个 Android 应用,以复制甚至增强与 Gemini 2.0 的多模态实时体验。以下是演示视频:

阅读更多
掌握 Ai 模型开发:利用这些基本步骤,在 2025 年之前建立自己的类似 Chatgpt 的模型

掌握 Ai 模型开发:利用这些基本步骤,在 2025 年之前建立自己的类似 Chatgpt 的模型

如何在2025年构建类似ChatGPT的AI模型? 近年来,人工智能迅速发展,像OpenAI的ChatGPT这样的模型彻底改变了我们与AI的互动方式。随着AI驱动应用的日益普及,许多开发者和企业希望在2025年构建自己的类似ChatGPT的AI模型。但创建一个像ChatGPT这样的AI模型需要什么? 在深入开发过程之前,了解是什么使ChatGPT成为一个强大的AI模型是很重要的。

阅读更多
掌握 Ai 代理:用 5 个简单步骤打造你的第一个 Linkedin 自动资料撷取器

掌握 Ai 代理:用 5 个简单步骤打造你的第一个 Linkedin 自动资料撷取器

Generated using Meta AI on WhatsApp 世界发展的速度真是疯狂。AI无处不在,撰写电子邮件、生成艺术作品,甚至编写完整的应用程序。这场变革的核心是大型语言模型 (LLMs),它们能够回答问题、总结书籍,甚至进行深入对话。但问题在于,LLMs虽然看起来聪明,但有其局限性。它们对过去的互动记忆不佳,无法自主采取行动,绝对不会在没有一点帮助的

阅读更多
对比分析:rag Kag Cag三种ai增强语言模型的优缺点与应用场景

对比分析:rag Kag Cag三种ai增强语言模型的优缺点与应用场景

Image by author 随着大型语言模型(LLMs)的发展 它们的局限性——幻觉、过时的知识和推理缺口——促使了检索增强生成(RAG)、**知识增强生成(KAG)和缓存增强生成(CAG)**等创新。每个框架以独特的方式应对这些挑战,将外部知识与生成能力相结合。本文将解析它们的机制、优势、劣势以及理想的使用案例,以帮助您导航人工智能领域。 1. 检

阅读更多
揭开 Llm 推理的神秘面纱:从思维链到强化学习的 5 项技术,助您提高绩效

揭开 Llm 推理的神秘面纱:从思维链到强化学习的 5 项技术,助您提高绩效

大型语言模型与推理技术 大型语言模型 (LLMs) 在近年来取得了显著进展,特别是在处理复杂推理任务的能力上。本文深入探讨了用于增强 LLM 推理的各种技术,借鉴了最近的研究论文,特别关注 DeepSeek-R1。我们将探讨如思维链 (CoT)、强化学习 (RL) 和蒸馏等方法,考察它们如何促进更强大和更类人化的推理。 在深入具体技术之前,了解训练阶段和测试阶段所应用的方法之间的区别是

阅读更多
解锁生成式 Ai:2024 年马德里 Aws 峰会对 Olx 工程师的启示

解锁生成式 Ai:2024 年马德里 Aws 峰会对 Olx 工程师的启示

在2024年马德里AWS峰会 氛围非常热烈!IFEMA吸引了成千上万的云计算爱好者、技术高管和开发者,他们渴望了解影响未来技术的新进展。作为OLX的一名工程师,我特别期待探索生成AI(GenAI)领域,并观察这些前沿工具如何被用于解决实际问题,为客户提供更好、更充实的体验。 合作伙伴展位内的爆米花机 一进入主旨演讲厅,就明显感觉到GenAI是主要的吸引力。随着演讲者展示全新服务、

阅读更多
构建高效的模型上下文协议服务器:使用jina.ai和python实现web搜索与事实核查功能

构建高效的模型上下文协议服务器:使用jina.ai和python实现web搜索与事实核查功能

在这篇文章中,我们将讨论模型上下文协议,它的重要性,以及构建一个MCP服务器的过程,以帮助我们与Jina.ai进行交互,并能够在Claude Desktop中使用Python和FastMCP添加网络搜索和事实核查功能。 Anthropic [宣布](https://www.anthropic

阅读更多
释放开发人员的潜能:为下一个编码项目增添动力的 7 种必备 Ai 工具

释放开发人员的潜能:为下一个编码项目增添动力的 7 种必备 Ai 工具

人工智能工具为软件开发者 你上一次去搜索引擎寻找常见问题是什么时候?2022年?2023年?这让你意识到我们在日常任务中采用人工智能的速度有多快。作为开发者,我们不再需要离开我们的集成开发环境;人工智能工具可以帮助我们进行研究、发现bug,以及自动补全。 这让互联网用户在关于人工智能是“副驾驶”还是“抢工作者”的观点上产生了分歧。新技术总是引发这样的争议,反过来,它也导致了新工作的产生

阅读更多
从零开始构建2亿参数的llm:使用python和the Pile数据集的实用指南

从零开始构建2亿参数的llm:使用python和the Pile数据集的实用指南

快速说明 — 我们将使用The Pile数据集从零开始训练一个2亿参数LLM。因此,我们得到一个在响应中输出完美语法和标点的LLM,较短的上下文是有意义的,但整个响应并不如此。我正在寻找AI领域的博士职位。您可以查看我的[简历](https://medium.com/r?url=https%3A%2F%2Fdrive.google.com%2Ffile%2Fd%2F1Xo

阅读更多
发现 4 个改变游戏规则的 Chatgpt 功能:立即改变您的研究和生产力

发现 4 个改变游戏规则的 Chatgpt 功能:立即改变您的研究和生产力

Generated by the author with Midjourney. 这几个月对聊天生成预训练变换器来说真是疯狂。以下是一些令人惊叹的新功能,您需要尝试一下。 1. 深度研究 深度研究是一个功能,使聊天生成预训练变换器能够使用网络浏览器进行连锁思维研究,这意味着它可以进行多层次的搜索。这意味着它可以在_正确_的意义上进行研究;它实际上可以深入探索,制定计划,甚至在运行

阅读更多
Ai Agent Reality Check:人类监督能否驯服炒作?

Ai Agent Reality Check:人类监督能否驯服炒作?

人工智能代理自主性的热潮正在降温,人类监督正在回归 监督 我们对人工智能代理的看法正在发生变化。让我在这里快速概述一下…… HuggingFace 发布了一项研究,他们认为 **_人工智能代理不应

阅读更多
Categories
Tags
Type something to search...