来源:近一个月牛客网真实面经汇总覆盖:字节、快手、腾讯、Shopee 等一线大厂 AI Agent 岗位建议:收藏后对照自查,缺哪块补哪块
一、Agent 基础概念(必问)
【Q1】用你自己的话定义 LLM Agent,并说明与单次调用的差异
Agent 是以大语言模型为推理核心,在多轮交互中与外部环境互动,通过规划、记忆和工具调用完成复杂任务的系统。
追问:没有外部工具,还能叫 Agent 吗?可以。称为"弱环境 Agent",仍具备对话记忆和推理能力,可有内环多步 CoT 与自我验证。面试中强调是否存在**"行动-观察"循环**更清晰。
【Q2】Agent 和 Prompt Chain 有什么本质区别?
二者可结合:链负责稳定流程,Agent 负责链内某段的灵活分支。
【Q3】ChatBot 加上插件,是不是就变成 Agent 了?
不一定。
- • 插件由固定规则触发(如关键词路由):更像"带工具的 Bot"
- • 由模型多步自主决策,形成闭环迭代:才真正接近 Agent
关键判断标准:多步自主决策 + 反馈闭环。
【Q4】RAG + Chat 算不算 Agent?
- • 有多轮检索策略(查不到换查询、分解子问题、交叉验证):具备 Agent 特征
二、Agent 架构设计(重点)
【Q5】Agent 的记忆一般怎么设计?
最常用的是分层设计:
- 3. 长期记忆:向量检索 / 结构化库存储历史信息
写入要点:区分"事实"与"推断";附带时间戳和来源;便于更新和撤销。
【Q6】规划和执行,要不要拆开两个模型?
视任务而定。
推荐混合方案:规划用强模型,执行层做确定性校验。
【Q7】ReAct 框架里三个字母代表什么?解决什么问题?
ReAct = Reasoning + Acting
工作流程:
- 1. Thought(推理):模型思考下一步做什么
- 3. Observation(观察):获取工具返回结果
解决的问题:模型仅"空想"容易偏离事实,通过显式推理 + 工具反馈把推理锚定在真实环境上。
【Q8】Agent 结构包含哪些部分?
典型 Agent 六模块:
三、关键技术(高频考点)
【Q9】MCP 是什么?如果 MCP 特别多,要怎么管理?
MCP(Model Context Protocol):连接 AI 助手与外部数据源和工具的开放协议。
管理大量 MCP 的六个方法:
【Q10】Skills 和 MCP 有什么区别?
简单说:MCP 是"如何连接工具"的协议,Skills 是"如何完成任务"的完整能力包。
【Q11】Agent 是怎么实现上下文记忆的?
五种常见实现方式:
- 1. 滚动窗口:保留最近 N 轮对话直接放入上下文
- 5. 分层记忆:工作记忆 + 会话记忆 + 长期记忆
【Q12】Tool 层怎么定义的?运行时怎么被调用?
Tool 定义五要素:名称、功能描述、输入参数 schema、输出格式、调用示例。
调用六步流程:
- 5. 结果作为 Observation 反馈给 Agent
四、RAG 技术(必考)
【Q13】向量数据库是什么?跟传统数据库有什么区别?
向量数据库:专门用于存储、索引和检索高维向量的数据库。
主流选型:Chroma(轻量)、Milvus(生产级)、Pinecone(云原生)、Qdrant(高性能)。
【Q14】稠密向量与稀疏向量的区别?分别适合什么搜索需求?
【Q15】向量化前为什么要对长文档切片?不切片会怎样?
切片的四个原因:
- 1. 上下文窗口限制:Embedding 模型有最大输入长度
- 2. 检索粒度:切片后检索最相关片段,而非整个文档
不切片的四个后果:截断丢失信息、检索不准确、上下文污染、效率低下。
【Q16】切片时设置重叠区域的作用是什么?比例怎么确定?
作用:确保上下文连续性,避免信息在切片边界丢失;提高相关片段召回率。
比例:通常为切片大小的 10%-20%,语义连贯性要求高的场景可适当增大。
【Q17】余弦相似度和欧氏距离,衡量文本相似性时各自的优缺点?
文本场景通常归一化后用余弦相似度,更关注语义方向而非绝对大小。
【Q18】Top-K 结果如果 K 值过大,对生成质量有什么负面影响?
实践建议:通常 K=5-10;经 Rerank 后压到 K=3-5。
【Q19】初筛召回后为什么还要加 Rerank?能解决向量搜索哪些局限?
核心原因:向量相似度 ≠ 语义相关性
解决的四个局限:
【Q20】文档局部更新时,如何通过增量索引避免全量重新向量化?
五个策略:
【Q21】RAG 生成阶段,如何在 Prompt 中设定边界条件防止幻觉?
五个 Prompt 边界技巧:
- 1. 明确告知检索范围:"仅基于以下参考内容回答"
- 3. 允许说不知道:"如果参考内容没有相关信息,请说明"
【Q22】减小幻觉的方法有哪些?
八个方向:RAG 检索增强、Prompt 工程约束、边界条件设定、事实校验工具、高质量数据微调、多轮自我验证、降低温度参数、结构化输出(先列证据再回答)。
五、项目经验(最容易拉开差距)
【Q23】Agent 项目面试中,如何正确讲解项目?
错误方式(避免):
- • 报菜名式:"我们用了 RAG、用了 Tool Calling"
正确方式(推荐):
- • 讲决策过程:"最开始想用单 Agent,后来发现规划、检索、执行全塞在一起链路太长,出错不好定位,所以才拆开"
- • 讲具体改动:"一开始检索结果直接拼上下文,后来发现召回一多模型就会被带偏,补了一层 rerank,把 topk 从 10 压到 5"
- • 用动作替代名词:"因为任务多步执行,中间结果后面还要用,所以把当前任务状态单独存出来,不然 Tool 超时后很难从中间恢复"
【Q24】如何设计长短期记忆的提取、压缩与冲突更新机制?
提取:短期记忆直接用最近 N 轮;长期记忆通过向量检索。
压缩:滑动窗口 + 摘要生成;重要性评分(区分事实/结论/闲聊);层级化摘要(会话级、日级、周级)。
冲突更新:新旧冲突时,带时间戳的新信息优先;用户明确修正时标记旧信息为过时;保留修改历史便于回溯。
【Q25】检测到用户极端情绪时,Agent 如何在不中断对话流的前提下干预?
四层策略:
示例话术:"我感受到你现在可能有些着急,让我帮你一步步解决这个问题..."
【Q26】ClaudeCode 了解吗?跟 Codex 有什么区别?
使用技巧:提供完整项目上下文;明确代码风格要求;充分利用 Agent 能力做项目级重构。
六、面试官常考技术栈与项目重点
技术栈必考点:
- • 大模型基础:Transformer、Attention、Normalization
- • RAG:向量数据库、检索、Rerank、切片策略
- • Agent:记忆设计、工具调用、规划、ReAct
- • 后端基础:Redis、MySQL、并发、分布式锁
项目面试必问:
七、2026 年 AI Agent 岗位面试建议
- 1. 深入理解基础概念:不仅要知道是什么,还要理解为什么这样设计
- 2. 准备真实可信的项目经验:讲清楚决策过程、具体改动、遇到的问题
- 3. 关注前沿动态:了解最新的 Agent 论文和开源项目
- 4. 动手实践:最好有实际项目经验,而不只是停留在理论
写在最后
Agent 岗面试已经过了一个能用概念唬住人的阶段。现在面试官要的是:你能说清楚一个决策为什么做、一个问题怎么定位、一个方案为什么选 A 不选 B。
收藏这篇,面试前对照自查。缺哪块,补哪块。