个人站
/
2026
大模型算法工程师,
聚焦 AI Agent 系统工程化。
15 年软件工程经验,前端 / 移动 / 后端 / AI 系统工程的全链路独立交付能力。近年聚焦 AI 方向,独立完成多个对话式 Agent 与多模态 AI 应用的架构设计与生产落地。
深度掌握 LLM 集成、MCP(Model Context Protocol)工具编排、Hybrid RAG(向量 + 全文)、多 provider 抽象与 fallback chain、Structured Output、Batch API + Embedding 缓存等成本与可靠性优化。喜欢把复杂系统拆成可治理的小单元。
- 经验
- 15 年
- 当前方向
- 大模型算法 · AI Agent
- 状态
- 开放新机会
- 所在地
- 宁波
P–01
supLink AI Agent 系统
2025.10 — 2026.04
·
项目负责人
三层解耦的 Agentic 架构——IM Bot 接入层(XMPP)→ Agent 决策网关(Node.js / TypeScript)→ MCP 工具服务集群(Python FastMCP)。LLM 负责自然语言理解与执行计划,MCP 负责工具调用,confirmation gate 在协议层阻止 LLM 误调用敏感工具。
- 01provider-agnostic LLM 编排:Anthropic / Bedrock / Gemini / OpenAI 多家原生协议 + 3 层 fallback chain + 指数退避重试,单 provider 故障服务不中断
- 02MCP 工具编排(JSON Schema 校验 + 参数绑定 + 结果标准化)+ Hybrid RAG(sqlite-vec 向量 + FTS5 全文 + MMR + 时间衰减)+ confirmation-gated 执行,敏感工具误调用协议层杜绝
- 03LLM 成本与可靠性体系:Embedding Batch API + SQLite LRU 缓存(典型场景 60-80% 复用率)+ 批 API 熔断 + per-provider 多窗口配额追踪
TypeScript
Node.js 22
Python
MCP / FastMCP
Anthropic SDK
AWS Bedrock
Gemini
sqlite-vec / FTS5
slixmpp
Playwright
P–02
多阶段 AI 内容创作平台
2026.01 — 2026.04
·
项目负责人
基于 LLM Agent 的多阶段内容创作系统,5 阶段流水线(任务理解 → RAG 召回 → 策略 → 文案 → 图像规划与生成)覆盖文案 + 多模态图像端到端生成;Vision provider 与文本 provider 独立配置,支持成本优化的混合 provider 组合。
- 01provider-agnostic LLM 编排(Vercel AI SDK),双协议(OpenAI-compatible / Anthropic Messages)+ 5 家 LLM 插拔;vision 与文本 provider 独立配置支持混合 provider 成本优化
- 02Hybrid RAG:pgvector 语义(text-embedding-3-small 1536 维)+ PostgreSQL 全文召回 + 自动降级链;零样本 / 检索增强双模式按相似度阈值自适应;结构化输出双模式 fallback
- 03多模态生成(DALL-E + Vertex Imagen 双 vendor)+ streamObject / SSE 流式 + BullMQ 三池工作队列异步双轨,文案增量可见、长任务带状态机
TypeScript
Next.js 16
React 19
PostgreSQL · pgvector
Redis · BullMQ
Vercel AI SDK
OpenAI
Anthropic
Vertex AI
P–03
TechPackAnnotator
2026.01 — 2026.04
·
项目负责人
面向技术规格书 / TechPack 的 PDF 智能翻译与标注系统。OCR + LLM 多阶段流水线,重点是把 LLM 调用率压到最低、把翻译质量稳住——同类文档热处理 < 5 秒,token 成本下降约 6 倍。
- 015 级混合翻译流水线(白名单 → 标识符正则 → 领域术语表 → 翻译记忆库 → LLM 兜底),LLM 调用率压到 ~15%,token 成本下降 ~6 倍
- 02Token Masking + ID-keyed JSON 双向协议:关键字段用占位符送入 LLM、ID 而非位置匹配回 bbox,从协议层杜绝 LLM 翻译丢字段或乱序
- 03高可用 LLM 调用层:指数退避重试 + 批次级故障降级 + 速率限制感知并发;翻译记忆库 + 双语术语表双层缓存,二次处理 LLM 量再降 50%+
Python
FastAPI
SQLAlchemy
PostgreSQL
Celery · Redis
Anthropic SDK
PaddleOCR PP-OCRv5
React 18
TypeScript
-
2018.08 — 2026.04
8 yr
-
2017.03 — 2018.08
1 yr+
-
2011.06 — 2017.02
5 yr+
- AI 工程
- LLM 集成 · MCP · Function Calling · Agentic Workflow · Hybrid RAG · 多模态 · Structured Output · Prompt Engineering
- 多 Provider 工程
- Anthropic · Bedrock · Gemini · OpenAI · Vertex AI · Vercel AI SDK · fallback chain · Batch API · Embedding 缓存
- 基础栈
- Python · TypeScript · Node.js · Next.js · PostgreSQL · pgvector · Redis · BullMQ · Docker