MemoryQwen

🌐 English | 中文

MemoryQwen

本地 AI Agent — 自适应认知外骨骼 v0.2-alpha

你的数据，你的模型，你的规则。 MemoryQwen v0.2-alpha 引入了 ACE-v1 自适应认知外骨骼——系统现在先判断事实、难度和风险，再决定如何回答。7B 仍是默认，14B 是可选 deep mode。不依赖任何云服务，所有数据留在本地。

✨ 为什么用 MemoryQwen？

对比	ChatGPT / 云端 AI	MemoryQwen
🌍 数据位置	云端服务器	你的硬盘
🔒 隐私	对话被记录	100% 本地
🧠 记忆力	依赖会话窗口	持久化 SQLite 记忆
📚 引用来源	幻觉 + 可能编造	精确引用原文 + 路径
🎯 纠错学习	无法纠正	一键纠错，永不再犯同类错误
💰 费用	按月付费	免费，用自己的 GPU
⚡ 离线可用	❌	✅

⚡ 5 分钟快速启动

git clone https://github.com/Fujo930/MemoryQwen
cd MemoryQwen
pip install -r requirements.txt
ollama pull qwen2.5:7b
mkdir inbox
echo "# 项目文档" > inbox/test.md
python -m src.cli job ingest inbox/
python -m src.cli chat "API 地址是什么？" --debug-memory

详细步骤见 Windows 11 快速启动

🏗️ 系统架构

┌─────────────────────────────────────────────────────┐
│                     CLI / API                        │
├─────────────────────────────────────────────────────┤
│  Agent Layer  │ ChatService │ PromptBuilder          │
│               │ ErrorLearning │ StrategyLearning     │
│               │ CapabilityBoundaryGuard              │
├─────────────────────────────────────────────────────┤
│  Retrieval    │ BM25 Tokenizer │ Multi-Store Search  │
├─────────────────────────────────────────────────────┤
│  Memory       │ knowledge_store │ error_store        │
│  (SQLite)     │ strategy_store  │ chat_messages      │
│               │ task_records     │                   │
├─────────────────────────────────────────────────────┤
│  Infrastructure │ Ingestion │ FileWatcher            │
│                 │ GPU Guardian │ BackgroundJobRunner │
│                 │ TaskRuntime │ EvalRunner           │
├─────────────────────────────────────────────────────┤
│  Model Client  │ Ollama / LM Studio / llama.cpp      │
└─────────────────────────────────────────────────────┘

✅ v0.2-alpha 功能概览

模块	功能	状态
📥 导入	文档导入 (.txt/.md) → SQLite	✅
🔍 检索	BM25 关键词检索，多库搜索	✅
💬 聊天	本地模型 (Ollama/LM Studio) + 来源引用	✅
🌐 联网	Internet Query：web search/fetch/ask，[W] 引用，不是 crawler	✅ v0.1.5
🧠 记忆	对话历史 + 知识库持久化存储	✅
🐛 纠错	用户纠正错误 → 自动学习 → 不再重犯	✅
📋 策略	错误模式归纳 → 可复用策略沉淀	✅
🎮 GPU	GPU 占用检测 + 游戏/渲染/后台自动让路	✅
📊 任务	任务队列 + 暂停/恢复 + 持久化	✅
🧪 评估	130 道评估题 + 启发式判定器 + 自动导出纠正	✅
🛡️ 边界	能力边界守卫，防止模型幻觉夸大功能	✅
🏷️ 来源	文件归档 → memory/sources/，聊天时精确引用	✅

尚未实现

Web UI · PDF/DOCX · embedding/向量检索 · daemon 后台 · tray 图标 · 爬虫 · LoRA 微调 · 一键安装 exe

📊 当前真实数据

指标	数值
🧪 pytest 测试	631/631 (100%)
📚 知识片段	43,645 chunks
🐛 错误案例	17 cases
📋 策略	11 strategies
📝 评估题目	396 real (M3 312 + web 84)
🛡️ 安全扫描	0 issues

🧠 模型推荐

模型	大小	用途	准确率
`qwen2.5-coder:3b`	1.9 GB	smoke test / 低配机	~64%
`qwen2.5:7b` ⭐	4.7 GB	日常使用	~91%
`qwen2.5:14b`	~8 GB	深度推理	待测

💡 3B 跑通，7B 常驻，14B 深度，32B+ 实验。

🧱 开发困境 & 已知瓶颈

以下是在开发中遇到的实际困难，不美化、不隐藏。

🚧 推理墙

7B 模型在多源信息冲突时无法稳定推理。系统 prompt 说"v0.1.5 支持联网"，但 43K 条旧训练数据说"v0.1 不支持联网"——模型会在两者之间随机摇摆。同一个问题问三次，可能得到三种不同答案。

这不是 prompt 工程能解决的。 需要 14B+ 参数规模或新的推理架构。RTX 4080 刚好能跑 14B：ollama pull qwen2.5:14b。

⚖️ Heuristic Judge 关键词过敏

v4 启发式判定器会误判正确回答。模型说"v0.1 不支持 PDF"，判定器看到"PDF"就标 overclaim。M3 300 题 eval 中 36 个"wrong"100% 是判定器误判，0 个真实违规。需要 Judge v5（LLM-as-Judge）。

🔍 检索质量瓶颈

BM25 在 43K chunks 中偏向高频旧文档。新增文档信号完全被淹没。eval 的 source_hit 率 0%——不是答案错了，是检索引擎拉不到正确资料。需要 Retrieval Quality v2。

🧩 单兵作战

所有代码、文档、测试、训练数据、eval 系统均为一人维护。欢迎贡献者。

⚠️ 备份记忆

模型可以重新下载，memory 不能丢！

xcopy memory memory_backup_%date% /E /I

详见记忆备份指南

🛠️ 常用命令

python -m src.cli health              # 健康检查
python -m src.cli job ingest inbox/   # 导入文档
python -m src.cli chat "问题"         # 聊天 (自动检索本地资料)
python -m src.cli web search "关键词" # 网页搜索 (v0.1.5)
python -m src.cli correct --wrong "旧错误" --correct "正确答案"
python -m src.cli memory stats        # 存储统计
python -m src.cli guardian status     # GPU 让路状态
python -m src.cli eval run training_packs/  # 运行评估

📖 完整命令参考

📖 文档

文档	说明
Windows 11 快速启动	从零开始搭建
Internet Query	联网查询指南
CLI 命令参考	所有命令详解
配置参考	YAML 配置项说明
系统架构	技术架构文档
安全模型	安全设计
记忆备份	备份策略

🗺️ 路线图

v0.1.x ✅ — Developer Preview
v0.1.5 ✅ — Internet Query
v0.2-alpha ✅ — ACE-v1 自适应认知外骨骼
v0.2 — Web UI 图形界面
v0.3 — Embedding 向量检索 + 混合搜索

🤝 参与贡献

欢迎提 Issue 和 PR。

python -m pytest tests/ -q --basetemp=/tmp/mqwen-pytest

📄 License

_{Built with ❤️ for local-first AI. No cloud required.}

Name		Name	Last commit message	Last commit date
Latest commit History 32 Commits
config		config
docs		docs
examples/inbox		examples/inbox
inbox		inbox
megatrain		megatrain
memory/sources		memory/sources
model_eval_reports		model_eval_reports
research_notes		research_notes
research_tracks/sdgi		research_tracks/sdgi
scripts		scripts
src		src
tests		tests
training_logs		training_logs
training_packs		training_packs
ui/templates		ui/templates
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
README_EN.md		README_EN.md
SOCIAL.md		SOCIAL.md
VERSION		VERSION
release_notes_v0.2-alpha.md		release_notes_v0.2-alpha.md
requirements.txt		requirements.txt
start.bat		start.bat

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MemoryQwen

本地 AI Agent — 自适应认知外骨骼 v0.2-alpha

✨ 为什么用 MemoryQwen？

⚡ 5 分钟快速启动

🏗️ 系统架构

✅ v0.2-alpha 功能概览

尚未实现

📊 当前真实数据

🧠 模型推荐

🧱 开发困境 & 已知瓶颈

🚧 推理墙

⚖️ Heuristic Judge 关键词过敏

🔍 检索质量瓶颈

🧩 单兵作战

⚠️ 备份记忆

🛠️ 常用命令

📖 文档

🗺️ 路线图

🤝 参与贡献

📄 License

About

Uh oh!

Releases 4

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

MemoryQwen

本地 AI Agent — 自适应认知外骨骼 v0.2-alpha

✨ 为什么用 MemoryQwen？

⚡ 5 分钟快速启动

🏗️ 系统架构

✅ v0.2-alpha 功能概览

尚未实现

📊 当前真实数据

🧠 模型推荐

🧱 开发困境 & 已知瓶颈

🚧 推理墙

⚖️ Heuristic Judge 关键词过敏

🔍 检索质量瓶颈

🧩 单兵作战

⚠️ 备份记忆

🛠️ 常用命令

📖 文档

🗺️ 路线图

🤝 参与贡献

📄 License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 4

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages