GitHub release (#20 )

* feat(web): remove mock data * feat(knowledgeBase): Refactor document list API and improve polling logic - Update getDocumentList API to accept kb_id as separate parameter instead of extracting from query object - Fix parameter name from auto_question to auto_questions in parser config - Add progress field initialization in document update params - Improve polling logic to handle both auto-return and manual stay scenarios with proper loading state management - Add console logging for debugging polling status and document processing - Reduce polling interval from 5000ms to 3000ms for faster status updates - Enhance cleanup logic with route change detection to prevent memory leaks - Add record parameter to progress render function for better data access - Refactor confirm dialog callbacks to properly manage loading state timing - Ensure loading indicator displays correctly when user chooses to stay on page * feat(web): Add Workflow * feat(web): Workflow * feat(web): node show id; update reflection engine example * feat(components): Add markdown editing capability and enhance component styling - Add editable mode to Markdown component with edit/save/cancel buttons - Import EditOutlined, SaveOutlined, CloseOutlined icons from ant-design - Add useState, useRef, useEffect hooks for managing edit state - Add editable, onContentChange, and onSave props to RbMarkdownProps interface - Create RbModal component with new index.css stylesheet for modal styling - Add index.css stylesheet to KnowledgeBase components for consistent styling - Update i18n translations in en.ts and zh.ts for new UI elements - Refactor Markdown component handlers to accept and spread additional props - Update InsertModal and RecallTestResult components for improved UX - Fix prop spreading in component handlers to maintain compatibility with Ant Design components * feat(web): Graph user memory update * feat(web): update routes.json * fix(web): workflow bug * fix(web): workflow variable * fix(web): workflow properties * feat(web): workflow support lexical editor * feat(web): workflow support lexical editor * feat(web): update reflection engine result * feat(web): workflow's chat support abort output * fix:git commit * fix:vite config * fix:breadcrumbs * feat(i18n): add document processing confirmation dialog translations - Add "processingDocuments" translation key for loading state message in English and Chinese - Add "startUploadConfirmTitle" translation for confirmation dialog title - Add "startUploadConfirmContent" translation for confirmation dialog description - Add "returnToList" translation for returning to list page action - Add "stayOnPage" translation for staying on current page action - Support user choice to either return to list or stay on page during background document processing * fix(web): user memory detail * feat(web): order * fix:面包屑修改 * feat(web): 1. user memory; 2. update workspace's model config * feat(web): update zh.ts / en.ts * fix(web): update user profile * feat(web): Agent add ai prompt * feat(web): Agent add ai prompt * feat(web): add pricing menu * feat(knowledgeBase): add media file validation and PDF enhancement method selection - Add i18n translations for file size and duration validation errors in English and Chinese - Implement media file validation with 256MB size limit and 150-second duration limit - Add support for audio and video file formats (mp3, mp4, mov, wav) in dataset creation - Add checkMediaDuration helper function to validate media file duration using HTML5 media API - Add PDF enhancement method selection dropdown with options (DeepDoc, MinerU, TextLN) - Change default PDF enhancement setting from disabled to enabled - Update file type array to include media formats - Add error messaging for file size and duration validation failures - Improve UI spacing for file parsing settings section * feat(knowledgeBase): add media dataset support and improve file handling - Add media dataset translations in English and Chinese locales - Add "mediaDataSet" and "uploadMedia" i18n keys for UI labels - Enable media dataset creation option in Private component by uncommenting menu item - Import and display image icon for media dataset menu option - Refactor file ID handling in CreateDataset to support both string and array types - Improve fileIds initialization logic to handle mixed input types - Update CreateImageDataset component to use file chunking workflow - Add navigation to parameter settings step after file upload - Pass file IDs to dataset creation flow for media processing - Add message API and navigate hook for improved UX feedback * fix(knowledgeBase): improve navigation and folder tree refresh logic - Add path comparison check in breadcrumb navigation to avoid unnecessary route changes when already on target page - Implement delayed folder tree refresh with setTimeout to ensure state reset completes before refreshing - Add manual table refresh trigger to ensure data updates after navigation - Reset expanded keys in FolderTree component during load to ensure consistent state from root directory - Add expanded keys reset in breadcrumb navigation to prevent stale expansion state - Improve navigation state handling by using replace flag only when on target path to reduce history stack pollution * fix:pdfEnhancementEnabled * feat(web): add tool management * fix(web): get the parent domain name adaptation IP * fix(web): Conversation add initialValue * feat(web): workflow’s Editor Variable support Tag * fix(web): pricing UI * feat(web): JSON Tool update * fix(web): update get llm,chat model list function * fix(web): time tool / cluster chat * fix(web): time tool add time zone * feat(web): neo4j type user memory detail * fix(web): update parseSchema api param * feat: workflow add knowledge-retrieval node * feat(knowledgeBase): enhance file upload and dataset creation with abort support and improved UX - Add AbortSignal support to uploadFile API for cancellable uploads - Implement custom onRemove callback in UploadFiles component with confirmation dialog - Add i18n translations for file removal confirmation and error messages - Update supported file types documentation to include IMAGE and MEDIA formats - Improve file removal UI with cursor pointer styling - Refactor getModelList API to remove unused type parameter - Add Form import and UploadFile type for better type safety in CreateDataset - Enhance error handling and user feedback for file operations * feat(web): MCP add bearer token auth type * fix(web): UI update --------- Co-authored-by: zhaoying <yzhao96@best-inc.com> Co-authored-by: yujiangping <yujiangping@taofen8.com> Co-authored-by: 赵莹 <zhaoying@redbearai.com> Co-authored-by: vrhs@163.com <accounts_660b6454a0eb398d3f8d2c76@mail.teambition.com>
2025-12-30 18:37:40 +08:00
1580 changed files with 44392 additions and 189832 deletions
--- a/.github/workflows/release-notify-wechat.yml
+++ b/.github/workflows/release-notify-wechat.yml
@@ -1,157 +0,0 @@
-name: Release Notify Workflow
-
-on:
-  pull_request:
-    types: [closed]
-
-jobs:
-  notify:
-    if: >
-      github.event.pull_request.merged == true &&
-      startsWith(github.event.pull_request.base.ref, 'release')
-    runs-on: ubuntu-latest
-
-    steps:
-      # 防止 GitHub HEAD 未同步
-      - run: sleep 3
-
-      # 1️⃣ 获取分支 HEAD
-      - name: Get HEAD
-        id: head
-        run: |
-          HEAD_SHA=$(curl -s \
-            -H "Authorization: Bearer ${{ secrets.GITHUB_TOKEN }}" \
-            https://api.github.com/repos/${{ github.repository }}/git/ref/heads/${{ github.event.pull_request.base.ref }} \
-            | jq -r '.object.sha')
-          echo "head_sha=$HEAD_SHA" >> $GITHUB_OUTPUT
-
-      # 2️⃣ 判断是否最终PR
-      - name: Check Latest
-        id: check
-        run: |
-          if [ "${{ github.event.pull_request.merge_commit_sha }}" = "${{ steps.head.outputs.head_sha }}" ]; then
-            echo "ok=true" >> $GITHUB_OUTPUT
-          else
-            echo "ok=false" >> $GITHUB_OUTPUT
-          fi
-
-      # 3️⃣ 尝试从 PR body 提取 Sourcery 摘要
-      - name: Extract Sourcery Summary
-        if: steps.check.outputs.ok == 'true'
-        id: sourcery
-        env:
-          PR_BODY: ${{ github.event.pull_request.body }}
-        run: |
-          python3 << 'PYEOF'
-          import os, re
-
-          body = os.environ.get("PR_BODY", "") or ""
-          match = re.search(
-              r"## Summary by Sourcery\s*\n(.*?)(?=\n## |\Z)",
-              body,
-              re.DOTALL
-          )
-
-          if match:
-              summary = match.group(1).strip()
-              found = "true"
-          else:
-              summary = ""
-              found = "false"
-
-          with open("sourcery_summary.txt", "w", encoding="utf-8") as f:
-              f.write(summary)
-
-          with open(os.environ["GITHUB_OUTPUT"], "a") as gh:
-              gh.write(f"found={found}\n")
-              gh.write("summary<<EOF\n")
-              gh.write(summary + "\n")
-              gh.write("EOF\n")
-          PYEOF
-
-      # 4️⃣ Fallback: 获取 commits + 通义千问总结
-      - name: Get Commits
-        if: steps.check.outputs.ok == 'true' && steps.sourcery.outputs.found == 'false'
-        run: |
-          curl -s \
-            -H "Authorization: Bearer ${{ secrets.GITHUB_TOKEN }}" \
-            ${{ github.event.pull_request.commits_url }} \
-            | jq -r '.[].commit.message' | head -n 20 > commits.txt
-
-      - name: AI Summary (Qwen Fallback)
-        if: steps.check.outputs.ok == 'true' && steps.sourcery.outputs.found == 'false'
-        id: qwen
-        env:
-          DASHSCOPE_API_KEY: ${{ secrets.DASHSCOPE_API_KEY }}
-        run: |
-          python3 << 'PYEOF'
-          import json, os, urllib.request
-
-          with open("commits.txt", "r") as f:
-              commits = f.read().strip()
-
-          prompt = "请用中文总结以下代码提交，输出3-5条要点，面向测试人员。直接输出编号列表，不要输出标题或前言：\n" + commits
-          payload = {"model": "qwen-plus", "input": {"prompt": prompt}}
-          data = json.dumps(payload, ensure_ascii=False).encode("utf-8")
-
-          req = urllib.request.Request(
-              "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation",
-              data=data,
-              headers={
-                  "Authorization": "Bearer " + os.environ["DASHSCOPE_API_KEY"],
-                  "Content-Type": "application/json"
-              }
-          )
-          resp = urllib.request.urlopen(req)
-          result = json.loads(resp.read().decode())
-          summary = result.get("output", {}).get("text", "AI 摘要生成失败")
-
-          with open(os.environ["GITHUB_OUTPUT"], "a") as gh:
-              gh.write("summary<<EOF\n")
-              gh.write(summary + "\n")
-              gh.write("EOF\n")
-          PYEOF
-
-      # 5️⃣ 企业微信通知（Markdown）
-      - name: Notify WeChat
-        if: steps.check.outputs.ok == 'true'
-        env:
-          WECHAT_WEBHOOK: ${{ secrets.WECHAT_WEBHOOK }}
-          BRANCH: ${{ github.event.pull_request.base.ref }}
-          AUTHOR: ${{ github.event.pull_request.user.login }}
-          PR_TITLE: ${{ github.event.pull_request.title }}
-          PR_URL: ${{ github.event.pull_request.html_url }}
-          SOURCERY_FOUND: ${{ steps.sourcery.outputs.found }}
-          SOURCERY_SUMMARY: ${{ steps.sourcery.outputs.summary }}
-          QWEN_SUMMARY: ${{ steps.qwen.outputs.summary }}
-        run: |
-          python3 << 'PYEOF'
-          import json, os, urllib.request
-
-          if os.environ.get("SOURCERY_FOUND") == "true":
-              label = "Summary by Sourcery"
-              summary = os.environ.get("SOURCERY_SUMMARY", "")
-          else:
-              label = "AI变更摘要"
-              summary = os.environ.get("QWEN_SUMMARY", "AI 摘要生成失败")
-
-          content = (
-            "## 🚀 Release 发布通知\n"
-            "> 📦 **分支**: " + os.environ["BRANCH"] + "\n"
-            "> 👤 **提交人**: " + os.environ["AUTHOR"] + "\n"
-            "> 📝 **标题**: " + os.environ["PR_TITLE"] + "\n\n"
-            "### 🧠 " + label + "\n" +
-            summary + "\n\n"
-            "---\n"
-            "🔗 [查看PR详情](" + os.environ["PR_URL"] + ")"
-          )
-          payload = {"msgtype": "markdown", "markdown": {"content": content}}
-          data = json.dumps(payload, ensure_ascii=False).encode("utf-8")
-          req = urllib.request.Request(
-            os.environ["WECHAT_WEBHOOK"],
-            data=data,
-            headers={"Content-Type": "application/json"}
-          )
-          resp = urllib.request.urlopen(req)
-          print(resp.read().decode())
-          PYEOF
--- a/.github/workflows/sync-to-gitee.yml
+++ b/.github/workflows/sync-to-gitee.yml
@@ -1,36 +0,0 @@
-name: Sync to Gitee
-
-on:
-  push:
-    branches:
-      - main     # Production
-      - develop  # Integration
-      - 'release/*' # Release preparation
-      - 'hotfix/*'  # Urgent fixes
-    tags:
-      - '*'      # All version tags (v1.0.0, etc.)
-
-jobs:
-  sync:
-    runs-on: ubuntu-latest
-
-    steps:
-      - name: Checkout Source Code
-        uses: actions/checkout@v4
-        with:
-          fetch-depth: 0
-
-      - name: Sync to Gitee
-        run: |
-          GITEE_URL="https://${{ secrets.GITEE_USERNAME }}:${{ secrets.GITEE_TOKEN }}@gitee.com/hangzhou-hongxiong-intelligent_1/MemoryBear.git"
-          git remote add gitee "$GITEE_URL"
-
-          # 遍历并推送所有分支
-          for branch in $(git branch -r | grep -v HEAD | sed 's/origin\///'); do
-            echo "Syncing branch: $branch"
-            git push -f gitee "origin/$branch:refs/heads/$branch"
-          done
-
-          # 推送所有标签
-          echo "Syncing tags..."
-          git push gitee --tags --force
--- a/.gitignore
+++ b/.gitignore
@@ -18,22 +18,16 @@ examples/
 .kiro
 .vscode
 .idea
-.claude

 # Temporary outputs
 .DS_Store
-.hypothesis/
 time.log
 celerybeat-schedule.db
 search_results.json
-redbear-mem-metrics/
-redbear-mem-benchmark/
-pitch-deck/

 api/migrations/versions
 tmp
 files
-powers/ 

 # Exclude dep files
 huggingface.co/
@@ -41,5 +35,3 @@ nltk_data/
 tika-server*.jar*
 cl100k_base.tiktoken
 libssl*.deb
-
-sandbox/lib/seccomp_redbear/target
--- a/README.md
+++ b/README.md
@@ -2,10 +2,6 @@

 # MemoryBear empowers AI with human-like memory capabilities

-[![License](https://img.shields.io/badge/License-Apache%202.0-blue.svg)](LICENSE)
-[![Python](https://img.shields.io/badge/Python-3.12+-green?logo=python&logoColor=white)](https://www.python.org/)
-[![Gitee Sync](https://img.shields.io/github/actions/workflow/status/SuanmoSuanyangTechnology/MemoryBear/sync-to-gitee.yml?label=Gitee%20Sync&logo=gitee&logoColor=white)](https://github.com/SuanmoSuanyangTechnology/MemoryBear/actions/workflows/sync-to-gitee.yml)
-
 [中文](./README_CN.md) | English

 ### [Installation Guide](#memorybear-installation-guide)
@@ -230,8 +226,8 @@ REDIS_PORT=6379
 REDIS_DB=1 

 # Celery (Using Redis as broker)
-REDIS_DB_CELERY_BROKER=1
-REDIS_DB_CELERY_BACKEND=2
+BROKER_URL=redis://127.0.0.1:6379/0
+RESULT_BACKEND=redis://127.0.0.1:6379/0

 # JWT Secret Key (Formation method: openssl rand -hex 32)
 SECRET_KEY=your-secret-key-here
@@ -338,13 +334,7 @@ step6: Log In to the Frontend Interface.
 ## License
 This project is licensed under the Apache License 2.0. For details, see the LICENSE file.

-## Community & Support
-
-Join our community to ask questions, share your work, and connect with fellow developers.
-
- **GitHub Issues**: Report bugs, request features, or track known issues via [GitHub Issues](https://github.com/SuanmoSuanyangTechnology/MemoryBear/issues).
- **GitHub Pull Requests**: Contribute code improvements or fixes through [Pull Requests](https://github.com/SuanmoSuanyangTechnology/MemoryBear/pulls).
- **GitHub Discussions**: Ask questions, share ideas, and engage with the community in [GitHub Discussions](https://github.com/SuanmoSuanyangTechnology/MemoryBear/discussions).
- **WeChat**: Scan the QR code below to join our WeChat community group.
- ![wecom-temp-114020-47fe87a75da439f09f5dc93a01593046](https://github.com/user-attachments/assets/8c81885c-4134-40d5-96e2-7f78cc082dc6)
- **Contact**: If you are interested in contributing or collaborating, feel free to reach out at tianyou_hubm@redbearai.com
+## Acknowledgements & Community
+- Feedback & Issues: Please submit an Issue in the repository for bug reports or discussions.
+- Contributions Welcome: When submitting a Pull Request, please create a feature branch and follow conventional commit message guidelines.
+- Contact: If you are interested in contributing or collaborating, feel free to reach out at tianyou_hubm@redbearai.com
--- a/README_CN.md
+++ b/README_CN.md
@@ -2,10 +2,6 @@

 # MemoryBear 让AI拥有如同人类一样的记忆

-[![License](https://img.shields.io/badge/License-Apache%202.0-blue.svg)](LICENSE)
-[![Python](https://img.shields.io/badge/Python-3.12+-green?logo=python&logoColor=white)](https://www.python.org/)
-[![Gitee Sync](https://img.shields.io/github/actions/workflow/status/SuanmoSuanyangTechnology/MemoryBear/sync-to-gitee.yml?label=Gitee%20Sync&logo=gitee&logoColor=white)](https://github.com/SuanmoSuanyangTechnology/MemoryBear/actions/workflows/sync-to-gitee.yml)
-
 中文 | [English](./README.md)

 ### [安装教程](#memorybear安装教程)
@@ -205,8 +201,8 @@ REDIS_PORT=6379
 REDIS_DB=1 

 # Celery (使用Redis作为broker)
-REDIS_DB_CELERY_BROKER=1
-REDIS_DB_CELERY_BACKEND=2
+BROKER_URL=redis://127.0.0.1:6379/0
+RESULT_BACKEND=redis://127.0.0.1:6379/0

 # JWT密钥 (生成方式: openssl rand -hex 32)
 SECRET_KEY=your-secret-key-here
--- a/api/Dockerfile
+++ b/api/Dockerfile
@@ -45,8 +45,7 @@ RUN --mount=type=cache,id=mem_apt,target=/var/cache/apt,sharing=locked \
    apt install -y libpython3-dev libgtk-4-1 libnss3 xdg-utils libgbm-dev && \
    apt install -y libjemalloc-dev && \
    apt install -y python3-pip pipx nginx unzip curl wget git vim less && \
-    apt install -y ghostscript && \
-    apt install -y libmagic1
+    apt install -y ghostscript

 RUN if [ "$NEED_MIRROR" == "1" ]; then \
        pip3 config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple && \
--- a/api/LICENSE
+++ b/api/LICENSE
--- a/api/alembic.ini
+++ b/api/alembic.ini
@@ -60,12 +60,7 @@ version_path_separator = os  # Use os.pathsep. Default configuration used for ne
 # are written from script.py.mako
 # output_encoding = utf-8

-# Database connection URL - DO NOT hardcode credentials here!
-# Connection string is set dynamically from environment variables in migrations/env.py
-# Required env vars: DB_USER, DB_PASSWORD, DB_HOST, DB_PORT, DB_NAME
-# Example: postgresql://user:password@localhost:5432/dbname
-; sqlalchemy.url = postgresql://user:password@host:port/dbname
-sqlalchemy.url = driver://user:password@host:port/dbname
+sqlalchemy.url = postgresql://user:password@localhost/dbname


 [post_write_hooks]
--- a/api/app/aioRedis.py
+++ b/api/app/aioRedis.py
@@ -1,18 +1,16 @@
+import os
 import asyncio
 import json
 import logging
-import os
-import threading
 from typing import Dict, Any, Optional
-
 import redis.asyncio as redis
 from redis.asyncio import ConnectionPool
-
 from app.core.config import settings

 # 设置日志记录器
 logger = logging.getLogger(__name__)

+
 # 创建连接池
 pool = ConnectionPool.from_url(
    f"redis://{settings.REDIS_HOST}:{settings.REDIS_PORT}",
@@ -23,51 +21,6 @@ pool = ConnectionPool.from_url(
 )
 aio_redis = redis.StrictRedis(connection_pool=pool)

-_REDIS_URL = f"redis://{settings.REDIS_HOST}:{settings.REDIS_PORT}"
-
-# Thread-local storage for connection pools.
-# Each thread (and each forked process) gets its own pool to avoid
-# "Future attached to a different loop" errors in Celery --pool=threads
-# and stale connections after fork in --pool=prefork.
-_thread_local = threading.local()
-
-
-def get_thread_safe_redis() -> redis.StrictRedis:
-    """Return a Redis client whose connection pool is bound to the current
-    thread, process **and** event loop.
-
-    The pool is recreated when:
-    - The PID changes (fork, Celery --pool=prefork)
-    - The thread has no pool yet (Celery --pool=threads)
-    - The previously-cached event loop has been closed (Celery tasks call
-      ``_shutdown_loop_gracefully`` which closes the loop after each run)
-    """
-    current_pid = os.getpid()
-    cached_loop = getattr(_thread_local, "loop", None)
-    loop_stale = cached_loop is not None and cached_loop.is_closed()
-
-    if not hasattr(_thread_local, "pool") \
-            or getattr(_thread_local, "pid", None) != current_pid \
-            or loop_stale:
-        _thread_local.pid = current_pid
-        # Python 3.10+: get_event_loop() raises RuntimeError in threads
-        # where no loop has been set yet (e.g. Celery --pool=threads).
-        try:
-            _thread_local.loop = asyncio.get_event_loop()
-        except RuntimeError:
-            _thread_local.loop = None
-        _thread_local.pool = ConnectionPool.from_url(
-            _REDIS_URL,
-            db=settings.REDIS_DB,
-            password=settings.REDIS_PASSWORD,
-            decode_responses=True,
-            max_connections=5,
-            health_check_interval=30,
-        )
-
-    return redis.StrictRedis(connection_pool=_thread_local.pool)
-
-
 async def get_redis_connection():
    """获取Redis连接"""
    try:
@@ -76,8 +29,7 @@ async def get_redis_connection():
        logger.error(f"Redis连接失败: {str(e)}")
        return None

-
-async def aio_redis_set(key: str, val: str | dict, expire: int = None):
+async def aio_redis_set(key: str, val: str|dict, expire: int = None):
    """设置Redis键值
    
    Args:
@@ -88,15 +40,16 @@ async def aio_redis_set(key: str, val: str | dict, expire: int = None):
    try:
        if isinstance(val, dict):
            val = json.dumps(val, ensure_ascii=False)
-
+        
        if expire is not None:
+            # 设置带过期时间的键值
            await aio_redis.set(key, val, ex=expire)
        else:
+            # 设置永久键值
            await aio_redis.set(key, val)
    except Exception as e:
        logger.error(f"Redis set错误: {str(e)}")

-
 async def aio_redis_get(key: str):
    """获取Redis键值"""
    try:
@@ -105,7 +58,6 @@ async def aio_redis_get(key: str):
        logger.error(f"Redis get错误: {str(e)}")
        return None

-
 async def aio_redis_delete(key: str):
    """删除Redis键"""
    try:
@@ -114,7 +66,6 @@ async def aio_redis_delete(key: str):
        logger.error(f"Redis delete错误: {str(e)}")
        return None

-
 async def aio_redis_publish(channel: str, message: Dict[str, Any]) -> bool:
    """发布消息到Redis频道"""
    try:
@@ -127,10 +78,9 @@ async def aio_redis_publish(channel: str, message: Dict[str, Any]) -> bool:
        logger.error(f"Redis发布错误: {str(e)}")
        return False

-
 class RedisSubscriber:
    """Redis订阅器"""
-
+    
    def __init__(self, channel: str):
        self.channel = channel
        self.conn = None
@@ -138,25 +88,25 @@ class RedisSubscriber:
        self.is_closed = False
        self._queue = asyncio.Queue()
        self._task = None
-
+    
    async def start(self):
        """开始订阅"""
        if self.is_closed or self._task:
            return
-
+            
        self._task = asyncio.create_task(self._receive_messages())
        logger.info(f"开始订阅: {self.channel}")
-
+    
    async def _receive_messages(self):
        """接收消息"""
        try:
            self.conn = await get_redis_connection()
            if not self.conn:
                return
-
+                
            self.pubsub = self.conn.pubsub()
            await self.pubsub.subscribe(self.channel)
-
+            
            while not self.is_closed:
                try:
                    message = await self.pubsub.get_message(ignore_subscribe_messages=True, timeout=0.01)
@@ -177,7 +127,7 @@ class RedisSubscriber:
        finally:
            await self._queue.put(None)
            await self._cleanup()
-
+    
    async def _cleanup(self):
        """清理资源"""
        if self.pubsub:
@@ -191,7 +141,7 @@ class RedisSubscriber:
                await self.conn.close()
            except Exception:
                pass
-
+    
    async def get_message(self) -> Optional[Dict[str, Any]]:
        """获取消息"""
        if self.is_closed:
@@ -203,7 +153,7 @@ class RedisSubscriber:
        except Exception as e:
            logger.error(f"获取消息错误: {str(e)}")
            return None
-
+    
    async def close(self):
        """关闭订阅器"""
        if self.is_closed:
@@ -213,33 +163,32 @@ class RedisSubscriber:
            self._task.cancel()
        await self._cleanup()

-
 class RedisPubSubManager:
    """Redis发布订阅管理器"""
-
+    
    def __init__(self):
        self.subscribers = {}
-
+    
    async def publish(self, channel: str, message: Dict[str, Any]) -> bool:
        return await aio_redis_publish(channel, message)
-
+    
    def get_subscriber(self, channel: str) -> RedisSubscriber:
        if channel in self.subscribers:
            subscriber = self.subscribers[channel]
            if not subscriber.is_closed:
                return subscriber
-
+        
        subscriber = RedisSubscriber(channel)
        self.subscribers[channel] = subscriber
        return subscriber
-
+    
    def cancel_subscription(self, channel: str) -> bool:
        if channel in self.subscribers:
            asyncio.create_task(self.subscribers[channel].close())
            del self.subscribers[channel]
            return True
        return False
-
+    
    def cancel_all_subscriptions(self) -> int:
        count = len(self.subscribers)
        for subscriber in self.subscribers.values():
@@ -247,6 +196,6 @@ class RedisPubSubManager:
        self.subscribers.clear()
        return count

-
 # 全局实例
 pubsub_manager = RedisPubSubManager()
+
--- a/api/app/base/type.py
+++ b/api/app/base/type.py
@@ -1,25 +0,0 @@
-from pydantic import BaseModel, Field
-from sqlalchemy import TypeDecorator, JSON
-
-
-class PydanticType(TypeDecorator):
-    impl = JSON
-
-    def __init__(self, pydantic_model: type[BaseModel]):
-        super().__init__()
-        self.model = pydantic_model
-
-    def process_bind_param(self, value, dialect):
-        # 入库：Model -> dict
-        if value is None:
-            return None
-        if isinstance(value, self.model):
-            return value.dict()
-        return value   # 已经是 dict 也放行
-
-    def process_result_value(self, value, dialect):
-        # 出库：dict -> Model
-        if value is None:
-            return None
-        # return self.model.parse_obj(value)  # pydantic v1
-        return self.model.model_validate(value)  # pydantic v2
--- a/api/app/cache/init.py
+++ b/api/app/cache/init.py
@@ -1,10 +0,0 @@
-"""
-Cache 缓存模块
-
-提供各种缓存功能的统一入口
-"""
-from .memory import InterestMemoryCache
-
-__all__ = [
-    "InterestMemoryCache",
-]
--- a/api/app/cache/memory/init.py
+++ b/api/app/cache/memory/init.py
@@ -1,12 +0,0 @@
-"""
-Memory 缓存模块
-
-提供记忆系统相关的缓存功能
-"""
-from .interest_memory import InterestMemoryCache
-from .activity_stats_cache import ActivityStatsCache
-
-__all__ = [
-    "InterestMemoryCache",
-    "ActivityStatsCache",
-]
--- a/api/app/cache/memory/activity_stats_cache.py
+++ b/api/app/cache/memory/activity_stats_cache.py
@@ -1,124 +0,0 @@
-"""
-Recent Activity Stats Cache
-
-记忆提取活动统计缓存模块
-用于缓存每次记忆提取流程的统计数据，按 workspace_id 存储，24小时后释放
-查询命令：cache:memory:activity_stats:by_workspace:7de31a97-40a6-4fc0-b8d3-15c89f523843
-"""
-import json
-import logging
-from typing import Optional, Dict, Any
-from datetime import datetime
-
-from app.aioRedis import get_thread_safe_redis
-
-logger = logging.getLogger(__name__)
-
-# 缓存过期时间：24小时
-ACTIVITY_STATS_CACHE_EXPIRE = 86400
-
-
-class ActivityStatsCache:
-    """记忆提取活动统计缓存类"""
-
-    PREFIX = "cache:memory:activity_stats"
-
-    @classmethod
-    def _get_key(cls, workspace_id: str) -> str:
-        """生成 Redis key
-
-        Args:
-            workspace_id: 工作空间ID
-
-        Returns:
-            完整的 Redis key
-        """
-        return f"{cls.PREFIX}:by_workspace:{workspace_id}"
-
-    @classmethod
-    async def set_activity_stats(
-        cls,
-        workspace_id: str,
-        stats: Dict[str, Any],
-        expire: int = ACTIVITY_STATS_CACHE_EXPIRE,
-    ) -> bool:
-        """设置记忆提取活动统计缓存
-
-        Args:
-            workspace_id: 工作空间ID
-            stats: 统计数据，格式：
-                {
-                    "chunk_count": int,
-                    "statements_count": int,
-                    "triplet_entities_count": int,
-                    "triplet_relations_count": int,
-                    "temporal_count": int,
-                }
-            expire: 过期时间（秒），默认24小时
-
-        Returns:
-            是否设置成功
-        """
-        try:
-            key = cls._get_key(workspace_id)
-            payload = {
-                "stats": stats,
-                "generated_at": datetime.now().isoformat(),
-                "workspace_id": workspace_id,
-                "cached": True,
-            }
-            value = json.dumps(payload, ensure_ascii=False)
-            await get_thread_safe_redis().set(key, value, ex=expire)
-            logger.info(f"设置活动统计缓存成功: {key}, 过期时间: {expire}秒")
-            return True
-        except Exception as e:
-            logger.error(f"设置活动统计缓存失败: {e}", exc_info=True)
-            return False
-
-    @classmethod
-    async def get_activity_stats(
-        cls,
-        workspace_id: str,
-    ) -> Optional[Dict[str, Any]]:
-        """获取记忆提取活动统计缓存
-
-        Args:
-            workspace_id: 工作空间ID
-
-        Returns:
-            统计数据字典，缓存不存在或已过期返回 None
-        """
-        try:
-            key = cls._get_key(workspace_id)
-            value = await get_thread_safe_redis().get(key)
-            if value:
-                payload = json.loads(value)
-                logger.info(f"命中活动统计缓存: {key}")
-                return payload
-            logger.info(f"活动统计缓存不存在或已过期: {key}")
-            return None
-        except Exception as e:
-            logger.error(f"获取活动统计缓存失败: {e}", exc_info=True)
-            return None
-
-    @classmethod
-    async def delete_activity_stats(
-        cls,
-        workspace_id: str,
-    ) -> bool:
-        """删除记忆提取活动统计缓存
-
-        Args:
-            workspace_id: 工作空间ID
-
-        Returns:
-            是否删除成功
-        """
-        try:
-            key = cls._get_key(workspace_id)
-            result = await get_thread_safe_redis().delete(key)
-            logger.info(f"删除活动统计缓存: {key}, 结果: {result}")
-            return result > 0
-        except Exception as e:
-            logger.error(f"删除活动统计缓存失败: {e}", exc_info=True)
-            return False
--- a/api/app/cache/memory/interest_memory.py
+++ b/api/app/cache/memory/interest_memory.py
@@ -1,122 +0,0 @@
-"""
-Interest Distribution Cache
-
-兴趣分布缓存模块
-用于缓存用户的兴趣分布标签数据，避免重复调用模型生成
-"""
-import json
-import logging
-from typing import Optional, List, Dict, Any
-from datetime import datetime
-
-from app.aioRedis import get_thread_safe_redis
-
-logger = logging.getLogger(__name__)
-
-# 缓存过期时间：24小时
-INTEREST_CACHE_EXPIRE = 86400
-
-
-class InterestMemoryCache:
-    """兴趣分布缓存类"""
-
-    PREFIX = "cache:memory:interest_distribution"
-
-    @classmethod
-    def _get_key(cls, end_user_id: str, language: str) -> str:
-        """生成 Redis key
-
-        Args:
-            end_user_id: 用户ID
-            language: 语言类型
-
-        Returns:
-            完整的 Redis key
-        """
-        return f"{cls.PREFIX}:by_user:{end_user_id}:{language}"
-
-    @classmethod
-    async def set_interest_distribution(
-        cls,
-        end_user_id: str,
-        language: str,
-        data: List[Dict[str, Any]],
-        expire: int = INTEREST_CACHE_EXPIRE,
-    ) -> bool:
-        """设置用户兴趣分布缓存
-
-        Args:
-            end_user_id: 用户ID
-            language: 语言类型
-            data: 兴趣分布列表，格式 [{"name": "...", "frequency": ...}, ...]
-            expire: 过期时间（秒），默认24小时
-
-        Returns:
-            是否设置成功
-        """
-        try:
-            key = cls._get_key(end_user_id, language)
-            payload = {
-                "data": data,
-                "generated_at": datetime.now().isoformat(),
-                "cached": True,
-            }
-            value = json.dumps(payload, ensure_ascii=False)
-            await get_thread_safe_redis().set(key, value, ex=expire)
-            logger.info(f"设置兴趣分布缓存成功: {key}, 过期时间: {expire}秒")
-            return True
-        except Exception as e:
-            logger.error(f"设置兴趣分布缓存失败: {e}", exc_info=True)
-            return False
-
-    @classmethod
-    async def get_interest_distribution(
-        cls,
-        end_user_id: str,
-        language: str,
-    ) -> Optional[List[Dict[str, Any]]]:
-        """获取用户兴趣分布缓存
-
-        Args:
-            end_user_id: 用户ID
-            language: 语言类型
-
-        Returns:
-            兴趣分布列表，缓存不存在或已过期返回 None
-        """
-        try:
-            key = cls._get_key(end_user_id, language)
-            value = await get_thread_safe_redis().get(key)
-            if value:
-                payload = json.loads(value)
-                logger.info(f"命中兴趣分布缓存: {key}")
-                return payload.get("data")
-            logger.info(f"兴趣分布缓存不存在或已过期: {key}")
-            return None
-        except Exception as e:
-            logger.error(f"获取兴趣分布缓存失败: {e}", exc_info=True)
-            return None
-
-    @classmethod
-    async def delete_interest_distribution(
-        cls,
-        end_user_id: str,
-        language: str,
-    ) -> bool:
-        """删除用户兴趣分布缓存
-
-        Args:
-            end_user_id: 用户ID
-            language: 语言类型
-
-        Returns:
-            是否删除成功
-        """
-        try:
-            key = cls._get_key(end_user_id, language)
-            result = await get_thread_safe_redis().delete(key)
-            logger.info(f"删除兴趣分布缓存: {key}, 结果: {result}")
-            return result > 0
-        except Exception as e:
-            logger.error(f"删除兴趣分布缓存失败: {e}", exc_info=True)
-            return False
--- a/api/app/celery_app.py
+++ b/api/app/celery_app.py
@@ -1,64 +1,40 @@
 import os
-import platform
-import re
 from datetime import timedelta
 from urllib.parse import quote

-from celery import Celery
-from celery.schedules import crontab
-
 from app.core.config import settings
-from app.core.logging_config import get_logger
-
-logger = get_logger(__name__)
-
-
-def _mask_url(url: str) -> str:
-    """隐藏 URL 中的密码部分，适用于 redis:// 和 amqp:// 等协议"""
-    return re.sub(r'(://[^:]*:)[^@]+(@)', r'\1***\2', url)
-
-# macOS fork() safety - must be set before any Celery initialization
-if platform.system() == 'Darwin':
-    os.environ.setdefault('OBJC_DISABLE_INITIALIZE_FORK_SAFETY', 'YES')
+from celery import Celery

 # 创建 Celery 应用实例
-# broker: 优先使用环境变量 CELERY_BROKER_URL（支持 amqp:// 等任意协议），
-#         未配置则回退到 Redis 方案
-# backend: 结果存储（使用 Redis）
-# NOTE: 不要在 .env 中设置 BROKER_URL / RESULT_BACKEND / CELERY_BROKER / CELERY_BACKEND，
-#       这些名称会被 Celery CLI 的 Click 框架劫持，详见 docs/celery-env-bug-report.md
-
-_broker_url = os.getenv("CELERY_BROKER_URL") or \
-    f"redis://:{quote(settings.REDIS_PASSWORD)}@{settings.REDIS_HOST}:{settings.REDIS_PORT}/{settings.REDIS_DB_CELERY_BROKER}"
-_backend_url = f"redis://:{quote(settings.REDIS_PASSWORD)}@{settings.REDIS_HOST}:{settings.REDIS_PORT}/{settings.REDIS_DB_CELERY_BACKEND}"
-os.environ["CELERY_BROKER_URL"] = _broker_url
-os.environ["CELERY_RESULT_BACKEND"] = _backend_url
-# Neutralize legacy Celery env vars that can be hijacked by Celery's CLI/Click
-# integration and accidentally override our canonical URLs.
-os.environ.pop("BROKER_URL", None)
-os.environ.pop("RESULT_BACKEND", None)
-os.environ.pop("CELERY_BROKER", None)
-os.environ.pop("CELERY_BACKEND", None)
-
+# broker: 任务队列（使用 Redis DB 0）
+# backend: 结果存储（使用 Redis DB 10）
 celery_app = Celery(
    "redbear_tasks",
-    broker=_broker_url,
-    backend=_backend_url,
+    broker=f"redis://:{quote(settings.REDIS_PASSWORD)}@{settings.REDIS_HOST}:{settings.REDIS_PORT}/{settings.CELERY_BROKER}",
+    backend=f"redis://:{quote(settings.REDIS_PASSWORD)}@{settings.REDIS_HOST}:{settings.REDIS_PORT}/{settings.CELERY_BACKEND}",
 )

-logger.info(
-    "Celery app initialized",
-    extra={
-        "broker": _mask_url(_broker_url),
-        "backend": _mask_url(_backend_url),
-    },
-)
-# Default queue for unrouted tasks
-celery_app.conf.task_default_queue = 'memory_tasks'
+# 配置使用本地队列，避免与远程 worker 冲突
+celery_app.conf.task_default_queue = 'localhost_test_wyl'
+celery_app.conf.task_default_exchange = 'localhost_test_wyl'
+celery_app.conf.task_default_routing_key = 'localhost_test_wyl'

 # macOS 兼容性配置
-if platform.system() == 'Darwin':
+import platform
+
+if platform.system() == 'Darwin':  # macOS
+    # 设置环境变量解决 fork 问题
    os.environ.setdefault('OBJC_DISABLE_INITIALIZE_FORK_SAFETY', 'YES')
+    
+    # 使用 solo 池避免多进程问题
+    celery_app.conf.worker_pool = 'solo'
+    
+    # 设置唯一的节点名称
+    import socket
+    import time
+    hostname = socket.gethostname()
+    timestamp = int(time.time())
+    celery_app.conf.worker_name = f"celery@{hostname}-{timestamp}"

 # Celery 配置
 celery_app.conf.update(
@@ -67,85 +43,56 @@ celery_app.conf.update(
    accept_content=['json'],
    result_serializer='json',
    
-    # # 时区
-    # timezone='Asia/Shanghai',
-    # enable_utc=False,
+    # 时区
+    timezone='Asia/Shanghai',
+    enable_utc=True,
    
    # 任务追踪
    task_track_started=True,
    task_ignore_result=False,
-
+    
    # 超时设置
-    task_time_limit=3600,  # 60分钟硬超时
-    task_soft_time_limit=3000,  # 50分钟软超时
-
-    # Worker 设置 (per-worker settings are in docker-compose command line)
-    worker_prefetch_multiplier=1,  # Don't hoard tasks, fairer distribution
-    worker_redirect_stdouts_level='INFO',  # stdout/print → INFO instead of WARNING
-
+    task_time_limit=30 * 60,  # 30 分钟硬超时
+    task_soft_time_limit=25 * 60,  # 25 分钟软超时
+    
+    # Worker 设置 - 针对 macOS 优化
+    worker_prefetch_multiplier=1,  # 减少预取任务数，避免内存堆积
+    worker_max_tasks_per_child=10,  # 大幅减少每个 worker 执行的任务数，频繁重启防止内存泄漏
+    worker_max_memory_per_child=200000,  # 200MB 内存限制，超过后重启 worker
+    
    # 结果过期时间
-    result_expires=3600,  # 结果保存1小时
-
+    result_expires=3600,  # 结果保存 1 小时
+    
    # 任务确认设置
-    task_acks_late=True,
-    task_reject_on_worker_lost=True,
-    worker_disable_rate_limits=True,
-
-    # FLower setting 
-    worker_send_task_events=True,
-    task_send_sent_event=True,
-
-    # task routing
-    task_routes={
-        # Memory tasks → memory_tasks queue (threads worker)
-        'app.core.memory.agent.read_message_priority': {'queue': 'memory_tasks'},
-        'app.core.memory.agent.read_message': {'queue': 'memory_tasks'},
-        'app.core.memory.agent.write_message': {'queue': 'memory_tasks'},
-        'app.tasks.write_perceptual_memory': {'queue': 'memory_tasks'},
-
-        # Long-term storage tasks → memory_tasks queue (batched write strategies)
-        'app.core.memory.agent.long_term_storage.window': {'queue': 'memory_tasks'},
-        'app.core.memory.agent.long_term_storage.time': {'queue': 'memory_tasks'},
-        'app.core.memory.agent.long_term_storage.aggregate': {'queue': 'memory_tasks'},
-
-        # Clustering tasks → memory_tasks queue (使用相同的 worker，避免 macOS fork 问题)
-        'app.tasks.run_incremental_clustering': {'queue': 'memory_tasks'},
-
-        # Metadata extraction → memory_tasks queue
-        'app.tasks.extract_user_metadata': {'queue': 'memory_tasks'},
-
-        # Document tasks → document_tasks queue (prefork worker)
-        'app.core.rag.tasks.parse_document': {'queue': 'document_tasks'},
-        'app.core.rag.tasks.build_graphrag_for_kb': {'queue': 'document_tasks'},
-        'app.core.rag.tasks.sync_knowledge_for_kb': {'queue': 'document_tasks'},
-
-        # Beat/periodic tasks → periodic_tasks queue (dedicated periodic worker)
-        'app.tasks.workspace_reflection_task': {'queue': 'periodic_tasks'},
-        'app.tasks.regenerate_memory_cache': {'queue': 'periodic_tasks'},
-        'app.tasks.run_forgetting_cycle_task': {'queue': 'periodic_tasks'},
-        'app.tasks.write_all_workspaces_memory_task': {'queue': 'periodic_tasks'},
-        'app.tasks.update_implicit_emotions_storage': {'queue': 'periodic_tasks'},
-        'app.tasks.init_implicit_emotions_for_users': {'queue': 'periodic_tasks'},
-        'app.tasks.init_interest_distribution_for_users': {'queue': 'periodic_tasks'},
-        'app.tasks.init_community_clustering_for_users': {'queue': 'periodic_tasks'},
-    },
+    task_acks_late=True,  # 任务完成后才确认，避免任务丢失
+    worker_disable_rate_limits=True,  # 禁用速率限制
+    
+    # 任务路由（可选，用于不同队列）
+    # task_routes={
+    #     'app.core.rag.tasks.parse_document': {'queue': 'document_processing'},
+    #     'app.core.memory.agent.read_message': {'queue': 'memory_processing'},
+    #     'app.core.memory.agent.write_message': {'queue': 'memory_processing'},
+    #     'tasks.process_item': {'queue': 'default'},
+    # },
 )

 # 自动发现任务模块
 celery_app.autodiscover_tasks(['app'])

 # Celery Beat schedule for periodic tasks
-memory_increment_schedule = crontab(hour=settings.MEMORY_INCREMENT_HOUR, minute=settings.MEMORY_INCREMENT_MINUTE)
+reflection_schedule = timedelta(seconds=settings.REFLECTION_INTERVAL_SECONDS)
+health_schedule = timedelta(seconds=settings.HEALTH_CHECK_SECONDS)
+memory_increment_schedule = timedelta(hours=settings.MEMORY_INCREMENT_INTERVAL_HOURS)
 memory_cache_regeneration_schedule = timedelta(hours=settings.MEMORY_CACHE_REGENERATION_HOURS)
-workspace_reflection_schedule = timedelta(seconds=settings.WORKSPACE_REFLECTION_INTERVAL_SECONDS)
-forgetting_cycle_schedule = timedelta(hours=settings.FORGETTING_CYCLE_INTERVAL_HOURS)
-implicit_emotions_update_schedule = crontab(
-    hour=settings.IMPLICIT_EMOTIONS_UPDATE_HOUR,
-    minute=settings.IMPLICIT_EMOTIONS_UPDATE_MINUTE,
-)
-
+workspace_reflection_schedule = timedelta(seconds=30)  # 每30秒运行一次settings.REFLECTION_INTERVAL_TIME
 # 构建定时任务配置
 beat_schedule_config = {
+
+    # "check-read-service": {
+    #     "task": "app.core.memory.agent.health.check_read_service",
+    #     "schedule": health_schedule,
+    #     "args": (),
+    # },
    "run-workspace-reflection": {
        "task": "app.tasks.workspace_reflection_task",
        "schedule": workspace_reflection_schedule,
@@ -156,23 +103,16 @@ beat_schedule_config = {
        "schedule": memory_cache_regeneration_schedule,
        "args": (),
    },
-    "run-forgetting-cycle": {
-        "task": "app.tasks.run_forgetting_cycle_task",
-        "schedule": forgetting_cycle_schedule,
-        "kwargs": {
-            "config_id": None,  # 使用默认配置，可以通过环境变量配置
-        },
-    },
-    "write-all-workspaces-memory": {
-        "task": "app.tasks.write_all_workspaces_memory_task",
-        "schedule": memory_increment_schedule,
-        "args": (),
-    },
-    "update-implicit-emotions-storage": {
-        "task": "app.tasks.update_implicit_emotions_storage",
-        "schedule": implicit_emotions_update_schedule,
-        "args": (),
-    },
 }

+# 如果配置了默认工作空间ID，则添加记忆总量统计任务
+if settings.DEFAULT_WORKSPACE_ID:
+    beat_schedule_config["write-total-memory"] = {
+        "task": "app.controllers.memory_storage_controller.search_all",
+        "schedule": memory_increment_schedule,
+        "kwargs": {
+            "workspace_id": settings.DEFAULT_WORKSPACE_ID,
+        },
+    }
+
 celery_app.conf.beat_schedule = beat_schedule_config
--- a/api/app/celery_worker.py
+++ b/api/app/celery_worker.py
@@ -3,14 +3,8 @@ Celery Worker 入口点
 用于启动 Celery Worker: celery -A app.celery_worker worker --loglevel=info
 """
 from app.celery_app import celery_app
-from app.core.logging_config import LoggingConfig, get_logger
-
-# Initialize logging system for Celery worker
-LoggingConfig.setup_logging()
-logger = get_logger(__name__)
-logger.info("Celery worker logging initialized")

 # 导入任务模块以注册任务
 import app.tasks

-__all__ = ['celery_app']
+__all__ = ['celery_app']
--- a/api/app/config/init.py
+++ b/api/app/config/init.py
@@ -1 +0,0 @@
-"""Configuration module for application settings."""
--- a/api/app/config/default_ontology_config.py
+++ b/api/app/config/default_ontology_config.py
@@ -1,239 +0,0 @@
-"""默认本体场景配置
-
-本模块定义系统预设的本体场景和实体类型配置。
-这些配置用于在工作空间创建时自动初始化默认场景。
-支持中英文双语配置，根据用户语言偏好创建对应语言的场景。
-"""
-
-# 在线教育场景配置
-ONLINE_EDUCATION_SCENE = {
-    "name_chinese": "在线教育",
-    "name_english": "Online Education",
-    "description_chinese": "适用于在线教育平台的本体建模，包含学生、教师、课程等核心实体类型",
-    "description_english": "Ontology modeling for online education platforms, including core entity types such as students, teachers, and courses",
-    "types": [
-        {
-            "name_chinese": "学生",
-            "name_english": "Student",
-            "description_chinese": "在教育系统中接受教育的个体，包含姓名、学号、年级、班级等属性",
-            "description_english": "Individuals receiving education in the education system, including attributes such as name, student ID, grade, and class"
-        },
-        {
-            "name_chinese": "教师",
-            "name_english": "Teacher",
-            "description_chinese": "在教育系统中提供教学服务的个体，包含姓名、工号、任教学科、职称等属性",
-            "description_english": "Individuals providing teaching services in the education system, including attributes such as name, employee ID, teaching subject, and title"
-        },
-        {
-            "name_chinese": "课程",
-            "name_english": "Course",
-            "description_chinese": "教育系统中的教学内容单元，包含课程名称、课程代码、学分、学时等属性",
-            "description_english": "Teaching content units in the education system, including attributes such as course name, course code, credits, and class hours"
-        },
-        {
-            "name_chinese": "作业",
-            "name_english": "Assignment",
-            "description_chinese": "课程中布置的学习任务，包含作业标题、截止日期、所属课程、提交状态等属性",
-            "description_english": "Learning tasks assigned in courses, including attributes such as assignment title, deadline, course, and submission status"
-        },
-        {
-            "name_chinese": "成绩",
-            "name_english": "Grade",
-            "description_chinese": "学生学习成果的评价结果，包含分数、评级、考试类型、所属课程等属性",
-            "description_english": "Evaluation results of student learning outcomes, including attributes such as score, rating, exam type, and course"
-        },
-        {
-            "name_chinese": "考试",
-            "name_english": "Exam",
-            "description_chinese": "评估学生学习成果的测试活动，包含考试名称、时间、地点、科目等属性",
-            "description_english": "Test activities to assess student learning outcomes, including attributes such as exam name, time, location, and subject"
-        },
-        {
-            "name_chinese": "教室",
-            "name_english": "Classroom",
-            "description_chinese": "进行教学活动的物理或虚拟空间，包含教室编号、容量、设备等属性",
-            "description_english": "Physical or virtual spaces for teaching activities, including attributes such as classroom number, capacity, and equipment"
-        },
-        {
-            "name_chinese": "学科",
-            "name_english": "Subject",
-            "description_chinese": "知识的分类领域，包含学科名称、代码、所属院系等属性",
-            "description_english": "Classification domains of knowledge, including attributes such as subject name, code, and department"
-        },
-        {
-            "name_chinese": "教材",
-            "name_english": "Textbook",
-            "description_chinese": "教学使用的书籍或资料，包含书名、作者、出版社、ISBN等属性",
-            "description_english": "Books or materials used for teaching, including attributes such as title, author, publisher, and ISBN"
-        },
-        {
-            "name_chinese": "班级",
-            "name_english": "Class",
-            "description_chinese": "学生的组织单位，包含班级名称、年级、人数、班主任等属性",
-            "description_english": "Organizational units of students, including attributes such as class name, grade, number of students, and class teacher"
-        },
-        {
-            "name_chinese": "学期",
-            "name_english": "Semester",
-            "description_chinese": "教学时间的划分单位，包含学期名称、开始时间、结束时间等属性",
-            "description_english": "Time division units for teaching, including attributes such as semester name, start time, and end time"
-        },
-        {
-            "name_chinese": "课时",
-            "name_english": "Class Hour",
-            "description_chinese": "课程的时间单位，包含上课时间、地点、教师、课程等属性",
-            "description_english": "Time units of courses, including attributes such as class time, location, teacher, and course"
-        },
-        {
-            "name_chinese": "教学计划",
-            "name_english": "Teaching Plan",
-            "description_chinese": "课程的教学安排，包含教学目标、内容安排、进度计划等属性",
-            "description_english": "Teaching arrangements for courses, including attributes such as teaching objectives, content arrangement, and progress plan"
-        }
-    ]
-}
-
-# 情感陪伴场景配置
-EMOTIONAL_COMPANION_SCENE = {
-    "name_chinese": "情感陪伴",
-    "name_english": "Emotional Companion",
-    "description_chinese": "适用于情感陪伴应用的本体建模，包含用户、情绪、活动等核心实体类型",
-    "description_english": "Ontology modeling for emotional companion applications, including core entity types such as users, emotions, and activities",
-    "types": [
-        {
-            "name_chinese": "用户",
-            "name_english": "User",
-            "description_chinese": "使用情感陪伴服务的个体，包含姓名、昵称、性格特征、偏好等属性",
-            "description_english": "Individuals using emotional companion services, including attributes such as name, nickname, personality traits, and preferences"
-        },
-        {
-            "name_chinese": "情绪",
-            "name_english": "Emotion",
-            "description_chinese": "用户的情感状态，包含情绪类型、强度、触发原因、持续时间等属性",
-            "description_english": "Emotional states of users, including attributes such as emotion type, intensity, trigger cause, and duration"
-        },
-        {
-            "name_chinese": "活动",
-            "name_english": "Activity",
-            "description_chinese": "用户参与的各类活动，包含活动名称、类型、参与者、时间地点等属性",
-            "description_english": "Various activities users participate in, including attributes such as activity name, type, participants, time, and location"
-        },
-        {
-            "name_chinese": "对话",
-            "name_english": "Conversation",
-            "description_chinese": "用户之间的交流记录，包含对话主题、参与者、时间、关键内容等属性",
-            "description_english": "Communication records between users, including attributes such as conversation topic, participants, time, and key content"
-        },
-        {
-            "name_chinese": "兴趣爱好",
-            "name_english": "Hobby",
-            "description_chinese": "用户的兴趣和爱好，包含爱好名称、类别、熟练程度、相关活动等属性",
-            "description_english": "User interests and hobbies, including attributes such as hobby name, category, proficiency level, and related activities"
-        },
-        {
-            "name_chinese": "日常事件",
-            "name_english": "Daily Event",
-            "description_chinese": "用户日常生活中的事件，包含事件描述、时间、地点、相关人物等属性",
-            "description_english": "Events in users' daily lives, including attributes such as event description, time, location, and related people"
-        },
-        {
-            "name_chinese": "关系",
-            "name_english": "Relationship",
-            "description_chinese": "用户之间的社会关系，包含关系类型、亲密度、建立时间等属性",
-            "description_english": "Social relationships between users, including attributes such as relationship type, intimacy, and establishment time"
-        },
-        {
-            "name_chinese": "回忆",
-            "name_english": "Memory",
-            "description_chinese": "用户的重要记忆片段，包含回忆内容、时间、地点、相关人物等属性",
-            "description_english": "Important memory fragments of users, including attributes such as memory content, time, location, and related people"
-        },
-        {
-            "name_chinese": "地点",
-            "name_english": "Location",
-            "description_chinese": "用户活动的地理位置，包含地点名称、地址、类型、相关事件等属性",
-            "description_english": "Geographic locations of user activities, including attributes such as location name, address, type, and related events"
-        },
-        {
-            "name_chinese": "时间节点",
-            "name_english": "Time Point",
-            "description_chinese": "重要的时间标记，包含日期、事件、意义等属性",
-            "description_english": "Important time markers, including attributes such as date, event, and significance"
-        },
-        {
-            "name_chinese": "目标",
-            "name_english": "Goal",
-            "description_chinese": "用户设定的目标，包含目标描述、截止时间、完成状态、相关活动等属性",
-            "description_english": "Goals set by users, including attributes such as goal description, deadline, completion status, and related activities"
-        },
-        {
-            "name_chinese": "成就",
-            "name_english": "Achievement",
-            "description_chinese": "用户获得的成就，包含成就名称、获得时间、描述、相关目标等属性",
-            "description_english": "Achievements obtained by users, including attributes such as achievement name, acquisition time, description, and related goals"
-        }
-    ]
-}
-
-# 导出默认场景列表
-DEFAULT_SCENES = [ONLINE_EDUCATION_SCENE, EMOTIONAL_COMPANION_SCENE]
-
-
-def get_scene_name(scene_config: dict, language: str = "zh") -> str:
-    """获取场景名称（根据语言）
-    
-    Args:
-        scene_config: 场景配置字典
-        language: 语言类型 ("zh" 或 "en")
-        
-    Returns:
-        对应语言的场景名称
-    """
-    if language == "en":
-        return scene_config.get("name_english", scene_config.get("name_chinese"))
-    return scene_config.get("name_chinese")
-
-
-def get_scene_description(scene_config: dict, language: str = "zh") -> str:
-    """获取场景描述（根据语言）
-    
-    Args:
-        scene_config: 场景配置字典
-        language: 语言类型 ("zh" 或 "en")
-        
-    Returns:
-        对应语言的场景描述
-    """
-    if language == "en":
-        return scene_config.get("description_english", scene_config.get("description_chinese"))
-    return scene_config.get("description_chinese")
-
-
-def get_type_name(type_config: dict, language: str = "zh") -> str:
-    """获取类型名称（根据语言）
-    
-    Args:
-        type_config: 类型配置字典
-        language: 语言类型 ("zh" 或 "en")
-        
-    Returns:
-        对应语言的类型名称
-    """
-    if language == "en":
-        return type_config.get("name_english", type_config.get("name_chinese"))
-    return type_config.get("name_chinese")
-
-
-def get_type_description(type_config: dict, language: str = "zh") -> str:
-    """获取类型描述（根据语言）
-    
-    Args:
-        type_config: 类型配置字典
-        language: 语言类型 ("zh" 或 "en")
-        
-    Returns:
-        对应语言的类型描述
-    """
-    if language == "en":
-        return type_config.get("description_english", type_config.get("description_chinese"))
-    return type_config.get("description_chinese")
--- a/api/app/config/default_ontology_initializer.py
+++ b/api/app/config/default_ontology_initializer.py
@@ -1,249 +0,0 @@
-# -*- coding: utf-8 -*-
-"""默认本体场景初始化器
-
-本模块提供默认本体场景和类型的自动初始化功能。
-在工作空间创建时，自动添加预设的本体场景和实体类型。
-
-Classes:
-    DefaultOntologyInitializer: 默认本体场景初始化器
-"""
-
-import logging
-from typing import List, Optional, Tuple
-from uuid import UUID
-
-from sqlalchemy.orm import Session
-
-from app.config.default_ontology_config import (
-    DEFAULT_SCENES,
-    get_scene_name,
-    get_scene_description,
-    get_type_name,
-    get_type_description,
-)
-from app.core.logging_config import get_business_logger
-from app.repositories.ontology_scene_repository import OntologySceneRepository
-from app.repositories.ontology_class_repository import OntologyClassRepository
-
-
-class DefaultOntologyInitializer:
-    """默认本体场景初始化器
-    
-    负责在工作空间创建时自动初始化默认的本体场景和类型。
-    遵循最小侵入原则，确保初始化失败不阻止工作空间创建。
-    
-    Attributes:
-        db: 数据库会话
-        scene_repo: 场景Repository
-        class_repo: 类型Repository
-        logger: 业务日志记录器
-    """
-    
-    def __init__(self, db: Session):
-        """初始化
-        
-        Args:
-            db: 数据库会话
-        """
-        self.db = db
-        self.scene_repo = OntologySceneRepository(db)
-        self.class_repo = OntologyClassRepository(db)
-        self.logger = get_business_logger()
-    
-    def initialize_default_scenes(
-        self,
-        workspace_id: UUID,
-        language: str = "zh"
-    ) -> Tuple[bool, str]:
-        """为工作空间初始化默认场景
-        
-        创建两个默认场景（在线教育、情感陪伴）及其对应的实体类型。
-        如果创建失败，记录错误日志但不抛出异常。
-        
-        Args:
-            workspace_id: 工作空间ID
-            language: 语言类型 ("zh" 或 "en")，默认为 "zh"
-            
-        Returns:
-            Tuple[bool, str]: (是否成功, 错误信息)
-        """
-        try:
-            self.logger.info(
-                f"开始初始化默认本体场景 - workspace_id={workspace_id}, language={language}"
-            )
-            
-            scenes_created = 0
-            total_types_created = 0
-            
-            # 遍历默认场景配置
-            for scene_config in DEFAULT_SCENES:
-                scene_name = get_scene_name(scene_config, language)
-                
-                # 创建场景及其类型
-                scene_id = self._create_scene_with_types(workspace_id, scene_config, language)
-                
-                if scene_id:
-                    scenes_created += 1
-                    # 统计类型数量
-                    types_count = len(scene_config.get("types", []))
-                    total_types_created += types_count
-                    
-                    self.logger.info(
-                        f"场景创建成功 - scene_name={scene_name}, "
-                        f"scene_id={scene_id}, types_count={types_count}, language={language}"
-                    )
-                else:
-                    self.logger.warning(
-                        f"场景创建失败 - scene_name={scene_name}, "
-                        f"workspace_id={workspace_id}, language={language}"
-                    )
-            
-            # 记录总体结果
-            self.logger.info(
-                f"默认场景初始化完成 - workspace_id={workspace_id}, "
-                f"language={language}, scenes_created={scenes_created}, "
-                f"total_types_created={total_types_created}"
-            )
-            
-            # 如果至少创建了一个场景，视为成功
-            if scenes_created > 0:
-                return True, ""
-            else:
-                error_msg = "所有默认场景创建失败"
-                self.logger.error(
-                    f"默认场景初始化失败 - workspace_id={workspace_id}, "
-                    f"language={language}, error={error_msg}"
-                )
-                return False, error_msg
-                
-        except Exception as e:
-            error_msg = f"默认场景初始化异常: {str(e)}"
-            self.logger.error(
-                f"默认场景初始化异常 - workspace_id={workspace_id}, "
-                f"language={language}, error={str(e)}",
-                exc_info=True
-            )
-            return False, error_msg
-    
-    def _create_scene_with_types(
-        self,
-        workspace_id: UUID,
-        scene_config: dict,
-        language: str = "zh"
-    ) -> Optional[UUID]:
-        """创建场景及其类型
-        
-        Args:
-            workspace_id: 工作空间ID
-            scene_config: 场景配置字典
-            language: 语言类型 ("zh" 或 "en")
-            
-        Returns:
-            Optional[UUID]: 创建的场景ID，失败返回None
-        """
-        try:
-            scene_name = get_scene_name(scene_config, language)
-            scene_description = get_scene_description(scene_config, language)
-            
-            # 检查是否已存在同名场景（支持向后兼容）
-            existing_scene = self.scene_repo.get_by_name(scene_name, workspace_id)
-            if existing_scene:
-                self.logger.info(
-                    f"场景已存在，跳过创建 - scene_name={scene_name}, "
-                    f"workspace_id={workspace_id}, scene_id={existing_scene.scene_id}, "
-                    f"language={language}"
-                )
-                return None
-            
-            # 创建场景记录，设置 is_system_default=true
-            scene_data = {
-                "scene_name": scene_name,
-                "scene_description": scene_description
-            }
-            
-            scene = self.scene_repo.create(scene_data, workspace_id)
-            
-            # 设置系统默认标识
-            scene.is_system_default = True
-            self.db.flush()
-            
-            self.logger.info(
-                f"场景创建成功 - scene_name={scene_name}, "
-                f"scene_id={scene.scene_id}, is_system_default=True, language={language}"
-            )
-            
-            # 批量创建类型
-            types_config = scene_config.get("types", [])
-            types_created = self._batch_create_types(scene.scene_id, types_config, language)
-            
-            self.logger.info(
-                f"场景类型创建完成 - scene_id={scene.scene_id}, "
-                f"types_created={types_created}/{len(types_config)}, language={language}"
-            )
-            
-            return scene.scene_id
-            
-        except Exception as e:
-            scene_name = get_scene_name(scene_config, language)
-            self.logger.error(
-                f"场景创建失败 - scene_name={scene_name}, "
-                f"workspace_id={workspace_id}, language={language}, error={str(e)}",
-                exc_info=True
-            )
-            return None
-    
-    def _batch_create_types(
-        self,
-        scene_id: UUID,
-        types_config: List[dict],
-        language: str = "zh"
-    ) -> int:
-        """批量创建实体类型
-        
-        Args:
-            scene_id: 场景ID
-            types_config: 类型配置列表
-            language: 语言类型 ("zh" 或 "en")
-            
-        Returns:
-            int: 成功创建的类型数量
-        """
-        created_count = 0
-        
-        for type_config in types_config:
-            try:
-                type_name = get_type_name(type_config, language)
-                type_description = get_type_description(type_config, language)
-                
-                # 创建类型数据
-                class_data = {
-                    "class_name": type_name,
-                    "class_description": type_description
-                }
-                
-                # 创建类型
-                ontology_class = self.class_repo.create(class_data, scene_id)
-                
-                # 设置系统默认标识
-                ontology_class.is_system_default = True
-                self.db.flush()
-                
-                created_count += 1
-                
-                self.logger.debug(
-                    f"类型创建成功 - class_name={type_name}, "
-                    f"class_id={ontology_class.class_id}, "
-                    f"scene_id={scene_id}, is_system_default=True, language={language}"
-                )
-                
-            except Exception as e:
-                type_name = get_type_name(type_config, language)
-                self.logger.warning(
-                    f"单个类型创建失败，继续创建其他类型 - "
-                    f"class_name={type_name}, scene_id={scene_id}, "
-                    f"language={language}, error={str(e)}"
-                )
-                # 继续创建其他类型
-                continue
-        
-        return created_count
--- a/api/app/controllers/init.py
+++ b/api/app/controllers/init.py
@@ -4,51 +4,37 @@
 认证方式: JWT Token
 """
 from fastapi import APIRouter
-
 from . import (
-    api_key_controller,
-    app_controller,
-    app_log_controller,
-    auth_controller,
-    chunk_controller,
-    document_controller,
-    emotion_config_controller,
-    emotion_controller,
-    file_controller,
-    file_storage_controller,
-    home_page_controller,
-    i18n_controller,
-    implicit_memory_controller,
-    knowledge_controller,
-    knowledgeshare_controller,
-    mcp_market_controller,
-    mcp_market_config_controller,
-    memory_agent_controller,
-    memory_dashboard_controller,
-    memory_episodic_controller,
-    memory_explicit_controller,
-    memory_forget_controller,
-    memory_perceptual_controller,
-    memory_reflection_controller,
-    memory_short_term_controller,
-    memory_storage_controller,
-    memory_working_controller,
    model_controller,
-    multi_agent_controller,
-    prompt_optimizer_controller,
-    public_share_controller,
-    release_share_controller,
-    setup_controller,
    task_controller,
    test_controller,
-    tool_controller,
-    upload_controller,
    user_controller,
-    user_memory_controllers,
+    auth_controller,
    workspace_controller,
-    ontology_controller,
-    skill_controller
+    setup_controller,
+    file_controller,
+    document_controller,
+    knowledge_controller,
+    chunk_controller,
+    knowledgeshare_controller,
+    app_controller,
+    upload_controller,
+    memory_agent_controller,
+    memory_dashboard_controller,
+    memory_storage_controller,
+    memory_dashboard_controller,
+    memory_reflection_controller,
+    api_key_controller,
+    release_share_controller,
+    public_share_controller,
+    multi_agent_controller,
+    workflow_controller,
+    emotion_controller,
+    emotion_config_controller,
+    prompt_optimizer_controller,
+    tool_controller,
 )
+from . import user_memory_controllers

 # 创建管理端 API 路由器
 manager_router = APIRouter()
@@ -64,39 +50,25 @@ manager_router.include_router(model_controller.router)
 manager_router.include_router(file_controller.router)
 manager_router.include_router(document_controller.router)
 manager_router.include_router(knowledge_controller.router)
-manager_router.include_router(mcp_market_controller.router)
-manager_router.include_router(mcp_market_config_controller.router)
 manager_router.include_router(chunk_controller.router)
 manager_router.include_router(test_controller.router)
 manager_router.include_router(knowledgeshare_controller.router)
 manager_router.include_router(app_controller.router)
-manager_router.include_router(app_log_controller.router)
 manager_router.include_router(upload_controller.router)
 manager_router.include_router(memory_agent_controller.router)
 manager_router.include_router(memory_dashboard_controller.router)
 manager_router.include_router(memory_storage_controller.router)
 manager_router.include_router(user_memory_controllers.router)
-manager_router.include_router(memory_episodic_controller.router)
-manager_router.include_router(memory_explicit_controller.router)
 manager_router.include_router(api_key_controller.router)
 manager_router.include_router(release_share_controller.router)
 manager_router.include_router(public_share_controller.router)  # 公开路由（无需认证）
 manager_router.include_router(memory_dashboard_controller.router)
 manager_router.include_router(multi_agent_controller.router)
+manager_router.include_router(workflow_controller.router)
 manager_router.include_router(emotion_controller.router)
 manager_router.include_router(emotion_config_controller.router)
 manager_router.include_router(prompt_optimizer_controller.router)
 manager_router.include_router(memory_reflection_controller.router)
-manager_router.include_router(memory_short_term_controller.router)
 manager_router.include_router(tool_controller.router)
-manager_router.include_router(memory_forget_controller.router)
-manager_router.include_router(home_page_controller.router)
-manager_router.include_router(implicit_memory_controller.router)
-manager_router.include_router(memory_perceptual_controller.router)
-manager_router.include_router(memory_working_controller.router)
-manager_router.include_router(file_storage_controller.router)
-manager_router.include_router(ontology_controller.router)
-manager_router.include_router(skill_controller.router)
-manager_router.include_router(i18n_controller.router)

 __all__ = ["manager_router"]
--- a/api/app/controllers/app_controller.py
+++ b/api/app/controllers/app_controller.py
--- a/api/app/controllers/app_log_controller.py
+++ b/api/app/controllers/app_log_controller.py
@@ -1,89 +0,0 @@
-"""应用日志（消息记录）接口"""
-import uuid
-from typing import Optional
-
-from fastapi import APIRouter, Depends, Query
-from sqlalchemy.orm import Session
-
-from app.core.logging_config import get_business_logger
-from app.core.response_utils import success
-from app.db import get_db
-from app.dependencies import get_current_user, cur_workspace_access_guard
-from app.schemas.app_log_schema import AppLogConversation, AppLogConversationDetail
-from app.schemas.response_schema import PageData, PageMeta
-from app.services.app_service import AppService
-from app.services.app_log_service import AppLogService
-
-router = APIRouter(prefix="/apps", tags=["App Logs"])
-logger = get_business_logger()
-
-
-@router.get("/{app_id}/logs", summary="应用日志 - 会话列表")
-@cur_workspace_access_guard()
-def list_app_logs(
-        app_id: uuid.UUID,
-        page: int = Query(1, ge=1),
-        pagesize: int = Query(20, ge=1, le=100),
-        is_draft: Optional[bool] = None,
-        db: Session = Depends(get_db),
-        current_user=Depends(get_current_user),
-):
-    """查看应用下所有会话记录（分页）
-
-    - 支持按 is_draft 筛选（草稿会话 / 发布会话）
-    - 按最新更新时间倒序排列
-    - 所有人（包括共享者和被共享者）都只能查看自己的会话记录
-    """
-    workspace_id = current_user.current_workspace_id
-
-    # 验证应用访问权限
-    app_service = AppService(db)
-    app_service.get_app(app_id, workspace_id)
-
-    # 使用 Service 层查询
-    log_service = AppLogService(db)
-    conversations, total = log_service.list_conversations(
-        app_id=app_id,
-        workspace_id=workspace_id,
-        page=page,
-        pagesize=pagesize,
-        is_draft=is_draft
-    )
-
-    items = [AppLogConversation.model_validate(c) for c in conversations]
-    meta = PageMeta(page=page, pagesize=pagesize, total=total, hasnext=(page * pagesize) < total)
-
-    return success(data=PageData(page=meta, items=items))
-
-
-@router.get("/{app_id}/logs/{conversation_id}", summary="应用日志 - 会话消息详情")
-@cur_workspace_access_guard()
-def get_app_log_detail(
-        app_id: uuid.UUID,
-        conversation_id: uuid.UUID,
-        db: Session = Depends(get_db),
-        current_user=Depends(get_current_user),
-):
-    """查看某会话的完整消息记录
-
-    - 返回会话基本信息 + 所有消息（按时间正序）
-    - 消息 meta_data 包含模型名、token 用量等信息
-    - 所有人（包括共享者和被共享者）都只能查看自己的会话详情
-    """
-    workspace_id = current_user.current_workspace_id
-
-    # 验证应用访问权限
-    app_service = AppService(db)
-    app_service.get_app(app_id, workspace_id)
-
-    # 使用 Service 层查询
-    log_service = AppLogService(db)
-    conversation = log_service.get_conversation_detail(
-        app_id=app_id,
-        conversation_id=conversation_id,
-        workspace_id=workspace_id
-    )
-
-    detail = AppLogConversationDetail.model_validate(conversation)
-
-    return success(data=detail)
--- a/api/app/controllers/auth_controller.py
+++ b/api/app/controllers/auth_controller.py
@@ -1,5 +1,4 @@
 from datetime import datetime, timedelta, timezone
-from typing import Callable
 from fastapi import APIRouter, Depends
 from sqlalchemy.orm import Session

@@ -17,7 +16,6 @@ from app.core.exceptions import BusinessException
 from app.core.error_codes import BizCode
 from app.dependencies import get_current_user, oauth2_scheme
 from app.models.user_model import User
-from app.i18n.dependencies import get_translator

 # 获取专用日志器
 auth_logger = get_auth_logger()
@@ -28,8 +26,7 @@ router = APIRouter(tags=["Authentication"])
@router.post("/token", response_model=ApiResponse)
 async def login_for_access_token(
    form_data: TokenRequest,
-    db: Session = Depends(get_db),
-    t: Callable = Depends(get_translator)
+    db: Session = Depends(get_db)
 ):
    """用户登录获取token"""
    auth_logger.info(f"用户登录请求: {form_data.email}")
@@ -43,38 +40,35 @@ async def login_for_access_token(
        invite_info = workspace_service.validate_invite_token(db, form_data.invite)
        
        if not invite_info.is_valid:
-            raise BusinessException(t("auth.invite.invalid"), code=BizCode.BAD_REQUEST)
+            raise BusinessException("邀请码无效或已过期", code=BizCode.BAD_REQUEST)
        
        if invite_info.email != form_data.email:
-            raise BusinessException(t("auth.invite.email_mismatch"), code=BizCode.BAD_REQUEST)        
+            raise BusinessException("邀请邮箱与登录邮箱不匹配", code=BizCode.BAD_REQUEST)        
        auth_logger.info(f"邀请码验证成功: workspace={invite_info.workspace_name}")
        try:
            # 尝试认证用户
            user = auth_service.authenticate_user_or_raise(db, form_data.email, form_data.password)
            auth_logger.info(f"用户认证成功: {user.email} (ID: {user.id})")
            if form_data.invite:
-                auth_service.bind_workspace_with_invite(
-                    db=db,
-                    user=user,
-                    invite_token=form_data.invite,
-                    workspace_id=invite_info.workspace_id
-                )
+                auth_service.bind_workspace_with_invite(db=db,
+                user=user,        
+                invite_token=form_data.invite,
+                workspace_id=invite_info.workspace_id)
        except BusinessException as e:
        # 用户不存在且有邀请码，尝试注册
            if e.code == BizCode.USER_NOT_FOUND:
                auth_logger.info(f"用户不存在，使用邀请码注册: {form_data.email}")
                user = auth_service.register_user_with_invite(
-                    db=db,
-                    email=form_data.email,
-                    username=form_data.username,
-                    password=form_data.password,
-                    invite_token=form_data.invite,
-                    workspace_id=invite_info.workspace_id
-                )
+                db=db,
+                email=form_data.email,
+                password=form_data.password,
+                invite_token=form_data.invite,
+                workspace_id=invite_info.workspace_id
+            )
            elif e.code == BizCode.PASSWORD_ERROR:
                # 用户存在但密码错误
                auth_logger.warning(f"接受邀请失败，密码验证错误: {form_data.email}")
-                raise BusinessException(t("auth.invite.password_verification_failed"), BizCode.LOGIN_FAILED)
+                raise BusinessException("接受邀请失败，密码验证错误", BizCode.LOGIN_FAILED)
            else:
                # 其他认证失败情况，直接抛出
                raise
@@ -87,7 +81,7 @@ async def login_for_access_token(
        except BusinessException as e:
            
            # 其他认证失败情况，直接抛出
-            raise BusinessException(e.message, BizCode.LOGIN_FAILED)
+            raise BusinessException(e.message,BizCode.LOGIN_FAILED)

    # 创建 tokens
    access_token, access_token_id = security.create_access_token(subject=user.id)
@@ -115,15 +109,14 @@ async def login_for_access_token(
            expires_at=access_expires_at,
            refresh_expires_at=refresh_expires_at
        ),
-        msg=t("auth.login.success")
+        msg="登录成功"
    )


@router.post("/refresh", response_model=ApiResponse)
 async def refresh_token(
    refresh_request: RefreshTokenRequest,
-    db: Session = Depends(get_db),
-    t: Callable = Depends(get_translator)
+    db: Session = Depends(get_db)
 ):
    """刷新token"""
    auth_logger.info("收到token刷新请求")
@@ -131,18 +124,18 @@ async def refresh_token(
    # 验证 refresh token
    userId = security.verify_token(refresh_request.refresh_token, "refresh")
    if not userId:
-        raise BusinessException(t("auth.token.invalid_refresh_token"), code=BizCode.TOKEN_INVALID)
+        raise BusinessException("无效的refresh token", code=BizCode.TOKEN_INVALID)
    
    # 检查用户是否存在
    user = auth_service.get_user_by_id(db, userId)
    if not user:
-        raise BusinessException(t("auth.user.not_found"), code=BizCode.USER_NO_ACCESS)
+        raise BusinessException("用户不存在", code=BizCode.USER_NOT_FOUND)
    
    # 检查 refresh token 黑名单
    if settings.ENABLE_SINGLE_SESSION:
        refresh_token_id = security.get_token_id(refresh_request.refresh_token)
        if refresh_token_id and await SessionService.is_token_blacklisted(refresh_token_id):
-            raise BusinessException(t("auth.token.refresh_token_blacklisted"), code=BizCode.TOKEN_BLACKLISTED)
+            raise BusinessException("Refresh token已失效", code=BizCode.TOKEN_BLACKLISTED)
    
    # 生成新 tokens
    new_access_token, new_access_token_id = security.create_access_token(subject=user.id)
@@ -173,7 +166,7 @@ async def refresh_token(
            expires_at=access_expires_at,
            refresh_expires_at=refresh_expires_at
        ),
-        msg=t("auth.token.refresh_success")
+        msg="token刷新成功"
    )


@@ -181,15 +174,14 @@ async def refresh_token(
 async def logout(
    token: str = Depends(oauth2_scheme),
    current_user: User = Depends(get_current_user),
-    db: Session = Depends(get_db),
-    t: Callable = Depends(get_translator)
+    db: Session = Depends(get_db)
 ):
    """登出当前用户：加入token黑名单并清理会话"""
    auth_logger.info(f"用户 {current_user.username} 请求登出")
    
    token_id = security.get_token_id(token)
    if not token_id:
-        raise BusinessException(t("auth.token.invalid"), code=BizCode.TOKEN_INVALID)
+        raise BusinessException("无效的access token", code=BizCode.TOKEN_INVALID)

    # 加入黑名单
    await SessionService.blacklist_token(token_id)
@@ -199,5 +191,5 @@ async def logout(
        await SessionService.clear_user_session(current_user.username)

    auth_logger.info(f"用户 {current_user.username} 登出成功")
-    return success(msg=t("auth.logout.success"))
+    return success(msg="登出成功")

--- a/api/app/controllers/chunk_controller.py
+++ b/api/app/controllers/chunk_controller.py
@@ -1,29 +1,24 @@
 import os
 from typing import Any, Optional
 import uuid
-
 from fastapi import APIRouter, Depends, HTTPException, status, Query
-from fastapi.encoders import jsonable_encoder
 from sqlalchemy.orm import Session
+from sqlalchemy import func

 from app.core.config import settings
-from app.core.logging_config import get_api_logger
-from app.core.rag.common.settings import kg_retriever
-from app.core.rag.llm.chat_model import Base
-from app.core.rag.llm.cv_model import QWenCV
-from app.core.rag.llm.embedding_model import OpenAIEmbed
-from app.core.rag.models.chunk import DocumentChunk
-from app.core.rag.vdb.elasticsearch.elasticsearch_vector import ElasticSearchVectorFactory
-from app.core.response_utils import success
 from app.db import get_db
+from app.core.rag.llm.cv_model import QWenCV
 from app.dependencies import get_current_user
-from app.models import knowledge_model, knowledgeshare_model
-from app.models.document_model import Document
 from app.models.user_model import User
+from app.models.document_model import Document
+from app.models import knowledge_model, knowledgeshare_model
+from app.core.rag.models.chunk import DocumentChunk
 from app.schemas import chunk_schema
 from app.schemas.response_schema import ApiResponse
+from app.core.response_utils import success
 from app.services import knowledge_service, document_service, file_service, knowledgeshare_service
-from app.services.model_service import ModelApiKeyService
+from app.core.rag.vdb.elasticsearch.elasticsearch_vector import ElasticSearchVectorFactory
+from app.core.logging_config import get_api_logger

 # Obtain a dedicated API logger
 api_logger = get_api_logger()
@@ -146,7 +141,7 @@ async def get_preview_chunks(
        }
    }
    api_logger.info(f"Querying the document block preview list successful: total={total}, returned={len(chunks)} records")
-    return success(data=jsonable_encoder(result), msg="Querying the document block preview list succeeded")
+    return success(data=result, msg="Querying the document block preview list succeeded")


@router.get("/{kb_id}/{document_id}/chunks", response_model=ApiResponse)
@@ -204,7 +199,7 @@ async def get_chunks(
            "has_next": True if page * pagesize < total else False
        }
    }
-    return success(data=jsonable_encoder(result), msg="Query of document chunk list succeeded")
+    return success(data=result, msg="Query of document chunk list succeeded")


@router.post("/{kb_id}/{document_id}/chunk", response_model=ApiResponse)
@@ -265,7 +260,7 @@ async def create_chunk(
    db_document.chunk_num += 1
    db.commit()

-    return success(data=jsonable_encoder(chunk), msg="Document chunk creation successful")
+    return success(data=chunk, msg="Document chunk creation successful")


@router.get("/{kb_id}/{document_id}/{doc_id}", response_model=ApiResponse)
@@ -292,7 +287,7 @@ async def get_chunk(
    vector_service = ElasticSearchVectorFactory().init_vector(knowledge=db_knowledge)
    total, items = vector_service.get_by_segment(doc_id=doc_id)
    if total:
-        return success(data=jsonable_encoder(items[0]), msg="Document chunk query successful")
+        return success(data=items[0], msg="Document chunk query successful")
    else:
        raise HTTPException(
            status_code=status.HTTP_404_NOT_FOUND,
@@ -329,7 +324,7 @@ async def update_chunk(
        chunk = items[0]
        chunk.page_content = content
        vector_service.update_by_segment(chunk)
-        return success(data=jsonable_encoder(chunk), msg="The document chunk has been successfully updated")
+        return success(data=chunk, msg="The document chunk has been successfully updated")
    else:
        raise HTTPException(
            status_code=status.HTTP_404_NOT_FOUND,
@@ -394,41 +389,36 @@ async def retrieve_chunks(
        knowledge_model.Knowledge.chunk_num > 0,
        knowledge_model.Knowledge.status == 1
    ]
-    private_items = knowledge_service.get_chunked_knowledgeids(
+    existing_ids = knowledge_service.get_chunded_knowledgeids(
        db=db,
        filters=filters,
        current_user=current_user
    )
-    private_kb_ids = [item[0] for item in private_items]
-    private_workspace_ids = [item[1] for item in private_items]
    filters = [
        knowledge_model.Knowledge.id.in_(retrieve_data.kb_ids),
        knowledge_model.Knowledge.permission_id == knowledge_model.PermissionType.Share,
        knowledge_model.Knowledge.chunk_num > 0,
        knowledge_model.Knowledge.status == 1
    ]
-    items = knowledge_service.get_chunked_knowledgeids(
+    share_ids = knowledge_service.get_chunded_knowledgeids(
        db=db,
        filters=filters,
        current_user=current_user
    )
-    if items:
+    if share_ids:
        filters = [
            knowledgeshare_model.KnowledgeShare.target_kb_id.in_(retrieve_data.kb_ids)
        ]
-        share_items = knowledgeshare_service.get_source_kb_ids_by_target_kb_id(
+        items = knowledgeshare_service.get_source_kb_ids_by_target_kb_id(
            db=db,
            filters=filters,
            current_user=current_user
        )
-        share_kb_ids = [item[0] for item in share_items]
-        share_workspace_ids = [item[1] for item in share_items]
-        private_kb_ids.extend(share_kb_ids)
-        private_workspace_ids.extend(share_workspace_ids)
-    if not private_kb_ids:
+        existing_ids.extend(items)
+    if not existing_ids:
        return success(data=[], msg="retrieval successful")
-    kb_id = private_kb_ids[0]
-    uuid_strs = [f"Vector_index_{kb_id}_Node".lower() for kb_id in private_kb_ids]
+    kb_id = existing_ids[0]
+    uuid_strs = [f"Vector_index_{kb_id}_Node".lower() for kb_id in existing_ids]
    indices = ",".join(uuid_strs)
    db_knowledge = knowledge_service.get_knowledge_by_id(db, knowledge_id=kb_id, current_user=current_user)
    if not db_knowledge:
@@ -442,14 +432,14 @@ async def retrieve_chunks(
    # 1 participle search, 2 semantic search, 3 hybrid search
    match retrieve_data.retrieve_type:
        case chunk_schema.RetrieveType.PARTICIPLE:
-            rs = vector_service.search_by_full_text(query=retrieve_data.query, top_k=retrieve_data.top_k, indices=indices, score_threshold=retrieve_data.similarity_threshold, file_names_filter=retrieve_data.file_names_filter)
+            rs = vector_service.search_by_full_text(query=retrieve_data.query, top_k=retrieve_data.top_k, indices=indices, score_threshold=retrieve_data.similarity_threshold)
            return success(data=rs, msg="retrieval successful")
        case chunk_schema.RetrieveType.SEMANTIC:
-            rs = vector_service.search_by_vector(query=retrieve_data.query, top_k=retrieve_data.top_k, indices=indices, score_threshold=retrieve_data.vector_similarity_weight, file_names_filter=retrieve_data.file_names_filter)
+            rs = vector_service.search_by_vector(query=retrieve_data.query, top_k=retrieve_data.top_k, indices=indices, score_threshold=retrieve_data.vector_similarity_weight)
            return success(data=rs, msg="retrieval successful")
        case _:
-            rs1 = vector_service.search_by_vector(query=retrieve_data.query, top_k=retrieve_data.top_k, indices=indices, score_threshold=retrieve_data.vector_similarity_weight, file_names_filter=retrieve_data.file_names_filter)
-            rs2 = vector_service.search_by_full_text(query=retrieve_data.query, top_k=retrieve_data.top_k, indices=indices, score_threshold=retrieve_data.similarity_threshold, file_names_filter=retrieve_data.file_names_filter)
+            rs1 = vector_service.search_by_vector(query=retrieve_data.query, top_k=retrieve_data.top_k, indices=indices, score_threshold=retrieve_data.vector_similarity_weight)
+            rs2 = vector_service.search_by_full_text(query=retrieve_data.query, top_k=retrieve_data.top_k, indices=indices, score_threshold=retrieve_data.similarity_threshold)
            # Efficient deduplication
            seen_ids = set()
            unique_rs = []
@@ -458,23 +448,4 @@ async def retrieve_chunks(
                    seen_ids.add(doc.metadata["doc_id"])
                    unique_rs.append(doc)
            rs = vector_service.rerank(query=retrieve_data.query, docs=unique_rs, top_k=retrieve_data.top_k)
-            if retrieve_data.retrieve_type == chunk_schema.RetrieveType.Graph:
-                kb_ids = [str(kb_id) for kb_id in private_kb_ids]
-                workspace_ids = [str(workspace_id) for workspace_id in private_workspace_ids]
-                llm_key = ModelApiKeyService.get_available_api_key(db, db_knowledge.llm_id)
-                emb_key = ModelApiKeyService.get_available_api_key(db, db_knowledge.embedding_id)
-                # Prepare to configure chat_mdl、embedding_model、vision_model information
-                chat_model = Base(
-                    key=llm_key.api_key,
-                    model_name=llm_key.model_name,
-                    base_url=llm_key.api_base
-                )
-                embedding_model = OpenAIEmbed(
-                    key=emb_key.api_key,
-                    model_name=emb_key.model_name,
-                    base_url=emb_key.api_base
-                )
-                doc = kg_retriever.retrieval(question=retrieve_data.query, workspace_ids=workspace_ids, kb_ids=kb_ids, emb_mdl=embedding_model, llm=chat_model)
-                if doc:
-                    rs.insert(0, doc)
-            return success(data=jsonable_encoder(rs), msg="retrieval successful")
+            return success(data=rs, msg="retrieval successful")
--- a/api/app/controllers/document_controller.py
+++ b/api/app/controllers/document_controller.py
@@ -1,26 +1,23 @@
-import datetime
 import os
 from typing import Optional
+import datetime
 import uuid
-
 from fastapi import APIRouter, Depends, HTTPException, status, Query
-from fastapi.encoders import jsonable_encoder
 from sqlalchemy.orm import Session

-from app.celery_app import celery_app
-from app.controllers import file_controller
 from app.core.config import settings
-from app.core.logging_config import get_api_logger
-from app.core.rag.vdb.elasticsearch.elasticsearch_vector import ElasticSearchVectorFactory
-from app.core.response_utils import success
 from app.db import get_db
 from app.dependencies import get_current_user
-from app.models import document_model
 from app.models.user_model import User
+from app.models import document_model
 from app.schemas import document_schema
 from app.schemas.response_schema import ApiResponse
+from app.core.response_utils import success
 from app.services import document_service, file_service, knowledge_service
-
+from app.controllers import file_controller
+from app.celery_app import celery_app
+from app.core.rag.vdb.elasticsearch.elasticsearch_vector import ElasticSearchVectorFactory
+from app.core.logging_config import get_api_logger

 # Obtain a dedicated API logger
 api_logger = get_api_logger()
@@ -109,7 +106,7 @@ async def get_documents(
            "has_next": True if page * pagesize < total else False
        }
    }
-    return success(data=jsonable_encoder(result), msg="Query of document list succeeded")
+    return success(data=result, msg="Query of document list succeeded")


@router.post("/document", response_model=ApiResponse)
@@ -127,7 +124,7 @@ async def create_document(
        api_logger.debug(f"Start creating a document: {create_data.file_name}")
        db_document = document_service.create_document(db=db, document=create_data, current_user=current_user)
        api_logger.info(f"Document created successfully: {db_document.file_name} (ID: {db_document.id})")
-        return success(data=jsonable_encoder(document_schema.Document.model_validate(db_document)), msg="Document creation successful")
+        return success(data=document_schema.Document.model_validate(db_document), msg="Document creation successful")
    except Exception as e:
        api_logger.error(f"Document creation failed: {create_data.file_name} - {str(e)}")
        raise
@@ -156,7 +153,7 @@ async def get_document(
            )

        api_logger.info(f"Document query successful: {db_document.file_name} (ID: {db_document.id})")
-        return success(data=jsonable_encoder(document_schema.Document.model_validate(db_document)), msg="Successfully obtained document information")
+        return success(data=document_schema.Document.model_validate(db_document), msg="Successfully obtained document information")
    except HTTPException:
        raise
    except Exception as e:
@@ -224,7 +221,7 @@ async def update_document(
        )

    # 5. Return the updated document
-    return success(data=jsonable_encoder(document_schema.Document.model_validate(db_document)), msg="Document information updated successfully")
+    return success(data=document_schema.Document.model_validate(db_document), msg="Document information updated successfully")


@router.delete("/{document_id}", response_model=ApiResponse)
@@ -314,10 +311,8 @@ async def parse_documents(
        )

        # 4. Check if the file exists
-        api_logger.debug(f"Constructed file path: {file_path}")
-        api_logger.debug(f"File metadata - kb_id: {db_file.kb_id}, parent_id: {db_file.parent_id}, file_id: {db_file.id}, extension: {db_file.file_ext}")
        if not os.path.exists(file_path):
-            api_logger.error(f"File not found (possibly deleted): file_path={file_path}, file_id={db_file.id}, document_id={document_id}")
+            api_logger.warning(f"File not found (possibly deleted): file_path={file_path}")
            raise HTTPException(
                status_code=status.HTTP_404_NOT_FOUND,
                detail="File not found (possibly deleted)"
--- a/api/app/controllers/emotion_config_controller.py
+++ b/api/app/controllers/emotion_config_controller.py
@@ -7,13 +7,11 @@ Routes:
    GET /memory/config/emotion - 获取情绪引擎配置
    POST /memory/config/emotion - 更新情绪引擎配置
 """
-import uuid

 from fastapi import APIRouter, Depends, Query, HTTPException, status
 from pydantic import BaseModel, Field
-from typing import Optional, Union
+from typing import Optional
 from sqlalchemy.orm import Session
-from uuid import UUID

 from app.core.response_utils import success
 from app.dependencies import get_current_user
@@ -22,7 +20,6 @@ from app.schemas.response_schema import ApiResponse
 from app.services.emotion_config_service import EmotionConfigService
 from app.core.logging_config import get_api_logger
 from app.db import get_db
-from app.utils.config_utils import resolve_config_id

 # 获取API专用日志器
 api_logger = get_api_logger()
@@ -35,11 +32,11 @@ router = APIRouter(

 class EmotionConfigQuery(BaseModel):
    """情绪配置查询请求模型"""
-    config_id: UUID = Field(..., description="配置ID")
+    config_id: int = Field(..., description="配置ID")

 class EmotionConfigUpdate(BaseModel):
    """情绪配置更新请求模型"""
-    config_id: Union[uuid.UUID, int, str]= Field(..., description="配置ID")
+    config_id: int = Field(..., description="配置ID")
    emotion_enabled: bool = Field(..., description="是否启用情绪提取")
    emotion_model_id: Optional[str] = Field(None, description="情绪分析专用模型ID")
    emotion_extract_keywords: bool = Field(..., description="是否提取情绪关键词")
@@ -48,7 +45,7 @@ class EmotionConfigUpdate(BaseModel):

@router.get("/read_config", response_model=ApiResponse)
 def get_emotion_config(
-    config_id: UUID|int = Query(..., description="配置ID"),
+    config_id: int = Query(..., description="配置ID"),
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
 ):
@@ -81,7 +78,7 @@ def get_emotion_config(
            f"用户 {current_user.username} 请求获取情绪配置",
            extra={"config_id": config_id}
        )
-        config_id=resolve_config_id(config_id, db)
+        
        # 初始化服务
        config_service = EmotionConfigService(db)
        
@@ -160,7 +157,6 @@ def update_emotion_config(
            }
        }
    """
-    config.config_id=resolve_config_id(config.config_id, db)
    try:
        api_logger.info(
            f"用户 {current_user.username} 请求更新情绪配置",
--- a/api/app/controllers/emotion_controller.py
+++ b/api/app/controllers/emotion_controller.py
@@ -11,7 +11,6 @@ Routes:
 """

 from app.core.error_codes import BizCode
-from app.core.language_utils import get_language_from_header
 from app.core.logging_config import get_api_logger
 from app.core.response_utils import fail, success
 from app.dependencies import get_current_user, get_db
@@ -19,20 +18,19 @@ from app.models.user_model import User
 from app.schemas.emotion_schema import (
    EmotionHealthRequest,
    EmotionSuggestionsRequest,
-    EmotionGenerateSuggestionsRequest,
    EmotionTagsRequest,
    EmotionWordcloudRequest,
 )
 from app.schemas.response_schema import ApiResponse
 from app.services.emotion_analytics_service import EmotionAnalyticsService
-from fastapi import APIRouter, Depends, HTTPException, status,Header
+from fastapi import APIRouter, Depends, HTTPException, status
 from sqlalchemy.orm import Session

 # 获取API专用日志器
 api_logger = get_api_logger()

 router = APIRouter(
-    prefix="/memory/emotion-memory",
+    prefix="/memory/emotion",
    tags=["Emotion Analysis"],
    dependencies=[Depends(get_current_user)]  # 所有路由都需要认证
 )
@@ -46,51 +44,45 @@ emotion_service = EmotionAnalyticsService()
@router.post("/tags", response_model=ApiResponse)
 async def get_emotion_tags(
    request: EmotionTagsRequest,
-    language_type: str = Header(default=None, alias="X-Language-Type"),
    current_user: User = Depends(get_current_user),
 ):

    try:
-        # 使用集中化的语言校验
-        language = get_language_from_header(language_type)
-        
        api_logger.info(
            f"用户 {current_user.username} 请求获取情绪标签统计",
            extra={
-                "end_user_id": request.end_user_id,
+                "group_id": request.group_id,
                "emotion_type": request.emotion_type,
                "start_date": request.start_date,
                "end_date": request.end_date,
-                "limit": request.limit,
-                "language_type": language
+                "limit": request.limit
            }
        )
-
+        
        # 调用服务层
        data = await emotion_service.get_emotion_tags(
-            end_user_id=request.end_user_id,
+            end_user_id=request.group_id,
            emotion_type=request.emotion_type,
            start_date=request.start_date,
            end_date=request.end_date,
-            limit=request.limit,
-            language=language
+            limit=request.limit
        )
-
+        
        api_logger.info(
            "情绪标签统计获取成功",
            extra={
-                "end_user_id": request.end_user_id,
+                "group_id": request.group_id,
                "total_count": data.get("total_count", 0),
                "tags_count": len(data.get("tags", []))
            }
        )
-
+        
        return success(data=data, msg="情绪标签获取成功")
-
+        
    except Exception as e:
        api_logger.error(
            f"获取情绪标签统计失败: {str(e)}",
-            extra={"end_user_id": request.end_user_id},
+            extra={"group_id": request.group_id},
            exc_info=True
        )
        raise HTTPException(
@@ -103,44 +95,40 @@ async def get_emotion_tags(
@router.post("/wordcloud", response_model=ApiResponse)
 async def get_emotion_wordcloud(
    request: EmotionWordcloudRequest,
-    language_type: str = Header(default=None, alias="X-Language-Type"),
    current_user: User = Depends(get_current_user),
 ):

    try:
-        # 使用集中化的语言校验
-        language = get_language_from_header(language_type)
-        
        api_logger.info(
            f"用户 {current_user.username} 请求获取情绪词云数据",
            extra={
-                "end_user_id": request.end_user_id,
+                "group_id": request.group_id,
                "emotion_type": request.emotion_type,
                "limit": request.limit
            }
        )
-
+        
        # 调用服务层
        data = await emotion_service.get_emotion_wordcloud(
-            end_user_id=request.end_user_id,
+            end_user_id=request.group_id,
            emotion_type=request.emotion_type,
            limit=request.limit
        )
-
+        
        api_logger.info(
            "情绪词云数据获取成功",
            extra={
-                "end_user_id": request.end_user_id,
+                "group_id": request.group_id,
                "total_keywords": data.get("total_keywords", 0)
            }
        )
-
+        
        return success(data=data, msg="情绪词云获取成功")
-
+        
    except Exception as e:
        api_logger.error(
            f"获取情绪词云数据失败: {str(e)}",
-            extra={"end_user_id": request.end_user_id},
+            extra={"group_id": request.group_id},
            exc_info=True
        )
        raise HTTPException(
@@ -153,52 +141,48 @@ async def get_emotion_wordcloud(
@router.post("/health", response_model=ApiResponse)
 async def get_emotion_health(
    request: EmotionHealthRequest,
-    language_type: str = Header(default=None, alias="X-Language-Type"),
    current_user: User = Depends(get_current_user),
 ):

    try:
-        # 使用集中化的语言校验
-        language = get_language_from_header(language_type)
-        
        # 验证时间范围参数
        if request.time_range not in ["7d", "30d", "90d"]:
            raise HTTPException(
                status_code=status.HTTP_400_BAD_REQUEST,
                detail="时间范围参数无效，必须是 7d、30d 或 90d"
            )
-
+        
        api_logger.info(
            f"用户 {current_user.username} 请求获取情绪健康指数",
            extra={
-                "end_user_id": request.end_user_id,
+                "group_id": request.group_id,
                "time_range": request.time_range
            }
        )
-
+        
        # 调用服务层
        data = await emotion_service.calculate_emotion_health_index(
-            end_user_id=request.end_user_id,
+            end_user_id=request.group_id,
            time_range=request.time_range
        )
-
+        
        api_logger.info(
            "情绪健康指数获取成功",
            extra={
-                "end_user_id": request.end_user_id,
-                "health_score": data.get("health_score") or 0,
+                "group_id": request.group_id,
+                "health_score": data.get("health_score", 0),
                "level": data.get("level", "未知")
            }
        )
-
+        
        return success(data=data, msg="情绪健康指数获取成功")
-
+        
    except HTTPException:
        raise
    except Exception as e:
        api_logger.error(
            f"获取情绪健康指数失败: {str(e)}",
-            extra={"end_user_id": request.end_user_id},
+            extra={"group_id": request.group_id},
            exc_info=True
        )
        raise HTTPException(
@@ -208,179 +192,78 @@ async def get_emotion_health(



-# @router.post("/check-data", response_model=ApiResponse)
-# async def check_emotion_data_exists(
-#     request: EmotionSuggestionsRequest,
-#     db: Session = Depends(get_db),
-#     current_user: User = Depends(get_current_user),
-# ):
-#     """检查用户情绪建议数据是否存在
-
-#     Args:
-#         request: 包含 end_user_id
-#         db: 数据库会话
-#         current_user: 当前用户
-
-#     Returns:
-#         数据存在状态
-#     """
-#     try:
-#         api_logger.info(
-#             f"检查用户情绪建议数据是否存在: {request.end_user_id}",
-#             extra={"end_user_id": request.end_user_id}
-#         )
-
-#         # 从数据库获取建议
-#         data = await emotion_service.get_cached_suggestions(
-#             end_user_id=request.end_user_id,
-#             db=db
-#         )
-
-#         if data is None:
-#             api_logger.info(f"用户 {request.end_user_id} 的情绪建议数据不存在")
-#             return fail(
-#                 BizCode.NOT_FOUND,
-#                 "情绪建议数据不存在，请点击右上角刷新进行初始化",
-#                 {"exists": False}
-#             )
-
-#         api_logger.info(f"用户 {request.end_user_id} 的情绪建议数据存在")
-#         return success(data={"exists": True}, msg="情绪建议数据已存在")
-
-#     except Exception as e:
-#         api_logger.error(
-#             f"检查情绪建议数据失败: {str(e)}",
-#             extra={"end_user_id": request.end_user_id},
-#             exc_info=True
-#         )
-#         raise HTTPException(
-#             status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-#             detail=f"检查情绪建议数据失败: {str(e)}"
-#         )
-
-
@router.post("/suggestions", response_model=ApiResponse)
 async def get_emotion_suggestions(
    request: EmotionSuggestionsRequest,
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
 ):
-    """获取个性化情绪建议（从数据库读取）
-
+    """获取个性化情绪建议
+    
    Args:
-        request: 包含 end_user_id 和可选的 config_id
+        request: 包含 group_id 和可选的 config_id
        db: 数据库会话
        current_user: 当前用户
-
+        
    Returns:
-        存储的个性化情绪建议响应
+        个性化情绪建议响应
    """
    try:
+        # 验证 config_id（如果提供）
+        # 获取终端用户关联的配置
+        config_id = request.config_id
+        if config_id is None:
+            # 如果没有提供 config_id，尝试获取用户关联的配置
+            try:
+                from app.services.memory_agent_service import (
+                    get_end_user_connected_config,
+                )
+                connected_config = get_end_user_connected_config(request.group_id, db)
+                config_id = connected_config.get("memory_config_id")
+            except ValueError as e:
+                return fail(BizCode.INVALID_PARAMETER, "无法获取用户关联的配置", str(e))
+        else:
+            # 如果提供了 config_id，验证其有效性
+            from app.services.memory_config_service import MemoryConfigService
+            try:
+                config_service = MemoryConfigService(db)
+                config = config_service.get_config_by_id(config_id)
+                if not config:
+                    return fail(BizCode.INVALID_PARAMETER, "配置ID无效", f"配置 {config_id} 不存在")
+            except Exception as e:
+                return fail(BizCode.INVALID_PARAMETER, "配置ID验证失败", str(e))
+        
        api_logger.info(
            f"用户 {current_user.username} 请求获取个性化情绪建议",
            extra={
-                "end_user_id": request.end_user_id,
-                "config_id": request.config_id
+                "group_id": request.group_id,
+                "config_id": config_id
            }
        )
-
-        # 从数据库获取建议
-        data = await emotion_service.get_cached_suggestions(
-            end_user_id=request.end_user_id,
+        
+        # 调用服务层
+        data = await emotion_service.generate_emotion_suggestions(
+            end_user_id=request.group_id,
            db=db
        )
-
-        if data is None:
-            api_logger.info(
-                f"用户 {request.end_user_id} 的建议数据不存在",
-                extra={"end_user_id": request.end_user_id}
-            )
-            return success(
-                data={"exists": False},
-                msg="情绪建议数据不存在，请点击右上角刷新进行初始化"
-            )
-
+        
        api_logger.info(
            "个性化建议获取成功",
            extra={
-                "end_user_id": request.end_user_id,
+                "group_id": request.group_id,
                "suggestions_count": len(data.get("suggestions", []))
            }
        )
-
+        
        return success(data=data, msg="个性化建议获取成功")
-
+        
    except Exception as e:
        api_logger.error(
            f"获取个性化建议失败: {str(e)}",
-            extra={"end_user_id": request.end_user_id},
+            extra={"group_id": request.group_id},
            exc_info=True
        )
        raise HTTPException(
            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
            detail=f"获取个性化建议失败: {str(e)}"
        )
-
-
-@router.post("/generate_suggestions", response_model=ApiResponse)
-async def generate_emotion_suggestions(
-    request: EmotionGenerateSuggestionsRequest,
-    language_type: str = Header(default=None, alias="X-Language-Type"),
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user),
-):
-    """生成个性化情绪建议（调用LLM并保存到数据库）
-
-    Args:
-        request: 包含 end_user_id
-        db: 数据库会话
-        current_user: 当前用户
-
-    Returns:
-        新生成的个性化情绪建议响应
-    """
-    try:
-        # 使用集中化的语言校验
-        language = get_language_from_header(language_type)
-        
-        api_logger.info(
-            f"用户 {current_user.username} 请求生成个性化情绪建议",
-            extra={
-                "end_user_id": request.end_user_id
-            }
-        )
-
-        # 调用服务层生成建议
-        data = await emotion_service.generate_emotion_suggestions(
-            end_user_id=request.end_user_id,
-            db=db,
-            language=language
-        )
-
-        # 保存到数据库
-        await emotion_service.save_suggestions_cache(
-            end_user_id=request.end_user_id,
-            suggestions_data=data,
-            db=db
-        )
-
-        api_logger.info(
-            "个性化建议生成成功",
-            extra={
-                "end_user_id": request.end_user_id,
-                "suggestions_count": len(data.get("suggestions", []))
-            }
-        )
-
-        return success(data=data, msg="个性化建议生成成功")
-
-    except Exception as e:
-        api_logger.error(
-            f"生成个性化建议失败: {str(e)}",
-            extra={"end_user_id": request.end_user_id},
-            exc_info=True
-        )
-        raise HTTPException(
-            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-            detail=f"生成个性化建议失败: {str(e)}"
-        )
--- a/api/app/controllers/file_controller.py
+++ b/api/app/controllers/file_controller.py
@@ -1,25 +1,22 @@
 import os
+from typing import Any, Optional
 from pathlib import Path
 import shutil
-from typing import Any, Optional
 import uuid
-
 from fastapi import APIRouter, Depends, HTTPException, status, File, UploadFile, Query
-from fastapi.encoders import jsonable_encoder
 from fastapi.responses import FileResponse
 from sqlalchemy.orm import Session

 from app.core.config import settings
-from app.core.logging_config import get_api_logger
-from app.core.response_utils import success
 from app.db import get_db
 from app.dependencies import get_current_user
-from app.models import file_model
 from app.models.user_model import User
+from app.models import file_model
 from app.schemas import file_schema, document_schema
 from app.schemas.response_schema import ApiResponse
+from app.core.response_utils import success
 from app.services import file_service, document_service
-
+from app.core.logging_config import get_api_logger

 # Obtain a dedicated API logger
 api_logger = get_api_logger()
@@ -96,11 +93,11 @@ async def get_files(
            "has_next": True if page * pagesize < total else False
        }
    }
-    return success(data=jsonable_encoder(result), msg="Query of file list succeeded")
+    return success(data=result, msg="Query of file list succeeded")


@router.post("/folder", response_model=ApiResponse)
-async def create_folder(
+def create_folder(
        kb_id: uuid.UUID,
        parent_id: uuid.UUID,
        folder_name: str = '/',
@@ -124,7 +121,7 @@ async def create_folder(
        )
        db_file = file_service.create_file(db=db, file=create_folder, current_user=current_user)
        api_logger.info(f"Folder created successfully: {db_file.file_name} (ID: {db_file.id})")
-        return success(data=jsonable_encoder(file_schema.File.model_validate(db_file)), msg="Folder creation successful")
+        return success(data=file_schema.File.model_validate(db_file), msg="Folder creation successful")
    except Exception as e:
        api_logger.error(f"Folder creation failed: {folder_name} - {str(e)}")
        raise
@@ -210,7 +207,7 @@ async def upload_file(
    db_document = document_service.create_document(db=db, document=create_data, current_user=current_user)

    api_logger.info(f"File upload successfully: {file.filename} (file_id: {db_file.id}, document_id: {db_document.id})")
-    return success(data=jsonable_encoder(document_schema.Document.model_validate(db_document)), msg="File upload successful")
+    return success(data=document_schema.Document.model_validate(db_document), msg="File upload successful")


@router.post("/customtext", response_model=ApiResponse)
@@ -291,7 +288,7 @@ async def custom_text(
    db_document = document_service.create_document(db=db, document=create_document_data, current_user=current_user)

    api_logger.info(f"custom text upload successfully: {create_data.title} (file_id: {db_file.id}, document_id: {db_document.id})")
-    return success(data=jsonable_encoder(document_schema.Document.model_validate(db_document)), msg="custom text upload successful")
+    return success(data=document_schema.Document.model_validate(db_document), msg="custom text upload successful")


@router.get("/{file_id}", response_model=Any)
@@ -365,7 +362,7 @@ async def update_file(
    # 2. Update fields (only update non-null fields)
    api_logger.debug(f"Start updating the file fields: {file_id}")
    updated_fields = []
-    for field, value in update_data.dict(exclude_unset=True).items():
+    for field, value in update_data.items():
        if hasattr(db_file, field):
            old_value = getattr(db_file, field)
            if old_value != value:
@@ -390,7 +387,7 @@ async def update_file(
        )

    # 4. Return the updated file
-    return success(data=jsonable_encoder(file_schema.File.model_validate(db_file)), msg="File information updated successfully")
+    return success(data=file_schema.File.model_validate(db_file), msg="File information updated successfully")


@router.delete("/{file_id}", response_model=ApiResponse)
--- a/api/app/controllers/file_storage_controller.py
+++ b/api/app/controllers/file_storage_controller.py
@@ -1,842 +0,0 @@
-"""
-File storage controller module.
-
-This module provides API endpoints for file storage operations using the
-configurable storage backend. It is a new controller that does not modify
-the existing file_controller.py.
-
-Routes:
-    POST /storage/files - Upload a file
-    GET /storage/files/{file_id} - Download a file
-    DELETE /storage/files/{file_id} - Delete a file
-"""
-
-import os
-import uuid
-from typing import Any
-import httpx
-import mimetypes
-from urllib.parse import urlparse, unquote
-
-from fastapi import APIRouter, Depends, File, HTTPException, Request, UploadFile, status
-from fastapi.responses import FileResponse, RedirectResponse
-from sqlalchemy.orm import Session
-
-from app.core.config import settings
-from app.core.logging_config import get_api_logger
-from app.core.response_utils import success
-from app.core.storage import LocalStorage
-from app.core.storage.url_signer import generate_signed_url, verify_signed_url
-from app.core.storage_exceptions import (
-    StorageDeleteError,
-    StorageUploadError,
-)
-from app.db import get_db
-from app.dependencies import get_current_user, get_share_user_id, ShareTokenData
-from app.models.file_metadata_model import FileMetadata
-from app.models.user_model import User
-from app.schemas.response_schema import ApiResponse
-from app.services.file_storage_service import (
-    FileStorageService,
-    generate_file_key,
-    get_file_storage_service,
-)
-
-api_logger = get_api_logger()
-
-router = APIRouter(
-    prefix="/storage",
-    tags=["storage"]
-)
-
-
-def _match_scheme(request: Request, url: str) -> str:
-    """
-    将 presigned URL 的协议替换为与当前请求一致的协议（http/https）。
-    解决反向代理场景下 presigned URL 协议与请求协议不匹配的问题。
-    """
-    incoming_scheme = request.headers.get("x-forwarded-proto") or request.url.scheme
-    if url.startswith("http://") and incoming_scheme == "https":
-        return "https://" + url[7:]
-    if url.startswith("https://") and incoming_scheme == "http":
-        return "http://" + url[8:]
-    return url
-
-
-@router.post("/files", response_model=ApiResponse)
-async def upload_file(
-    file: UploadFile = File(...),
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user),
-    storage_service: FileStorageService = Depends(get_file_storage_service),
-):
-    """
-    Upload a file to the configured storage backend.
-    """
-    tenant_id = current_user.tenant_id
-    workspace_id = current_user.current_workspace_id
-
-    api_logger.info(
-        f"Storage upload request: tenant_id={tenant_id}, workspace_id={workspace_id}, "
-        f"filename={file.filename}, username={current_user.username}"
-    )
-
-    # Read file contents
-    contents = await file.read()
-    file_size = len(contents)
-
-    # Validate file size
-    if file_size == 0:
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail="The file is empty."
-        )
-
-    if file_size > settings.MAX_FILE_SIZE:
-        raise HTTPException(
-            status_code=status.HTTP_413_CONTENT_TOO_LARGE,
-            detail=f"The file size exceeds the {settings.MAX_FILE_SIZE} byte limit"
-        )
-
-    # Extract file extension
-    _, file_extension = os.path.splitext(file.filename)
-    file_ext = file_extension.lower()
-
-    # Generate file_id and file_key
-    file_id = uuid.uuid4()
-    file_key = generate_file_key(
-        tenant_id=tenant_id,
-        workspace_id=workspace_id,
-        file_id=file_id,
-        file_ext=file_ext,
-    )
-
-    # Create file metadata record with pending status
-    file_metadata = FileMetadata(
-        id=file_id,
-        tenant_id=tenant_id,
-        workspace_id=workspace_id,
-        file_key=file_key,
-        file_name=file.filename,
-        file_ext=file_ext,
-        file_size=file_size,
-        content_type=file.content_type,
-        status="pending",
-    )
-    db.add(file_metadata)
-    db.commit()
-    db.refresh(file_metadata)
-
-    # Upload file to storage backend
-    try:
-        await storage_service.upload_file(
-            tenant_id=tenant_id,
-            workspace_id=workspace_id,
-            file_id=file_id,
-            file_ext=file_ext,
-            content=contents,
-            content_type=file.content_type,
-        )
-        # Update status to completed
-        file_metadata.status = "completed"
-        db.commit()
-        api_logger.info(f"File uploaded to storage: file_key={file_key}")
-    except StorageUploadError as e:
-        # Update status to failed
-        file_metadata.status = "failed"
-        db.commit()
-        api_logger.error(f"Storage upload failed: {e}")
-        raise HTTPException(
-            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-            detail=f"File storage failed: {str(e)}"
-        )
-
-    api_logger.info(f"File upload successful: {file.filename} (file_id: {file_id})")
-
-    return success(
-        data={"file_id": str(file_id), "file_key": file_key},
-        msg="File upload successful"
-    )
-
-
-@router.post("/share/files", response_model=ApiResponse)
-async def upload_file_with_share_token(
-    file: UploadFile = File(...),
-    db: Session = Depends(get_db),
-    share_data: ShareTokenData = Depends(get_share_user_id),
-    storage_service: FileStorageService = Depends(get_file_storage_service),
-):
-    """
-    Upload a file to the configured storage backend using share_token authentication.
-    """
-    from app.services.release_share_service import ReleaseShareService
-    from app.models.app_model import App
-    from app.models.workspace_model import Workspace
-    
-    # Get share and release info from share_token
-    service = ReleaseShareService(db)
-    
-    # Get share object to access app_id
-    share = service.repo.get_by_share_token(share_data.share_token)
-    if not share:
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail="Shared app not found"
-        )
-    
-    # Get app to access workspace_id
-    app = db.query(App).filter(
-        App.id == share.app_id,
-        App.is_active.is_(True)
-    ).first()
-    
-    if not app:
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail="App not found"
-        )
-    
-    # Get workspace to access tenant_id
-    workspace = db.query(Workspace).filter(
-        Workspace.id == app.workspace_id
-    ).first()
-    
-    if not workspace:
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail="Workspace not found"
-        )
-    
-    tenant_id = workspace.tenant_id
-    workspace_id = app.workspace_id
-
-    api_logger.info(
-        f"Storage upload request (share): tenant_id={tenant_id}, workspace_id={workspace_id}, "
-        f"filename={file.filename}, share_token={share_data.share_token}"
-    )
-
-    # Read file contents
-    contents = await file.read()
-    file_size = len(contents)
-
-    # Validate file size
-    if file_size == 0:
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail="The file is empty."
-        )
-
-    if file_size > settings.MAX_FILE_SIZE:
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail=f"The file size exceeds the {settings.MAX_FILE_SIZE} byte limit"
-        )
-
-    # Extract file extension
-    _, file_extension = os.path.splitext(file.filename)
-    file_ext = file_extension.lower()
-
-    # Generate file_id and file_key
-    file_id = uuid.uuid4()
-    file_key = generate_file_key(
-        tenant_id=tenant_id,
-        workspace_id=workspace_id,
-        file_id=file_id,
-        file_ext=file_ext,
-    )
-
-    # Create file metadata record with pending status
-    file_metadata = FileMetadata(
-        id=file_id,
-        tenant_id=tenant_id,
-        workspace_id=workspace_id,
-        file_key=file_key,
-        file_name=file.filename,
-        file_ext=file_ext,
-        file_size=file_size,
-        content_type=file.content_type,
-        status="pending",
-    )
-    db.add(file_metadata)
-    db.commit()
-    db.refresh(file_metadata)
-
-    # Upload file to storage backend
-    try:
-        await storage_service.upload_file(
-            tenant_id=tenant_id,
-            workspace_id=workspace_id,
-            file_id=file_id,
-            file_ext=file_ext,
-            content=contents,
-            content_type=file.content_type,
-        )
-        # Update status to completed
-        file_metadata.status = "completed"
-        db.commit()
-        api_logger.info(f"File uploaded to storage (share): file_key={file_key}")
-    except StorageUploadError as e:
-        # Update status to failed
-        file_metadata.status = "failed"
-        db.commit()
-        api_logger.error(f"Storage upload failed (share): {e}")
-        raise HTTPException(
-            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-            detail=f"File storage failed: {str(e)}"
-        )
-
-    api_logger.info(f"File upload successful (share): {file.filename} (file_id: {file_id})")
-
-    return success(
-        data={"file_id": str(file_id), "file_key": file_key},
-        msg="File upload successful"
-    )
-
-
-@router.get("/files/info-by-url", response_model=ApiResponse)
-async def get_file_info_by_url(
-        url: str,
-):
-    """
-    Get file information by network URL (no authentication required).
-
-    Fetches file metadata from a remote URL via HTTP HEAD request.
-    Falls back to GET request if HEAD is not supported.
-    Returns file type, name, and size.
-
-    Args:
-        url: The network URL of the file.
-
-    Returns:
-        ApiResponse with file information.
-    """
-    api_logger.info(f"File info by URL request: url={url}")
-
-    try:
-        async with httpx.AsyncClient(timeout=10.0) as client:
-            # Try HEAD request first
-            response = await client.head(url, follow_redirects=True)
-
-            # If HEAD fails, try GET request (some servers don't support HEAD)
-            if response.status_code != 200:
-                api_logger.info(f"HEAD request failed with {response.status_code}, trying GET request")
-                response = await client.get(url, follow_redirects=True)
-                
-                if response.status_code != 200:
-                    api_logger.error(f"Failed to fetch file info: HTTP {response.status_code}")
-                    raise HTTPException(
-                        status_code=status.HTTP_400_BAD_REQUEST,
-                        detail=f"Unable to access file: HTTP {response.status_code}"
-                    )
-
-            # Get file size from Content-Length header or actual content
-            file_size = response.headers.get("Content-Length")
-            if file_size:
-                file_size = int(file_size)
-            elif hasattr(response, 'content'):
-                file_size = len(response.content)
-            else:
-                file_size = None
-
-            # Get content type from Content-Type header
-            content_type = response.headers.get("Content-Type", "application/octet-stream")
-            # Remove charset and other parameters from content type
-            content_type = content_type.split(';')[0].strip()
-
-            # Extract filename from Content-Disposition or URL
-            file_name = None
-            content_disposition = response.headers.get("Content-Disposition")
-            if content_disposition and "filename=" in content_disposition:
-                parts = content_disposition.split("filename=")
-                if len(parts) > 1:
-                    file_name = parts[1].strip('"').strip("'")
-
-            if not file_name:
-                parsed_url = urlparse(url)
-                file_name = unquote(os.path.basename(parsed_url.path)) or "unknown"
-
-            # Extract file extension from filename
-            _, file_ext = os.path.splitext(file_name)
-            
-            # If no extension found, infer from content type
-            if not file_ext:
-                ext = mimetypes.guess_extension(content_type)
-                if ext:
-                    file_ext = ext
-                    file_name = f"{file_name}{file_ext}"
-
-            api_logger.info(f"File info retrieved: name={file_name}, size={file_size}, type={content_type}")
-
-            return success(
-                data={
-                    "url": url,
-                    "file_name": file_name,
-                    "file_ext": file_ext.lower() if file_ext else "",
-                    "file_size": file_size,
-                    "content_type": content_type,
-                },
-                msg="File information retrieved successfully"
-            )
-
-    except HTTPException:
-        raise
-    except Exception as e:
-        api_logger.error(f"Unexpected error: {e}")
-        raise HTTPException(
-            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-            detail=f"Failed to retrieve file information: {str(e)}"
-        )
-
-
-@router.get("/files/{file_id}", response_model=Any)
-async def download_file(
-    request: Request,
-    file_id: uuid.UUID,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user),
-    storage_service: FileStorageService = Depends(get_file_storage_service),
-) -> Any:
-    """
-    Download a file from the configured storage backend.
-    """
-    api_logger.info(f"Storage download request: file_id={file_id}")
-
-    # Query file metadata from database
-    file_metadata = db.query(FileMetadata).filter(FileMetadata.id == file_id).first()
-    if not file_metadata:
-        api_logger.warning(f"File not found in database: file_id={file_id}")
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail="The file does not exist"
-        )
-
-    if file_metadata.status != "completed":
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail=f"File upload not completed, status: {file_metadata.status}"
-        )
-
-    file_key = file_metadata.file_key
-    storage = storage_service.storage
-
-    if isinstance(storage, LocalStorage):
-        full_path = storage._get_full_path(file_key)
-
-        if not full_path.exists():
-            api_logger.warning(f"File not found on disk: file_key={file_key}")
-            raise HTTPException(
-                status_code=status.HTTP_404_NOT_FOUND,
-                detail="File not found (possibly deleted)"
-            )
-
-        api_logger.info(f"Serving local file: file_key={file_key}")
-        return FileResponse(
-            path=str(full_path),
-            filename=file_metadata.file_name,
-            media_type=file_metadata.content_type or "application/octet-stream"
-        )
-    else:
-        try:
-            presigned_url = await storage_service.get_file_url(file_key, expires=3600)
-            presigned_url = _match_scheme(request, presigned_url)
-            api_logger.info(f"Redirecting to presigned URL: file_key={file_key}")
-            return RedirectResponse(url=presigned_url, status_code=status.HTTP_302_FOUND)
-        except FileNotFoundError:
-            api_logger.warning(f"File not found in remote storage: file_key={file_key}")
-            raise HTTPException(
-                status_code=status.HTTP_404_NOT_FOUND,
-                detail="File not found in storage"
-            )
-        except Exception as e:
-            api_logger.error(f"Failed to get presigned URL: {e}")
-            raise HTTPException(
-                status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-                detail=f"Failed to retrieve file: {str(e)}"
-            )
-
-
-@router.delete("/files/{file_id}", response_model=ApiResponse)
-async def delete_file(
-    file_id: uuid.UUID,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user),
-    storage_service: FileStorageService = Depends(get_file_storage_service),
-):
-    """
-    Delete a file from the configured storage backend.
-    """
-    api_logger.info(
-        f"Storage delete request: file_id={file_id}, username={current_user.username}"
-    )
-
-    # Query file metadata from database
-    file_metadata = db.query(FileMetadata).filter(FileMetadata.id == file_id).first()
-    if not file_metadata:
-        api_logger.warning(f"File not found in database: file_id={file_id}")
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail="The file does not exist"
-        )
-
-    file_key = file_metadata.file_key
-
-    # Delete file from storage
-    try:
-        deleted = await storage_service.delete_file(file_key)
-        if deleted:
-            api_logger.info(f"File deleted from storage: file_key={file_key}")
-        else:
-            api_logger.info(f"File did not exist in storage: file_key={file_key}")
-    except StorageDeleteError as e:
-        api_logger.error(f"Storage delete failed: {e}")
-        raise HTTPException(
-            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-            detail=f"Failed to delete file from storage: {str(e)}"
-        )
-
-    # Delete database record
-    try:
-        db.delete(file_metadata)
-        db.commit()
-        api_logger.info(f"File record deleted from database: file_id={file_id}")
-    except Exception as e:
-        api_logger.error(f"Database delete failed: {e}")
-        db.rollback()
-        raise HTTPException(
-            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-            detail=f"Failed to delete file record: {str(e)}"
-        )
-
-    return success(msg="File deleted successfully")
-
-
-@router.get("/files/{file_id}/url", response_model=ApiResponse)
-async def get_file_url(
-    request: Request,
-    file_id: uuid.UUID,
-    expires: int = None,
-    permanent: bool = False,
-    db: Session = Depends(get_db),
-    storage_service: FileStorageService = Depends(get_file_storage_service),
-):
-    """
-    Get an access URL for a file (no authentication required).
-
-    Args:
-        file_id: The UUID of the file.
-        expires: URL validity period in seconds (default from FILE_URL_EXPIRES env).
-        permanent: If True, return a permanent URL without expiration.
-        db: Database session.
-        storage_service: The file storage service.
-
-    Returns:
-        ApiResponse with the access URL.
-    """
-    if expires is None:
-        expires = settings.FILE_URL_EXPIRES
-
-    api_logger.info(f"Get file URL request: file_id={file_id}, expires={expires}, permanent={permanent}")
-
-    # Query file metadata from database
-    file_metadata = db.query(FileMetadata).filter(FileMetadata.id == file_id).first()
-    if not file_metadata:
-        api_logger.warning(f"File not found in database: file_id={file_id}")
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail="The file does not exist"
-        )
-
-    if file_metadata.status != "completed":
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail=f"File upload not completed, status: {file_metadata.status}"
-        )
-
-    file_key = file_metadata.file_key
-    storage = storage_service.storage
-
-    try:
-        if permanent:
-            # Generate permanent URL (no expiration check)
-            server_url = settings.FILE_LOCAL_SERVER_URL
-            url = f"{server_url}/storage/permanent/{file_id}"
-            return success(
-                data={
-                    "url": url,
-                    "expires_in": None,
-                    "permanent": True,
-                    "file_name": file_metadata.file_name,
-                },
-                msg="Permanent file URL generated successfully"
-            )
-
-        if isinstance(storage, LocalStorage):
-            # For local storage, generate signed URL with expiration
-            url = generate_signed_url(str(file_id), expires)
-        else:
-            # For remote storage (OSS/S3), get presigned URL with forced download
-            url = await storage_service.get_file_url(
-                file_key,
-                expires=expires,
-                file_name=file_metadata.file_name,
-            )
-            url = _match_scheme(request, url)
-
-        api_logger.info(f"Generated file URL: file_id={file_id}")
-        return success(
-            data={
-                "url": url,
-                "expires_in": expires,
-                "permanent": False,
-                "file_name": file_metadata.file_name,
-            },
-            msg="File URL generated successfully"
-        )
-    except Exception as e:
-        api_logger.error(f"Failed to generate file URL: {e}")
-        raise HTTPException(
-            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-            detail=f"Failed to generate file URL: {str(e)}"
-        )
-
-
-@router.get("/files/{file_id}/public-url", response_model=ApiResponse)
-async def get_permanent_file_url(
-    file_id: uuid.UUID,
-    db: Session = Depends(get_db),
-    storage_service: FileStorageService = Depends(get_file_storage_service),
-):
-    """
-    获取文件的永久公开 URL（无过期时间）。
-
-    - 本地存储：返回 API 永久访问地址（基于 FILE_LOCAL_SERVER_URL 配置）
-    - 远程存储（OSS/S3）：返回 bucket 公读地址（需 bucket 已配置公共读权限）
-    """
-    file_metadata = db.query(FileMetadata).filter(FileMetadata.id == file_id).first()
-    if not file_metadata:
-        raise HTTPException(status_code=status.HTTP_404_NOT_FOUND, detail="The file does not exist")
-
-    if file_metadata.status != "completed":
-        raise HTTPException(status_code=status.HTTP_400_BAD_REQUEST,
-                            detail=f"File upload not completed, status: {file_metadata.status}")
-
-    file_key = file_metadata.file_key
-    storage = storage_service.storage
-
-    try:
-        if isinstance(storage, LocalStorage):
-            url = f"{settings.FILE_LOCAL_SERVER_URL}/storage/permanent/{file_id}"
-        else:
-            url = await storage.get_permanent_url(file_key)
-            if not url:
-                raise HTTPException(status_code=status.HTTP_501_NOT_IMPLEMENTED,
-                                    detail="Permanent URL not supported for current storage backend")
-
-        api_logger.info(f"Generated permanent URL: file_id={file_id}")
-        return success(
-            data={"url": url, "expires_in": None, "permanent": True, "file_name": file_metadata.file_name},
-            msg="Permanent file URL generated successfully"
-        )
-    except HTTPException:
-        raise
-    except Exception as e:
-        api_logger.error(f"Failed to generate permanent URL: {e}")
-        raise HTTPException(status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-                            detail=f"Failed to generate permanent URL: {str(e)}")
-
-
-@router.get("/public/{file_id}", response_model=Any)
-async def public_download_file(
-    request: Request,
-    file_id: uuid.UUID,
-    expires: int = 0,
-    signature: str = "",
-    db: Session = Depends(get_db),
-    storage_service: FileStorageService = Depends(get_file_storage_service),
-) -> Any:
-    """
-    Public file download endpoint with signature verification.
-
-    This endpoint allows downloading files without authentication,
-    but requires a valid signature and non-expired timestamp.
-
-    Args:
-        file_id: The UUID of the file.
-        expires: Expiration timestamp.
-        signature: HMAC signature for verification.
-        db: Database session.
-        storage_service: The file storage service.
-
-    Returns:
-        FileResponse for the requested file.
-    """
-    api_logger.info(f"Public download request: file_id={file_id}")
-
-    # Verify signature
-    is_valid, error_msg = verify_signed_url(str(file_id), expires, signature)
-    if not is_valid:
-        api_logger.warning(f"Invalid signed URL: file_id={file_id}, error={error_msg}")
-        raise HTTPException(
-            status_code=status.HTTP_403_FORBIDDEN,
-            detail=error_msg
-        )
-
-    # Query file metadata from database
-    file_metadata = db.query(FileMetadata).filter(FileMetadata.id == file_id).first()
-    if not file_metadata:
-        api_logger.warning(f"File not found in database: file_id={file_id}")
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail="The file does not exist"
-        )
-
-    if file_metadata.status != "completed":
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail=f"File upload not completed, status: {file_metadata.status}"
-        )
-
-    file_key = file_metadata.file_key
-    storage = storage_service.storage
-
-    if isinstance(storage, LocalStorage):
-        full_path = storage._get_full_path(file_key)
-
-        if not full_path.exists():
-            api_logger.warning(f"File not found on disk: file_key={file_key}")
-            raise HTTPException(
-                status_code=status.HTTP_404_NOT_FOUND,
-                detail="File not found"
-            )
-
-        api_logger.info(f"Serving public file: file_key={file_key}")
-        return FileResponse(
-            path=str(full_path),
-            filename=file_metadata.file_name,
-            media_type=file_metadata.content_type or "application/octet-stream"
-        )
-    else:
-        # For remote storage, redirect to presigned URL
-        try:
-            presigned_url = await storage_service.get_file_url(file_key, expires=3600)
-            presigned_url = _match_scheme(request, presigned_url)
-            return RedirectResponse(url=presigned_url, status_code=status.HTTP_302_FOUND)
-        except Exception as e:
-            api_logger.error(f"Failed to get presigned URL: {e}")
-            raise HTTPException(
-                status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-                detail=f"Failed to retrieve file: {str(e)}"
-            )
-
-
-@router.get("/permanent/{file_id}", response_model=Any)
-async def permanent_download_file(
-    request: Request,
-    file_id: uuid.UUID,
-    db: Session = Depends(get_db),
-    storage_service: FileStorageService = Depends(get_file_storage_service),
-) -> Any:
-    """
-    Permanent file download endpoint (no expiration, no signature required).
-
-    This endpoint allows downloading files without authentication or expiration.
-    Use with caution as URLs are permanently accessible.
-
-    Args:
-        file_id: The UUID of the file.
-        db: Database session.
-        storage_service: The file storage service.
-
-    Returns:
-        FileResponse for the requested file.
-    """
-    api_logger.info(f"Permanent download request: file_id={file_id}")
-
-    # Query file metadata from database
-    file_metadata = db.query(FileMetadata).filter(FileMetadata.id == file_id).first()
-    if not file_metadata:
-        api_logger.warning(f"File not found in database: file_id={file_id}")
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail="The file does not exist"
-        )
-
-    if file_metadata.status != "completed":
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail=f"File upload not completed, status: {file_metadata.status}"
-        )
-
-    file_key = file_metadata.file_key
-    storage = storage_service.storage
-
-    if isinstance(storage, LocalStorage):
-        full_path = storage._get_full_path(file_key)
-
-        if not full_path.exists():
-            api_logger.warning(f"File not found on disk: file_key={file_key}")
-            raise HTTPException(
-                status_code=status.HTTP_404_NOT_FOUND,
-                detail="File not found"
-            )
-
-        api_logger.info(f"Serving permanent file: file_key={file_key}")
-        return FileResponse(
-            path=str(full_path),
-            filename=file_metadata.file_name,
-            media_type=file_metadata.content_type or "application/octet-stream"
-        )
-    else:
-        # For remote storage, redirect to presigned URL with long expiration
-        try:
-            # Use a very long expiration (7 days max for most cloud providers)
-            presigned_url = await storage_service.get_file_url(file_key, expires=604800, file_name=file_metadata.file_name)
-            presigned_url = _match_scheme(request, presigned_url)
-            return RedirectResponse(url=presigned_url, status_code=status.HTTP_302_FOUND)
-        except Exception as e:
-            api_logger.error(f"Failed to get presigned URL: {e}")
-            raise HTTPException(
-                status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-                detail=f"Failed to retrieve file: {str(e)}"
-            )
-
-
-@router.get("/files/{file_id}/status", response_model=ApiResponse)
-async def get_file_status(
-    file_id: uuid.UUID,
-    db: Session = Depends(get_db),
-):
-    """
-    Get file upload/processing status (no authentication required).
-    
-    This endpoint is used to check if a file (e.g., TTS audio) is ready.
-    Returns status: pending, completed, or failed.
-    
-    Args:
-        file_id: The UUID of the file.
-        db: Database session.
-    
-    Returns:
-        ApiResponse with file status and metadata.
-    """
-    api_logger.info(f"File status request: file_id={file_id}")
-    
-    # Query file metadata from database
-    file_metadata = db.query(FileMetadata).filter(FileMetadata.id == file_id).first()
-    if not file_metadata:
-        api_logger.warning(f"File not found in database: file_id={file_id}")
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail="The file does not exist"
-        )
-    
-    return success(
-        data={
-            "file_id": str(file_id),
-            "status": file_metadata.status,
-            "file_name": file_metadata.file_name,
-            "file_size": file_metadata.file_size,
-            "content_type": file_metadata.content_type,
-        },
-        msg="File status retrieved successfully"
-    )
--- a/api/app/controllers/home_page_controller.py
+++ b/api/app/controllers/home_page_controller.py
@@ -1,68 +0,0 @@
-from fastapi import APIRouter, Depends
-from sqlalchemy.orm import Session
-
-from app.core.config import settings
-from app.core.response_utils import success
-from app.db import get_db, SessionLocal
-from app.dependencies import get_current_user
-from app.models.user_model import User
-from app.repositories.home_page_repository import HomePageRepository
-from app.schemas.response_schema import ApiResponse
-from app.services.home_page_service import HomePageService
-
-router = APIRouter(prefix="/home-page", tags=["Home Page"])
-
-@router.get("/statistics", response_model=ApiResponse)
-def get_home_statistics(
-    current_user: User = Depends(get_current_user),
-    db: Session = Depends(get_db)
-):
-    """获取首页统计数据"""
-    statistics = HomePageService.get_home_statistics(db, current_user.tenant_id)
-    return success(data=statistics, msg="统计数据获取成功")
-
-@router.get("/workspaces", response_model=ApiResponse)
-def get_workspace_list(
-    current_user: User = Depends(get_current_user),
-    db: Session = Depends(get_db)
-):
-    """获取工作空间列表"""
-    workspace_list = HomePageService.get_workspace_list(db, current_user.tenant_id)
-    return success(data=workspace_list, msg="工作空间列表获取成功")
-
-@router.get("/version", response_model=ApiResponse)
-def get_system_version():
-    """获取系统版本号 + 说明"""
-    current_version = None
-    version_info = None
-    
-    # 1️⃣ 优先从数据库获取最新已发布的版本
-    try:
-        db = SessionLocal()
-        try:
-            current_version, version_info = HomePageRepository.get_latest_version_introduction(db)
-        finally:
-            db.close()
-    except Exception as e:
-        pass
-    
-    # 2️⃣ 降级：使用环境变量中的版本号
-    if not current_version:
-        current_version = settings.SYSTEM_VERSION
-        version_info = HomePageService.load_version_introduction(current_version)
-    
-    # 3️⃣ 如果数据库和 JSON 都没有，返回基本信息
-    if not version_info:
-        version_info = {
-            "introduction": {"codeName": "", "releaseDate": "", "upgradePosition": "", "coreUpgrades": []},
-            "introduction_en": {"codeName": "", "releaseDate": "", "upgradePosition": "", "coreUpgrades": []}
-        }
-    
-    return success(
-        data={
-            "version": current_version,
-            "introduction": version_info.get("introduction"),
-            "introduction_en": version_info.get("introduction_en")
-        },
-        msg="系统版本获取成功"
-    )
--- a/api/app/controllers/i18n_controller.py
+++ b/api/app/controllers/i18n_controller.py
@@ -1,833 +0,0 @@
-"""
-I18n Management API Controller
-
-This module provides management APIs for:
- Language management (list, get, add, update languages)
- Translation management (get, update, reload translations)
-"""
-
-from fastapi import APIRouter, Depends, HTTPException, status
-from sqlalchemy.orm import Session
-from typing import Callable, Optional
-
-from app.core.logging_config import get_api_logger
-from app.core.response_utils import success
-from app.db import get_db
-from app.dependencies import get_current_user, get_current_superuser
-from app.i18n.dependencies import get_translator
-from app.i18n.service import get_translation_service
-from app.models.user_model import User
-from app.schemas.i18n_schema import (
-    LanguageInfo,
-    LanguageListResponse,
-    LanguageCreateRequest,
-    LanguageUpdateRequest,
-    TranslationResponse,
-    TranslationUpdateRequest,
-    MissingTranslationsResponse,
-    ReloadResponse
-)
-from app.schemas.response_schema import ApiResponse
-
-api_logger = get_api_logger()
-
-router = APIRouter(
-    prefix="/i18n",
-    tags=["I18n Management"],
-)
-
-
-# ============================================================================
-# Language Management APIs
-# ============================================================================
-
-@router.get("/languages", response_model=ApiResponse)
-def get_languages(
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_user)
-):
-    """
-    Get list of all supported languages.
-    
-    Returns:
-        List of language information including code, name, and status
-    """
-    api_logger.info(f"Get languages request from user: {current_user.username}")
-    
-    from app.core.config import settings
-    translation_service = get_translation_service()
-    
-    # Get available locales from translation service
-    available_locales = translation_service.get_available_locales()
-    
-    # Build language info list
-    languages = []
-    for locale in available_locales:
-        is_default = locale == settings.I18N_DEFAULT_LANGUAGE
-        is_enabled = locale in settings.I18N_SUPPORTED_LANGUAGES
-        
-        # Get native names
-        native_names = {
-            "zh": "中文（简体）",
-            "en": "English",
-            "ja": "日本語",
-            "ko": "한국어",
-            "fr": "Français",
-            "de": "Deutsch",
-            "es": "Español"
-        }
-        
-        language_info = LanguageInfo(
-            code=locale,
-            name=f"{locale.upper()}",
-            native_name=native_names.get(locale, locale),
-            is_enabled=is_enabled,
-            is_default=is_default
-        )
-        languages.append(language_info)
-    
-    response = LanguageListResponse(languages=languages)
-    
-    api_logger.info(f"Returning {len(languages)} languages")
-    return success(data=response.dict(), msg=t("common.success.retrieved"))
-
-
-@router.get("/languages/{locale}", response_model=ApiResponse)
-def get_language(
-    locale: str,
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_user)
-):
-    """
-    Get information about a specific language.
-    
-    Args:
-        locale: Language code (e.g., 'zh', 'en')
-        
-    Returns:
-        Language information
-    """
-    api_logger.info(f"Get language info request: locale={locale}, user={current_user.username}")
-    
-    from app.core.config import settings
-    translation_service = get_translation_service()
-    
-    # Check if locale exists
-    available_locales = translation_service.get_available_locales()
-    if locale not in available_locales:
-        api_logger.warning(f"Language not found: {locale}")
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail=t("i18n.language.not_found", locale=locale)
-        )
-    
-    # Build language info
-    is_default = locale == settings.I18N_DEFAULT_LANGUAGE
-    is_enabled = locale in settings.I18N_SUPPORTED_LANGUAGES
-    
-    native_names = {
-        "zh": "中文（简体）",
-        "en": "English",
-        "ja": "日本語",
-        "ko": "한국어",
-        "fr": "Français",
-        "de": "Deutsch",
-        "es": "Español"
-    }
-    
-    language_info = LanguageInfo(
-        code=locale,
-        name=f"{locale.upper()}",
-        native_name=native_names.get(locale, locale),
-        is_enabled=is_enabled,
-        is_default=is_default
-    )
-    
-    api_logger.info(f"Returning language info for: {locale}")
-    return success(data=language_info.dict(), msg=t("common.success.retrieved"))
-
-
-@router.post("/languages", response_model=ApiResponse)
-def add_language(
-    request: LanguageCreateRequest,
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_superuser)
-):
-    """
-    Add a new language (admin only).
-    
-    Note: This endpoint validates the request but actual language addition
-    requires creating translation files in the locales directory.
-    
-    Args:
-        request: Language creation request
-        
-    Returns:
-        Success message
-    """
-    api_logger.info(
-        f"Add language request: code={request.code}, admin={current_user.username}"
-    )
-    
-    from app.core.config import settings
-    translation_service = get_translation_service()
-    
-    # Check if language already exists
-    available_locales = translation_service.get_available_locales()
-    if request.code in available_locales:
-        api_logger.warning(f"Language already exists: {request.code}")
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail=t("i18n.language.already_exists", locale=request.code)
-        )
-    
-    # Note: Actual language addition requires creating translation files
-    # This endpoint serves as a validation and documentation point
-    
-    api_logger.info(
-        f"Language addition validated: {request.code}. "
-        "Translation files need to be created manually."
-    )
-    
-    return success(
-        msg=t(
-            "i18n.language.add_instructions",
-            locale=request.code,
-            dir=settings.I18N_CORE_LOCALES_DIR
-        )
-    )
-
-
-@router.put("/languages/{locale}", response_model=ApiResponse)
-def update_language(
-    locale: str,
-    request: LanguageUpdateRequest,
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_superuser)
-):
-    """
-    Update language configuration (admin only).
-    
-    Note: This endpoint validates the request but actual configuration
-    changes require updating environment variables or config files.
-    
-    Args:
-        locale: Language code
-        request: Language update request
-        
-    Returns:
-        Success message
-    """
-    api_logger.info(
-        f"Update language request: locale={locale}, admin={current_user.username}"
-    )
-    
-    translation_service = get_translation_service()
-    
-    # Check if language exists
-    available_locales = translation_service.get_available_locales()
-    if locale not in available_locales:
-        api_logger.warning(f"Language not found: {locale}")
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail=t("i18n.language.not_found", locale=locale)
-        )
-    
-    # Note: Actual configuration changes require updating settings
-    # This endpoint serves as a validation and documentation point
-    
-    api_logger.info(
-        f"Language update validated: {locale}. "
-        "Configuration changes require environment variable updates."
-    )
-    
-    return success(msg=t("i18n.language.update_instructions", locale=locale))
-
-
-# ============================================================================
-# Translation Management APIs
-# ============================================================================
-
-@router.get("/translations", response_model=ApiResponse)
-def get_all_translations(
-    locale: Optional[str] = None,
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_user)
-):
-    """
-    Get all translations for all or specific locale.
-    
-    Args:
-        locale: Optional locale filter
-        
-    Returns:
-        All translations organized by locale and namespace
-    """
-    api_logger.info(
-        f"Get all translations request: locale={locale}, user={current_user.username}"
-    )
-    
-    translation_service = get_translation_service()
-    
-    if locale:
-        # Get translations for specific locale
-        available_locales = translation_service.get_available_locales()
-        if locale not in available_locales:
-            raise HTTPException(
-                status_code=status.HTTP_404_NOT_FOUND,
-                detail=t("i18n.language.not_found", locale=locale)
-            )
-        
-        translations = {
-            locale: translation_service._cache.get(locale, {})
-        }
-    else:
-        # Get all translations
-        translations = translation_service._cache
-    
-    response = TranslationResponse(translations=translations)
-    
-    api_logger.info(f"Returning translations for: {locale or 'all locales'}")
-    return success(data=response.dict(), msg=t("common.success.retrieved"))
-
-
-@router.get("/translations/{locale}", response_model=ApiResponse)
-def get_locale_translations(
-    locale: str,
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_user)
-):
-    """
-    Get all translations for a specific locale.
-    
-    Args:
-        locale: Language code
-        
-    Returns:
-        All translations for the locale organized by namespace
-    """
-    api_logger.info(
-        f"Get locale translations request: locale={locale}, user={current_user.username}"
-    )
-    
-    translation_service = get_translation_service()
-    
-    # Check if locale exists
-    available_locales = translation_service.get_available_locales()
-    if locale not in available_locales:
-        api_logger.warning(f"Language not found: {locale}")
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail=t("i18n.language.not_found", locale=locale)
-        )
-    
-    translations = translation_service._cache.get(locale, {})
-    
-    api_logger.info(f"Returning {len(translations)} namespaces for locale: {locale}")
-    return success(data={"locale": locale, "translations": translations}, msg=t("common.success.retrieved"))
-
-
-@router.get("/translations/{locale}/{namespace}", response_model=ApiResponse)
-def get_namespace_translations(
-    locale: str,
-    namespace: str,
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_user)
-):
-    """
-    Get translations for a specific namespace in a locale.
-    
-    Args:
-        locale: Language code
-        namespace: Translation namespace (e.g., 'common', 'auth')
-        
-    Returns:
-        Translations for the specified namespace
-    """
-    api_logger.info(
-        f"Get namespace translations request: locale={locale}, "
-        f"namespace={namespace}, user={current_user.username}"
-    )
-    
-    translation_service = get_translation_service()
-    
-    # Check if locale exists
-    available_locales = translation_service.get_available_locales()
-    if locale not in available_locales:
-        api_logger.warning(f"Language not found: {locale}")
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail=t("i18n.language.not_found", locale=locale)
-        )
-    
-    # Get namespace translations
-    locale_translations = translation_service._cache.get(locale, {})
-    namespace_translations = locale_translations.get(namespace, {})
-    
-    if not namespace_translations:
-        api_logger.warning(f"Namespace not found: {namespace} in locale: {locale}")
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail=t("i18n.namespace.not_found", namespace=namespace, locale=locale)
-        )
-    
-    api_logger.info(
-        f"Returning translations for namespace: {namespace} in locale: {locale}"
-    )
-    return success(
-        data={
-            "locale": locale,
-            "namespace": namespace,
-            "translations": namespace_translations
-        },
-        msg=t("common.success.retrieved")
-    )
-
-
-@router.put("/translations/{locale}/{key:path}", response_model=ApiResponse)
-def update_translation(
-    locale: str,
-    key: str,
-    request: TranslationUpdateRequest,
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_superuser)
-):
-    """
-    Update a single translation (admin only).
-    
-    Note: This endpoint validates the request but actual translation updates
-    require modifying translation files in the locales directory.
-    
-    Args:
-        locale: Language code
-        key: Translation key (format: "namespace.key.subkey")
-        request: Translation update request
-        
-    Returns:
-        Success message
-    """
-    api_logger.info(
-        f"Update translation request: locale={locale}, key={key}, "
-        f"admin={current_user.username}"
-    )
-    
-    translation_service = get_translation_service()
-    
-    # Check if locale exists
-    available_locales = translation_service.get_available_locales()
-    if locale not in available_locales:
-        api_logger.warning(f"Language not found: {locale}")
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail=t("i18n.language.not_found", locale=locale)
-        )
-    
-    # Validate key format
-    if "." not in key:
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail=t("i18n.translation.invalid_key_format", key=key)
-        )
-    
-    # Note: Actual translation updates require modifying JSON files
-    # This endpoint serves as a validation and documentation point
-    
-    api_logger.info(
-        f"Translation update validated: {locale}/{key}. "
-        "Translation files need to be updated manually."
-    )
-    
-    return success(
-        msg=t("i18n.translation.update_instructions", locale=locale, key=key)
-    )
-
-
-@router.get("/translations/missing", response_model=ApiResponse)
-def get_missing_translations(
-    locale: Optional[str] = None,
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_user)
-):
-    """
-    Get list of missing translations.
-    
-    Compares translations across locales to find missing keys.
-    
-    Args:
-        locale: Optional locale to check (defaults to checking all non-default locales)
-        
-    Returns:
-        List of missing translation keys
-    """
-    api_logger.info(
-        f"Get missing translations request: locale={locale}, user={current_user.username}"
-    )
-    
-    from app.core.config import settings
-    translation_service = get_translation_service()
-    
-    default_locale = settings.I18N_DEFAULT_LANGUAGE
-    available_locales = translation_service.get_available_locales()
-    
-    # Get default locale translations as reference
-    default_translations = translation_service._cache.get(default_locale, {})
-    
-    # Collect all keys from default locale
-    def collect_keys(data, prefix=""):
-        keys = []
-        for key, value in data.items():
-            full_key = f"{prefix}.{key}" if prefix else key
-            if isinstance(value, dict):
-                keys.extend(collect_keys(value, full_key))
-            else:
-                keys.append(full_key)
-        return keys
-    
-    default_keys = set()
-    for namespace, translations in default_translations.items():
-        namespace_keys = collect_keys(translations, namespace)
-        default_keys.update(namespace_keys)
-    
-    # Find missing keys in target locale(s)
-    missing_by_locale = {}
-    
-    target_locales = [locale] if locale else [
-        loc for loc in available_locales if loc != default_locale
-    ]
-    
-    for target_locale in target_locales:
-        if target_locale not in available_locales:
-            continue
-        
-        target_translations = translation_service._cache.get(target_locale, {})
-        target_keys = set()
-        
-        for namespace, translations in target_translations.items():
-            namespace_keys = collect_keys(translations, namespace)
-            target_keys.update(namespace_keys)
-        
-        missing_keys = default_keys - target_keys
-        if missing_keys:
-            missing_by_locale[target_locale] = sorted(list(missing_keys))
-    
-    response = MissingTranslationsResponse(missing_translations=missing_by_locale)
-    
-    total_missing = sum(len(keys) for keys in missing_by_locale.values())
-    api_logger.info(f"Found {total_missing} missing translations across {len(missing_by_locale)} locales")
-    
-    return success(data=response.dict(), msg=t("common.success.retrieved"))
-
-
-@router.post("/reload", response_model=ApiResponse)
-def reload_translations(
-    locale: Optional[str] = None,
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_superuser)
-):
-    """
-    Trigger hot reload of translation files (admin only).
-    
-    Args:
-        locale: Optional locale to reload (defaults to reloading all locales)
-        
-    Returns:
-        Reload status and statistics
-    """
-    api_logger.info(
-        f"Reload translations request: locale={locale or 'all'}, "
-        f"admin={current_user.username}"
-    )
-    
-    from app.core.config import settings
-    
-    if not settings.I18N_ENABLE_HOT_RELOAD:
-        api_logger.warning("Hot reload is disabled in configuration")
-        raise HTTPException(
-            status_code=status.HTTP_403_FORBIDDEN,
-            detail=t("i18n.reload.disabled")
-        )
-    
-    translation_service = get_translation_service()
-    
-    try:
-        # Reload translations
-        translation_service.reload(locale)
-        
-        # Get statistics
-        available_locales = translation_service.get_available_locales()
-        reloaded_locales = [locale] if locale else available_locales
-        
-        response = ReloadResponse(
-            success=True,
-            reloaded_locales=reloaded_locales,
-            total_locales=len(available_locales)
-        )
-        
-        api_logger.info(
-            f"Successfully reloaded translations for: {', '.join(reloaded_locales)}"
-        )
-        
-        return success(data=response.dict(), msg=t("i18n.reload.success"))
-        
-    except Exception as e:
-        api_logger.error(f"Failed to reload translations: {str(e)}")
-        raise HTTPException(
-            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-            detail=t("i18n.reload.failed", error=str(e))
-        )
-
-
-# ============================================================================
-# Performance Monitoring APIs
-# ============================================================================
-
-@router.get("/metrics", response_model=ApiResponse)
-def get_metrics(
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_superuser)
-):
-    """
-    Get i18n performance metrics (admin only).
-    
-    Returns:
-        Performance metrics including:
-        - Request counts
-        - Missing translations
-        - Timing statistics
-        - Locale usage
-        - Error counts
-    """
-    api_logger.info(f"Get metrics request: admin={current_user.username}")
-    
-    translation_service = get_translation_service()
-    metrics = translation_service.get_metrics_summary()
-    
-    api_logger.info("Returning i18n metrics")
-    return success(data=metrics, msg=t("common.success.retrieved"))
-
-
-@router.get("/metrics/cache", response_model=ApiResponse)
-def get_cache_stats(
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_superuser)
-):
-    """
-    Get cache statistics (admin only).
-    
-    Returns:
-        Cache statistics including:
-        - Hit/miss rates
-        - LRU cache performance
-        - Loaded locales
-        - Memory usage
-    """
-    api_logger.info(f"Get cache stats request: admin={current_user.username}")
-    
-    translation_service = get_translation_service()
-    cache_stats = translation_service.get_cache_stats()
-    memory_usage = translation_service.get_memory_usage()
-    
-    data = {
-        "cache": cache_stats,
-        "memory": memory_usage
-    }
-    
-    api_logger.info("Returning cache statistics")
-    return success(data=data, msg=t("common.success.retrieved"))
-
-
-@router.get("/metrics/prometheus")
-def get_prometheus_metrics(
-    current_user: User = Depends(get_current_superuser)
-):
-    """
-    Get metrics in Prometheus format (admin only).
-    
-    Returns:
-        Prometheus-formatted metrics as plain text
-    """
-    api_logger.info(f"Get Prometheus metrics request: admin={current_user.username}")
-    
-    from app.i18n.metrics import get_metrics
-    metrics = get_metrics()
-    prometheus_output = metrics.export_prometheus()
-    
-    from fastapi.responses import PlainTextResponse
-    return PlainTextResponse(content=prometheus_output)
-
-
-@router.post("/metrics/reset", response_model=ApiResponse)
-def reset_metrics(
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_superuser)
-):
-    """
-    Reset all metrics (admin only).
-    
-    Returns:
-        Success message
-    """
-    api_logger.info(f"Reset metrics request: admin={current_user.username}")
-    
-    from app.i18n.metrics import get_metrics
-    metrics = get_metrics()
-    metrics.reset()
-    
-    translation_service = get_translation_service()
-    translation_service.cache.reset_stats()
-    
-    api_logger.info("Metrics reset completed")
-    return success(msg=t("i18n.metrics.reset_success"))
-
-
-# ============================================================================
-# Missing Translation Logging and Reporting APIs
-# ============================================================================
-
-@router.get("/logs/missing", response_model=ApiResponse)
-def get_missing_translation_logs(
-    locale: Optional[str] = None,
-    limit: Optional[int] = 100,
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_superuser)
-):
-    """
-    Get missing translation logs (admin only).
-    
-    Returns logged missing translations with context information.
-    
-    Args:
-        locale: Optional locale filter
-        limit: Maximum number of entries to return (default: 100)
-        
-    Returns:
-        Missing translation logs with context
-    """
-    api_logger.info(
-        f"Get missing translation logs request: locale={locale}, "
-        f"limit={limit}, admin={current_user.username}"
-    )
-    
-    translation_service = get_translation_service()
-    translation_logger = translation_service.translation_logger
-    
-    # Get missing translations
-    missing_translations = translation_logger.get_missing_translations(locale)
-    
-    # Get missing with context
-    missing_with_context = translation_logger.get_missing_with_context(locale, limit)
-    
-    # Get statistics
-    statistics = translation_logger.get_statistics()
-    
-    data = {
-        "missing_translations": missing_translations,
-        "recent_context": missing_with_context,
-        "statistics": statistics
-    }
-    
-    api_logger.info(
-        f"Returning {statistics['total_missing']} missing translations"
-    )
-    return success(data=data, msg=t("common.success.retrieved"))
-
-
-@router.get("/logs/missing/report", response_model=ApiResponse)
-def generate_missing_translation_report(
-    locale: Optional[str] = None,
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_superuser)
-):
-    """
-    Generate a comprehensive missing translation report (admin only).
-    
-    Args:
-        locale: Optional locale filter
-        
-    Returns:
-        Comprehensive report with missing translations and statistics
-    """
-    api_logger.info(
-        f"Generate missing translation report request: locale={locale}, "
-        f"admin={current_user.username}"
-    )
-    
-    translation_service = get_translation_service()
-    translation_logger = translation_service.translation_logger
-    
-    # Generate report
-    report = translation_logger.generate_report(locale)
-    
-    api_logger.info(
-        f"Generated report with {report['total_missing']} missing translations"
-    )
-    return success(data=report, msg=t("common.success.retrieved"))
-
-
-@router.post("/logs/missing/export", response_model=ApiResponse)
-def export_missing_translations(
-    locale: Optional[str] = None,
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_superuser)
-):
-    """
-    Export missing translations to JSON file (admin only).
-    
-    Args:
-        locale: Optional locale filter
-        
-    Returns:
-        Export status and file path
-    """
-    api_logger.info(
-        f"Export missing translations request: locale={locale}, "
-        f"admin={current_user.username}"
-    )
-    
-    from datetime import datetime
-    translation_service = get_translation_service()
-    translation_logger = translation_service.translation_logger
-    
-    # Generate filename with timestamp
-    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
-    locale_suffix = f"_{locale}" if locale else "_all"
-    output_file = f"logs/i18n/missing_translations{locale_suffix}_{timestamp}.json"
-    
-    # Export to file
-    translation_logger.export_to_json(output_file)
-    
-    api_logger.info(f"Missing translations exported to: {output_file}")
-    return success(
-        data={"file_path": output_file},
-        msg=t("i18n.logs.export_success", file=output_file)
-    )
-
-
-@router.delete("/logs/missing", response_model=ApiResponse)
-def clear_missing_translation_logs(
-    locale: Optional[str] = None,
-    t: Callable = Depends(get_translator),
-    current_user: User = Depends(get_current_superuser)
-):
-    """
-    Clear missing translation logs (admin only).
-    
-    Args:
-        locale: Optional locale to clear (clears all if not specified)
-        
-    Returns:
-        Success message
-    """
-    api_logger.info(
-        f"Clear missing translation logs request: locale={locale or 'all'}, "
-        f"admin={current_user.username}"
-    )
-    
-    translation_service = get_translation_service()
-    translation_logger = translation_service.translation_logger
-    
-    # Clear logs
-    translation_logger.clear(locale)
-    
-    api_logger.info(f"Cleared missing translation logs for: {locale or 'all locales'}")
-    return success(msg=t("i18n.logs.clear_success"))
--- a/api/app/controllers/implicit_memory_controller.py
+++ b/api/app/controllers/implicit_memory_controller.py
@@ -1,457 +0,0 @@
-from datetime import datetime
-from typing import Optional
-
-from app.core.error_codes import BizCode
-from app.core.logging_config import get_api_logger
-from app.core.response_utils import fail, success
-from app.db import get_db
-from app.dependencies import (
-    cur_workspace_access_guard,
-    get_current_user,
-)
-from app.models.user_model import User
-from app.schemas.response_schema import ApiResponse
-from app.schemas.implicit_memory_schema import GenerateProfileRequest
-from app.services.implicit_memory_service import ImplicitMemoryService
-from fastapi import APIRouter, Depends, Query
-from sqlalchemy.orm import Session
-
-api_logger = get_api_logger()
-
-router = APIRouter(
-    prefix="/memory/implicit-memory",
-    tags=["Implicit Memory"],
-)
-
-
-def handle_implicit_memory_error(e: Exception, operation: str, user_id: str = None) -> dict:
-    """
-    Centralized error handling for implicit memory operations.
-    
-    Args:
-        e: The exception that occurred
-        operation: Description of the operation that failed
-        user_id: Optional user ID for logging context
-        
-    Returns:
-        Standardized error response
-    """
-    error_context = f"user_id={user_id}" if user_id else "unknown user"
-    
-    if isinstance(e, ValueError):
-        if "user" in str(e).lower() and "not found" in str(e).lower():
-            api_logger.warning(f"Invalid user ID for {operation}: {error_context}")
-            return fail(BizCode.INVALID_USER_ID, "无效的用户ID", str(e))
-        elif "insufficient" in str(e).lower() or "no data" in str(e).lower():
-            api_logger.warning(f"Insufficient data for {operation}: {error_context}")
-            return fail(BizCode.INSUFFICIENT_DATA, "数据不足，无法进行分析", str(e))
-        else:
-            api_logger.warning(f"Invalid parameters for {operation}: {error_context}")
-            return fail(BizCode.INVALID_FILTER_PARAMS, "无效的参数", str(e))
-    
-    elif isinstance(e, KeyError):
-        api_logger.warning(f"Missing required data for {operation}: {error_context}")
-        return fail(BizCode.INSUFFICIENT_DATA, "缺少必要的数据", str(e))
-    
-    elif isinstance(e, (ConnectionError, TimeoutError)):
-        api_logger.error(f"Service unavailable for {operation}: {error_context}")
-        return fail(BizCode.SERVICE_UNAVAILABLE, "服务暂时不可用", str(e))
-    
-    elif "analysis" in str(e).lower() or "llm" in str(e).lower():
-        api_logger.error(f"Analysis failed for {operation}: {error_context}", exc_info=True)
-        return fail(BizCode.ANALYSIS_FAILED, "分析处理失败", str(e))
-    
-    elif "storage" in str(e).lower() or "database" in str(e).lower():
-        api_logger.error(f"Storage error for {operation}: {error_context}", exc_info=True)
-        return fail(BizCode.PROFILE_STORAGE_ERROR, "数据存储失败", str(e))
-    
-    else:
-        api_logger.error(f"Unexpected error for {operation}: {error_context}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, f"{operation}失败", str(e))
-
-
-def validate_user_id(user_id: str) -> None:
-    """
-    Validate user ID format and constraints.
-    
-    Args:
-        user_id: User ID to validate
-        
-    Raises:
-        ValueError: If user ID is invalid
-    """
-    if not user_id or not user_id.strip():
-        raise ValueError("User ID cannot be empty")
-    
-    if len(user_id.strip()) < 1:
-        raise ValueError("User ID is too short")
-
-
-def validate_date_range(start_date: Optional[datetime], end_date: Optional[datetime]) -> None:
-    """
-    Validate date range parameters.
-    
-    Args:
-        start_date: Start date
-        end_date: End date
-        
-    Raises:
-        ValueError: If date range is invalid
-    """
-    if (start_date and not end_date) or (end_date and not start_date):
-        raise ValueError("Both start_date and end_date must be provided together")
-    
-    if start_date and end_date and start_date >= end_date:
-        raise ValueError("start_date must be before end_date")
-    
-    if start_date and start_date > datetime.now():
-        raise ValueError("start_date cannot be in the future")
-
-
-def validate_confidence_threshold(threshold: float) -> None:
-    """
-    Validate confidence threshold parameter.
-    
-    Args:
-        threshold: Confidence threshold to validate
-        
-    Raises:
-        ValueError: If threshold is invalid
-    """
-    if not 0.0 <= threshold <= 1.0:
-        raise ValueError("confidence_threshold must be between 0.0 and 1.0")
-
-
-@router.get("/check-data/{end_user_id}", response_model=ApiResponse)
-@cur_workspace_access_guard()
-async def check_user_data_exists(
-    end_user_id: str,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-) -> ApiResponse:
-    """
-    检查用户画像数据是否存在
-    
-    Args:
-        end_user_id: 目标用户ID
-        
-    Returns:
-        数据存在状态
-    """
-    api_logger.info(f"检查用户画像数据是否存在: {end_user_id}")
-    
-    try:
-        # Validate inputs
-        validate_user_id(end_user_id)
-        
-        # Create service with user-specific config
-        service = ImplicitMemoryService(db=db, end_user_id=end_user_id)
-        
-        # Get cached profile
-        cached_profile = await service.get_cached_profile(end_user_id=end_user_id, db=db)
-        
-        if cached_profile is None:
-            api_logger.info(f"用户 {end_user_id} 的画像数据不存在")
-            return success(
-                data={"exists": False},
-                msg="画像数据不存在，请点击右上角刷新进行初始化"
-            )
-        
-        api_logger.info(f"用户 {end_user_id} 的画像数据存在")
-        return success(data={"exists": True}, msg="画像数据已存在")
-        
-    except Exception as e:
-        return handle_implicit_memory_error(e, "检查画像数据", end_user_id)
-
-
-@router.get("/preferences/{end_user_id}", response_model=ApiResponse)
-@cur_workspace_access_guard()
-async def get_preference_tags(
-    end_user_id: str,
-    confidence_threshold: float = Query(0.5, ge=0.0, le=1.0, description="Minimum confidence threshold"),
-    tag_category: Optional[str] = Query(None, description="Filter by tag category"),
-    start_date: Optional[datetime] = Query(None, description="Filter start date"),
-    end_date: Optional[datetime] = Query(None, description="Filter end date"),
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-) -> ApiResponse:
-    """
-    Get user preference tags from cache.
-    
-    Args:
-        end_user_id: Target end user ID
-        confidence_threshold: Minimum confidence score (0.0-1.0)
-        tag_category: Optional category filter
-        start_date: Optional start date filter
-        end_date: Optional end date filter
-        
-    Returns:
-        List of preference tags from cache
-    """
-    api_logger.info(f"Preference tags requested for user: {end_user_id} (from cache)")
-    
-    try:
-        # Validate inputs
-        validate_user_id(end_user_id)
-        
-        # Create service with user-specific config
-        service = ImplicitMemoryService(db=db, end_user_id=end_user_id)
-        
-        # Get cached profile
-        cached_profile = await service.get_cached_profile(end_user_id=end_user_id, db=db)
-        
-        if cached_profile is None:
-            api_logger.info(f"用户 {end_user_id} 的画像数据不存在")
-            return fail(BizCode.NOT_FOUND, "", "")
-        
-        # Extract preferences from cache
-        preferences = cached_profile.get("preferences", [])
-        
-        # Apply filters (client-side filtering on cached data)
-        filtered_preferences = []
-        for pref in preferences:
-            # Filter by confidence threshold
-            if confidence_threshold is not None and pref.get("confidence_score", 0) < confidence_threshold:
-                continue
-            
-            # Filter by category if specified
-            if tag_category and pref.get("category") != tag_category:
-                continue
-            
-            # Filter by date range if specified
-            if start_date or end_date:
-                created_at_ts = pref.get("created_at")
-                if created_at_ts:
-                    created_at = datetime.fromtimestamp(created_at_ts / 1000)
-                    if start_date and created_at < start_date:
-                        continue
-                    if end_date and created_at > end_date:
-                        continue
-            
-            filtered_preferences.append(pref)
-        
-        api_logger.info(f"Retrieved {len(filtered_preferences)} preference tags for user: {end_user_id} (from cache)")
-        return success(data=filtered_preferences, msg="偏好标签获取成功（缓存）")
-        
-    except Exception as e:
-        return handle_implicit_memory_error(e, "偏好标签获取", end_user_id)
-
-
-@router.get("/portrait/{end_user_id}", response_model=ApiResponse)
-@cur_workspace_access_guard()
-async def get_dimension_portrait(
-    end_user_id: str,
-    include_history: bool = Query(False, description="Include historical trends"),
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-) -> ApiResponse:
-    """
-    Get user's four-dimension personality portrait from cache.
-    
-    Args:
-        end_user_id: Target end user ID
-        include_history: Whether to include historical trend data (ignored for cached data)
-        
-    Returns:
-        Four-dimension personality portrait from cache
-    """
-    api_logger.info(f"Dimension portrait requested for user: {end_user_id} (from cache)")
-    
-    try:
-        # Validate inputs
-        validate_user_id(end_user_id)
-        
-        # Create service with user-specific config
-        service = ImplicitMemoryService(db=db, end_user_id=end_user_id)
-        
-        # Get cached profile
-        cached_profile = await service.get_cached_profile(end_user_id=end_user_id, db=db)
-        
-        if cached_profile is None:
-            api_logger.info(f"用户 {end_user_id} 的画像数据不存在")
-            return fail(BizCode.NOT_FOUND, "", "")
-        
-        # Extract portrait from cache
-        portrait = cached_profile.get("portrait", {})
-        
-        api_logger.info(f"Dimension portrait retrieved for user: {end_user_id} (from cache)")
-        return success(data=portrait, msg="四维画像获取成功（缓存）")
-        
-    except Exception as e:
-        return handle_implicit_memory_error(e, "四维画像获取", end_user_id)
-
-
-@router.get("/interest-areas/{end_user_id}", response_model=ApiResponse)
-@cur_workspace_access_guard()
-async def get_interest_area_distribution(
-    end_user_id: str,
-    include_trends: bool = Query(False, description="Include trend analysis"),
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-) -> ApiResponse:
-    """
-    Get user's interest area distribution from cache.
-    
-    Args:
-        end_user_id: Target end user ID
-        include_trends: Whether to include trend analysis data (ignored for cached data)
-        
-    Returns:
-        Interest area distribution from cache
-    """
-    api_logger.info(f"Interest area distribution requested for user: {end_user_id} (from cache)")
-    
-    try:
-        # Validate inputs
-        validate_user_id(end_user_id)
-        
-        # Create service with user-specific config
-        service = ImplicitMemoryService(db=db, end_user_id=end_user_id)
-        
-        # Get cached profile
-        cached_profile = await service.get_cached_profile(end_user_id=end_user_id, db=db)
-        
-        if cached_profile is None:
-            api_logger.info(f"用户 {end_user_id} 的画像数据不存在")
-            return fail(BizCode.NOT_FOUND, "", "")
-        
-        # Extract interest areas from cache
-        interest_areas = cached_profile.get("interest_areas", {})
-        
-        api_logger.info(f"Interest area distribution retrieved for user: {end_user_id} (from cache)")
-        return success(data=interest_areas, msg="兴趣领域分布获取成功（缓存）")
-        
-    except Exception as e:
-        return handle_implicit_memory_error(e, "兴趣领域分布获取", end_user_id)
-
-
-@router.get("/habits/{end_user_id}", response_model=ApiResponse)
-@cur_workspace_access_guard()
-async def get_behavior_habits(
-    end_user_id: str,
-    confidence_level: Optional[str] = Query(None, regex="^(high|medium|low)$", description="Filter by confidence level"),
-    frequency_pattern: Optional[str] = Query(None, regex="^(daily|weekly|monthly|seasonal|occasional|event_triggered)$", description="Filter by frequency pattern"),
-    time_period: Optional[str] = Query(None, regex="^(current|past)$", description="Filter by time period"),
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-) -> ApiResponse:
-    """
-    Get user's behavioral habits from cache.
-    
-    Args:
-        end_user_id: Target end user ID
-        confidence_level: Filter by confidence level (high, medium, low)
-        frequency_pattern: Filter by frequency pattern (daily, weekly, monthly, seasonal, occasional, event_triggered)
-        time_period: Filter by time period (current, past)
-        
-    Returns:
-        List of behavioral habits from cache
-    """
-    api_logger.info(f"Behavior habits requested for user: {end_user_id} (from cache)")
-    
-    try:
-        # Validate inputs
-        validate_user_id(end_user_id)
-        
-        # Create service with user-specific config
-        service = ImplicitMemoryService(db=db, end_user_id=end_user_id)
-        
-        # Get cached profile
-        cached_profile = await service.get_cached_profile(end_user_id=end_user_id, db=db)
-        
-        if cached_profile is None:
-            api_logger.info(f"用户 {end_user_id} 的画像数据不存在")
-            return fail(BizCode.NOT_FOUND, "", "")
-        
-        # Extract habits from cache
-        habits = cached_profile.get("habits", [])
-        
-        # Apply filters (client-side filtering on cached data)
-        filtered_habits = []
-        for habit in habits:
-            # Filter by confidence level
-            if confidence_level:
-                confidence_mapping = {
-                    "high": 85,
-                    "medium": 50,
-                    "low": 20
-                }
-                numerical_confidence = confidence_mapping.get(confidence_level.lower())
-                if habit.get("confidence_level", 0) < numerical_confidence:
-                    continue
-            
-            # Filter by frequency pattern
-            if frequency_pattern and habit.get("frequency_pattern") != frequency_pattern:
-                continue
-            
-            # Filter by time period
-            if time_period:
-                is_current = habit.get("is_current", True)
-                if time_period.lower() == "current" and not is_current:
-                    continue
-                elif time_period.lower() == "past" and is_current:
-                    continue
-            
-            filtered_habits.append(habit)
-        
-        api_logger.info(f"Retrieved {len(filtered_habits)} behavior habits for user: {end_user_id} (from cache)")
-        return success(data=filtered_habits, msg="行为习惯获取成功（缓存）")
-        
-    except Exception as e:
-        return handle_implicit_memory_error(e, "行为习惯获取", end_user_id)
-
-
-
-
-
-@router.post("/generate_profile", response_model=ApiResponse)
-@cur_workspace_access_guard()
-async def generate_implicit_memory_profile(
-    request: GenerateProfileRequest,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-) -> ApiResponse:
-    """
-    Generate complete user profile (all 4 modules) and cache it.
-    
-    Args:
-        request: Generate profile request with end_user_id
-        db: Database session
-        current_user: Current authenticated user
-        
-    Returns:
-        Complete user profile with all modules
-    """
-    end_user_id = request.end_user_id
-    api_logger.info(f"Generate profile requested for user: {end_user_id}")
-    
-    try:
-        # Validate inputs
-        validate_user_id(end_user_id)
-        
-        # Create service with user-specific config
-        service = ImplicitMemoryService(db=db, end_user_id=end_user_id)
-        
-        # Generate complete profile (calls LLM for all 4 modules)
-        api_logger.info(f"开始生成完整用户画像: user={end_user_id}")
-        profile_data = await service.generate_complete_profile(user_id=end_user_id)
-        
-        # Save to cache
-        await service.save_profile_cache(
-            end_user_id=end_user_id,
-            profile_data=profile_data,
-            db=db,
-            expires_hours=168  # 7 days
-        )
-        
-        api_logger.info(f"用户画像生成并缓存成功: user={end_user_id}")
-        
-        # Add metadata
-        profile_data["end_user_id"] = end_user_id
-        profile_data["cached"] = False
-        
-        return success(data=profile_data, msg="用户画像生成成功")
-        
-    except Exception as e:
-        api_logger.error(f"生成用户画像失败: user={end_user_id}, error={str(e)}", exc_info=True)
-        return handle_implicit_memory_error(e, "用户画像生成", end_user_id)
--- a/api/app/controllers/knowledge_controller.py
+++ b/api/app/controllers/knowledge_controller.py
@@ -1,32 +1,26 @@
+from typing import Optional
 import datetime
 import json
-from typing import Optional
 import uuid
-
 from fastapi import APIRouter, Depends, HTTPException, status, Query
-from fastapi.encoders import jsonable_encoder
 from sqlalchemy import or_
 from sqlalchemy.orm import Session

-from app.celery_app import celery_app
-from app.core.error_codes import BizCode
-from app.core.logging_config import get_api_logger
-from app.core.rag.common import settings
-from app.core.rag.integrations.feishu.client import FeishuAPIClient
-from app.core.rag.integrations.yuque.client import YuqueAPIClient
-from app.core.rag.llm.chat_model import Base
-from app.core.rag.nlp import rag_tokenizer, search
-from app.core.rag.prompts.generator import graph_entity_types
-from app.core.rag.vdb.elasticsearch.elasticsearch_vector import ElasticSearchVectorFactory
-from app.core.response_utils import success, fail
 from app.db import get_db
 from app.dependencies import get_current_user
-from app.models import knowledge_model
 from app.models.user_model import User
+from app.models import knowledge_model, document_model, file_model
 from app.schemas import knowledge_schema
 from app.schemas.response_schema import ApiResponse
+from app.core.response_utils import success
 from app.services import knowledge_service, document_service
-from app.services.model_service import ModelConfigService
+from app.core.rag.llm.chat_model import Base
+from app.core.rag.prompts.generator import graph_entity_types
+from app.core.rag.vdb.elasticsearch.elasticsearch_vector import ElasticSearchVectorFactory
+from app.core.logging_config import get_api_logger
+from app.core.rag.nlp import rag_tokenizer, search
+from app.core.rag.common import settings
+from app.celery_app import celery_app

 # Obtain a dedicated API logger
 api_logger = get_api_logger()
@@ -53,45 +47,6 @@ def get_parser_types():
    return success(msg="Successfully obtained the knowledge parser type", data=list(knowledge_model.ParserType))


-@router.get("/knowledge_graph_entity_types", response_model=ApiResponse)
-async def get_knowledge_graph_entity_types(
-        llm_id: uuid.UUID,
-        scenario: str,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    get knowledge graph entity types based on llm_id
-    """
-    api_logger.info(f"Obtain details of the knowledge graph: llm_id={llm_id}, username: {current_user.username}")
-
-    try:
-        # 1. Check whether the model exists
-        api_logger.debug(f"Check whether the model exists: {llm_id}")
-        config = ModelConfigService.get_model_by_id(db=db, model_id=llm_id)
-
-        if not config:
-            api_logger.warning(
-                f"The model does not exist or you do not have permission to access it: llm_id={llm_id}")
-            raise HTTPException(
-                status_code=status.HTTP_404_NOT_FOUND,
-                detail="The model does not exist or you do not have permission to access it"
-            )
-        # 2. Prepare to configure chat_mdl information
-        chat_model = Base(
-            key=config.api_keys[0].api_key,
-            model_name=config.api_keys[0].model_name,
-            base_url=config.api_keys[0].api_base
-        )
-        response = graph_entity_types(chat_model, scenario)
-        return success(data=response, msg="Successfully obtained knowledge graph entity types")
-    except HTTPException:
-        raise
-    except Exception as e:
-        api_logger.error(f"get knowledge graph entity types failed: llm_id={llm_id} - {str(e)}")
-        raise
-
-
@router.get("/knowledges", response_model=ApiResponse)
 async def get_knowledges(
        parent_id: Optional[uuid.UUID] = Query(None, description="parent folder id"),
@@ -175,7 +130,7 @@ async def get_knowledges(
            "has_next": True if page*pagesize < total else False
        }
    }
-    return success(data=jsonable_encoder(result), msg="Query of knowledge base list successful")
+    return success(data=result, msg="Query of knowledge base list successful")


@router.post("/knowledge", response_model=ApiResponse)
@@ -201,7 +156,7 @@ async def create_knowledge(
            )
        db_knowledge = knowledge_service.create_knowledge(db=db, knowledge=create_data, current_user=current_user)
        api_logger.info(f"The knowledge base has been successfully created: {db_knowledge.name} (ID: {db_knowledge.id})")
-        return success(data=jsonable_encoder(knowledge_schema.Knowledge.model_validate(db_knowledge)), msg="The knowledge base has been successfully created")
+        return success(data=knowledge_schema.Knowledge.model_validate(db_knowledge), msg="The knowledge base has been successfully created")
    except Exception as e:
        api_logger.error(f"The creation of the knowledge base failed: {create_data.name} - {str(e)}")
        raise
@@ -230,7 +185,7 @@ async def get_knowledge(
            )
        
        api_logger.info(f"Knowledge base query successful: {db_knowledge.name} (ID: {db_knowledge.id})")
-        return success(data=jsonable_encoder(knowledge_schema.Knowledge.model_validate(db_knowledge)), msg="Successfully obtained knowledge base information")
+        return success(data=knowledge_schema.Knowledge.model_validate(db_knowledge), msg="Successfully obtained knowledge base information")
    except HTTPException:
        raise
    except Exception as e:
@@ -247,7 +202,7 @@ async def update_knowledge(
 ):
    api_logger.info(f"Update knowledge base request: knowledge_id={knowledge_id}, username: {current_user.username}")
    db_knowledge = await _update_knowledge(knowledge_id=knowledge_id, update_data=update_data, db=db, current_user=current_user)
-    return success(data=jsonable_encoder(knowledge_schema.Knowledge.model_validate(db_knowledge)), msg="The knowledge base information has been successfully updated")
+    return success(data=knowledge_schema.Knowledge.model_validate(db_knowledge), msg="The knowledge base information has been successfully updated")


 async def _update_knowledge(
@@ -352,7 +307,6 @@ async def delete_knowledge(
        # 2. Soft-delete knowledge base
        api_logger.debug(f"Perform a soft delete: {db_knowledge.name} (ID: {knowledge_id})")
        db_knowledge.status = 2
-        db_knowledge.updated_at = datetime.datetime.now()
        db.commit()
        api_logger.info(f"The knowledge base has been successfully deleted: {db_knowledge.name} (ID: {knowledge_id})")
        return success(msg="The knowledge base has been successfully deleted")
@@ -425,7 +379,7 @@ async def delete_knowledge_graph(
        current_user: User = Depends(get_current_user)
 ):
    """
-    delete knowledge graph
+    Soft-delete knowledge graph
    """
    api_logger.info(f"Request to delete knowledge graph: knowledge_id={knowledge_id}, username: {current_user.username}")

@@ -490,97 +444,40 @@ async def rebuild_knowledge_graph(
        raise


-@router.get("/check/yuque/auth", response_model=ApiResponse)
-async def check_yuque_auth(
-        yuque_user_id: str,
-        yuque_token: str,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    check yuque auth info
-    """
-    api_logger.info(f"check yuque auth info, username: {current_user.username}")
-
-    try:
-        api_client = YuqueAPIClient(
-            user_id=yuque_user_id,
-            token=yuque_token
-        )
-        async with api_client as client:
-            repos = await client.get_user_repos()
-            if repos:
-                return success(msg="Successfully auth yuque info")
-        return fail(BizCode.UNAUTHORIZED, msg="auth yuque info failed", error="user_id or token is incorrect")
-    except HTTPException:
-        raise
-    except Exception as e:
-        api_logger.error(f"auth yuque info failed: {str(e)}")
-        raise
-
-
-@router.get("/check/feishu/auth", response_model=ApiResponse)
-async def check_feishu_auth(
-        feishu_app_id: str,
-        feishu_app_secret: str,
-        feishu_folder_token: str,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    check feishu auth info
-    """
-    api_logger.info(f"check feishu auth info, username: {current_user.username}")
-
-    try:
-        api_client = FeishuAPIClient(
-            app_id=feishu_app_id,
-            app_secret=feishu_app_secret
-        )
-        async with api_client as client:
-            files = await client.list_all_folder_files(feishu_folder_token, recursive=True)
-            if files:
-                return success(msg="Successfully auth feishu info")
-        return fail(BizCode.UNAUTHORIZED, msg="auth feishu info failed", error="app_id or app_secret or feishu_folder_token is incorrect")
-    except HTTPException:
-        raise
-    except Exception as e:
-        api_logger.error(f"auth feishu info failed: {str(e)}")
-        raise
-
-
-@router.post("/{knowledge_id}/sync", response_model=ApiResponse)
-async def sync_knowledge(
+@router.get("/{knowledge_id}/knowledge_graph_entity_types", response_model=ApiResponse)
+async def get_knowledge_graph_entity_types(
        knowledge_id: uuid.UUID,
+        scenario: str,
        db: Session = Depends(get_db),
        current_user: User = Depends(get_current_user)
 ):
    """
-    sync knowledge base information based on knowledge_id
+    get knowledge graph entity types based on knowledge_id
    """
-    api_logger.info(f"Obtain details of the knowledge base: knowledge_id={knowledge_id}, username: {current_user.username}")
+    api_logger.info(f"Obtain details of the knowledge graph: knowledge_id={knowledge_id}, username: {current_user.username}")

    try:
-        # 1. Query knowledge base information from the database
-        api_logger.debug(f"Query knowledge base: {knowledge_id}")
+        # 1. Check whether the knowledge base exists
+        api_logger.debug(f"Check whether the knowledge base exists: {knowledge_id}")
        db_knowledge = knowledge_service.get_knowledge_by_id(db, knowledge_id=knowledge_id, current_user=current_user)
+
        if not db_knowledge:
-            api_logger.warning(f"The knowledge base does not exist or access is denied: knowledge_id={knowledge_id}")
+            api_logger.warning(
+                f"The knowledge base does not exist or you do not have permission to access it: knowledge_id={knowledge_id}")
            raise HTTPException(
                status_code=status.HTTP_404_NOT_FOUND,
-                detail="The knowledge base does not exist or access is denied"
+                detail="The knowledge base does not exist or you do not have permission to access it"
            )
-
-        # 2. sync knowledge
-        # from app.tasks import sync_knowledge_for_kb
-        # sync_knowledge_for_kb(kb_id)
-        task = celery_app.send_task("app.core.rag.tasks.sync_knowledge_for_kb", args=[knowledge_id])
-        result = {
-             "task_id": task.id
-        }
-        return success(data=result, msg="Task accepted. sync knowledge is being processed in the background.")
+        # 2. Prepare to configure chat_mdl information
+        chat_model = Base(
+            key=db_knowledge.llm.api_keys[0].api_key,
+            model_name=db_knowledge.llm.api_keys[0].model_name,
+            base_url=db_knowledge.llm.api_keys[0].api_base
+        )
+        response = graph_entity_types(chat_model, scenario)
+        return success(data=response, msg="Successfully obtained knowledge graph entity types")
    except HTTPException:
        raise
    except Exception as e:
-        api_logger.error(f"Failed to sync knowledge: knowledge_id={knowledge_id} - {str(e)}")
+        api_logger.error(f"get knowledge graph entity types failed: knowledge_id={knowledge_id} - {str(e)}")
        raise
--- a/api/app/controllers/mcp_market_config_controller.py
+++ b/api/app/controllers/mcp_market_config_controller.py
@@ -1,474 +0,0 @@
-import datetime
-import json
-from typing import Optional
-import uuid
-
-from fastapi import APIRouter, Depends, HTTPException, status, Query
-from fastapi.encoders import jsonable_encoder
-import requests
-from sqlalchemy import or_
-from sqlalchemy.orm import Session
-from modelscope.hub.errors import raise_for_http_status
-from modelscope.hub.mcp_api import MCPApi
-
-from app.core.logging_config import get_api_logger
-from app.core.response_utils import success, fail
-from app.db import get_db
-from app.dependencies import get_current_user
-from app.models import mcp_market_config_model
-from app.models.user_model import User
-from app.schemas import mcp_market_config_schema
-from app.schemas.response_schema import ApiResponse
-from app.services import mcp_market_config_service, mcp_market_service
-
-# Obtain a dedicated API logger
-api_logger = get_api_logger()
-
-router = APIRouter(
-    prefix="/mcp_market_configs",
-    tags=["mcp_market_configs"],
-    dependencies=[Depends(get_current_user)]  # Apply auth to all routes in this controller
-)
-
-
-@router.get("/mcp_servers", response_model=ApiResponse)
-async def get_mcp_servers(
-        mcp_market_config_id: uuid.UUID,
-        page: int = Query(1, gt=0),  # Default: 1, which must be greater than 0
-        pagesize: int = Query(20, gt=0, le=100),  # Default: 20 items per page, maximum: 100 items
-        keywords: Optional[str] = Query(None, description="Search keywords (Optional search query string,e.g. Chinese service name, English service name, author/owner username)"),
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    Query the mcp servers list in pages
-    - Support keyword search for name,author,owner
-    - Return paging metadata + mcp server list
-    """
-    api_logger.info(
-        f"Query mcp server list: tenant_id={current_user.tenant_id}, page={page}, pagesize={pagesize}, keywords={keywords}, username: {current_user.username}")
-
-    # 1. parameter validation
-    if page < 1 or pagesize < 1:
-        api_logger.warning(f"Error in paging parameters: page={page}, pagesize={pagesize}")
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail="The paging parameter must be greater than 0"
-        )
-    if page * pagesize > 100:
-        api_logger.warning(f"Paging parameters exceed ModelScope limit: page={page}, pagesize={pagesize}")
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail=f"The maximum number of MCP services can view is 100. Please visit the ModelScope MCP Plaza."
-        )
-
-    # 2. Query mcp market config information from the database
-    api_logger.debug(f"Query mcp market config: {mcp_market_config_id}")
-    db_mcp_market_config = mcp_market_config_service.get_mcp_market_config_by_id(db,
-                                                                                 mcp_market_config_id=mcp_market_config_id,
-                                                                                 current_user=current_user)
-    if not db_mcp_market_config:
-        api_logger.warning(
-            f"The mcp market config does not exist or access is denied: mcp_market_config_id={mcp_market_config_id}")
-        return success(msg='The mcp market config does not exist or access is denied')
-
-    # 3. Execute paged query
-    token = db_mcp_market_config.token
-    if not token:
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail="MCP market config token is not configured"
-        )
-    api = MCPApi()
-    api.login(token)
-
-    body = {
-        'filter': {},
-        'page_number': page,
-        'page_size': pagesize,
-        'search': keywords
-    }
-
-    try:
-        cookies = api.get_cookies(token)
-        headers=api.builder_headers(api.headers)
-        headers['Authorization'] = f'Bearer {token}'
-        r = api.session.put(
-            url=api.mcp_base_url,
-            headers=headers,
-            json=body,
-            cookies=cookies)
-        raise_for_http_status(r)
-    except requests.exceptions.RequestException as e:
-        api_logger.error(f"Failed to get MCP servers: {str(e)}")
-        raise HTTPException(
-            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-            detail=f"Failed to get MCP servers: {str(e)}"
-        )
-
-    data = api._handle_response(r)
-    total = data.get('total_count', 0)
-    mcp_server_list = data.get('mcp_server_list', [])
-    # items = [{
-    #     'name': item.get('name', ''),
-    #     'id': item.get('id', ''),
-    #     'description': item.get('description', '')
-    # } for item in mcp_server_list]
-
-    # 4. Return structured response
-    result = {
-        "items": mcp_server_list,
-        "page": {
-            "page": page,
-            "pagesize": pagesize,
-            "total": total,
-            "has_next": True if page * pagesize < total else False
-        }
-    }
-    # 5. Update mck_market.mcp_count
-    db_mcp_market = mcp_market_service.get_mcp_market_by_id(db, mcp_market_id=db_mcp_market_config.mcp_market_id, current_user=current_user)
-    if not db_mcp_market:
-        api_logger.warning(f"The mcp market does not exist or access is denied: mcp_market_id={db_mcp_market_config.mcp_market_id}")
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail="The mcp market does not exist or access is denied"
-        )
-    db_mcp_market.mcp_count = total
-    db.commit()
-    db.refresh(db_mcp_market)
-    return success(data=result, msg="Query of mcp servers list successful")
-
-
-@router.get("/operational_mcp_servers", response_model=ApiResponse)
-async def get_operational_mcp_servers(
-        mcp_market_config_id: uuid.UUID,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    Query the operational mcp servers list in pages
-    - Support keyword search for name,author,owner
-    - Return paging metadata + operational mcp server list
-    """
-    api_logger.info(
-        f"Query operational mcp server list: tenant_id={current_user.tenant_id}, username: {current_user.username}")
-
-    # 1. Query mcp market config information from the database
-    api_logger.debug(f"Query mcp market config: {mcp_market_config_id}")
-    db_mcp_market_config = mcp_market_config_service.get_mcp_market_config_by_id(db,
-                                                                                 mcp_market_config_id=mcp_market_config_id,
-                                                                                 current_user=current_user)
-    if not db_mcp_market_config:
-        api_logger.warning(
-            f"The mcp market config does not exist or access is denied: mcp_market_config_id={mcp_market_config_id}")
-        return success(msg='The mcp market config does not exist or access is denied')
-
-    # 2. Execute paged query
-    token = db_mcp_market_config.token
-    if not token:
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail="MCP market config token is not configured"
-        )
-    api = MCPApi()
-    api.login(token)
-
-    url = f'{api.mcp_base_url}/operational'
-    headers = api.builder_headers(api.headers)
-    headers['Authorization'] = f'Bearer {token}'
-
-    try:
-        cookies = api.get_cookies(access_token=token, cookies_required=True)
-        r = api.session.get(url, headers=headers, cookies=cookies)
-        raise_for_http_status(r)
-    except requests.exceptions.RequestException as e:
-        api_logger.error(f"Failed to get operational MCP servers: {str(e)}")
-        raise HTTPException(
-            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-            detail=f"Failed to get operational MCP servers: {str(e)}"
-        )
-
-    data = api._handle_response(r)
-    total = data.get('total_count', 0)
-    mcp_server_list = data.get('mcp_server_list', [])
-    # items = [{
-    #     'name': item.get('name', ''),
-    #     'id': item.get('id', ''),
-    #     'description': item.get('description', '')
-    # } for item in mcp_server_list]
-
-    # 3. Return structured response
-    return success(data=mcp_server_list, msg="Query of operational mcp servers list successful")
-
-
-@router.get("/mcp_server", response_model=ApiResponse)
-async def get_mcp_server(
-        mcp_market_config_id: uuid.UUID,
-        server_id: str,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    Get detailed information for a specific MCP Server
-    """
-    api_logger.info(
-        f"Query mcp server: tenant_id={current_user.tenant_id}, mcp_market_config_id={mcp_market_config_id}, server_id={server_id}, username: {current_user.username}")
-
-    # 1. Query mcp market config information from the database
-    api_logger.debug(f"Query mcp market config: {mcp_market_config_id}")
-    db_mcp_market_config = mcp_market_config_service.get_mcp_market_config_by_id(db,
-                                                                                 mcp_market_config_id=mcp_market_config_id,
-                                                                                 current_user=current_user)
-    if not db_mcp_market_config:
-        api_logger.warning(
-            f"The mcp market config does not exist or access is denied: mcp_market_config_id={mcp_market_config_id}")
-        return success(msg='The mcp market config does not exist or access is denied')
-
-    # 2. Get detailed information for a specific MCP Server
-    token = db_mcp_market_config.token
-    if not token:
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail="MCP market config token is not configured"
-        )
-    api = MCPApi()
-    api.login(token)
-
-    result = api.get_mcp_server(server_id=server_id)
-    return success(data=result, msg="Query of mcp servers list successful")
-
-
-@router.post("/mcp_market_config", response_model=ApiResponse)
-async def create_mcp_market_config(
-        create_data: mcp_market_config_schema.McpMarketConfigCreate,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    create mcp market config
-    """
-    api_logger.info(
-        f"Request to create a mcp market config: mcp_market_id={create_data.mcp_market_id}, tenant_id={current_user.tenant_id}, username: {current_user.username}")
-
-    try:
-        api_logger.debug(f"Start creating the mcp market config: {create_data.mcp_market_id}")
-        # 1. Validate token can access ModelScope MCP market
-        if not create_data.token:
-            raise HTTPException(
-                status_code=status.HTTP_400_BAD_REQUEST,
-                detail="Token is required to access ModelScope MCP market"
-            )
-        try:
-            api = MCPApi()
-            api.login(create_data.token)
-            body = {'filter': {}, 'page_number': 1, 'page_size': 1, 'search': None}
-            cookies = api.get_cookies(create_data.token)
-            headers = api.builder_headers(api.headers)
-            headers['Authorization'] = f'Bearer {create_data.token}'
-            r = api.session.put(url=api.mcp_base_url, headers=headers, json=body, cookies=cookies)
-            raise_for_http_status(r)
-        except Exception as e:
-            api_logger.warning(f"Token validation failed for ModelScope MCP market: {str(e)}")
-            raise HTTPException(
-                status_code=status.HTTP_400_BAD_REQUEST,
-                detail=f"Unable to access ModelScope MCP market with the provided token: {str(e)}"
-            )
-        # 2. Check if the mcp market name already exists
-        db_mcp_market_config_exist = mcp_market_config_service.get_mcp_market_config_by_mcp_market_id(db, mcp_market_id=create_data.mcp_market_id, current_user=current_user)
-        if db_mcp_market_config_exist:
-            api_logger.warning(f"The mcp market id already exists: {create_data.mcp_market_id}")
-            raise HTTPException(
-                status_code=status.HTTP_400_BAD_REQUEST,
-                detail=f"The mcp market id already exists: {create_data.mcp_market_id}"
-            )
-        # 2. verify token
-        create_data.status = 1
-        try:
-            api = MCPApi()
-            token = create_data.token
-            api.login(token)
-
-            body = {
-                'filter': {},
-                'page_number': 1,
-                'page_size': 20,
-                'search': ""
-            }
-            cookies = api.get_cookies(token)
-            headers = api.builder_headers(api.headers)
-            headers['Authorization'] = f'Bearer {token}'
-            r = api.session.put(
-                url=api.mcp_base_url,
-                headers=headers,
-                json=body,
-                cookies=cookies)
-            raise_for_http_status(r)
-        except requests.exceptions.RequestException as e:
-            api_logger.error(f"Failed to get MCP servers: {str(e)}")
-            create_data.status = 0
-        # 3. create mcp_market_config
-        db_mcp_market_config = mcp_market_config_service.create_mcp_market_config(db=db, mcp_market_config=create_data, current_user=current_user)
-        api_logger.info(
-            f"The mcp market config has been successfully created: (ID: {db_mcp_market_config.id})")
-        return success(data=jsonable_encoder(mcp_market_config_schema.McpMarketConfig.model_validate(db_mcp_market_config)),
-                       msg="The mcp market config has been successfully created")
-    except Exception as e:
-        api_logger.error(f"The creation of the mcp market config failed: {create_data.mcp_market_id} - {str(e)}")
-        raise
-
-
-@router.get("/{mcp_market_config_id}", response_model=ApiResponse)
-async def get_mcp_market_config(
-        mcp_market_config_id: uuid.UUID,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    Retrieve mcp market config information based on mcp_market_config_id
-    """
-    api_logger.info(
-        f"Obtain details of the mcp market config: mcp_market_config_id={mcp_market_config_id}, username: {current_user.username}")
-
-    try:
-        # 1. Query mcp market config information from the database
-        api_logger.debug(f"Query mcp market config: {mcp_market_config_id}")
-        db_mcp_market_config = mcp_market_config_service.get_mcp_market_config_by_id(db, mcp_market_config_id=mcp_market_config_id, current_user=current_user)
-        if not db_mcp_market_config:
-            api_logger.warning(f"The mcp market config does not exist or access is denied: mcp_market_config_id={mcp_market_config_id}")
-            return success(msg='The mcp market config does not exist or access is denied')
-
-        api_logger.info(f"mcp market config query successful: (ID: {db_mcp_market_config.id})")
-        return success(data=jsonable_encoder(mcp_market_config_schema.McpMarketConfig.model_validate(db_mcp_market_config)),
-                       msg="Successfully obtained mcp market config information")
-    except HTTPException:
-        raise
-    except Exception as e:
-        api_logger.error(f"mcp market config query failed: mcp_market_config_id={mcp_market_config_id} - {str(e)}")
-        raise
-
-
-@router.get("/mcp_market_id/{mcp_market_id}", response_model=ApiResponse)
-async def get_mcp_market_config_by_mcp_market_id(
-        mcp_market_id: uuid.UUID,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    Retrieve mcp market config information based on mcp_market_id
-    """
-    api_logger.info(
-        f"Request to create a mcp market config: mcp_market_id={mcp_market_id}, tenant_id={current_user.tenant_id}, username: {current_user.username}")
-
-    try:
-        # 1. Query mcp market config information from the database
-        api_logger.debug(f"Query mcp market config: mcp_market_id={mcp_market_id}")
-        db_mcp_market_config = mcp_market_config_service.get_mcp_market_config_by_mcp_market_id(db, mcp_market_id=mcp_market_id, current_user=current_user)
-        if not db_mcp_market_config:
-            api_logger.warning(f"The mcp market config does not exist or access is denied: mcp_market_id={mcp_market_id}")
-            return success(msg='The mcp market config does not exist or access is denied')
-
-        api_logger.info(f"mcp market config query successful: (ID: {db_mcp_market_config.id})")
-        return success(data=jsonable_encoder(mcp_market_config_schema.McpMarketConfig.model_validate(db_mcp_market_config)),
-                       msg="Successfully obtained mcp market config information")
-    except HTTPException:
-        raise
-    except Exception as e:
-        api_logger.error(f"mcp market config query failed: mcp_market_id={mcp_market_id} - {str(e)}")
-        raise
-
-
-@router.put("/{mcp_market_config_id}", response_model=ApiResponse)
-async def update_mcp_market_config(
-        mcp_market_config_id: uuid.UUID,
-        update_data: mcp_market_config_schema.McpMarketConfigUpdate,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    # 1. Check if the mcp market config exists
-    api_logger.debug(f"Query the mcp market config to be updated: {mcp_market_config_id}")
-    db_mcp_market_config = mcp_market_config_service.get_mcp_market_config_by_id(db, mcp_market_config_id=mcp_market_config_id, current_user=current_user)
-
-    if not db_mcp_market_config:
-        api_logger.warning(
-            f"The mcp market config does not exist or you do not have permission to access it: mcp_market_config_id={mcp_market_config_id}")
-        return success(msg='The mcp market config does not exist or access is denied')
-
-    # 2. Validate new token if provided
-    if update_data.token is not None:
-        try:
-            api = MCPApi()
-            api.login(update_data.token)
-            body = {'filter': {}, 'page_number': 1, 'page_size': 1, 'search': None}
-            cookies = api.get_cookies(update_data.token)
-            headers = api.builder_headers(api.headers)
-            headers['Authorization'] = f'Bearer {update_data.token}'
-            r = api.session.put(url=api.mcp_base_url, headers=headers, json=body, cookies=cookies)
-            raise_for_http_status(r)
-        except Exception as e:
-            api_logger.warning(f"Token validation failed for ModelScope MCP market: {str(e)}")
-            raise HTTPException(
-                status_code=status.HTTP_400_BAD_REQUEST,
-                detail=f"Unable to access ModelScope MCP market with the provided token: {str(e)}"
-            )
-
-    # 3. Update fields (only update non-null fields)
-    api_logger.debug(f"Start updating the mcp market config fields: {mcp_market_config_id}")
-    update_dict = update_data.dict(exclude_unset=True)
-    updated_fields = []
-    for field, value in update_dict.items():
-        if hasattr(db_mcp_market_config, field):
-            old_value = getattr(db_mcp_market_config, field)
-            if old_value != value:
-                # update value
-                setattr(db_mcp_market_config, field, value)
-                updated_fields.append(f"{field}: {old_value} -> {value}")
-
-    if updated_fields:
-        api_logger.debug(f"updated fields: {', '.join(updated_fields)}")
-
-    # 4. Save to database
-    try:
-        db.commit()
-        db.refresh(db_mcp_market_config)
-        api_logger.info(f"The mcp market config has been successfully updated: (ID: {db_mcp_market_config.id})")
-    except Exception as e:
-        db.rollback()
-        api_logger.error(f"The mcp market config update failed: mcp_market_config_id={mcp_market_config_id} - {str(e)}")
-        raise HTTPException(
-            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-            detail=f"The mcp market config update failed: {str(e)}"
-        )
-
-    # 5. Return the updated mcp market config
-    return success(data=jsonable_encoder(mcp_market_config_schema.McpMarketConfig.model_validate(db_mcp_market_config)),
-                   msg="The mcp market config information updated successfully")
-
-
-@router.delete("/{mcp_market_config_id}", response_model=ApiResponse)
-async def delete_mcp_market_config(
-        mcp_market_config_id: uuid.UUID,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    delete mcp market config
-    """
-    api_logger.info(f"Request to delete mcp market config: mcp_market_config_id={mcp_market_config_id}, username: {current_user.username}")
-
-    try:
-        # 1. Check whether the mcp market config exists
-        api_logger.debug(f"Check whether the mcp market config exists: {mcp_market_config_id}")
-        db_mcp_market_config = mcp_market_config_service.get_mcp_market_config_by_id(db, mcp_market_config_id=mcp_market_config_id, current_user=current_user)
-
-        if not db_mcp_market_config:
-            api_logger.warning(
-                f"The mcp market config does not exist or you do not have permission to access it: mcp_market_config_id={mcp_market_config_id}")
-            return success(msg='The mcp market config does not exist or access is denied')
-
-        # 2. Deleting mcp market config
-        mcp_market_config_service.delete_mcp_market_config_by_id(db, mcp_market_config_id=mcp_market_config_id, current_user=current_user)
-        api_logger.info(f"The mcp market config has been successfully deleted: (ID: {mcp_market_config_id})")
-        return success(msg="The mcp market config has been successfully deleted")
-    except Exception as e:
-        api_logger.error(f"Failed to delete from the mcp market config: mcp_market_config_id={mcp_market_config_id} - {str(e)}")
-        raise
--- a/api/app/controllers/mcp_market_controller.py
+++ b/api/app/controllers/mcp_market_controller.py
@@ -1,262 +0,0 @@
-import datetime
-import json
-from typing import Optional
-import uuid
-
-from fastapi import APIRouter, Depends, HTTPException, status, Query
-from fastapi.encoders import jsonable_encoder
-from sqlalchemy import or_
-from sqlalchemy.orm import Session
-
-from app.core.logging_config import get_api_logger
-from app.core.response_utils import success, fail
-from app.db import get_db
-from app.dependencies import get_current_user
-from app.models import mcp_market_model
-from app.models.user_model import User
-from app.schemas import mcp_market_schema
-from app.schemas.response_schema import ApiResponse
-from app.services import mcp_market_service
-
-# Obtain a dedicated API logger
-api_logger = get_api_logger()
-
-router = APIRouter(
-    prefix="/mcp_markets",
-    tags=["mcp_markets"],
-    dependencies=[Depends(get_current_user)]  # Apply auth to all routes in this controller
-)
-
-
-@router.get("/mcp_markets", response_model=ApiResponse)
-async def get_mcp_markets(
-        page: int = Query(1, gt=0),  # Default: 1, which must be greater than 0
-        pagesize: int = Query(20, gt=0, le=100),  # Default: 20 items per page, maximum: 100 items
-        orderby: Optional[str] = Query(None, description="Sort fields, such as: category, created_at"),
-        desc: Optional[bool] = Query(False, description="Is it descending order"),
-        keywords: Optional[str] = Query(None, description="Search keywords (mcp_market base name)"),
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    Query the mcp markets list in pages
-    - Support keyword search for name,description
-    - Support dynamic sorting
-    - Return paging metadata + mcp_market list
-    """
-    api_logger.info(
-        f"Query mcp market list: tenant_id={current_user.tenant_id}, page={page}, pagesize={pagesize}, keywords={keywords}, username: {current_user.username}")
-
-    # 1. parameter validation
-    if page < 1 or pagesize < 1:
-        api_logger.warning(f"Error in paging parameters: page={page}, pagesize={pagesize}")
-        raise HTTPException(
-            status_code=status.HTTP_400_BAD_REQUEST,
-            detail="The paging parameter must be greater than 0"
-        )
-
-    # 2. Construct query conditions
-    filters = []
-
-    # Keyword search (fuzzy matching of mcp market name,description)
-    if keywords:
-        api_logger.debug(f"Add keyword search criteria: {keywords}")
-        filters.append(
-            or_(
-                mcp_market_model.McpMarket.name.ilike(f"%{keywords}%"),
-                mcp_market_model.McpMarket.description.ilike(f"%{keywords}%")
-            )
-        )
-    # 3. Execute paged query
-    try:
-        api_logger.debug("Start executing mcp market paging query")
-        total, items = mcp_market_service.get_mcp_markets_paginated(
-            db=db,
-            filters=filters,
-            page=page,
-            pagesize=pagesize,
-            orderby=orderby,
-            desc=desc,
-            current_user=current_user
-        )
-        api_logger.info(f"mcp market query successful: total={total}, returned={len(items)} records")
-    except Exception as e:
-        api_logger.error(f"mcp market query failed: {str(e)}")
-        raise HTTPException(
-            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-            detail=f"Query failed: {str(e)}"
-        )
-
-    # 4. Return structured response
-    result = {
-        "items": items,
-        "page": {
-            "page": page,
-            "pagesize": pagesize,
-            "total": total,
-            "has_next": True if page * pagesize < total else False
-        }
-    }
-    return success(data=jsonable_encoder(result), msg="Query of mcp market list successful")
-
-
-@router.post("/mcp_market", response_model=ApiResponse)
-async def create_mcp_market(
-        create_data: mcp_market_schema.McpMarketCreate,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    create mcp market
-    """
-    api_logger.info(
-        f"Request to create a mcp market: name={create_data.name}, tenant_id={current_user.tenant_id}, username: {current_user.username}")
-
-    try:
-        api_logger.debug(f"Start creating the mcp market: {create_data.name}")
-        # 1. Check if the mcp market name already exists
-        db_mcp_market_exist = mcp_market_service.get_mcp_market_by_name(db, name=create_data.name, current_user=current_user)
-        if db_mcp_market_exist:
-            api_logger.warning(f"The mcp market name already exists: {create_data.name}")
-            raise HTTPException(
-                status_code=status.HTTP_400_BAD_REQUEST,
-                detail=f"The mcp market name already exists: {create_data.name}"
-            )
-        db_mcp_market = mcp_market_service.create_mcp_market(db=db, mcp_market=create_data, current_user=current_user)
-        api_logger.info(
-            f"The mcp market has been successfully created: {db_mcp_market.name} (ID: {db_mcp_market.id})")
-        return success(data=jsonable_encoder(mcp_market_schema.McpMarket.model_validate(db_mcp_market)),
-                       msg="The mcp market has been successfully created")
-    except Exception as e:
-        api_logger.error(f"The creation of the mcp market failed: {create_data.name} - {str(e)}")
-        raise
-
-
-@router.get("/{mcp_market_id}", response_model=ApiResponse)
-async def get_mcp_market(
-        mcp_market_id: uuid.UUID,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    Retrieve mcp market information based on mcp_market_id
-    """
-    api_logger.info(
-        f"Obtain details of the mcp market: mcp_market_id={mcp_market_id}, username: {current_user.username}")
-
-    try:
-        # 1. Query mcp market information from the database
-        api_logger.debug(f"Query mcp market: {mcp_market_id}")
-        db_mcp_market = mcp_market_service.get_mcp_market_by_id(db, mcp_market_id=mcp_market_id, current_user=current_user)
-        if not db_mcp_market:
-            api_logger.warning(f"The mcp market does not exist or access is denied: mcp_market_id={mcp_market_id}")
-            raise HTTPException(
-                status_code=status.HTTP_404_NOT_FOUND,
-                detail="The mcp market does not exist or access is denied"
-            )
-
-        api_logger.info(f"mcp market query successful: {db_mcp_market.name} (ID: {db_mcp_market.id})")
-        return success(data=jsonable_encoder(mcp_market_schema.McpMarket.model_validate(db_mcp_market)),
-                       msg="Successfully obtained mcp market information")
-    except HTTPException:
-        raise
-    except Exception as e:
-        api_logger.error(f"mcp market query failed: mcp_market_id={mcp_market_id} - {str(e)}")
-        raise
-
-
-@router.put("/{mcp_market_id}", response_model=ApiResponse)
-async def update_mcp_market(
-        mcp_market_id: uuid.UUID,
-        update_data: mcp_market_schema.McpMarketUpdate,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    # 1. Check if the mcp market exists
-    api_logger.debug(f"Query the mcp market to be updated: {mcp_market_id}")
-    db_mcp_market = mcp_market_service.get_mcp_market_by_id(db, mcp_market_id=mcp_market_id, current_user=current_user)
-
-    if not db_mcp_market:
-        api_logger.warning(
-            f"The mcp market does not exist or you do not have permission to access it: mcp_market_id={mcp_market_id}")
-        raise HTTPException(
-            status_code=status.HTTP_404_NOT_FOUND,
-            detail="The mcp market does not exist or you do not have permission to access it"
-        )
-
-    # 2. not updating the name (name already exists)
-    update_dict = update_data.dict(exclude_unset=True)
-    if "name" in update_dict:
-        name = update_dict["name"]
-        if name != db_mcp_market.name:
-            # Check if the mcp market name already exists
-            db_mcp_market_exist = mcp_market_service.get_mcp_market_by_name(db, name=name, current_user=current_user)
-            if db_mcp_market_exist:
-                api_logger.warning(f"The mcp market name already exists: {name}")
-                raise HTTPException(
-                    status_code=status.HTTP_400_BAD_REQUEST,
-                    detail=f"The mcp market name already exists: {name}"
-                )
-    # 3. Update fields (only update non-null fields)
-    api_logger.debug(f"Start updating the mcp market fields: {mcp_market_id}")
-    updated_fields = []
-    for field, value in update_dict.items():
-        if hasattr(db_mcp_market, field):
-            old_value = getattr(db_mcp_market, field)
-            if old_value != value:
-                # update value
-                setattr(db_mcp_market, field, value)
-                updated_fields.append(f"{field}: {old_value} -> {value}")
-
-    if updated_fields:
-        api_logger.debug(f"updated fields: {', '.join(updated_fields)}")
-
-    # 4. Save to database
-    try:
-        db.commit()
-        db.refresh(db_mcp_market)
-        api_logger.info(f"The mcp market has been successfully updated: {db_mcp_market.name} (ID: {db_mcp_market.id})")
-    except Exception as e:
-        db.rollback()
-        api_logger.error(f"The mcp market update failed: mcp_market_id={mcp_market_id} - {str(e)}")
-        raise HTTPException(
-            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
-            detail=f"The mcp market update failed: {str(e)}"
-        )
-
-    # 5. Return the updated mcp market
-    return success(data=jsonable_encoder(mcp_market_schema.McpMarket.model_validate(db_mcp_market)),
-                   msg="The mcp market information updated successfully")
-
-
-@router.delete("/{mcp_market_id}", response_model=ApiResponse)
-async def delete_mcp_market(
-        mcp_market_id: uuid.UUID,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    delete mcp market
-    """
-    api_logger.info(f"Request to delete mcp market: mcp_market_id={mcp_market_id}, username: {current_user.username}")
-
-    try:
-        # 1. Check whether the mcp market exists
-        api_logger.debug(f"Check whether the mcp market exists: {mcp_market_id}")
-        db_mcp_market = mcp_market_service.get_mcp_market_by_id(db, mcp_market_id=mcp_market_id, current_user=current_user)
-
-        if not db_mcp_market:
-            api_logger.warning(
-                f"The mcp market does not exist or you do not have permission to access it: mcp_market_id={mcp_market_id}")
-            raise HTTPException(
-                status_code=status.HTTP_404_NOT_FOUND,
-                detail="The mcp market does not exist or you do not have permission to access it"
-            )
-
-        # 2. Deleting mcp market
-        mcp_market_service.delete_mcp_market_by_id(db, mcp_market_id=mcp_market_id, current_user=current_user)
-        api_logger.info(f"The mcp market has been successfully deleted: (ID: {mcp_market_id})")
-        return success(msg="The mcp market has been successfully deleted")
-    except Exception as e:
-        api_logger.error(f"Failed to delete from the mcp market: mcp_market_id={mcp_market_id} - {str(e)}")
-        raise
--- a/api/app/controllers/memory_agent_controller.py
+++ b/api/app/controllers/memory_agent_controller.py
@@ -1,17 +1,8 @@
 from typing import List, Optional

-from dotenv import load_dotenv
-from fastapi import APIRouter, Depends, File, Form, Query, UploadFile, Header
-from sqlalchemy.orm import Session
-from starlette.responses import StreamingResponse
-
-from app.cache.memory.interest_memory import InterestMemoryCache
 from app.celery_app import celery_app
 from app.core.error_codes import BizCode
-from app.core.language_utils import get_language_from_header
 from app.core.logging_config import get_api_logger
-from app.core.memory.agent.utils.redis_tool import store
-from app.core.memory.agent.utils.session_tools import SessionService
 from app.core.rag.llm.cv_model import QWenCV
 from app.core.response_utils import fail, success
 from app.db import get_db
@@ -24,6 +15,10 @@ from app.schemas.response_schema import ApiResponse
 from app.services import task_service, workspace_service
 from app.services.memory_agent_service import MemoryAgentService
 from app.services.model_service import ModelConfigService
+from dotenv import load_dotenv
+from fastapi import APIRouter, Depends, File, Form, Query, UploadFile
+from sqlalchemy.orm import Session
+from starlette.responses import StreamingResponse

 load_dotenv()
 api_logger = get_api_logger()
@@ -38,7 +33,7 @@ router = APIRouter(

@router.get("/health/status", response_model=ApiResponse)
 async def get_health_status(
-        current_user: User = Depends(get_current_user)
+    current_user: User = Depends(get_current_user)
 ):
    """
    Get latest health status written by Celery periodic task
@@ -56,9 +51,8 @@ async def get_health_status(

@router.get("/download_log")
 async def download_log(
-        log_type: str = Query("file", regex="^(file|transmission)$",
-                              description="日志类型: file=完整文件, transmission=实时流式传输"),
-        current_user: User = Depends(get_current_user)
+    log_type: str = Query("file", regex="^(file|transmission)$", description="日志类型: file=完整文件, transmission=实时流式传输"),
+    current_user: User = Depends(get_current_user)
 ):
    """
    Download or stream agent service log file
@@ -77,16 +71,16 @@ async def download_log(
        - transmission mode: StreamingResponse with SSE
    """
    api_logger.info(f"Log download requested with log_type={log_type}")
-
+    
    # Validate log_type parameter (FastAPI Query regex already validates, but explicit check for clarity)
    if log_type not in ["file", "transmission"]:
        api_logger.warning(f"Invalid log_type parameter: {log_type}")
        return fail(
-            BizCode.BAD_REQUEST,
-            "无效的log_type参数",
+            BizCode.BAD_REQUEST, 
+            "无效的log_type参数", 
            "log_type必须是'file'或'transmission'"
        )
-
+    
    # Route to appropriate mode
    if log_type == "file":
        # File mode: Return complete log file content
@@ -118,168 +112,96 @@ async def download_log(
            return fail(BizCode.INTERNAL_ERROR, "启动日志流式传输失败", str(e))


-# @router.post("/writer_service", response_model=ApiResponse)
-# @cur_workspace_access_guard()
-# async def write_server(
-#         user_input: Write_UserInput,
-#         language_type: str = Header(default=None, alias="X-Language-Type"),
-#         db: Session = Depends(get_db),
-#         current_user: User = Depends(get_current_user)
-# ):
-#     """
-#     Write service endpoint - processes write operations synchronously
-#
-#     Args:
-#         user_input: Write request containing message and end_user_id
-#         language_type: 语言类型 ("zh" 中文, "en" 英文)，通过 X-Language-Type Header 传递
-#
-#     Returns:
-#         Response with write operation status
-#     """
-#     # 使用集中化的语言校验
-#     language = get_language_from_header(language_type)
-#
-#     config_id = user_input.config_id
-#     workspace_id = current_user.current_workspace_id
-#     api_logger.info(f"Write service: workspace_id={workspace_id}, config_id={config_id}, language_type={language}")
-#
-#     # 获取 storage_type，如果为 None 则使用默认值
-#     storage_type = workspace_service.get_workspace_storage_type(
-#         db=db,
-#         workspace_id=workspace_id,
-#         user=current_user
-#     )
-#     if storage_type is None: storage_type = 'neo4j'
-#     user_rag_memory_id = ''
-#
-#     # 如果 storage_type 是 rag，必须确保有有效的 user_rag_memory_id
-#     if storage_type == 'rag':
-#         if workspace_id:
-#             knowledge = knowledge_repository.get_knowledge_by_name(
-#                 db=db,
-#                 name="USER_RAG_MERORY",
-#                 workspace_id=workspace_id
-#             )
-#             if knowledge:
-#                 user_rag_memory_id = str(knowledge.id)
-#             else:
-#                 api_logger.warning(
-#                     f"未找到名为 'USER_RAG_MERORY' 的知识库，workspace_id: {workspace_id}，将使用 neo4j 存储")
-#                 storage_type = 'neo4j'
-#         else:
-#             api_logger.warning("workspace_id 为空，无法使用 rag 存储，将使用 neo4j 存储")
-#             storage_type = 'neo4j'
-#
-#     api_logger.info(
-#         f"Write service requested for group {user_input.end_user_id}, storage_type: {storage_type}, user_rag_memory_id: {user_rag_memory_id}")
-#     try:
-#         messages_list = memory_agent_service.get_messages_list(user_input)
-#         result = await memory_agent_service.write_memory(
-#             user_input.end_user_id,
-#             messages_list,
-#             config_id,
-#             db,
-#             storage_type,
-#             user_rag_memory_id,
-#             language
-#         )
-#
-#         return success(data=result, msg="写入成功")
-#     except BaseException as e:
-#         # Handle ExceptionGroup from TaskGroup (Python 3.11+) or BaseExceptionGroup
-#         if hasattr(e, 'exceptions'):
-#             error_messages = [f"{type(sub_e).__name__}: {str(sub_e)}" for sub_e in e.exceptions]
-#             detailed_error = "; ".join(error_messages)
-#             api_logger.error(f"Write operation error (TaskGroup): {detailed_error}", exc_info=True)
-#             return fail(BizCode.INTERNAL_ERROR, "写入失败", detailed_error)
-#         api_logger.error(f"Write operation error: {str(e)}", exc_info=True)
-#         return fail(BizCode.INTERNAL_ERROR, "写入失败", str(e))
-#
-#
-# @router.post("/writer_service_async", response_model=ApiResponse)
-# @cur_workspace_access_guard()
-# async def write_server_async(
-#         user_input: Write_UserInput,
-#         language_type: str = Header(default=None, alias="X-Language-Type"),
-#         db: Session = Depends(get_db),
-#         current_user: User = Depends(get_current_user)
-# ):
-#     """
-#     Async write service endpoint - enqueues write processing to Celery
-#
-#     Args:
-#         user_input: Write request containing message and end_user_id
-#         language_type: 语言类型 ("zh" 中文, "en" 英文)，通过 X-Language-Type Header 传递
-#
-#     Returns:
-#         Task ID for tracking async operation
-#         Use GET /memory/write_result/{task_id} to check task status and get result
-#     """
-#     # 使用集中化的语言校验
-#     language = get_language_from_header(language_type)
-#
-#     config_id = user_input.config_id
-#     workspace_id = current_user.current_workspace_id
-#     api_logger.info(
-#         f"Async write service: workspace_id={workspace_id}, config_id={config_id}, language_type={language}")
-#
-#     # 获取 storage_type，如果为 None 则使用默认值
-#     storage_type = workspace_service.get_workspace_storage_type(
-#         db=db,
-#         workspace_id=workspace_id,
-#         user=current_user
-#     )
-#     if storage_type is None: storage_type = 'neo4j'
-#     user_rag_memory_id = ''
-#     if workspace_id:
-#
-#         knowledge = knowledge_repository.get_knowledge_by_name(
-#             db=db,
-#             name="USER_RAG_MERORY",
-#             workspace_id=workspace_id
-#         )
-#         if knowledge: user_rag_memory_id = str(knowledge.id)
-#     api_logger.info(f"Async write: storage_type={storage_type}, user_rag_memory_id={user_rag_memory_id}")
-#     try:
-#         # 获取标准化的消息列表
-#         messages_list = memory_agent_service.get_messages_list(user_input)
-#
-#         task = celery_app.send_task(
-#             "app.core.memory.agent.write_message",
-#             args=[user_input.end_user_id, messages_list, config_id, storage_type, user_rag_memory_id, language]
-#         )
-#         api_logger.info(f"Write task queued: {task.id}")
-#
-#         return success(data={"task_id": task.id}, msg="写入任务已提交")
-#     except Exception as e:
-#         api_logger.error(f"Async write operation failed: {str(e)}")
-#         return fail(BizCode.INTERNAL_ERROR, "写入失败", str(e))
-
-
-@router.post("/read_service", response_model=ApiResponse)
+@router.post("/writer_service", response_model=ApiResponse)
@cur_workspace_access_guard()
-async def read_server(
-        user_input: UserInput,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
+async def write_server(
+    user_input: Write_UserInput,
+    db: Session = Depends(get_db),
+    current_user: User = Depends(get_current_user)
 ):
    """
-    Read service endpoint - processes read operations synchronously
-    
-    search_switch values:
-    - "0": Requires verification
-    - "1": No verification, direct split
-    - "2": Direct answer based on context
+    Write service endpoint - processes write operations synchronously
    
    Args:
-        user_input: Read request with message, history, search_switch, and end_user_id
+        user_input: Write request containing message and group_id
    
    Returns:
-        Response with query answer
+        Response with write operation status
    """
    config_id = user_input.config_id
    workspace_id = current_user.current_workspace_id
+    api_logger.info(f"Write service: workspace_id={workspace_id}, config_id={config_id}")
+    
+    # 获取 storage_type，如果为 None 则使用默认值
+    storage_type = workspace_service.get_workspace_storage_type(
+        db=db,
+        workspace_id=workspace_id,
+        user=current_user
+    )
+    if storage_type is None: storage_type = 'neo4j'
+    user_rag_memory_id = ''
+    
+    # 如果 storage_type 是 rag，必须确保有有效的 user_rag_memory_id
+    if storage_type == 'rag':
+        if workspace_id:
+            knowledge = knowledge_repository.get_knowledge_by_name(
+                db=db,
+                name="USER_RAG_MERORY",
+                workspace_id=workspace_id
+            )
+            if knowledge:
+                user_rag_memory_id = str(knowledge.id)
+            else:
+                api_logger.warning(f"未找到名为 'USER_RAG_MERORY' 的知识库，workspace_id: {workspace_id}，将使用 neo4j 存储")
+                storage_type = 'neo4j'
+        else:
+            api_logger.warning("workspace_id 为空，无法使用 rag 存储，将使用 neo4j 存储")
+            storage_type = 'neo4j'
+    
+    api_logger.info(f"Write service requested for group {user_input.group_id}, storage_type: {storage_type}, user_rag_memory_id: {user_rag_memory_id}")
+    try:
+        result = await memory_agent_service.write_memory(
+            user_input.group_id, 
+            user_input.message, 
+            config_id,
+            db,
+            storage_type, 
+            user_rag_memory_id
+        )
+        return success(data=result, msg="写入成功")
+    except BaseException as e:
+        # Handle ExceptionGroup from TaskGroup (Python 3.11+) or BaseExceptionGroup
+        if hasattr(e, 'exceptions'):
+            error_messages = [f"{type(sub_e).__name__}: {str(sub_e)}" for sub_e in e.exceptions]
+            detailed_error = "; ".join(error_messages)
+            api_logger.error(f"Write operation error (TaskGroup): {detailed_error}", exc_info=True)
+            return fail(BizCode.INTERNAL_ERROR, "写入失败", detailed_error)
+        api_logger.error(f"Write operation error: {str(e)}", exc_info=True)
+        return fail(BizCode.INTERNAL_ERROR, "写入失败", str(e))

+
+@router.post("/writer_service_async", response_model=ApiResponse)
+@cur_workspace_access_guard()
+async def write_server_async(
+    user_input: Write_UserInput,
+    db: Session = Depends(get_db),
+    current_user: User = Depends(get_current_user)
+):
+    """
+    Async write service endpoint - enqueues write processing to Celery
+    
+    Args:
+        user_input: Write request containing message and group_id
+    
+    Returns:
+        Task ID for tracking async operation
+        Use GET /memory/write_result/{task_id} to check task status and get result
+    """
+    config_id = user_input.config_id
+    workspace_id = current_user.current_workspace_id
+    api_logger.info(f"Async write service: workspace_id={workspace_id}, config_id={config_id}")
+
+    # 获取 storage_type，如果为 None 则使用默认值
    storage_type = workspace_service.get_workspace_storage_type(
        db=db,
        workspace_id=workspace_id,
@@ -294,14 +216,67 @@ async def read_server(
            name="USER_RAG_MERORY",
            workspace_id=workspace_id
        )
-        if knowledge:
-            user_rag_memory_id = str(knowledge.id)
+        if knowledge: user_rag_memory_id = str(knowledge.id)
+    api_logger.info(f"Async write: storage_type={storage_type}, user_rag_memory_id={user_rag_memory_id}")
+    try:
+        task = celery_app.send_task(
+            "app.core.memory.agent.write_message",
+            args=[user_input.group_id, user_input.message, config_id, storage_type, user_rag_memory_id]
+        )
+        api_logger.info(f"Write task queued: {task.id}")
+        
+        return success(data={"task_id": task.id}, msg="写入任务已提交")
+    except Exception as e:
+        api_logger.error(f"Async write operation failed: {str(e)}")
+        return fail(BizCode.INTERNAL_ERROR, "写入失败", str(e))

-    api_logger.info(
-        f"Read service: group={user_input.end_user_id}, storage_type={storage_type}, user_rag_memory_id={user_rag_memory_id}, workspace_id={workspace_id}")
+
+@router.post("/read_service", response_model=ApiResponse)
+@cur_workspace_access_guard()
+async def read_server(
+    user_input: UserInput,
+    db: Session = Depends(get_db),
+    current_user: User = Depends(get_current_user)
+):
+    """
+    Read service endpoint - processes read operations synchronously
+    
+    search_switch values:
+    - "0": Requires verification
+    - "1": No verification, direct split
+    - "2": Direct answer based on context
+    
+    Args:
+        user_input: Read request with message, history, search_switch, and group_id
+    
+    Returns:
+        Response with query answer
+    """
+    config_id = user_input.config_id
+    workspace_id = current_user.current_workspace_id
+    api_logger.info(f"Read service: workspace_id={workspace_id}, config_id={config_id}")
+
+    # 获取 storage_type，如果为 None 则使用默认值
+    storage_type = workspace_service.get_workspace_storage_type(
+        db=db,
+        workspace_id=workspace_id,
+        user=current_user
+    )
+    if storage_type is None: storage_type = 'neo4j'
+    user_rag_memory_id = ''
+    if workspace_id:
+
+        knowledge = knowledge_repository.get_knowledge_by_name(
+            db=db,
+            name="USER_RAG_MERORY",
+            workspace_id=workspace_id
+        )
+        if knowledge: user_rag_memory_id = str(knowledge.id)
+    
+    api_logger.info(f"Read service: group={user_input.group_id}, storage_type={storage_type}, user_rag_memory_id={user_rag_memory_id}, workspace_id={workspace_id}")
    try:
        result = await memory_agent_service.read_memory(
-            user_input.end_user_id,
+            user_input.group_id,
            user_input.message,
            user_input.history,
            user_input.search_switch,
@@ -310,23 +285,6 @@ async def read_server(
            storage_type,
            user_rag_memory_id
        )
-        if str(user_input.search_switch) == "2":
-            retrieve_info = result['answer']
-            history = await SessionService(store).get_history(user_input.end_user_id, user_input.end_user_id,
-                                                              user_input.end_user_id)
-            query = user_input.message
-
-            # 调用 memory_agent_service 的方法生成最终答案
-            result['answer'] = await memory_agent_service.generate_summary_from_retrieve(
-                end_user_id=user_input.end_user_id,
-                retrieve_info=retrieve_info,
-                history=history,
-                query=query,
-                config_id=config_id,
-                db=db
-            )
-            if "信息不足，无法回答" in result['answer']:
-                result['answer'] = retrieve_info
        return success(data=result, msg="回复对话消息成功")
    except BaseException as e:
        # Handle ExceptionGroup from TaskGroup (Python 3.11+) or BaseExceptionGroup
@@ -342,10 +300,9 @@ async def read_server(
@router.post("/file", response_model=ApiResponse)
 async def file_update(
        files: List[UploadFile] = File(..., description="要上传的文件"),
-        model_id: str = Form(..., description="模型ID"),
+        model_id:str = Form(..., description="模型ID"),
        metadata: Optional[str] = Form(None, description="文件元数据 (JSON格式)"),
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
+        current_user: User = Depends(get_current_user)
 ):
    """
    文件上传接口 - 支持图片识别
@@ -358,6 +315,9 @@ async def file_update(
    Returns:
        文件处理结果
    """
+
+    db_gen = get_db()             # get_db 通常是一个生成器
+    db = next(db_gen)
    api_logger.info(f"File upload requested, file count: {len(files)}")
    config = ModelConfigService.get_model_by_id(db=db, model_id=model_id)
    apiConfig: ModelApiKey = config.api_keys[0]
@@ -366,7 +326,7 @@ async def file_update(
        for file in files:
            api_logger.debug(f"Processing file: {file.filename}, content_type: {file.content_type}")
            content = await file.read()
-
+            
            if file.content_type and file.content_type.startswith("image/"):
                vision_model = QWenCV(
                    key=apiConfig.api_key,
@@ -380,12 +340,12 @@ async def file_update(
            else:
                api_logger.warning(f"Unsupported file type: {file.content_type}")
                file_content.append(f"[不支持的文件类型: {file.content_type}]")
-
+        
        result_text = ';'.join(file_content)
        api_logger.info(f"File processing completed, result length: {len(result_text)}")
-
+        
        return success(data=result_text, msg="转换文本成功")
-
+        
    except Exception as e:
        api_logger.error(f"File processing failed: {str(e)}", exc_info=True)
        return fail(BizCode.INTERNAL_ERROR, "转换文本失败", str(e))
@@ -422,7 +382,7 @@ async def read_server_async(
    try:
        task = celery_app.send_task(
            "app.core.memory.agent.read_message",
-            args=[user_input.end_user_id, user_input.message, user_input.history, user_input.search_switch,
+            args=[user_input.group_id, user_input.message, user_input.history, user_input.search_switch,
                  config_id, storage_type, user_rag_memory_id]
        )
        api_logger.info(f"Read task queued: {task.id}")
@@ -435,8 +395,8 @@ async def read_server_async(

@router.get("/read_result/", response_model=ApiResponse)
 async def get_read_task_result(
-        task_id: str,
-        current_user: User = Depends(get_current_user)
+    task_id: str,
+    current_user: User = Depends(get_current_user)
 ):
    """
    Get the status and result of an async read task
@@ -457,7 +417,7 @@ async def get_read_task_result(
    try:
        result = task_service.get_task_memory_read_result(task_id)
        status = result.get("status")
-
+        
        if status == "SUCCESS":
            # 任务成功完成
            task_result = result.get("result", {})
@@ -466,7 +426,7 @@ async def get_read_task_result(
                return success(
                    data={
                        "result": task_result.get("result"),
-                        "end_user_id": task_result.get("end_user_id"),
+                        "group_id": task_result.get("group_id"),
                        "elapsed_time": task_result.get("elapsed_time"),
                        "task_id": task_id
                    },
@@ -475,7 +435,7 @@ async def get_read_task_result(
            else:
                # 旧格式：直接返回结果
                return success(data=task_result, msg="查询任务已完成")
-
+                
        elif status == "FAILURE":
            # 任务失败
            error_info = result.get("result", "Unknown error")
@@ -484,7 +444,7 @@ async def get_read_task_result(
            else:
                error_msg = str(error_info)
            return fail(BizCode.INTERNAL_ERROR, "查询任务失败", error_msg)
-
+            
        elif status in ["PENDING", "STARTED"]:
            # 任务进行中
            return success(
@@ -504,7 +464,7 @@ async def get_read_task_result(
                },
                msg=f"任务状态: {status}"
            )
-
+            
    except Exception as e:
        api_logger.error(f"Read task status check failed: {str(e)}", exc_info=True)
        return fail(BizCode.INTERNAL_ERROR, "任务状态查询失败", str(e))
@@ -512,8 +472,8 @@ async def get_read_task_result(

@router.get("/write_result/", response_model=ApiResponse)
 async def get_write_task_result(
-        task_id: str,
-        current_user: User = Depends(get_current_user)
+    task_id: str,
+    current_user: User = Depends(get_current_user)
 ):
    """
    Get the status and result of an async write task
@@ -534,7 +494,7 @@ async def get_write_task_result(
    try:
        result = task_service.get_task_memory_write_result(task_id)
        status = result.get("status")
-
+        
        if status == "SUCCESS":
            # 任务成功完成
            task_result = result.get("result", {})
@@ -543,7 +503,7 @@ async def get_write_task_result(
                return success(
                    data={
                        "result": task_result.get("result"),
-                        "end_user_id": task_result.get("end_user_id"),
+                        "group_id": task_result.get("group_id"),
                        "elapsed_time": task_result.get("elapsed_time"),
                        "task_id": task_id
                    },
@@ -552,7 +512,7 @@ async def get_write_task_result(
            else:
                # 旧格式：直接返回结果
                return success(data=task_result, msg="写入任务已完成")
-
+                
        elif status == "FAILURE":
            # 任务失败
            error_info = result.get("result", "Unknown error")
@@ -561,7 +521,7 @@ async def get_write_task_result(
            else:
                error_msg = str(error_info)
            return fail(BizCode.INTERNAL_ERROR, "写入任务失败", error_msg)
-
+            
        elif status in ["PENDING", "STARTED"]:
            # 任务进行中
            return success(
@@ -581,7 +541,7 @@ async def get_write_task_result(
                },
                msg=f"任务状态: {status}"
            )
-
+            
    except Exception as e:
        api_logger.error(f"Write task status check failed: {str(e)}", exc_info=True)
        return fail(BizCode.INTERNAL_ERROR, "任务状态查询失败", str(e))
@@ -589,38 +549,23 @@ async def get_write_task_result(

@router.post("/status_type", response_model=ApiResponse)
 async def status_type(
-        user_input: Write_UserInput,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
+    user_input: Write_UserInput,
+    db: Session = Depends(get_db),
+    current_user: User = Depends(get_current_user)
 ):
    """
    Determine the type of user message (read or write)
    
    Args:
-        user_input: Request containing user message and end_user_id
+        user_input: Request containing user message and group_id
    
    Returns:
        Type classification result
    """
-    api_logger.info(f"Status type check requested for group {user_input.end_user_id}")
+    api_logger.info(f"Status type check requested for group {user_input.group_id}")
    try:
-        # 获取标准化的消息列表
-        messages_list = memory_agent_service.get_messages_list(user_input)
-
-        # 将消息列表转换为字符串用于分类
-        # 只取最后一条用户消息进行分类
-        last_user_message = ""
-        for msg in reversed(messages_list):
-            if msg.get('role') == 'user':
-                last_user_message = msg.get('content', '')
-                break
-
-        if not last_user_message:
-            # 如果没有用户消息，使用所有消息的内容
-            last_user_message = " ".join([msg.get('content', '') for msg in messages_list])
-
        result = await memory_agent_service.classify_message_type(
-            last_user_message,
+            user_input.message,
            user_input.config_id,
            db
        )
@@ -634,21 +579,26 @@ async def status_type(

@router.get("/stats/types", response_model=ApiResponse)
 async def get_knowledge_type_stats_api(
-        end_user_id: Optional[str] = Query(None, description="用户ID（可选）"),
-        only_active: bool = Query(True, description="仅统计有效记录(status=1)"),
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
+    end_user_id: Optional[str] = Query(None, description="用户ID（可选）"),
+    only_active: bool = Query(True, description="仅统计有效记录(status=1)"),
+    current_user: User = Depends(get_current_user)
 ):
    """
-    统计当前空间下各知识库类型的数量，包含 General | Web | Third-party | Folder。
+    统计当前空间下各知识库类型的数量，包含 General | Web | Third-party | Folder | memory。
    会对缺失类型补 0，返回字典形式。
    可选按状态过滤。
    - 知识库类型根据当前用户的 current_workspace_id 过滤
-    - 如果用户没有当前工作空间，对应的统计返回 0
+    - memory 是 Neo4j 中 Chunk 的数量，根据 end_user_id (group_id) 过滤
+    - 如果用户没有当前工作空间或未提供 end_user_id，对应的统计返回 0
    """
-    api_logger.info(
-        f"Knowledge type stats requested for workspace_id: {current_user.current_workspace_id}, end_user_id: {end_user_id}")
+    api_logger.info(f"Knowledge type stats requested for workspace_id: {current_user.current_workspace_id}, end_user_id: {end_user_id}")
    try:
+        from app.db import get_db
+        
+        # 获取数据库会话
+        db_gen = get_db()
+        db = next(db_gen)
+        
        # 调用service层函数
        result = await memory_agent_service.get_knowledge_type_stats(
            end_user_id=end_user_id,
@@ -656,70 +606,45 @@ async def get_knowledge_type_stats_api(
            current_workspace_id=current_user.current_workspace_id,
            db=db
        )
-
+        
        return success(data=result, msg="获取知识库类型统计成功")
    except Exception as e:
        api_logger.error(f"Knowledge type stats failed: {str(e)}")
        return fail(BizCode.INTERNAL_ERROR, "获取知识库类型统计失败", str(e))


-@router.get("/analytics/interest_distribution/by_user", response_model=ApiResponse)
-async def get_interest_distribution_by_user_api(
-        end_user_id: str = Query(..., description="用户ID（必填）"),
-        limit: int = Query(5, le=5, description="返回兴趣标签数量限制，最多5个"),
-        language_type: str = Header(default=None, alias="X-Language-Type"),
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
+@router.get("/analytics/hot_memory_tags/by_user", response_model=ApiResponse)
+async def get_hot_memory_tags_by_user_api(
+    end_user_id: Optional[str] = Query(None, description="用户ID（可选）"),
+    limit: int = Query(20, description="返回标签数量限制"),
+    current_user: User = Depends(get_current_user)
 ):
    """
-    获取指定用户的兴趣分布标签
-    
-    与热门标签不同，此接口专注于识别用户的兴趣活动（运动、爱好、学习、创作等），
-    过滤掉纯物品、工具、地点等不代表用户主动参与活动的名词。
+    获取指定用户的热门记忆标签
    
    返回格式：
    [
-        {"name": "兴趣活动名", "frequency": 频次},
+        {"name": "标签名", "frequency": 频次},
        ...
    ]
    """
-    language = get_language_from_header(language_type)
-    api_logger.info(f"Interest distribution by user requested: end_user_id={end_user_id}, language={language}")
+    api_logger.info(f"Hot memory tags by user requested: end_user_id={end_user_id}")
    try:
-        # 优先读取缓存
-        cached = await InterestMemoryCache.get_interest_distribution(
+        result = await memory_agent_service.get_hot_memory_tags_by_user(
            end_user_id=end_user_id,
-            language=language,
+            limit=limit
        )
-        if cached is not None:
-            api_logger.info(f"Interest distribution cache hit: end_user_id={end_user_id}")
-            return success(data=cached, msg="获取兴趣分布标签成功")
-
-        # 缓存未命中，调用模型生成
-        result = await memory_agent_service.get_interest_distribution_by_user(
-            end_user_id=end_user_id,
-            limit=limit,
-            language=language
-        )
-
-        # 写入缓存，24小时过期
-        await InterestMemoryCache.set_interest_distribution(
-            end_user_id=end_user_id,
-            language=language,
-            data=result,
-        )
-
-        return success(data=result, msg="获取兴趣分布标签成功")
+        return success(data=result, msg="获取热门记忆标签成功")
    except Exception as e:
-        api_logger.error(f"Interest distribution by user failed: {str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "获取兴趣分布标签失败", str(e))
+        api_logger.error(f"Hot memory tags by user failed: {str(e)}")
+        return fail(BizCode.INTERNAL_ERROR, "获取热门记忆标签失败", str(e))


@router.get("/analytics/user_profile", response_model=ApiResponse)
 async def get_user_profile_api(
-        end_user_id: Optional[str] = Query(None, description="用户ID（可选）"),
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
+    end_user_id: Optional[str] = Query(None, description="用户ID（可选）"),
+    db: Session = Depends(get_db),
+    current_user: User = Depends(get_current_user)
 ):
    """
    获取用户详情，包含：
@@ -757,17 +682,17 @@ async def get_user_profile_api(
 # ):
 #     """
 #     Get parsed API documentation (Public endpoint - no authentication required)
-
+    
 #     Args:
 #         file_path: Optional path to API docs file. If None, uses default path.
-
+    
 #     Returns:
 #         Parsed API documentation including title, meta info, and sections
 #     """
 #     api_logger.info(f"API docs requested, file_path: {file_path or 'default'}")
 #     try:
 #         result = await memory_agent_service.get_api_docs(file_path)
-
+        
 #         if result.get("success"):
 #             return success(msg=result["msg"], data=result["data"])
 #         else:
@@ -783,9 +708,9 @@ async def get_user_profile_api(

@router.get("/end_user/{end_user_id}/connected_config", response_model=ApiResponse)
 async def get_end_user_connected_config(
-        end_user_id: str,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
+    end_user_id: str,
+    db: Session = Depends(get_db),
+    current_user: User = Depends(get_current_user)
 ):
    """
    获取终端用户关联的记忆配置
@@ -804,9 +729,9 @@ async def get_end_user_connected_config(
    from app.services.memory_agent_service import (
        get_end_user_connected_config as get_config,
    )
-
+    
    api_logger.info(f"Getting connected config for end_user: {end_user_id}")
-
+    
    try:
        result = get_config(end_user_id, db)
        return success(data=result, msg="获取终端用户关联配置成功")
@@ -815,4 +740,4 @@ async def get_end_user_connected_config(
        return fail(BizCode.NOT_FOUND, str(e))
    except Exception as e:
        api_logger.error(f"Failed to get end user connected config: {str(e)}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, "获取终端用户关联配置失败", str(e))
+        return fail(BizCode.INTERNAL_ERROR, "获取终端用户关联配置失败", str(e))
--- a/api/app/controllers/memory_dashboard_controller.py
+++ b/api/app/controllers/memory_dashboard_controller.py
@@ -1,18 +1,18 @@
-import asyncio
-import uuid
 from fastapi import APIRouter, Depends, HTTPException, status, Query
-from pydantic import BaseModel, Field
 from sqlalchemy.orm import Session
-from typing import Optional
+from typing import List, Optional
+import uuid
+from app.repositories.end_user_repository import update_end_user_other_name
+import uuid
 from app.core.response_utils import success
 from app.db import get_db
 from app.dependencies import get_current_user
 from app.models.user_model import User
+from app.schemas.memory_agent_schema import End_User_Information
 from app.schemas.response_schema import ApiResponse
+from app.schemas.app_schema import App as AppSchema

 from app.services import memory_dashboard_service, memory_storage_service, workspace_service
-from app.services.memory_agent_service import get_end_users_connected_configs_batch
-from app.services.app_statistics_service import AppStatisticsService
 from app.core.logging_config import get_api_logger

 # 获取API专用日志器
@@ -43,165 +43,94 @@ def get_workspace_total_end_users(
    api_logger.info(f"成功获取最新用户总数: total_num={total_end_users.get('total_num', 0)}")
    return success(data=total_end_users, msg="用户数量获取成功")

+@router.post("/update/end_users", response_model=ApiResponse)
+async def update_workspace_end_users(
+    user_input: End_User_Information,
+    db: Session = Depends(get_db),
+    current_user: User = Depends(get_current_user),
+):
+    """
+    更新工作空间的宿主信息
+    """
+    username = user_input.end_user_name  # 要更新的用户名
+    end_user_input_id = user_input.id  # 宿主ID
+    workspace_id = current_user.current_workspace_id
+    
+    api_logger.info(f"用户 {current_user.username} 请求更新工作空间 {workspace_id} 的宿主信息")
+    api_logger.info(f"更新参数: username={username}, end_user_id={end_user_input_id}")

+    try:
+        # 导入更新函数
+        from app.repositories.end_user_repository import update_end_user_other_name
+        import uuid
+        
+        # 转换 end_user_id 为 UUID 类型
+        end_user_uuid = uuid.UUID(end_user_input_id)
+        
+        # 直接更新数据库中的 other_name 字段
+        updated_count = update_end_user_other_name(
+            db=db,
+            end_user_id=end_user_uuid,
+            other_name=username
+        )
+        
+        api_logger.info(f"成功更新宿主 {end_user_input_id} 的 other_name 为: {username}")
+
+        return success(
+            data={
+                "updated_count": updated_count,
+                "end_user_id": end_user_input_id,
+                "updated_other_name": username
+            },
+            msg=f"成功更新 {updated_count} 个宿主的信息"
+        )
+        
+    except Exception as e:
+        api_logger.error(f"更新宿主信息失败: {str(e)}")
+        raise HTTPException(
+            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
+            detail=f"更新宿主信息失败: {str(e)}"
+        )



@router.get("/end_users", response_model=ApiResponse)
 async def get_workspace_end_users(
-    workspace_id: Optional[uuid.UUID] = Query(None, description="工作空间ID（可选，默认当前用户工作空间）"),
-    keyword: Optional[str] = Query(None, description="搜索关键词（同时模糊匹配 other_name 和 id）"),
-    page: int = Query(1, ge=1, description="页码，从1开始"),
-    pagesize: int = Query(10, ge=1, description="每页数量"),
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
 ):
    """
-    获取工作空间的宿主列表（分页查询，支持模糊搜索）
-
-    返回工作空间下的宿主列表，支持分页查询和模糊搜索。
-    通过 keyword 参数同时模糊匹配 other_name 和 id 字段。
-
-    Args:
-        workspace_id: 工作空间ID（可选，默认当前用户工作空间）
-        keyword: 搜索关键词（可选，同时模糊匹配 other_name 和 id）
-        page: 页码（从1开始，默认1）
-        pagesize: 每页数量（默认10）
-        db: 数据库会话
-        current_user: 当前用户
-
-    Returns:
-        ApiResponse: 包含宿主列表和分页信息
+    获取工作空间的宿主列表
+    
+    返回格式与原 memory_list 接口中的 end_users 字段相同
    """
-    # 如果未提供 workspace_id，使用当前用户的工作空间
-    if workspace_id is None:
-        workspace_id = current_user.current_workspace_id
+    workspace_id = current_user.current_workspace_id
    # 获取当前空间类型
    current_workspace_type = memory_dashboard_service.get_current_workspace_type(db, workspace_id, current_user)
-    api_logger.info(f"用户 {current_user.username} 请求获取工作空间 {workspace_id} 的宿主列表, 类型: {current_workspace_type}")
-
-    # 获取分页的 end_users
-    end_users_result = memory_dashboard_service.get_workspace_end_users_paginated(
+    api_logger.info(f"用户 {current_user.username} 请求获取工作空间 {workspace_id} 的宿主列表")
+    end_users = memory_dashboard_service.get_workspace_end_users(
        db=db,
        workspace_id=workspace_id,
-        current_user=current_user,
-        page=page,
-        pagesize=pagesize,
-        keyword=keyword
+        current_user=current_user
    )
-
-    end_users = end_users_result.get("items", [])
-    total = end_users_result.get("total", 0)
-
-    if not end_users:
-        api_logger.info(f"工作空间下没有宿主或当前页无数据: total={total}, page={page}")
-        return success(data={
-            "items": [],
-            "page": {
-                "page": page,
-                "pagesize": pagesize,
-                "total": total,
-                "hasnext": (page * pagesize) < total
-            }
-        }, msg="宿主列表获取成功")
-
-    end_user_ids = [str(user.id) for user in end_users]
-
-    # 并发执行两个独立的查询任务
-    async def get_memory_configs():
-        """获取记忆配置（在线程池中执行同步查询）"""
-        try:
-            return await asyncio.to_thread(
-                get_end_users_connected_configs_batch,
-                end_user_ids, db
-            )
-        except Exception as e:
-            api_logger.error(f"批量获取记忆配置失败: {str(e)}")
-            return {}
-
-    async def get_memory_nums():
-        """获取记忆数量"""
-        if current_workspace_type == "rag":
-            # RAG 模式：批量查询
-            try:
-                chunk_map = await asyncio.to_thread(
-                    memory_dashboard_service.get_users_total_chunk_batch,
-                    end_user_ids, db, current_user
-                )
-                return {uid: {"total": count} for uid, count in chunk_map.items()}
-            except Exception as e:
-                api_logger.error(f"批量获取 RAG chunk 数量失败: {str(e)}")
-                return {uid: {"total": 0} for uid in end_user_ids}
-
-        elif current_workspace_type == "neo4j":
-            # Neo4j 模式：批量查询（简化版本，只返回total）
-            try:
-                batch_result = await memory_storage_service.search_all_batch(end_user_ids)
-                return {uid: {"total": count} for uid, count in batch_result.items()}
-            except Exception as e:
-                api_logger.error(f"批量获取 Neo4j 记忆数量失败: {str(e)}")
-                return {uid: {"total": 0} for uid in end_user_ids}
-
-        return {uid: {"total": 0} for uid in end_user_ids}
-
-    # 触发按需初始化：为 implicit_emotions_storage 中没有记录的用户异步生成数据
-    try:
-        from app.celery_app import celery_app as _celery_app
-        _celery_app.send_task(
-            "app.tasks.init_implicit_emotions_for_users",
-            kwargs={"end_user_ids": end_user_ids},
-        )
-        _celery_app.send_task(
-            "app.tasks.init_interest_distribution_for_users",
-            kwargs={"end_user_ids": end_user_ids},
-        )
-        api_logger.info(f"已触发按需初始化任务，候选用户数: {len(end_user_ids)}")
-    except Exception as e:
-        api_logger.warning(f"触发按需初始化任务失败（不影响主流程）: {e}")
-
-    # 并发执行配置查询和记忆数量查询
-    memory_configs_map, memory_nums_map = await asyncio.gather(
-        get_memory_configs(),
-        get_memory_nums()
-    )
-
-    # 构建结果列表
-    items = []
+    result = []
    for end_user in end_users:
-        user_id = str(end_user.id)
-        config_info = memory_configs_map.get(user_id, {})
-        items.append({
-            'end_user': {
-                'id': user_id,
-                'other_name': end_user.other_name
-            },
-            'memory_num': memory_nums_map.get(user_id, {"total": 0}),
-            'memory_config': {
-                "memory_config_id": config_info.get("memory_config_id"),
-                "memory_config_name": config_info.get("memory_config_name")
+        memory_num = {}
+        if current_workspace_type == "neo4j":
+            # EndUser 是 Pydantic 模型，直接访问属性而不是使用 .get()
+            memory_num = await memory_storage_service.search_all(str(end_user.id))
+        elif current_workspace_type == "rag":
+            memory_num = {
+                "total":memory_dashboard_service.get_current_user_total_chunk(str(end_user.id), db, current_user)
            }
-        })
-
-    # 触发社区聚类补全任务（异步，不阻塞接口响应）
-    try:
-        from app.tasks import init_community_clustering_for_users
-        init_community_clustering_for_users.delay(end_user_ids=end_user_ids, workspace_id=str(workspace_id))
-        api_logger.info(f"已触发社区聚类补全任务，候选用户数: {len(end_user_ids)}")
-    except Exception as e:
-        api_logger.warning(f"触发社区聚类补全任务失败（不影响主流程）: {str(e)}")
-
-    # 构建分页响应
-    result = {
-        "items": items,
-        "page": {
-            "page": page,
-            "pagesize": pagesize,
-            "total": total,
-            "hasnext": (page * pagesize) < total
-        }
-    }
-
-    api_logger.info(f"成功获取 {len(end_users)} 个宿主记录，总计 {total} 条")
+        result.append(
+            {
+                'end_user':end_user,
+                'memory_num':memory_num
+            }
+        )
+        
+    api_logger.info(f"成功获取 {len(end_users)} 个宿主记录")
    return success(data=result, msg="宿主列表获取成功")


@@ -410,15 +339,14 @@ def get_current_user_rag_total_num(
@router.get("/rag_content", response_model=ApiResponse)
 def get_rag_content(
    end_user_id: str = Query(..., description="宿主ID"),
-    page: int = Query(1, gt=0, description="页码，从1开始"),
-    pagesize: int = Query(15, gt=0, le=100, description="每页返回记录数"),
+    limit: int = Query(15, description="返回记录数"),
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
 ):
    """
-    获取当前宿主知识库中的chunk内容（分页）
+    获取当前宿主知识库中的chunk内容
    """
-    data = memory_dashboard_service.get_rag_content(end_user_id, page, pagesize, db, current_user)
+    data = memory_dashboard_service.get_rag_content(end_user_id, limit, db, current_user)
    return success(data=data, msg="宿主RAGchunk数据获取成功")


@@ -431,18 +359,26 @@ async def get_chunk_summary_tag(
    current_user: User = Depends(get_current_user),
 ):
    """
-    读取RAG摘要、标签和人物形象（纯读库，不触发生成）。
-
+    获取chunk总结、提取的标签和人物形象
+    
    返回格式：
    {
-        "summary": "用户摘要",
-        "tags": [{"tag": "标签1", "frequency": 5}, ...],
-        "personas": ["产品设计师", ...],
-        "generated": true/false  // false表示尚未生产，请调用 /generate_rag_profile
+        "summary": "chunk内容的总结",
+        "tags": [
+            {"tag": "标签1", "frequency": 5},
+            {"tag": "标签2", "frequency": 3},
+            ...
+        ],
+        "personas": [
+            "产品设计师",
+            "旅行爱好者",
+            "摄影发烧友",
+            ...
+        ]
    }
    """
-    api_logger.info(f"用户 {current_user.username} 读取宿主 {end_user_id} 的RAG摘要/标签/人物形象")
-
+    api_logger.info(f"用户 {current_user.username} 请求获取宿主 {end_user_id} 的chunk摘要、标签和人物形象")
+    
    data = await memory_dashboard_service.get_chunk_summary_and_tags(
        end_user_id=end_user_id,
        limit=limit,
@@ -450,8 +386,9 @@ async def get_chunk_summary_tag(
        db=db,
        current_user=current_user
    )
-
-    return success(data=data, msg="获取成功")
+    
+    api_logger.info(f"成功获取chunk摘要、{len(data.get('tags', []))} 个标签和 {len(data.get('personas', []))} 个人物形象")
+    return success(data=data, msg="chunk摘要、标签和人物形象获取成功")


@router.get("/chunk_insight", response_model=ApiResponse)
@@ -462,64 +399,29 @@ async def get_chunk_insight(
    current_user: User = Depends(get_current_user),
 ):
    """
-    读取RAG洞察报告（纯读库，不触发生成）。
-
+    获取chunk的洞察内容
+    
    返回格式：
    {
-        "insight": "总体概述",
-        "behavior_pattern": "行为模式",
-        "key_findings": "关键发现",
-        "growth_trajectory": "成长轨迹",
-        "generated": true/false  // false表示尚未生产，请调用 /generate_rag_profile
+        "insight": "对chunk内容的深度洞察分析"
    }
    """
-    api_logger.info(f"用户 {current_user.username} 读取宿主 {end_user_id} 的RAG洞察")
-
+    api_logger.info(f"用户 {current_user.username} 请求获取宿主 {end_user_id} 的chunk洞察")
+    
    data = await memory_dashboard_service.get_chunk_insight(
        end_user_id=end_user_id,
        limit=limit,
        db=db,
        current_user=current_user
    )
-
-    return success(data=data, msg="获取成功")
-
-
-class GenerateRagProfileRequest(BaseModel):
-    end_user_id: str = Field(..., description="宿主ID")
-    limit: int = Field(15, description="参与生成的chunk数量上限")
-    max_tags: int = Field(10, description="最大标签数量")
-
-
-@router.post("/generate_rag_profile", response_model=ApiResponse)
-async def generate_rag_profile(
-    body: GenerateRagProfileRequest,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user),
-):
-    """
-    生产接口：为RAG存储模式的宿主全量重新生成完整画像并持久化到end_user表。
-    每次请求都会重新生成，覆盖已有数据。
-    """
-    api_logger.info(f"用户 {current_user.username} 触发RAG画像生产: end_user_id={body.end_user_id}")
-
-    data = await memory_dashboard_service.generate_rag_profile(
-        end_user_id=body.end_user_id,
-        limit=body.limit,
-        max_tags=body.max_tags,
-        db=db,
-        current_user=current_user,
-    )
-
-    api_logger.info(f"RAG画像生产完成: {data}")
-    return success(data=data, msg="RAG画像生产完成")
+    
+    api_logger.info("成功获取chunk洞察")
+    return success(data=data, msg="chunk洞察获取成功")


@router.get("/dashboard_data", response_model=ApiResponse)
 async def dashboard_data(
    end_user_id: Optional[str] = Query(None, description="可选的用户ID"),
-    start_date: Optional[int] = Query(None, description="开始时间戳（毫秒）"),
-    end_date: Optional[int] = Query(None, description="结束时间戳（毫秒）"),
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
 ):
@@ -554,15 +456,6 @@ async def dashboard_data(
    workspace_id = current_user.current_workspace_id
    api_logger.info(f"用户 {current_user.username} 请求获取工作空间 {workspace_id} 的dashboard整合数据")
    
-    # 如果没有提供时间范围，默认使用最近30天
-    if start_date is None or end_date is None:
-        from datetime import datetime, timedelta
-        end_dt = datetime.now()
-        start_dt = end_dt - timedelta(days=30)
-        end_date = int(end_dt.timestamp() * 1000)
-        start_date = int(start_dt.timestamp() * 1000)
-        api_logger.info(f"使用默认时间范围: {start_dt} 到 {end_dt}")
-    
    # 获取 storage_type，如果为 None 则使用默认值
    storage_type = workspace_service.get_workspace_storage_type(
        db=db,
@@ -572,6 +465,7 @@ async def dashboard_data(
    if storage_type is None:
        storage_type = 'neo4j'
    
+    user_rag_memory_id = None
    
    # 根据 storage_type 决定返回哪个数据对象
    # 如果是 'rag'，neo4j_data 为 null；否则 rag_data 为 null
@@ -591,7 +485,7 @@ async def dashboard_data(
                "total_api_call": None
            }
            
-            # 1. 获取记忆总量（total_memory）—— neo4j 独有逻辑：查询 neo4j 存储节点
+            # 1. 获取记忆总量（total_memory）
            try:
                total_memory_data = await memory_dashboard_service.get_workspace_total_memory_count(
                    db=db,
@@ -600,33 +494,41 @@ async def dashboard_data(
                    end_user_id=end_user_id
                )
                neo4j_data["total_memory"] = total_memory_data.get("total_memory_count", 0)
-                api_logger.info(f"成功获取记忆总量: {neo4j_data['total_memory']}")
+                # total_app: 统计当前空间下的所有app数量
+                from app.repositories import app_repository
+                apps_orm = app_repository.get_apps_by_workspace_id(db, workspace_id)
+                neo4j_data["total_app"] = len(apps_orm)
+                api_logger.info(f"成功获取记忆总量: {neo4j_data['total_memory']}, 应用数量: {neo4j_data['total_app']}")
            except Exception as e:
                api_logger.warning(f"获取记忆总量失败: {str(e)}")
            
-            # 2. 获取共享统计数据（total_app、total_knowledge、total_api_call）
-            common_stats = memory_dashboard_service.get_dashboard_common_stats(db, workspace_id)
-            neo4j_data.update(common_stats)
-            api_logger.info(f"成功获取共享统计: app={common_stats['total_app']}, knowledge={common_stats['total_knowledge']}, api_call={common_stats['total_api_call']}")
-            
-            # 计算昨日对比
+            # 2. 获取知识库类型统计（total_knowledge）
            try:
-                changes = memory_dashboard_service.get_dashboard_yesterday_changes(
+                from app.services.memory_agent_service import MemoryAgentService 
+                memory_agent_service = MemoryAgentService()
+                knowledge_stats = await memory_agent_service.get_knowledge_type_stats(
+                    end_user_id=end_user_id,
+                    only_active=True,
+                    current_workspace_id=workspace_id,
+                    db=db
+                )
+                neo4j_data["total_knowledge"] = knowledge_stats.get("total", 0)
+                api_logger.info(f"成功获取知识库类型统计total: {neo4j_data['total_knowledge']}")
+            except Exception as e:
+                api_logger.warning(f"获取知识库类型统计失败: {str(e)}")
+            
+            # 3. 获取API调用增量（total_api_call，转换为整数）
+            try:
+                api_increment = memory_dashboard_service.get_workspace_api_increment(
                    db=db,
                    workspace_id=workspace_id,
-                    storage_type=storage_type,
-                    today_data=neo4j_data
+                    current_user=current_user
                )
-                neo4j_data.update(changes)
+                neo4j_data["total_api_call"] = api_increment
+                api_logger.info(f"成功获取API调用增量: {neo4j_data['total_api_call']}")
            except Exception as e:
-                api_logger.warning(f"计算neo4j昨日对比失败: {str(e)}")
-                neo4j_data.update({
-                    "total_memory_change": None,
-                    "total_app_change": None,
-                    "total_knowledge_change": None,
-                    "total_api_call_change": None,
-                })
-
+                api_logger.warning(f"获取API调用增量失败: {str(e)}")
+            
            result["neo4j_data"] = neo4j_data
            api_logger.info("成功获取neo4j_data")
        
@@ -639,37 +541,28 @@ async def dashboard_data(
                "total_api_call": None
            }
            
-            # 1. 获取记忆总量（total_memory）—— rag 独有逻辑：查询 document 表的 chunk_num
+            # 获取RAG相关数据
            try:
-                total_chunk = memory_dashboard_service.get_rag_user_kb_total_chunk(db, current_user)
+                # total_memory: 使用 total_chunk（总chunk数）
+                total_chunk = memory_dashboard_service.get_rag_total_chunk(db, current_user)
                rag_data["total_memory"] = total_chunk
-                api_logger.info(f"成功获取RAG记忆总量: {total_chunk}")
+                
+                # total_app: 统计当前空间下的所有app数量
+                from app.repositories import app_repository
+                apps_orm = app_repository.get_apps_by_workspace_id(db, workspace_id)
+                rag_data["total_app"] = len(apps_orm)
+                
+                # total_knowledge: 使用 total_kb（总知识库数）
+                total_kb = memory_dashboard_service.get_rag_total_kb(db, current_user)
+                rag_data["total_knowledge"] = total_kb
+                
+                # total_api_call: 固定值
+                rag_data["total_api_call"] = 1024
+                
+                api_logger.info(f"成功获取RAG相关数据: memory={total_chunk}, app={len(apps_orm)}, knowledge={total_kb}")
            except Exception as e:
-                api_logger.warning(f"获取RAG记忆总量失败: {str(e)}")
+                api_logger.warning(f"获取RAG相关数据失败: {str(e)}")
            
-            # 2. 获取共享统计数据（total_app、total_knowledge、total_api_call）
-            common_stats = memory_dashboard_service.get_dashboard_common_stats(db, workspace_id)
-            rag_data.update(common_stats)
-            api_logger.info(f"成功获取共享统计: app={common_stats['total_app']}, knowledge={common_stats['total_knowledge']}, api_call={common_stats['total_api_call']}")
-            
-            # 计算昨日对比
-            try:
-                changes = memory_dashboard_service.get_dashboard_yesterday_changes(
-                    db=db,
-                    workspace_id=workspace_id,
-                    storage_type=storage_type,
-                    today_data=rag_data
-                )
-                rag_data.update(changes)
-            except Exception as e:
-                api_logger.warning(f"计算RAG昨日对比失败: {str(e)}")
-                rag_data.update({
-                    "total_memory_change": None,
-                    "total_app_change": None,
-                    "total_knowledge_change": None,
-                    "total_api_call_change": None,
-                })
-
            result["rag_data"] = rag_data
            api_logger.info("成功获取rag_data")
        
--- a/api/app/controllers/memory_episodic_controller.py
+++ b/api/app/controllers/memory_episodic_controller.py
@@ -1,133 +0,0 @@
-"""
-情景记忆相关的控制器
-包含情景记忆总览和详情查询接口
-"""
-
-from fastapi import APIRouter, Depends, Header
-
-from app.core.error_codes import BizCode
-from app.core.language_utils import get_language_from_header
-from app.core.logging_config import get_api_logger
-from app.core.response_utils import fail, success
-from app.dependencies import get_current_user
-from app.models.user_model import User
-from app.schemas.response_schema import ApiResponse
-from app.schemas.memory_episodic_schema import (
-    EpisodicMemoryOverviewRequest,
-    EpisodicMemoryDetailsRequest,
-    translate_episodic_type,
-)
-from app.services.memory_episodic_service import memory_episodic_service
-
-# Get API logger
-api_logger = get_api_logger()
-
-router = APIRouter(
-    prefix="/memory/episodic-memory",
-    tags=["Episodic Memory"],
-)
-
-
-@router.post("/overview", response_model=ApiResponse)
-async def get_episodic_memory_overview_api(
-    request: EpisodicMemoryOverviewRequest,
-    current_user: User = Depends(get_current_user),
-) -> dict:
-    """
-    获取情景记忆总览
-    
-    返回指定用户的所有情景记忆列表，包括标题和创建时间。
-    支持通过时间范围、情景类型和标题关键词进行筛选。
-    
-    """
-    workspace_id = current_user.current_workspace_id
-    
-    # 检查用户是否已选择工作空间
-    if workspace_id is None:
-        api_logger.warning(f"用户 {current_user.username} 尝试查询情景记忆总览但未选择工作空间")
-        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-    
-    # 验证参数
-    valid_time_ranges = ["all", "today", "this_week", "this_month"]
-    valid_episodic_types = ["all", "conversation", "project_work", "learning", "decision", "important_event"]
-    
-    if request.time_range not in valid_time_ranges:
-        return fail(BizCode.INVALID_PARAMETER, f"无效的时间范围参数，可选值：{', '.join(valid_time_ranges)}")
-    
-    if request.episodic_type not in valid_episodic_types:
-        return fail(BizCode.INVALID_PARAMETER, f"无效的情景类型参数，可选值：{', '.join(valid_episodic_types)}")
-    
-    # 处理 title_keyword（去除首尾空格）
-    title_keyword = request.title_keyword.strip() if request.title_keyword else None
-    
-    api_logger.info(
-        f"情景记忆总览查询请求: end_user_id={request.end_user_id}, user={current_user.username}, "
-        f"workspace={workspace_id}, time_range={request.time_range}, episodic_type={request.episodic_type}, "
-        f"title_keyword={title_keyword}"
-    )
-    
-    try:
-        # 调用Service层方法
-        result = await memory_episodic_service.get_episodic_memory_overview(
-            request.end_user_id, request.time_range, request.episodic_type, title_keyword
-        )
-        
-        api_logger.info(
-            f"成功获取情景记忆总览: end_user_id={request.end_user_id}, "
-            f"total={result['total']}"
-        )
-        return success(data=result, msg="查询成功")
-        
-    except Exception as e:
-        api_logger.error(f"情景记忆总览查询失败: end_user_id={request.end_user_id}, error={str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "情景记忆总览查询失败", str(e))
-
-
-@router.post("/details", response_model=ApiResponse)
-async def get_episodic_memory_details_api(
-    request: EpisodicMemoryDetailsRequest,
-    language_type: str = Header(default=None, alias="X-Language-Type"),
-    current_user: User = Depends(get_current_user),
-) -> dict:
-    """
-    获取情景记忆详情
-    
-    返回指定情景记忆的详细信息，包括涉及对象、情景类型、内容记录和情绪。
-    
-    """
-    workspace_id = current_user.current_workspace_id
-    
-    # 检查用户是否已选择工作空间
-    if workspace_id is None:
-        api_logger.warning(f"用户 {current_user.username} 尝试查询情景记忆详情但未选择工作空间")
-        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-    
-    api_logger.info(
-        f"情景记忆详情查询请求: end_user_id={request.end_user_id}, summary_id={request.summary_id}, "
-        f"user={current_user.username}, workspace={workspace_id}"
-    )
-    
-    try:
-        # 调用Service层方法
-        result = await memory_episodic_service.get_episodic_memory_details(
-            end_user_id=request.end_user_id,
-            summary_id=request.summary_id
-        )
-        
-        # 根据语言参数翻译 episodic_type
-        language = get_language_from_header(language_type)
-        if "episodic_type" in result:
-            result["episodic_type"] = translate_episodic_type(result["episodic_type"], language)
-        
-        api_logger.info(
-            f"成功获取情景记忆详情: end_user_id={request.end_user_id}, summary_id={request.summary_id}"
-        )
-        return success(data=result, msg="查询成功")
-        
-    except ValueError as e:
-        # 处理情景记忆不存在的情况
-        api_logger.warning(f"情景记忆不存在: end_user_id={request.end_user_id}, summary_id={request.summary_id}, error={str(e)}")
-        return fail(BizCode.INVALID_PARAMETER, "情景记忆不存在", str(e))
-    except Exception as e:
-        api_logger.error(f"情景记忆详情查询失败: end_user_id={request.end_user_id}, summary_id={request.summary_id}, error={str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "情景记忆详情查询失败", str(e))
--- a/api/app/controllers/memory_explicit_controller.py
+++ b/api/app/controllers/memory_explicit_controller.py
@@ -1,115 +0,0 @@
-"""
-显性记忆控制器
-
-处理显性记忆相关的API接口，包括情景记忆和语义记忆的查询。
-"""
-
-from fastapi import APIRouter, Depends
-
-from app.core.logging_config import get_api_logger
-from app.core.response_utils import success, fail
-from app.core.error_codes import BizCode
-from app.services.memory_explicit_service import MemoryExplicitService
-from app.schemas.response_schema import ApiResponse
-from app.schemas.memory_explicit_schema import (
-    ExplicitMemoryOverviewRequest,
-    ExplicitMemoryDetailsRequest,
-)
-from app.dependencies import get_current_user
-from app.models.user_model import User
-
-# Get API logger
-api_logger = get_api_logger()
-
-# Initialize service
-memory_explicit_service = MemoryExplicitService()
-
-router = APIRouter(
-    prefix="/memory/explicit-memory",
-    tags=["Explicit Memory"],
-)
-
-
-@router.post("/overview", response_model=ApiResponse)
-async def get_explicit_memory_overview_api(
-    request: ExplicitMemoryOverviewRequest,
-    current_user: User = Depends(get_current_user),
-) -> dict:
-    """
-    获取显性记忆总览
-    
-    返回指定用户的所有显性记忆列表，包括标题、完整内容、创建时间和情绪信息。
-    """
-    workspace_id = current_user.current_workspace_id
-    
-    # 检查用户是否已选择工作空间
-    if workspace_id is None:
-        api_logger.warning(f"用户 {current_user.username} 尝试查询显性记忆总览但未选择工作空间")
-        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-    
-    api_logger.info(
-        f"显性记忆总览查询请求: end_user_id={request.end_user_id}, user={current_user.username}, "
-        f"workspace={workspace_id}"
-    )
-    
-    try:
-        # 调用Service层方法
-        result = await memory_explicit_service.get_explicit_memory_overview(
-            request.end_user_id
-        )
-        
-        api_logger.info(
-            f"成功获取显性记忆总览: end_user_id={request.end_user_id}, "
-            f"total={result['total']}"
-        )
-        return success(data=result, msg="查询成功")
-        
-    except Exception as e:
-        api_logger.error(f"显性记忆总览查询失败: end_user_id={request.end_user_id}, error={str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "显性记忆总览查询失败", str(e))
-
-
-@router.post("/details", response_model=ApiResponse)
-async def get_explicit_memory_details_api(
-    request: ExplicitMemoryDetailsRequest,
-    current_user: User = Depends(get_current_user),
-) -> dict:
-    """
-    获取显性记忆详情
-    
-    根据 memory_id 返回情景记忆或语义记忆的详细信息。
-    - 情景记忆：包括标题、内容、情绪、创建时间
-    - 语义记忆：包括名称、核心定义、详细笔记、创建时间
-    """
-    workspace_id = current_user.current_workspace_id
-    
-    # 检查用户是否已选择工作空间
-    if workspace_id is None:
-        api_logger.warning(f"用户 {current_user.username} 尝试查询显性记忆详情但未选择工作空间")
-        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-    
-    api_logger.info(
-        f"显性记忆详情查询请求: end_user_id={request.end_user_id}, memory_id={request.memory_id}, "
-        f"user={current_user.username}, workspace={workspace_id}"
-    )
-    
-    try:
-        # 调用Service层方法
-        result = await memory_explicit_service.get_explicit_memory_details(
-            end_user_id=request.end_user_id,
-            memory_id=request.memory_id
-        )
-        
-        api_logger.info(
-            f"成功获取显性记忆详情: end_user_id={request.end_user_id}, memory_id={request.memory_id}, "
-            f"memory_type={result.get('memory_type')}"
-        )
-        return success(data=result, msg="查询成功")
-        
-    except ValueError as e:
-        # 处理记忆不存在的情况
-        api_logger.warning(f"显性记忆不存在: end_user_id={request.end_user_id}, memory_id={request.memory_id}, error={str(e)}")
-        return fail(BizCode.INVALID_PARAMETER, "显性记忆不存在", str(e))
-    except Exception as e:
-        api_logger.error(f"显性记忆详情查询失败: end_user_id={request.end_user_id}, memory_id={request.memory_id}, error={str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "显性记忆详情查询失败", str(e))
--- a/api/app/controllers/memory_forget_controller.py
+++ b/api/app/controllers/memory_forget_controller.py
@@ -1,462 +0,0 @@
-"""
-遗忘引擎控制器模块
-
-本模块提供遗忘引擎的 REST API 接口，包括：
-1. 手动触发遗忘周期
-2. 获取和更新配置
-3. 获取统计信息
-4. 获取遗忘曲线数据
-
-所有接口都需要用户认证，并自动关联到当前工作空间。
-"""
-
-from typing import Optional
-from uuid import UUID
-
-from fastapi import APIRouter, Depends
-from sqlalchemy.orm import Session
-
-from app.core.error_codes import BizCode
-from app.core.logging_config import get_api_logger
-from app.core.response_utils import fail, success
-from app.db import get_db
-from app.dependencies import get_current_user
-from app.models.user_model import User
-from app.schemas.memory_storage_schema import (
-    ForgettingTriggerRequest,
-    ForgettingConfigResponse,
-    ForgettingConfigUpdateRequest,
-    ForgettingStatsResponse,
-    ForgettingReportResponse,
-    ForgettingCurveRequest,
-    ForgettingCurveResponse,
-    ForgettingCurvePoint,
-    PendingNodesResponse,
-)
-from app.schemas.response_schema import ApiResponse
-from app.services.memory_forget_service import MemoryForgetService
-from app.utils.config_utils import resolve_config_id
-
-# 获取API专用日志器
-api_logger = get_api_logger()
-
-router = APIRouter(
-    prefix="/memory/forget-memory",
-    tags=["Memory Forgetting Engine"],
-    dependencies=[Depends(get_current_user)]  # 所有路由都需要认证
-)
-
-# 初始化服务
-forget_service = MemoryForgetService()
-
-
-# ==================== API 端点 ====================
-
-@router.post("/trigger", response_model=ApiResponse)
-async def trigger_forgetting_cycle(
-    payload: ForgettingTriggerRequest,
-    current_user: User = Depends(get_current_user),
-    db: Session = Depends(get_db)
-):
-    """
-    手动触发遗忘周期
-    
-    执行一次完整的遗忘周期，识别并融合低激活值节点。
-    
-    Args:
-        payload: 触发请求参数
-        current_user: 当前用户
-        db: 数据库会话
-    
-    Returns:
-        ApiResponse: 包含遗忘报告的响应
-    """
-    workspace_id = current_user.current_workspace_id
-    end_user_id = payload.end_user_id  # 从 payload 中获取 end_user_id
-    
-    # 检查用户是否已选择工作空间
-    if workspace_id is None:
-        api_logger.warning(f"用户 {current_user.username} 尝试触发遗忘周期但未选择工作空间")
-        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-    
-    # 通过 end_user_id 获取关联的 config_id
-    try:
-        from app.services.memory_agent_service import get_end_user_connected_config
-        
-        connected_config = get_end_user_connected_config(end_user_id, db)
-        config_id = connected_config.get("memory_config_id")
-        config_id = resolve_config_id((config_id), db)
-
-        if config_id is None:
-            api_logger.warning(f"终端用户 {end_user_id} 未关联记忆配置")
-            return fail(BizCode.INVALID_PARAMETER, f"终端用户 {end_user_id} 未关联记忆配置", "memory_config_id is None")
-        
-        api_logger.debug(f"通过 end_user_id={end_user_id} 获取到 config_id={config_id}")
-    except ValueError as e:
-        api_logger.warning(f"获取终端用户配置失败: {str(e)}")
-        return fail(BizCode.INVALID_PARAMETER, str(e), "ValueError")
-    except Exception as e:
-        api_logger.error(f"获取终端用户配置时发生错误: {str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "获取终端用户配置失败", str(e))
-    
-    api_logger.info(
-        f"用户 {current_user.username} 在工作空间 {workspace_id} 请求触发遗忘周期: "
-        f"end_user_id={end_user_id}, config_id={config_id}, max_batch={payload.max_merge_batch_size}, "
-        f"min_days={payload.min_days_since_access}"
-    )
-    
-    try:
-        # 调用服务层执行遗忘周期
-        report = await forget_service.trigger_forgetting_cycle(
-            db=db,
-            end_user_id=end_user_id,  # 服务层方法的参数名是 end_user_id
-            max_merge_batch_size=payload.max_merge_batch_size,
-            min_days_since_access=payload.min_days_since_access,
-            config_id=config_id
-        )
-        
-        # 构建响应
-        response_data = ForgettingReportResponse(**report)
-        
-        return success(data=response_data.model_dump(), msg="遗忘周期执行成功")
-    
-    except RuntimeError as e:
-        api_logger.warning(f"遗忘周期执行被拒绝: {str(e)}")
-        return fail(BizCode.INVALID_PARAMETER, str(e), "RuntimeError")
-    
-    except Exception as e:
-        api_logger.error(f"触发遗忘周期失败: {str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "触发遗忘周期失败", str(e))
-
-
-@router.get("/read_config", response_model=ApiResponse)
-async def read_forgetting_config(
-    config_id: UUID|int,
-    current_user: User = Depends(get_current_user),
-    db: Session = Depends(get_db)
-):
-    """
-    获取遗忘引擎配置
-    
-    读取指定配置ID的遗忘引擎参数。
-    
-    Args:
-        config_id: 配置ID
-        current_user: 当前用户
-        db: 数据库会话
-    
-    Returns:
-        ApiResponse: 包含配置信息的响应
-    """
-    workspace_id = current_user.current_workspace_id
-    
-    # 检查用户是否已选择工作空间
-    if workspace_id is None:
-        api_logger.warning(f"用户 {current_user.username} 尝试读取遗忘引擎配置但未选择工作空间")
-        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-    
-    api_logger.info(
-        f"用户 {current_user.username} 在工作空间 {workspace_id} 请求读取遗忘引擎配置: {config_id}"
-    )
-    
-    try:
-        config_id=resolve_config_id(config_id, db)
-        # 调用服务层读取配置
-        config = forget_service.read_forgetting_config(db=db, config_id=config_id)
-        
-        # 构建响应
-        response_data = ForgettingConfigResponse(**config)
-        
-        return success(data=response_data.model_dump(), msg="查询成功")
-    
-    except ValueError as e:
-        api_logger.warning(f"配置不存在: config_id={config_id}, 错误: {str(e)}")
-        return fail(BizCode.INVALID_PARAMETER, f"配置不存在: {config_id}", str(e))
-    
-    except Exception as e:
-        api_logger.error(f"读取遗忘引擎配置失败: {str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "查询遗忘引擎配置失败", str(e))
-
-
-@router.post("/update_config", response_model=ApiResponse)
-async def update_forgetting_config(
-    payload: ForgettingConfigUpdateRequest,
-    current_user: User = Depends(get_current_user),
-    db: Session = Depends(get_db)
-):
-    """
-    更新遗忘引擎配置
-    
-    更新指定配置ID的遗忘引擎参数。
-    
-    Args:
-        payload: 配置更新请求
-        current_user: 当前用户
-        db: 数据库会话
-    
-    Returns:
-        ApiResponse: 包含更新结果的响应
-    """
-    workspace_id = current_user.current_workspace_id
-    payload.config_id=resolve_config_id((payload.config_id), db)
-
-    
-    # 检查用户是否已选择工作空间
-    if workspace_id is None:
-        api_logger.warning(f"用户 {current_user.username} 尝试更新遗忘引擎配置但未选择工作空间")
-        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-    
-    api_logger.info(
-        f"用户 {current_user.username} 在工作空间 {workspace_id} 请求更新遗忘引擎配置: {payload.config_id}"
-    )
-    
-    try:
-        # 构建更新字段字典（排除 None 值和 config_id）
-        update_data = {
-            key: value 
-            for key, value in payload.model_dump(exclude_none=True).items() 
-            if key != 'config_id'
-        }
-        
-        # 调用服务层更新配置
-        config = forget_service.update_forgetting_config(
-            db=db,
-            config_id=payload.config_id,
-            update_fields=update_data
-        )
-        
-        # 构建响应
-        response_data = ForgettingConfigResponse(**config)
-        
-        return success(data=response_data.model_dump(), msg="更新成功")
-    
-    except ValueError as e:
-        api_logger.warning(f"配置不存在: config_id={payload.config_id}, 错误: {str(e)}")
-        return fail(BizCode.INVALID_PARAMETER, str(e), "ValueError")
-    
-    except Exception as e:
-        db.rollback()
-        api_logger.error(f"更新遗忘引擎配置失败: {str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "更新遗忘引擎配置失败", str(e))
-
-
-@router.get("/stats", response_model=ApiResponse)
-async def get_forgetting_stats(
-    end_user_id: Optional[str] = None,
-    current_user: User = Depends(get_current_user),
-    db: Session = Depends(get_db)
-):
-    """
-    获取遗忘引擎统计信息
-    
-    返回知识层节点统计、激活值分布等信息。
-    
-    Args:
-        end_user_id: 组ID（即 end_user_id，可选）
-        current_user: 当前用户
-        db: 数据库会话
-    
-    Returns:
-        ApiResponse: 包含统计信息的响应
-    """
-    workspace_id = current_user.current_workspace_id
-    # 检查用户是否已选择工作空间
-    if workspace_id is None:
-        api_logger.warning(f"用户 {current_user.username} 尝试获取遗忘引擎统计但未选择工作空间")
-        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-    # 如果提供了 end_user_id，通过它获取 config_id
-    config_id = None
-    if end_user_id:
-        try:
-            from app.services.memory_agent_service import get_end_user_connected_config
-            
-            connected_config = get_end_user_connected_config(end_user_id, db)
-            config_id = connected_config.get("memory_config_id")
-            config_id = resolve_config_id(config_id, db)
-            
-            if config_id is None:
-                api_logger.warning(f"终端用户 {end_user_id} 未关联记忆配置")
-                return fail(BizCode.INVALID_PARAMETER, f"终端用户 {end_user_id} 未关联记忆配置", "memory_config_id is None")
-            
-            api_logger.debug(f"通过 end_user_id={end_user_id} 获取到 config_id={config_id}")
-        except ValueError as e:
-            api_logger.warning(f"获取终端用户配置失败: {str(e)}")
-            return fail(BizCode.INVALID_PARAMETER, str(e), "ValueError")
-        except Exception as e:
-            api_logger.error(f"获取终端用户配置时发生错误: {str(e)}")
-            return fail(BizCode.INTERNAL_ERROR, "获取终端用户配置失败", str(e))
-    
-    api_logger.info(
-        f"用户 {current_user.username} 在工作空间 {workspace_id} 请求获取遗忘引擎统计: "
-        f"end_user_id={end_user_id}, config_id={config_id}"
-    )
-    
-    try:
-        # 调用服务层获取统计信息
-        stats = await forget_service.get_forgetting_stats(
-            db=db,
-            end_user_id=end_user_id,
-            config_id=config_id
-        )
-        
-        # 构建响应
-        response_data = ForgettingStatsResponse(**stats)
-        
-        return success(data=response_data.model_dump(), msg="查询成功")
-    
-    except Exception as e:
-        api_logger.error(f"获取遗忘引擎统计失败: {str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "获取遗忘引擎统计失败", str(e))
-
-
-@router.get("/pending-nodes", response_model=ApiResponse)
-async def get_pending_nodes(
-    end_user_id: str,
-    page: int = 1,
-    pagesize: int = 10,
-    current_user: User = Depends(get_current_user),
-    db: Session = Depends(get_db)
-):
-    """
-    获取待遗忘节点列表（独立分页接口）
-
-    查询满足遗忘条件的节点（激活值低于阈值且最后访问时间超过最小天数）。
-    此接口独立分页，与 /stats 接口分离。
-
-    Args:
-        end_user_id: 组ID（即 end_user_id，必填）
-        page: 页码（从1开始，默认1）
-        pagesize: 每页数量（默认10）
-        current_user: 当前用户
-        db: 数据库会话
-
-    Returns:
-        ApiResponse: 包含待遗忘节点列表和分页信息的响应
-
-    Examples:
-        - 第1页，每页10条：GET /memory/forget-memory/pending-nodes?end_user_id=xxx&page=1&pagesize=10
-        - 第2页，每页20条：GET /memory/forget-memory/pending-nodes?end_user_id=xxx&page=2&pagesize=20
-
-    Notes:
-        - page 从1开始，pagesize 必须大于0
-        - 返回格式：{"items": [...], "page": {"page": 1, "pagesize": 10, "total": 100, "hasnext": true}}
-    """
-    workspace_id = current_user.current_workspace_id
-    # 检查用户是否已选择工作空间
-    if workspace_id is None:
-        api_logger.warning(f"用户 {current_user.username} 尝试获取待遗忘节点但未选择工作空间")
-        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-
-    # 验证 end_user_id 必填
-    if not end_user_id:
-        api_logger.warning(f"用户 {current_user.username} 尝试获取待遗忘节点但未提供 end_user_id")
-        return fail(BizCode.INVALID_PARAMETER, "end_user_id 不能为空", "end_user_id is required")
-
-    # 通过 end_user_id 获取关联的 config_id
-    try:
-        from app.services.memory_agent_service import get_end_user_connected_config
-
-        connected_config = get_end_user_connected_config(end_user_id, db)
-        config_id = connected_config.get("memory_config_id")
-        config_id = resolve_config_id(config_id, db)
-
-        if config_id is None:
-            api_logger.warning(f"终端用户 {end_user_id} 未关联记忆配置")
-            return fail(BizCode.INVALID_PARAMETER, f"终端用户 {end_user_id} 未关联记忆配置", "memory_config_id is None")
-
-        api_logger.debug(f"通过 end_user_id={end_user_id} 获取到 config_id={config_id}")
-    except ValueError as e:
-        api_logger.warning(f"获取终端用户配置失败: {str(e)}")
-        return fail(BizCode.INVALID_PARAMETER, str(e), "ValueError")
-    except Exception as e:
-        api_logger.error(f"获取终端用户配置时发生错误: {str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "获取终端用户配置失败", str(e))
-
-    # 验证分页参数
-    if page < 1:
-        return fail(BizCode.INVALID_PARAMETER, "page 必须大于等于1", "page < 1")
-    if pagesize < 1:
-        return fail(BizCode.INVALID_PARAMETER, "pagesize 必须大于等于1", "pagesize < 1")
-
-    api_logger.info(
-        f"用户 {current_user.username} 在工作空间 {workspace_id} 请求获取待遗忘节点: "
-        f"end_user_id={end_user_id}, page={page}, pagesize={pagesize}"
-    )
-
-    try:
-        # 调用服务层获取待遗忘节点列表
-        result = await forget_service.get_pending_nodes(
-            db=db,
-            end_user_id=end_user_id,
-            config_id=config_id,
-            page=page,
-            pagesize=pagesize
-        )
-
-        # 构建响应
-        response_data = PendingNodesResponse(**result)
-
-        return success(data=response_data.model_dump(), msg="查询成功")
-
-    except Exception as e:
-        api_logger.error(f"获取待遗忘节点列表失败: {str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "获取待遗忘节点列表失败", str(e))
-
-
-@router.post("/forgetting_curve", response_model=ApiResponse)
-async def get_forgetting_curve(
-    request: ForgettingCurveRequest,
-    current_user: User = Depends(get_current_user),
-    db: Session = Depends(get_db)
-):
-    """
-    获取遗忘曲线数据
-    
-    生成遗忘曲线数据用于可视化，模拟记忆激活值随时间的衰减。
-    
-    Args:
-        request: 遗忘曲线请求参数
-        current_user: 当前用户
-        db: 数据库会话
-    
-    Returns:
-        ApiResponse: 包含遗忘曲线数据的响应
-    """
-    workspace_id = current_user.current_workspace_id
-    request.config_id = resolve_config_id((request.config_id), db)
-    # 检查用户是否已选择工作空间
-    if workspace_id is None:
-        api_logger.warning(f"用户 {current_user.username} 尝试获取遗忘曲线但未选择工作空间")
-        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-    
-    api_logger.info(
-        f"用户 {current_user.username} 在工作空间 {workspace_id} 请求获取遗忘曲线: "
-        f"importance_score={request.importance_score}, days={request.days}, config_id={request.config_id}"
-    )
-    
-    try:
-        # 调用服务层生成遗忘曲线
-        result = await forget_service.get_forgetting_curve(
-            db=db,
-            importance_score=request.importance_score,
-            days=request.days,
-            config_id=request.config_id
-        )
-        
-        # 转换为响应格式
-        curve_points = [
-            ForgettingCurvePoint(**point)
-            for point in result['curve_data']
-        ]
-        
-        # 构建响应
-        response_data = ForgettingCurveResponse(
-            curve_data=curve_points,
-            config=result['config']
-        )
-        
-        return success(data=response_data.model_dump(), msg="查询成功")
-    
-    except Exception as e:
-        api_logger.error(f"获取遗忘曲线失败: {str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "获取遗忘曲线失败", str(e))
--- a/api/app/controllers/memory_perceptual_controller.py
+++ b/api/app/controllers/memory_perceptual_controller.py
@@ -1,255 +0,0 @@
-import uuid
-from typing import Optional
-
-from fastapi import APIRouter, Depends, Query
-from sqlalchemy.orm import Session
-
-from app.core.error_codes import BizCode
-from app.core.logging_config import get_api_logger
-from app.core.response_utils import success, fail
-from app.db import get_db
-from app.dependencies import get_current_user
-from app.models import User
-from app.models.memory_perceptual_model import PerceptualType
-from app.schemas.memory_perceptual_schema import (
-    PerceptualQuerySchema,
-    PerceptualFilter
-)
-from app.schemas.response_schema import ApiResponse
-from app.services.memory_perceptual_service import MemoryPerceptualService
-
-api_logger = get_api_logger()
-
-router = APIRouter(
-    prefix="/memory/perceptual",
-    tags=["Perceptual Memory System"],
-    dependencies=[Depends(get_current_user)]
-)
-
-
-@router.get("/{end_user_id}/count", response_model=ApiResponse)
-def get_memory_count(
-        end_user_id: uuid.UUID,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db)
-):
-    """Retrieve perceptual memory statistics for a user group.
-
-    Args:
-        end_user_id: ID of the user group (usually end_user_id in this context)
-        current_user: Current authenticated user
-        db: Database session
-
-    Returns:
-        ApiResponse: Response containing memory count statistics
-    """
-    api_logger.info(f"Fetching perceptual memory statistics: user={current_user.username}, end_user_id={end_user_id}")
-
-    try:
-        service = MemoryPerceptualService(db)
-        count_stats = service.get_memory_count(end_user_id)
-
-        api_logger.info(f"Memory statistics fetched successfully: total={count_stats.get('total', 0)}")
-
-        return success(
-            data=count_stats,
-            msg="Memory statistics retrieved successfully"
-        )
-
-    except Exception as e:
-        api_logger.error(f"Failed to fetch memory statistics: end_user_id={end_user_id}, error={str(e)}")
-        return fail(
-            code=BizCode.INTERNAL_ERROR,
-            msg="Failed to fetch memory statistics",
-        )
-
-
-@router.get("/{end_user_id}/last_visual", response_model=ApiResponse)
-def get_last_visual_memory(
-        end_user_id: uuid.UUID,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db)
-):
-    """Retrieve the most recent VISION-type memory for a user.
-
-    Args:
-        end_user_id: ID of the user group
-        current_user: Current authenticated user
-        db: Database session
-
-    Returns:
-        ApiResponse: Metadata of the latest visual memory
-    """
-    api_logger.info(f"Fetching latest visual memory: user={current_user.username}, end_user_id={end_user_id}")
-
-    try:
-        service = MemoryPerceptualService(db)
-        visual_memory = service.get_latest_visual_memory(end_user_id)
-
-        if visual_memory is None:
-            api_logger.info(f"No visual memory found: end_user_id={end_user_id}")
-            return success(
-                data=None,
-                msg="No visual memory available"
-            )
-
-        api_logger.info(f"Latest visual memory retrieved successfully: file={visual_memory.get('file_name')}")
-
-        return success(
-            data=visual_memory,
-            msg="Latest visual memory retrieved successfully"
-        )
-
-    except Exception as e:
-        api_logger.error(f"Failed to fetch latest visual memory: end_user_id={end_user_id}, error={str(e)}")
-        return fail(
-            code=BizCode.INTERNAL_ERROR,
-            msg="Failed to fetch latest visual memory",
-        )
-
-
-@router.get("/{end_user_id}/last_listen", response_model=ApiResponse)
-def get_last_memory_listen(
-        end_user_id: uuid.UUID,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db)
-):
-    """Retrieve the most recent AUDIO-type memory for a user.
-
-    Args:
-        end_user_id: ID of the user group
-        current_user: Current authenticated user
-        db: Database session
-
-    Returns:
-        ApiResponse: Metadata of the latest audio memory
-    """
-    api_logger.info(f"Fetching latest audio memory: user={current_user.username}, end_user_id={end_user_id}")
-
-    try:
-        service = MemoryPerceptualService(db)
-        audio_memory = service.get_latest_audio_memory(end_user_id)
-
-        if audio_memory is None:
-            api_logger.info(f"No audio memory found: end_user_id={end_user_id}")
-            return success(
-                data=None,
-                msg="No audio memory available"
-            )
-
-        api_logger.info(f"Latest audio memory retrieved successfully: file={audio_memory.get('file_name')}")
-
-        return success(
-            data=audio_memory,
-            msg="Latest audio memory retrieved successfully"
-        )
-
-    except Exception as e:
-        api_logger.error(f"Failed to fetch latest audio memory: end_user_id={end_user_id}, error={str(e)}")
-        return fail(
-            code=BizCode.INTERNAL_ERROR,
-            msg="Failed to fetch latest audio memory",
-        )
-
-
-@router.get("/{end_user_id}/last_text", response_model=ApiResponse)
-def get_last_text_memory(
-        end_user_id: uuid.UUID,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db)
-):
-    """Retrieve the most recent TEXT-type memory for a user.
-
-    Args:
-        end_user_id: ID of the user group
-        current_user: Current authenticated user
-        db: Database session
-
-    Returns:
-        ApiResponse: Metadata of the latest text memory
-    """
-    api_logger.info(f"Fetching latest text memory: user={current_user.username}, end_user_id={end_user_id}")
-
-    try:
-        # 调用服务层获取最近的文本记忆
-        service = MemoryPerceptualService(db)
-        text_memory = service.get_latest_text_memory(end_user_id)
-
-        if text_memory is None:
-            api_logger.info(f"No text memory found: end_user_id={end_user_id}")
-            return success(
-                data=None,
-                msg="No text memory available"
-            )
-
-        api_logger.info(f"Latest text memory retrieved successfully: file={text_memory.get('file_name')}")
-
-        return success(
-            data=text_memory,
-            msg="Latest text memory retrieved successfully"
-        )
-
-    except Exception as e:
-        api_logger.error(f"Failed to fetch latest text memory: end_user_id={end_user_id}, error={str(e)}")
-        return fail(
-            code=BizCode.INTERNAL_ERROR,
-            msg="Failed to fetch latest text memory",
-        )
-
-
-@router.get("/{end_user_id}/timeline", response_model=ApiResponse)
-def get_memory_time_line(
-        end_user_id: uuid.UUID,
-        perceptual_type: Optional[PerceptualType] = Query(None, description="感知类型过滤"),
-        page: int = Query(1, ge=1, description="页码"),
-        page_size: int = Query(10, ge=1, le=100, description="每页大小"),
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db)
-):
-    """Retrieve a timeline of perceptual memories for a user group.
-
-    Args:
-        end_user_id: ID of the user group
-        perceptual_type: Optional filter for perceptual type
-        page: Page number for pagination
-        page_size: Number of items per page
-        current_user: Current authenticated user
-        db: Database session
-
-    Returns:
-        ApiResponse: Timeline data of perceptual memories
-    """
-    api_logger.info(
-        f"Fetching perceptual memory timeline: user={current_user.username}, "
-        f"end_user_id={end_user_id}, type={perceptual_type}, page={page}"
-    )
-
-    try:
-        query = PerceptualQuerySchema(
-            filter=PerceptualFilter(type=perceptual_type),
-            page=page,
-            page_size=page_size
-        )
-
-        service = MemoryPerceptualService(db)
-        timeline_data = service.get_time_line(end_user_id, query)
-
-        api_logger.info(
-            f"Perceptual memory timeline retrieved successfully: total={timeline_data.total}, "
-            f"returned={len(timeline_data.memories)}"
-        )
-
-        return success(
-            data=timeline_data.model_dump(),
-            msg="Perceptual memory timeline retrieved successfully"
-        )
-
-    except Exception as e:
-        api_logger.error(
-            f"Failed to fetch perceptual memory timeline: end_user_id={end_user_id}, "
-            f"error={str(e)}"
-        )
-        return fail(
-            code=BizCode.INTERNAL_ERROR,
-            msg="Failed to fetch perceptual memory timeline",
-        )
--- a/api/app/controllers/memory_reflection_controller.py
+++ b/api/app/controllers/memory_reflection_controller.py
@@ -1,35 +1,16 @@
-"""
-Memory Reflection Controller
-
-This module provides REST API endpoints for managing memory reflection configurations
-and operations. It handles reflection engine setup, configuration management, and
-execution of self-reflection processes across memory systems.
-
-Key Features:
- Reflection configuration management (save, retrieve, update)
- Workspace-wide reflection execution across multiple applications
- Individual configuration-based reflection runs
- Multi-language support for reflection outputs
- Integration with Neo4j memory storage and LLM models
- Comprehensive error handling and logging
-"""
-
 import asyncio
 import time
-import uuid
-from uuid import UUID

-from app.core.language_utils import get_language_from_header
 from app.core.logging_config import get_api_logger
 from app.core.memory.storage_services.reflection_engine.self_reflexion import (
    ReflectionConfig,
-    ReflectionEngine, ReflectionRange, ReflectionBaseline,
+    ReflectionEngine,
 )
 from app.core.response_utils import success
 from app.db import get_db
 from app.dependencies import get_current_user
 from app.models.user_model import User
-from app.repositories.memory_config_repository import MemoryConfigRepository
+from app.repositories.data_config_repository import DataConfigRepository
 from app.repositories.neo4j.neo4j_connector import Neo4jConnector
 from app.schemas.memory_reflection_schemas import Memory_Reflection
 from app.services.memory_reflection_service import (
@@ -38,19 +19,13 @@ from app.services.memory_reflection_service import (
 )
 from app.services.model_service import ModelConfigService
 from dotenv import load_dotenv
-from fastapi import APIRouter, Depends, HTTPException, status,Header
+from fastapi import APIRouter, Depends, HTTPException, status
 from sqlalchemy import text
 from sqlalchemy.orm import Session

-from app.utils.config_utils import resolve_config_id
-
-# Load environment variables for configuration
 load_dotenv()
-
-# Initialize API logger for request tracking and debugging
 api_logger = get_api_logger()

-# Configure router with prefix and tags for API organization
 router = APIRouter(
    prefix="/memory",
    tags=["Memory"],
@@ -63,74 +38,65 @@ async def save_reflection_config(
    current_user: User = Depends(get_current_user),
    db: Session = Depends(get_db),
 ) -> dict:
-    """
-    Save reflection configuration to memory config table
+    """Save reflection configuration to data_comfig table"""
    
-    Persists reflection engine configuration settings to the data_config table,
-    including reflection parameters, model settings, and evaluation criteria.
-    Validates configuration parameters and ensures data consistency.
+
    
-    Args:
-        request: Memory reflection configuration data including:
-            - config_id: Configuration identifier to update
-            - reflection_enabled: Whether reflection is enabled
-            - reflection_period_in_hours: Reflection execution interval
-            - reflexion_range: Scope of reflection (partial/all)
-            - baseline: Reflection strategy (time/fact/hybrid)
-            - reflection_model_id: LLM model for reflection operations
-            - memory_verify: Enable memory verification checks
-            - quality_assessment: Enable quality assessment evaluation
-        current_user: Authenticated user saving the configuration
-        db: Database session for data operations
-    
-    Returns:
-        dict: Success response with saved reflection configuration data
-        
-    Raises:
-        HTTPException 400: If config_id is missing or parameters are invalid
-        HTTPException 500: If configuration save operation fails
-        
-    Database Operations:
-        - Updates memory_config table with reflection settings
-        - Commits transaction and refreshes entity
-        - Maintains configuration consistency
-    """
    try:
        config_id = request.config_id
-        config_id = resolve_config_id(config_id, db)
        if not config_id:
            raise HTTPException(
                status_code=status.HTTP_400_BAD_REQUEST,
                detail="缺少必需参数: config_id"
            )
+
        api_logger.info(f"用户 {current_user.username} 保存反思配置，config_id: {config_id}")

-        # Update reflection configuration in database
-        memory_config = MemoryConfigRepository.update_reflection_config(
-            db,
-            config_id=config_id,
-            enable_self_reflexion=request.reflection_enabled,
-            iteration_period=request.reflection_period_in_hours,
-            reflexion_range=request.reflexion_range,
-            baseline=request.baseline,
-            reflection_model_id=request.reflection_model_id,
-            memory_verify=request.memory_verify,
-            quality_assessment=request.quality_assessment
-        )
+        update_params = {
+            "enable_self_reflexion": request.reflection_enabled,
+            "iteration_period": request.reflection_period_in_hours,
+            "reflexion_range": request.reflexion_range,
+            "baseline": request.baseline,
+            "reflection_model_id": request.reflection_model_id,
+            "memory_verify": request.memory_verify,
+            "quality_assessment": request.quality_assessment,
+        }

-        # Commit transaction and refresh entity
+
+
+        query, params = DataConfigRepository.build_update_reflection(config_id, **update_params)
+
+        result = db.execute(text(query), params)
+        if result.rowcount == 0:
+            raise HTTPException(
+                status_code=status.HTTP_404_NOT_FOUND,
+                detail=f"未找到config_id为 {config_id} 的配置"
+            )
+        
        db.commit()
-        db.refresh(memory_config)
+        
+        # 查询更新后的配置
+        select_query, select_params = DataConfigRepository.build_select_reflection(config_id)
+        result = db.execute(text(select_query), select_params).fetchone()
+        
+        if not result:
+            raise HTTPException(
+                status_code=status.HTTP_404_NOT_FOUND,
+                detail=f"更新后未找到config_id为 {config_id} 的配置"
+            )
+        
+        api_logger.info(f"成功保存反思配置到数据库，config_id: {config_id}")

        reflection_result={
-                "config_id": memory_config.config_id,
-                "enable_self_reflexion": memory_config.enable_self_reflexion,
-                "iteration_period": memory_config.iteration_period,
-                "reflexion_range": memory_config.reflexion_range,
-                "baseline": memory_config.baseline,
-                "reflection_model_id": memory_config.reflection_model_id,
-                "memory_verify": memory_config.memory_verify,
-                "quality_assessment": memory_config.quality_assessment}
+                "config_id": result.config_id,
+                "enable_self_reflexion": result.enable_self_reflexion,
+                "iteration_period": result.iteration_period,
+                "reflexion_range": result.reflexion_range,
+                "baseline": result.baseline,
+                "reflection_model_id": result.reflection_model_id,
+                "memory_verify": result.memory_verify,
+                "quality_assessment": result.quality_assessment,
+                "user_id": result.user_id}

        return success(data=reflection_result, msg="反思配置成功")
        
@@ -150,119 +116,48 @@ async def save_reflection_config(
        )


-@router.get("/reflection")
+@router.post("/reflection")
 async def start_workspace_reflection(
+    config_id: int,
    current_user: User = Depends(get_current_user),
    db: Session = Depends(get_db),
 ) -> dict:
-    """
-    Start reflection functionality for all matching applications in workspace
-    
-    Initiates reflection processes across all applications within the user's current
-    workspace that have valid memory configurations. Processes each application's
-    configurations and associated end users, executing reflection operations
-    with proper error isolation and transaction management.
-    
-    This endpoint serves as a workspace-wide reflection orchestrator, ensuring
-    that reflection failures for individual users don't affect other operations.
-    
-    Args:
-        current_user: Authenticated user initiating workspace reflection
-        db: Database session for configuration queries
-    
-    Returns:
-        dict: Success response with reflection results for all processed applications:
-            - app_id: Application identifier
-            - config_id: Memory configuration identifier
-            - end_user_id: End user identifier
-            - reflection_result: Individual reflection operation result
-    
-    Processing Logic:
-        1. Retrieve all applications in the current workspace
-        2. Filter applications with valid memory configurations
-        3. For each configuration, find matching releases
-        4. Execute reflection for each end user with isolated transactions
-        5. Aggregate results with error handling per user
-    
-    Error Handling:
-        - Individual user reflection failures are isolated
-        - Failed operations are logged and included in results
-        - Database transactions are isolated per user to prevent cascading failures
-        - Comprehensive error reporting for debugging
-    
-    Raises:
-        HTTPException 500: If workspace reflection initialization fails
-        
-    Performance Notes:
-        - Uses independent database sessions for each user operation
-        - Prevents transaction failures from affecting other users
-        - Comprehensive logging for operation tracking
-    """
+    """Activate the reflection function for all matching applications in the workspace"""
    workspace_id = current_user.current_workspace_id
+    reflection_service = MemoryReflectionService(db)

    try:
        api_logger.info(f"用户 {current_user.username} 启动workspace反思，workspace_id: {workspace_id}")

-        # Use independent database session to get workspace app details, avoiding transaction failures
-        from app.db import get_db_context
-        with get_db_context() as query_db:
-            service = WorkspaceAppService(query_db)
-            result = service.get_workspace_apps_detailed(workspace_id)
+        service = WorkspaceAppService(db)
+        result = service.get_workspace_apps_detailed(workspace_id)
        
        reflection_results = []
        
-        # Process each application in the workspace
        for data in result['apps_detailed_info']:
-            # Skip applications without configurations
-            if not data['memory_configs']:
-                api_logger.debug(f"应用 {data['id']} 没有memory_configs，跳过")
+            if data['data_configs'] == []: 
                continue
-
+                
            releases = data['releases']
-            memory_configs = data['memory_configs']
+            data_configs = data['data_configs']
            end_users = data['end_users']
-
-            # Execute reflection for each configuration and user combination
-            for config in memory_configs:
-                config_id_str = str(config['config_id'])
-
-                # Find all releases matching this configuration
-                matching_releases = [r for r in releases if str(r['config']) == config_id_str]
-
-                if not matching_releases:
-                    api_logger.debug(f"配置 {config_id_str} 没有匹配的release")
-                    continue
-
-                # Execute reflection for each user - using independent database sessions
-                for user in end_users:
-                    api_logger.info(f"为用户 {user['id']} 启动反思，config_id: {config_id_str}")
-
-                    # Create independent database session for each user to avoid transaction failure impact
-                    with get_db_context() as user_db:
-                        try:
-                            reflection_service = MemoryReflectionService(user_db)
-                            reflection_result = await reflection_service.start_text_reflection(
-                                config_data=config,
-                                end_user_id=user['id']
-                            )
-
-                            reflection_results.append({
-                                "app_id": data['id'],
-                                "config_id": config_id_str,
-                                "end_user_id": user['id'],
-                                "reflection_result": reflection_result
-                            })
-                        except Exception as e:
-                            api_logger.error(f"用户 {user['id']} 反思失败: {str(e)}")
-                            reflection_results.append({
-                                "app_id": data['id'],
-                                "config_id": config_id_str,
-                                "end_user_id": user['id'],
-                                "reflection_result": {
-                                    "status": "错误",
-                                    "message": f"反思失败: {str(e)}"
-                                }
-                            })
+            
+            for base, config, user in zip(releases, data_configs, end_users):
+                if int(base['config']) == int(config['config_id']) and base['app_id'] == user['app_id']:
+                    # 调用反思服务
+                    api_logger.info(f"为用户 {user['id']} 启动反思，config_id: {config['config_id']}")
+                    
+                    reflection_result = await reflection_service.start_reflection_from_data(
+                        config_data=config,
+                        end_user_id=user['id']
+                    )
+                    
+                    reflection_results.append({
+                        "app_id": base['app_id'],
+                        "config_id": config['config_id'],
+                        "end_user_id": user['id'],
+                        "reflection_result": reflection_result
+                    })

        return success(data=reflection_results, msg="反思配置成功")

@@ -276,73 +171,42 @@ async def start_workspace_reflection(

@router.get("/reflection/configs")
 async def start_reflection_configs(
-        config_id: uuid.UUID|int,
+        config_id: int,
        current_user: User = Depends(get_current_user),
        db: Session = Depends(get_db),
 ) -> dict:
-    """
-    Query reflection configuration information by config_id
-    
-    Retrieves detailed reflection configuration settings from the memory_config
-    table for a specific configuration ID. Provides comprehensive reflection
-    parameters including model settings, evaluation criteria, and operational flags.
-    
-    Args:
-        config_id: Configuration identifier (UUID or integer) to query
-        current_user: Authenticated user making the request
-        db: Database session for data operations
-    
-    Returns:
-        dict: Success response with detailed reflection configuration:
-            - config_id: Resolved configuration identifier
-            - reflection_enabled: Whether reflection is enabled for this config
-            - reflection_period_in_hours: Reflection execution interval
-            - reflexion_range: Scope of reflection operations (partial/all)
-            - baseline: Reflection strategy (time/fact/hybrid)
-            - reflection_model_id: LLM model identifier for reflection
-            - memory_verify: Memory verification flag
-            - quality_assessment: Quality assessment flag
-    
-    Database Operations:
-        - Queries memory_config table by resolved config_id
-        - Retrieves all reflection-related configuration fields
-        - Resolves configuration ID for consistent formatting
-    
-    Raises:
-        HTTPException 404: If configuration with specified ID is not found
-        HTTPException 500: If configuration query operation fails
-        
-    ID Resolution:
-        - Supports both UUID and integer config_id formats
-        - Automatically resolves to appropriate internal format
-        - Maintains consistency across different ID representations
-    """
-    config_id = resolve_config_id(config_id, db)
+    """通过config_id查询data_config表中的反思配置信息"""
    try:
-        config_id=resolve_config_id(config_id,db)
        api_logger.info(f"用户 {current_user.username} 查询反思配置，config_id: {config_id}")
-        result = MemoryConfigRepository.query_reflection_config_by_id(db, config_id)
-        memory_config_id = resolve_config_id(result.config_id, db)
        
-        # Build response data with comprehensive configuration details
+        # 使用DataConfigRepository查询反思配置
+        select_query, select_params = DataConfigRepository.build_select_reflection(config_id)
+        result = db.execute(text(select_query), select_params).fetchone()
+        
+        if not result:
+            raise HTTPException(
+                status_code=status.HTTP_404_NOT_FOUND,
+                detail=f"未找到config_id为 {config_id} 的配置"
+            )
+        
+        # 构建返回数据
        reflection_config = {
-            "config_id": memory_config_id,
+            "config_id": result.config_id,
            "reflection_enabled": result.enable_self_reflexion,
            "reflection_period_in_hours": result.iteration_period,
            "reflexion_range": result.reflexion_range,
            "baseline": result.baseline,
            "reflection_model_id": result.reflection_model_id,
            "memory_verify": result.memory_verify,
-            "quality_assessment": result.quality_assessment
+            "quality_assessment": result.quality_assessment,
+            "user_id": result.user_id
        }
        api_logger.info(f"成功查询反思配置，config_id: {config_id}")
        return success(data=reflection_config, msg="反思配置查询成功")
-
-        api_logger.info(f"Successfully queried reflection config, config_id: {config_id}")
-        return success(data=reflection_config, msg="Reflection configuration query successful")
        
+
    except HTTPException:
-        # Re-raise HTTP exceptions without modification
+        # 重新抛出HTTP异常
        raise
    except Exception as e:
        api_logger.error(f"查询反思配置失败: {str(e)}")
@@ -353,72 +217,19 @@ async def start_reflection_configs(

@router.get("/reflection/run")
 async def reflection_run(
-    config_id: UUID|int,
-    language_type: str = Header(default=None, alias="X-Language-Type"),
+    config_id: int,
+    language_type: str = "zh",
    current_user: User = Depends(get_current_user),
    db: Session = Depends(get_db),
 ) -> dict:
-    """
-    Execute reflection engine with specified configuration
-    
-    Runs the reflection engine using configuration parameters from the database.
-    Validates model availability, sets up the reflection engine with proper
-    configuration, and executes the reflection process with multi-language support.
-    
-    This endpoint provides a test run capability for reflection configurations,
-    allowing users to validate their reflection settings and see results before
-    deploying to production environments.
-    
-    Args:
-        config_id: Configuration identifier (UUID or integer) for reflection settings
-        language_type: Language preference header for output localization (optional)
-        current_user: Authenticated user executing the reflection
-        db: Database session for configuration queries
-    
-    Returns:
-        dict: Success response with reflection execution results including:
-            - baseline: Reflection strategy used
-            - source_data: Input data processed
-            - memory_verifies: Memory verification results (if enabled)
-            - quality_assessments: Quality assessment results (if enabled)
-            - reflexion_data: Generated reflection insights and solutions
-    
-    Configuration Validation:
-        - Verifies configuration exists in database
-        - Validates LLM model availability
-        - Falls back to default model if specified model is unavailable
-        - Ensures all required parameters are properly set
-    
-    Reflection Engine Setup:
-        - Creates ReflectionConfig with database parameters
-        - Initializes Neo4j connector for memory access
-        - Sets up ReflectionEngine with validated model
-        - Configures language preferences for output
-    
-    Error Handling:
-        - Model validation with fallback to default
-        - Configuration validation and error reporting
-        - Comprehensive logging for debugging
-        - Graceful handling of missing configurations
-    
-    Raises:
-        HTTPException 404: If configuration is not found
-        HTTPException 500: If reflection execution fails
-        
-    Performance Notes:
-        - Direct database query for configuration retrieval
-        - Model validation to prevent runtime failures
-        - Efficient reflection engine initialization
-        - Language-aware output processing
-    """
-    # Use centralized language validation for consistent localization
-    language = get_language_from_header(language_type)
+    """Activate the reflection function for all matching applications in the workspace"""

    api_logger.info(f"用户 {current_user.username} 查询反思配置，config_id: {config_id}")
-    config_id = resolve_config_id(config_id, db)
-    
-    # Query reflection configuration using MemoryConfigRepository
-    result = MemoryConfigRepository.query_reflection_config_by_id(db, config_id)
+
+    # 使用DataConfigRepository查询反思配置
+    select_query, select_params = DataConfigRepository.build_select_reflection(config_id)
+    result = db.execute(text(select_query), select_params).fetchone()
+
    if not result:
        raise HTTPException(
            status_code=status.HTTP_404_NOT_FOUND,
@@ -427,23 +238,22 @@ async def reflection_run(

    api_logger.info(f"成功查询反思配置，config_id: {config_id}")

-    # Validate model ID existence
+    # 验证模型ID是否存在
    model_id = result.reflection_model_id
    if model_id:
        try:
-            ModelConfigService.get_model_by_id(db=db, model_id=uuid.UUID(model_id))
+            ModelConfigService.get_model_by_id(db=db, model_id=model_id)
            api_logger.info(f"模型ID验证成功: {model_id}")
        except Exception as e:
            api_logger.warning(f"模型ID '{model_id}' 不存在，将使用默认模型: {str(e)}")
            # 可以设置为None，让反思引擎使用默认模型
            model_id = None

-    # Create reflection configuration with database parameters
    config = ReflectionConfig(
        enabled=result.enable_self_reflexion,
        iteration_period=result.iteration_period,
-        reflexion_range=ReflectionRange(result.reflexion_range),
-        baseline=ReflectionBaseline(result.baseline),
+        reflexion_range=result.reflexion_range,
+        baseline=result.baseline,
        output_example='',
        memory_verify=result.memory_verify,
        quality_assessment=result.quality_assessment,
@@ -451,13 +261,11 @@ async def reflection_run(
        model_id=model_id,
        language_type=language_type
    )
-    
-    # Initialize Neo4j connector and reflection engine
    connector = Neo4jConnector()
    engine = ReflectionEngine(
        config=config,
        neo4j_connector=connector,
-        llm_client=model_id  # Pass validated model_id
+        llm_client=model_id  # 传入验证后的 model_id
    )

    result=await (engine.reflection_run())
--- a/api/app/controllers/memory_short_term_controller.py
+++ b/api/app/controllers/memory_short_term_controller.py
@@ -1,118 +0,0 @@
-"""
-Memory Short Term Controller
-
-This module provides REST API endpoints for managing short-term and long-term memory
-data retrieval and analysis. It handles memory system statistics, data aggregation,
-and provides comprehensive memory insights for end users.
-
-Key Features:
- Short-term memory data retrieval and statistics
- Long-term memory data aggregation
- Entity count integration
- Multi-language response support
- Memory system analytics and reporting
-"""
-
-from typing import Optional
-
-from dotenv import load_dotenv
-from fastapi import APIRouter, Depends, Header, HTTPException, status
-from sqlalchemy.orm import Session
-
-from app.core.language_utils import get_language_from_header
-from app.core.logging_config import get_api_logger
-from app.core.response_utils import success
-from app.db import get_db
-from app.dependencies import get_current_user
-from app.models.user_model import User
-from app.services.memory_short_service import LongService, ShortService
-from app.services.memory_storage_service import search_entity
-
-# Load environment variables for configuration
-load_dotenv()
-
-# Initialize API logger for request tracking and debugging
-api_logger = get_api_logger()
-
-# Configure router with prefix and tags for API organization
-router = APIRouter(
-    prefix="/memory/short",
-    tags=["Memory"],
-)
-@router.get("/short_term")
-async def short_term_configs(
-        end_user_id: str,
-        language_type:str = Header(default=None, alias="X-Language-Type"),
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
-):
-    """
-    Retrieve comprehensive short-term and long-term memory statistics
-    
-    Provides a comprehensive overview of memory system data for a specific end user,
-    including short-term memory entries, long-term memory aggregations, entity counts,
-    and retrieval statistics. Supports multi-language responses based on request headers.
-    
-    This endpoint serves as a central dashboard for memory system analytics, combining
-    data from multiple memory subsystems to provide a holistic view of user memory state.
-    
-    Args:
-        end_user_id: Unique identifier for the end user whose memory data to retrieve
-        language_type: Language preference header for response localization (optional)
-        current_user: Authenticated user making the request (injected by dependency)
-        db: Database session for data operations (injected by dependency)
-    
-    Returns:
-        dict: Success response containing comprehensive memory statistics:
-            - short_term: List of short-term memory entries with detailed data
-            - long_term: List of long-term memory aggregations and summaries
-            - entity: Count of entities associated with the end user
-            - retrieval_number: Total count of short-term memory retrievals
-            - long_term_number: Total count of long-term memory entries
-    
-    Response Structure:
-        {
-            "code": 200,
-            "msg": "Short-term memory system data retrieved successfully",
-            "data": {
-                "short_term": [...],      # Short-term memory entries
-                "long_term": [...],       # Long-term memory data
-                "entity": 42,             # Entity count
-                "retrieval_number": 156,  # Short-term retrieval count
-                "long_term_number": 23    # Long-term memory count
-            }
-        }
-    
-    Raises:
-        HTTPException: If end_user_id is invalid or data retrieval fails
-        
-    Performance Notes:
-        - Combines multiple service calls for comprehensive data
-        - Entity search is performed asynchronously for better performance
-        - Response time depends on memory data volume for the specified user
-    """
-    # Use centralized language validation for consistent localization
-    language = get_language_from_header(language_type)
-    
-    # Retrieve short-term memory data and statistics
-    short_term = ShortService(end_user_id, db)
-    short_result = short_term.get_short_databasets()  # Get short-term memory entries
-    short_count = short_term.get_short_count()        # Get short-term retrieval count
-
-    # Retrieve long-term memory data and aggregations
-    long_term = LongService(end_user_id, db)
-    long_result = long_term.get_long_databasets()     # Get long-term memory entries
-
-    # Get entity count for the specified end user
-    entity_result = await search_entity(end_user_id)
-    
-    # Compile comprehensive memory statistics response
-    result = {
-        'short_term': short_result,                    # Short-term memory entries
-        'long_term': long_result,                      # Long-term memory data
-        'entity': entity_result.get('num', 0),        # Entity count (default to 0 if not found)
-        "retrieval_number": short_count,               # Short-term retrieval statistics
-        "long_term_number": len(long_result)          # Long-term memory entry count
-    }
-
-    return success(data=result, msg="短期记忆系统数据获取成功")
--- a/api/app/controllers/memory_storage_controller.py
+++ b/api/app/controllers/memory_storage_controller.py
@@ -1,23 +1,29 @@
+import datetime
+import os
+import uuid
 from typing import Optional
-from uuid import UUID
-
-from fastapi import APIRouter, Depends, Query
-from fastapi.responses import StreamingResponse, JSONResponse
-from sqlalchemy.orm import Session

 from app.core.error_codes import BizCode
-from app.core.language_utils import get_language_from_header
 from app.core.logging_config import get_api_logger
+from app.core.memory.utils.self_reflexion_utils import self_reflexion
 from app.core.response_utils import fail, success
 from app.db import get_db
 from app.dependencies import get_current_user
+from app.models.end_user_model import EndUser
 from app.models.user_model import User
+from app.schemas.end_user_schema import (
+    EndUserProfileResponse,
+    EndUserProfileUpdate,
+)
 from app.schemas.memory_storage_schema import (
    ConfigKey,
    ConfigParamsCreate,
+    ConfigParamsDelete,
    ConfigPilotRun,
    ConfigUpdate,
    ConfigUpdateExtracted,
+    ConfigUpdateForget,
+    GenerateCacheRequest,
 )
 from app.schemas.response_schema import ApiResponse
 from app.services.memory_storage_service import (
@@ -26,20 +32,19 @@ from app.services.memory_storage_service import (
    analytics_hot_memory_tags,
    analytics_recent_activity_stats,
    kb_type_distribution,
-    search_all_batch,
+    search_all,
    search_chunk,
    search_detials,
    search_dialogue,
    search_edges,
    search_entity,
+    search_entity_graph,
    search_statement,
 )
-from fastapi import APIRouter, Depends, Header
+from fastapi import APIRouter, Depends
 from fastapi.responses import StreamingResponse
 from sqlalchemy.orm import Session

-from app.utils.config_utils import resolve_config_id
-
 # Get API logger
 api_logger = get_api_logger()

@@ -54,8 +59,8 @@ router = APIRouter(

@router.get("/info", response_model=ApiResponse)
 async def get_storage_info(
-        storage_id: str,
-        current_user: User = Depends(get_current_user)
+    storage_id: str,
+    current_user: User = Depends(get_current_user)
 ):
    """
    Example wrapper endpoint - retrieves storage information
@@ -75,19 +80,83 @@ async def get_storage_info(
        return fail(BizCode.INTERNAL_ERROR, "存储信息获取失败", str(e))


-@router.post("/create_config", response_model=ApiResponse)  # 创建配置文件，其他参数默认
+# --- DB connection dependency ---
+_CONN: Optional[object] = None
+
+
+"""PostgreSQL 连接生成与管理（使用 psycopg2）。"""
+# 这个可以转移，可能是已经有的
+# PostgreSQL 数据库连接
+def _make_pgsql_conn() -> Optional[object]:  # 创建 PostgreSQL 数据库连接
+    host = os.getenv("DB_HOST")
+    user = os.getenv("DB_USER")
+    password = os.getenv("DB_PASSWORD")
+    database = os.getenv("DB_NAME")
+    port_str = os.getenv("DB_PORT")
+    try:
+        import psycopg2  # type: ignore
+        port = int(port_str) if port_str else 5432
+        conn = psycopg2.connect(
+            host=host or "localhost",
+            port=port,
+            user=user,
+            password=password,
+            dbname=database,
+        )
+        # 设置自动提交，避免显式事务管理
+        conn.autocommit = True
+        # 设置会话时区为中国标准时间（Asia/Shanghai），便于直接以本地时区展示
+        try:
+            cur = conn.cursor()
+            cur.execute("SET TIME ZONE 'Asia/Shanghai'")
+            cur.close()
+        except Exception:
+            # 时区设置失败不影响连接，仅记录但不抛出
+            pass
+        return conn
+    except Exception as e:
+        try:
+            print(f"[PostgreSQL] 连接失败: {e}")
+        except Exception:
+            pass
+        return None
+
+def get_db_conn() -> Optional[object]:  # 获取 PostgreSQL 数据库连接
+    global _CONN
+    if _CONN is None:
+        _CONN = _make_pgsql_conn()
+    return _CONN
+
+
+def reset_db_conn() -> bool:  # 重置 PostgreSQL 数据库连接
+    """Close and recreate the global DB connection."""
+    global _CONN
+    try:
+        if _CONN:
+            try:
+                _CONN.close()
+            except Exception:
+                pass
+        _CONN = _make_pgsql_conn()
+        return _CONN is not None
+    except Exception:
+        _CONN = None
+        return False
+
+
+@router.post("/create_config", response_model=ApiResponse)   # 创建配置文件，其他参数默认
 def create_config(
-        payload: ConfigParamsCreate,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
-        x_language_type: Optional[str] = Header(None, alias="X-Language-Type"),
-) -> dict:
+    payload: ConfigParamsCreate,
+    current_user: User = Depends(get_current_user),
+    db: Session = Depends(get_db),
+    ) -> dict:
    workspace_id = current_user.current_workspace_id
+    
    # 检查用户是否已选择工作空间
    if workspace_id is None:
        api_logger.warning(f"用户 {current_user.username} 尝试创建配置但未选择工作空间")
        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-
+    
    api_logger.info(f"用户 {current_user.username} 在工作空间 {workspace_id} 请求创建配置: {payload.config_name}")
    try:
        # 将 workspace_id 注入到 payload 中（保持为 UUID 类型）
@@ -95,130 +164,46 @@ def create_config(
        svc = DataConfigService(db)
        result = svc.create(payload)
        return success(data=result, msg="创建成功")
-    except ValueError as e:
-        err_str = str(e)
-        if err_str.startswith("DUPLICATE_CONFIG_NAME:"):
-            config_name = err_str.split(":", 1)[1]
-            api_logger.warning(f"重复的配置名称 '{config_name}' 在工作空间 {workspace_id}")
-            lang = get_language_from_header(x_language_type)
-            if lang == "en":
-                msg = fail(BizCode.BAD_REQUEST, "Config name already exists",
-                           f"A config named \"{config_name}\" already exists in the current workspace. Please use a different name.")
-            else:
-                msg = fail(BizCode.BAD_REQUEST, "配置名称已存在",
-                           f"当前工作空间下已存在名为「{config_name}」的记忆配置，请使用其他名称")
-            return JSONResponse(status_code=400, content=msg)
-        api_logger.error(f"Create config failed: {err_str}")
-        return fail(BizCode.INTERNAL_ERROR, "创建配置失败", err_str)
    except Exception as e:
-        from sqlalchemy.exc import IntegrityError
-        if isinstance(e, IntegrityError) and "uq_workspace_config_name" in str(getattr(e, 'orig', '')):
-            api_logger.warning(f"重复的配置名称 '{payload.config_name}' 在工作空间 {workspace_id}")
-            lang = get_language_from_header(x_language_type)
-            if lang == "en":
-                msg = fail(BizCode.BAD_REQUEST, "Config name already exists",
-                           f"A config named \"{payload.config_name}\" already exists in the current workspace. Please use a different name.")
-            else:
-                msg = fail(BizCode.BAD_REQUEST, "配置名称已存在",
-                           f"当前工作空间下已存在名为「{payload.config_name}」的记忆配置，请使用其他名称")
-            return JSONResponse(status_code=400, content=msg)
        api_logger.error(f"Create config failed: {str(e)}")
        return fail(BizCode.INTERNAL_ERROR, "创建配置失败", str(e))


@router.delete("/delete_config", response_model=ApiResponse)  # 删除数据库中的内容（按配置名称）
 def delete_config(
-        config_id: UUID | int,
-        force: bool = Query(False, description="是否强制删除（即使有终端用户正在使用）"),
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
-) -> dict:
-    """删除记忆配置（带终端用户保护）
-    
-    - 检查是否为默认配置，默认配置不允许删除
-    - 检查是否有终端用户连接到该配置
-    - 如果有连接且 force=False，返回警告
-    - 如果 force=True，清除终端用户引用后删除配置
-    
-    Query Parameters:
-        force: 设置为 true 可强制删除（即使有终端用户正在使用）
-    """
+    config_id: str,
+    current_user: User = Depends(get_current_user),
+    db: Session = Depends(get_db),
+    ) -> dict:
    workspace_id = current_user.current_workspace_id
-    config_id = resolve_config_id(config_id, db)
+    
    # 检查用户是否已选择工作空间
    if workspace_id is None:
        api_logger.warning(f"用户 {current_user.username} 尝试删除配置但未选择工作空间")
        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-
-    api_logger.info(
-        f"用户 {current_user.username} 在工作空间 {workspace_id} 请求删除配置: "
-        f"config_id={config_id}, force={force}"
-    )
-
+    
+    api_logger.info(f"用户 {current_user.username} 在工作空间 {workspace_id} 请求删除配置: {config_id}")
    try:
-        # 使用带保护的删除服务
-        from app.services.memory_config_service import MemoryConfigService
-
-        config_service = MemoryConfigService(db)
-        result = config_service.delete_config(config_id=config_id, force=force)
-
-        if result["status"] == "error":
-            api_logger.warning(
-                f"记忆配置删除被拒绝: config_id={config_id}, reason={result['message']}"
-            )
-            return fail(
-                code=BizCode.FORBIDDEN,
-                msg=result["message"],
-                data={"config_id": str(config_id), "is_default": result.get("is_default", False)}
-            )
-
-        if result["status"] == "warning":
-            api_logger.warning(
-                f"记忆配置正在使用，无法删除: config_id={config_id}, "
-                f"connected_count={result['connected_count']}"
-            )
-            return fail(
-                code=BizCode.RESOURCE_IN_USE,
-                msg=result["message"],
-                data={
-                    "connected_count": result["connected_count"],
-                    "force_required": result["force_required"]
-                }
-            )
-
-        api_logger.info(
-            f"记忆配置删除成功: config_id={config_id}, "
-            f"affected_users={result['affected_users']}"
-        )
-        return success(
-            msg=result["message"],
-            data={"affected_users": result["affected_users"]}
-        )
-
+        svc = DataConfigService(db)
+        result = svc.delete(ConfigParamsDelete(config_id=config_id))
+        return success(data=result, msg="删除成功")
    except Exception as e:
-        api_logger.error(f"Delete config failed: {str(e)}", exc_info=True)
+        api_logger.error(f"Delete config failed: {str(e)}")
        return fail(BizCode.INTERNAL_ERROR, "删除配置失败", str(e))

-
@router.post("/update_config", response_model=ApiResponse)  # 更新配置文件中name和desc
 def update_config(
-        payload: ConfigUpdate,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
-) -> dict:
+    payload: ConfigUpdate,
+    current_user: User = Depends(get_current_user),
+    db: Session = Depends(get_db),
+    ) -> dict:
    workspace_id = current_user.current_workspace_id
-    payload.config_id = resolve_config_id(payload.config_id, db)
+    
    # 检查用户是否已选择工作空间
    if workspace_id is None:
        api_logger.warning(f"用户 {current_user.username} 尝试更新配置但未选择工作空间")
        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-
-    # 校验至少有一个字段需要更新
-    if payload.config_name is None and payload.config_desc is None and payload.scene_id is None:
-        api_logger.warning(f"用户 {current_user.username} 尝试更新配置但未提供任何更新字段")
-        return fail(BizCode.INVALID_PARAMETER, "请至少提供一个需要更新的字段",
-                    "config_name, config_desc, scene_id 均为空")
-
+    
    api_logger.info(f"用户 {current_user.username} 在工作空间 {workspace_id} 请求更新配置: {payload.config_id}")
    try:
        svc = DataConfigService(db)
@@ -231,17 +216,17 @@ def update_config(

@router.post("/update_config_extracted", response_model=ApiResponse)  # 更新数据库中的部分内容 所有业务字段均可选
 def update_config_extracted(
-        payload: ConfigUpdateExtracted,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
-) -> dict:
+    payload: ConfigUpdateExtracted,
+    current_user: User = Depends(get_current_user),
+    db: Session = Depends(get_db),
+    ) -> dict:
    workspace_id = current_user.current_workspace_id
-    payload.config_id = resolve_config_id(payload.config_id, db)
+    
    # 检查用户是否已选择工作空间
    if workspace_id is None:
        api_logger.warning(f"用户 {current_user.username} 尝试更新提取配置但未选择工作空间")
        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-
+    
    api_logger.info(f"用户 {current_user.username} 在工作空间 {workspace_id} 请求更新提取配置: {payload.config_id}")
    try:
        svc = DataConfigService(db)
@@ -253,22 +238,42 @@ def update_config_extracted(


 # --- Forget config params ---
-# 遗忘引擎配置接口已迁移到 memory_forget_controller.py
-# 使用新接口: /api/memory/forget/read_config 和 /api/memory/forget/update_config
-
-@router.get("/read_config_extracted", response_model=ApiResponse)  # 通过查询参数读取某条配置（固定路径） 没有意义的话就删除
-def read_config_extracted(
-        config_id: UUID | int,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
-) -> dict:
+@router.post("/update_config_forget", response_model=ApiResponse) # 更新遗忘引擎配置参数（固定路径）
+def update_config_forget(
+    payload: ConfigUpdateForget,
+    current_user: User = Depends(get_current_user),
+    db: Session = Depends(get_db),
+    ) -> dict:
    workspace_id = current_user.current_workspace_id
-    config_id = resolve_config_id(config_id, db)
+    
+    # 检查用户是否已选择工作空间
+    if workspace_id is None:
+        api_logger.warning(f"用户 {current_user.username} 尝试更新遗忘引擎配置但未选择工作空间")
+        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
+    
+    api_logger.info(f"用户 {current_user.username} 在工作空间 {workspace_id} 请求更新遗忘引擎配置: {payload.config_id}")
+    try:
+        svc = DataConfigService(db)
+        result = svc.update_forget(payload)
+        return success(data=result, msg="更新成功")
+    except Exception as e:
+        api_logger.error(f"Update config forget failed: {str(e)}")
+        return fail(BizCode.INTERNAL_ERROR, "更新遗忘引擎配置失败", str(e))
+
+
+@router.get("/read_config_extracted", response_model=ApiResponse) # 通过查询参数读取某条配置（固定路径） 没有意义的话就删除
+def read_config_extracted(
+    config_id: str,
+    current_user: User = Depends(get_current_user),
+    db: Session = Depends(get_db),
+    ) -> dict:
+    workspace_id = current_user.current_workspace_id
+    
    # 检查用户是否已选择工作空间
    if workspace_id is None:
        api_logger.warning(f"用户 {current_user.username} 尝试读取提取配置但未选择工作空间")
        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-
+    
    api_logger.info(f"用户 {current_user.username} 在工作空间 {workspace_id} 请求读取提取配置: {config_id}")
    try:
        svc = DataConfigService(db)
@@ -278,19 +283,40 @@ def read_config_extracted(
        api_logger.error(f"Read config extracted failed: {str(e)}")
        return fail(BizCode.INTERNAL_ERROR, "查询配置失败", str(e))

-
-@router.get("/read_all_config", response_model=ApiResponse)  # 读取所有配置文件列表
-def read_all_config(
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
-) -> dict:
+@router.get("/read_config_forget", response_model=ApiResponse) # 通过查询参数读取某条配置（固定路径） 没有意义的话就删除
+def read_config_forget(
+    config_id: str,
+    current_user: User = Depends(get_current_user),
+    db: Session = Depends(get_db),
+    ) -> dict:
    workspace_id = current_user.current_workspace_id
+    
+    # 检查用户是否已选择工作空间
+    if workspace_id is None:
+        api_logger.warning(f"用户 {current_user.username} 尝试读取遗忘引擎配置但未选择工作空间")
+        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
+    
+    api_logger.info(f"用户 {current_user.username} 在工作空间 {workspace_id} 请求读取遗忘引擎配置: {config_id}")
+    try:
+        svc = DataConfigService(db)
+        result = svc.get_forget(ConfigKey(config_id=config_id))
+        return success(data=result, msg="查询成功")
+    except Exception as e:
+        api_logger.error(f"Read config forget failed: {str(e)}")
+        return fail(BizCode.INTERNAL_ERROR, "查询遗忘引擎配置失败", str(e))

+@router.get("/read_all_config", response_model=ApiResponse) # 读取所有配置文件列表
+def read_all_config(
+    current_user: User = Depends(get_current_user),
+    db: Session = Depends(get_db),
+    ) -> dict:
+    workspace_id = current_user.current_workspace_id
+    
    # 检查用户是否已选择工作空间
    if workspace_id is None:
        api_logger.warning(f"用户 {current_user.username} 尝试查询配置但未选择工作空间")
        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-
+    
    api_logger.info(f"用户 {current_user.username} 在工作空间 {workspace_id} 请求读取所有配置")
    try:
        svc = DataConfigService(db)
@@ -304,23 +330,17 @@ def read_all_config(

@router.post("/pilot_run", response_model=None)
 async def pilot_run(
-        payload: ConfigPilotRun,
-        language_type: str = Header(default=None, alias="X-Language-Type"),
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
+    payload: ConfigPilotRun,
+    current_user: User = Depends(get_current_user),
+    db: Session = Depends(get_db),
 ) -> StreamingResponse:
-    # 使用集中化的语言校验
-    language = get_language_from_header(language_type)
-
    api_logger.info(
        f"Pilot run requested: config_id={payload.config_id}, "
-        f"dialogue_text_length={len(payload.dialogue_text)}, "
-        f"custom_text_length={len(payload.custom_text) if payload.custom_text else 0}"
+        f"dialogue_text_length={len(payload.dialogue_text)}"
    )
-    payload.config_id = resolve_config_id(payload.config_id, db)
    svc = DataConfigService(db)
    return StreamingResponse(
-        svc.pilot_run_stream(payload, language=language),
+        svc.pilot_run_stream(payload),
        media_type="text/event-stream",
        headers={
            "Cache-Control": "no-cache",
@@ -329,14 +349,15 @@ async def pilot_run(
        },
    )

-
-# ==================== Search & Analytics ====================
+"""
+以下为搜索与分析接口，直接挂载到同一 router，统一响应为 ApiResponse。
+"""

@router.get("/search/kb_type_distribution", response_model=ApiResponse)
 async def get_kb_type_distribution(
-        end_user_id: Optional[str] = None,
-        current_user: User = Depends(get_current_user),
-) -> dict:
+    end_user_id: Optional[str] = None,
+    current_user: User = Depends(get_current_user),
+    ) -> dict:
    api_logger.info(f"KB type distribution requested for end_user_id: {end_user_id}")
    try:
        result = await kb_type_distribution(end_user_id)
@@ -345,12 +366,12 @@ async def get_kb_type_distribution(
        api_logger.error(f"KB type distribution failed: {str(e)}")
        return fail(BizCode.INTERNAL_ERROR, "知识库类型分布查询失败", str(e))

-
+    
@router.get("/search/dialogue", response_model=ApiResponse)
 async def search_dialogues_num(
-        end_user_id: Optional[str] = None,
-        current_user: User = Depends(get_current_user),
-) -> dict:
+    end_user_id: Optional[str] = None,
+    current_user: User = Depends(get_current_user),
+    ) -> dict:
    api_logger.info(f"Search dialogue requested for end_user_id: {end_user_id}")
    try:
        result = await search_dialogue(end_user_id)
@@ -362,9 +383,9 @@ async def search_dialogues_num(

@router.get("/search/chunk", response_model=ApiResponse)
 async def search_chunks_num(
-        end_user_id: Optional[str] = None,
-        current_user: User = Depends(get_current_user),
-) -> dict:
+    end_user_id: Optional[str] = None,
+    current_user: User = Depends(get_current_user),
+    ) -> dict:
    api_logger.info(f"Search chunk requested for end_user_id: {end_user_id}")
    try:
        result = await search_chunk(end_user_id)
@@ -376,9 +397,9 @@ async def search_chunks_num(

@router.get("/search/statement", response_model=ApiResponse)
 async def search_statements_num(
-        end_user_id: Optional[str] = None,
-        current_user: User = Depends(get_current_user),
-) -> dict:
+    end_user_id: Optional[str] = None,
+    current_user: User = Depends(get_current_user),
+    ) -> dict:
    api_logger.info(f"Search statement requested for end_user_id: {end_user_id}")
    try:
        result = await search_statement(end_user_id)
@@ -390,9 +411,9 @@ async def search_statements_num(

@router.get("/search/entity", response_model=ApiResponse)
 async def search_entities_num(
-        end_user_id: Optional[str] = None,
-        current_user: User = Depends(get_current_user),
-) -> dict:
+    end_user_id: Optional[str] = None,
+    current_user: User = Depends(get_current_user),
+    ) -> dict:
    api_logger.info(f"Search entity requested for end_user_id: {end_user_id}")
    try:
        result = await search_entity(end_user_id)
@@ -404,15 +425,12 @@ async def search_entities_num(

@router.get("/search", response_model=ApiResponse)
 async def search_all_num(
-        end_user_id: Optional[str] = None,
-        current_user: User = Depends(get_current_user),
-) -> dict:
+    end_user_id: Optional[str] = None,
+    current_user: User = Depends(get_current_user),
+    ) -> dict:
    api_logger.info(f"Search all requested for end_user_id: {end_user_id}")
    try:
-        if not end_user_id:
-            return success(data={"total": 0}, msg="查询成功")
-        batch_result = await search_all_batch([end_user_id])
-        result = {"total": batch_result.get(end_user_id, 0)}
+        result = await search_all(end_user_id)
        return success(data=result, msg="查询成功")
    except Exception as e:
        api_logger.error(f"Search all failed: {str(e)}")
@@ -421,9 +439,9 @@ async def search_all_num(

@router.get("/search/detials", response_model=ApiResponse)
 async def search_entities_detials(
-        end_user_id: Optional[str] = None,
-        current_user: User = Depends(get_current_user),
-) -> dict:
+    end_user_id: Optional[str] = None,
+    current_user: User = Depends(get_current_user),
+    ) -> dict:
    api_logger.info(f"Search details requested for end_user_id: {end_user_id}")
    try:
        result = await search_detials(end_user_id)
@@ -435,9 +453,9 @@ async def search_entities_detials(

@router.get("/search/edges", response_model=ApiResponse)
 async def search_entity_edges(
-        end_user_id: Optional[str] = None,
-        current_user: User = Depends(get_current_user),
-) -> dict:
+    end_user_id: Optional[str] = None,
+    current_user: User = Depends(get_current_user),
+    ) -> dict:
    api_logger.info(f"Search edges requested for end_user_id: {end_user_id}")
    try:
        result = await search_edges(end_user_id)
@@ -446,112 +464,62 @@ async def search_entity_edges(
        api_logger.error(f"Search edges failed: {str(e)}")
        return fail(BizCode.INTERNAL_ERROR, "边查询失败", str(e))

+@router.get("/search/entity_graph", response_model=ApiResponse)
+async def search_for_entity_graph(
+    end_user_id: Optional[str] = None,
+    current_user: User = Depends(get_current_user),
+    ) -> dict:
+    """
+    搜索所有实体之间的关系网络
+    """
+    api_logger.info(f"Search entity graph requested for end_user_id: {end_user_id}")
+    try:
+        result = await search_entity_graph(end_user_id)
+        return success(data=result, msg="查询成功")
+    except Exception as e:
+        api_logger.error(f"Search entity graph failed: {str(e)}")
+        return fail(BizCode.INTERNAL_ERROR, "实体图查询失败", str(e))
+

@router.get("/analytics/hot_memory_tags", response_model=ApiResponse)
 async def get_hot_memory_tags_api(
-        limit: int = 10,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user),
-) -> dict:
-    """
-    获取热门记忆标签（带Redis缓存）
-    
-    缓存策略：
-    - 缓存键：workspace_id + limit
-    - 过期时间：5分钟（300秒）
-    - 缓存命中：~50ms
-    - 缓存未命中：~600-800ms（取决于LLM速度）
-    """
-    workspace_id = current_user.current_workspace_id
-
-    # 构建缓存键
-    cache_key = f"hot_memory_tags:{workspace_id}:{limit}"
-
-    api_logger.info(f"Hot memory tags requested for workspace: {workspace_id}, limit: {limit}")
-
+    limit: int = 10,
+    db: Session = Depends(get_db),
+    current_user: User = Depends(get_current_user),
+    ) -> dict:
+    api_logger.info(f"Hot memory tags requested for current_user: {current_user.id}")
    try:
-        # 尝试从Redis缓存获取
-        import json
-
-        from app.aioRedis import aio_redis_get, aio_redis_set
-
-        cached_result = await aio_redis_get(cache_key)
-        if cached_result:
-            api_logger.info(f"Cache hit for key: {cache_key}")
-            try:
-                data = json.loads(cached_result)
-                return success(data=data, msg="查询成功（缓存）")
-            except json.JSONDecodeError:
-                api_logger.warning(f"Failed to parse cached data, will refresh")
-
-        # 缓存未命中，执行查询
-        api_logger.info(f"Cache miss for key: {cache_key}, executing query")
        result = await analytics_hot_memory_tags(db, current_user, limit)
-
-        # 写入缓存（过期时间：5分钟）
-        # 注意：result是列表，需要转换为JSON字符串
-        try:
-            cache_data = json.dumps(result, ensure_ascii=False)
-            await aio_redis_set(cache_key, cache_data, expire=300)
-            api_logger.info(f"Cached result for key: {cache_key}")
-        except Exception as cache_error:
-            # 缓存写入失败不影响主流程
-            api_logger.warning(f"Failed to cache result: {str(cache_error)}")
-
        return success(data=result, msg="查询成功")
-
    except Exception as e:
        api_logger.error(f"Hot memory tags failed: {str(e)}")
        return fail(BizCode.INTERNAL_ERROR, "热门标签查询失败", str(e))


-@router.delete("/analytics/hot_memory_tags/cache", response_model=ApiResponse)
-async def clear_hot_memory_tags_cache(
-        current_user: User = Depends(get_current_user),
-) -> dict:
-    """
-    清除热门标签缓存
-    
-    用于：
-    - 手动刷新数据
-    - 调试和测试
-    - 数据更新后立即生效
-    """
-    workspace_id = current_user.current_workspace_id
-
-    api_logger.info(f"Clear hot memory tags cache requested for workspace: {workspace_id}")
-
-    try:
-        from app.aioRedis import aio_redis_delete
-
-        # 清除所有limit的缓存（常见的limit值）
-        cleared_count = 0
-        for limit in [5, 10, 15, 20, 30, 50]:
-            cache_key = f"hot_memory_tags:{workspace_id}:{limit}"
-            result = await aio_redis_delete(cache_key)
-            if result:
-                cleared_count += 1
-                api_logger.info(f"Cleared cache for key: {cache_key}")
-
-        return success(
-            data={"cleared_count": cleared_count},
-            msg=f"成功清除 {cleared_count} 个缓存"
-        )
-
-    except Exception as e:
-        api_logger.error(f"Clear cache failed: {str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "清除缓存失败", str(e))
-
-
@router.get("/analytics/recent_activity_stats", response_model=ApiResponse)
 async def get_recent_activity_stats_api(
-        current_user: User = Depends(get_current_user),
-) -> dict:
-    workspace_id = str(current_user.current_workspace_id) if current_user.current_workspace_id else None
-    api_logger.info(f"Recent activity stats requested: workspace_id={workspace_id}")
+    current_user: User = Depends(get_current_user),
+    ) -> dict:
+    api_logger.info("Recent activity stats requested")
    try:
-        result = await analytics_recent_activity_stats(workspace_id=workspace_id)
+        result = await analytics_recent_activity_stats()
        return success(data=result, msg="查询成功")
    except Exception as e:
        api_logger.error(f"Recent activity stats failed: {str(e)}")
        return fail(BizCode.INTERNAL_ERROR, "最近活动统计失败", str(e))
+
+
+
+
+@router.get("/self_reflexion")
+async def self_reflexion_endpoint(host_id: uuid.UUID) -> str:
+    """
+    自我反思接口，自动对检索出的信息进行自我反思并返回自我反思结果。
+
+    Args:
+        None
+    Returns:
+        自我反思结果。
+    """
+    return await self_reflexion(host_id)
+
--- a/api/app/controllers/memory_working_controller.py
+++ b/api/app/controllers/memory_working_controller.py
@@ -1,143 +0,0 @@
-import uuid
-
-from fastapi import APIRouter, Depends
-from sqlalchemy.orm import Session
-
-from app.core.logging_config import get_api_logger
-from app.core.response_utils import success
-from app.db import get_db
-from app.dependencies import get_current_user
-from app.models import User
-from app.schemas import conversation_schema
-from app.schemas.response_schema import ApiResponse
-from app.services.conversation_service import ConversationService
-
-api_logger = get_api_logger()
-
-router = APIRouter(
-    prefix="/memory/work",
-    tags=["Working Memory System"],
-    dependencies=[Depends(get_current_user)]
-)
-
-
-@router.get("/{end_user_id}/count", response_model=ApiResponse)
-def get_memory_count(
-        end_user_id: uuid.UUID,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db)
-):
-    pass
-
-
-@router.get("/{end_user_id}/conversations", response_model=ApiResponse)
-def get_conversations(
-        end_user_id: uuid.UUID,
-        page: int = 1,
-        pagesize: int = 20,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db)
-):
-    """
-    Retrieve conversations for the current user in a specific group with pagination.
-
-    Args:
-        end_user_id (UUID): The group identifier.
-        page (int): Page number (1-based). Defaults to 1.
-        pagesize (int): Number of items per page. Defaults to 20.
-        current_user (User, optional): The authenticated user.
-        db (Session, optional): SQLAlchemy session.
-
-    Returns:
-        ApiResponse: Contains a paginated list of conversations.
-    """
-    page = max(1, page)
-    page_size = max(1, min(pagesize, 100))  # Limit page size between 1 and 100
-    conversation_service = ConversationService(db)
-    conversations, total = conversation_service.get_user_conversations(
-        end_user_id,
-        page=page,
-        page_size=page_size
-    )
-    return success(data={
-        "items": [
-            {
-                "id": conversation.id,
-                "title": conversation.title
-            } for conversation in conversations
-        ],
-        "total": total,
-        "page": {
-            "page": page,
-            "pagesize": page_size,
-            "total": total,
-            "hasnext": (page * page_size) < total
-        },
-    }, msg="get conversations success")
-
-
-@router.get("/{end_user_id}/messages", response_model=ApiResponse)
-def get_messages(
-        conversation_id: uuid.UUID,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db)
-):
-    """
-    Retrieve the message history for a specific conversation.
-
-    Args:
-        conversation_id (UUID): The ID of the conversation to fetch messages from.
-        current_user (User, optional): The authenticated user.
-        db (Session, optional): SQLAlchemy session.
-
-    Returns:
-        ApiResponse: Contains the list of messages in the conversation.
-
-    Notes:
-        - Uses ConversationService to fetch messages.
-        - Consider paginating results if message history is large.
-        - Logging can be added for audit and debugging.
-    """
-    conversation_service = ConversationService(db)
-    messages_obj = conversation_service.get_messages(
-        conversation_id,
-    )
-    messages = [
-        conversation_schema.Message.model_validate(message)
-        for message in messages_obj
-    ]
-    return success(data=messages, msg="get conversation history success")
-
-
-@router.get("/{end_user_id}/detail", response_model=ApiResponse)
-async def get_conversation_detail(
-        conversation_id: uuid.UUID,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db)
-):
-    """
-    Retrieve detailed information about a specific conversation.
-
-    This endpoint will fetch the conversation detail for the user. If the detail
-    does not exist or is outdated, it will trigger the LLM to generate a new summary.
-
-    Args:
-        conversation_id (UUID): The ID of the conversation.
-        current_user (User, optional): The authenticated user making the request.
-        db (Session, optional): SQLAlchemy session.
-
-    Returns:
-        ApiResponse: Contains the conversation detail serialized as a dictionary.
-
-    Notes:
-        - Uses async ConversationService to fetch or generate the conversation detail.
-        - Handles workspace and user-specific context automatically.
-        - Logging and exception handling should be implemented for production monitoring.
-    """
-    conversation_service = ConversationService(db)
-    detail = await conversation_service.get_conversation_detail(
-        user=current_user,
-        conversation_id=conversation_id,
-        workspace_id=current_user.current_workspace_id
-    )
-    return success(data=detail.model_dump(), msg="get conversation detail success")
--- a/api/app/controllers/model_controller.py
+++ b/api/app/controllers/model_controller.py
@@ -3,17 +3,15 @@ from sqlalchemy.orm import Session
 from typing import Optional
 import uuid

-from app.core.error_codes import BizCode
-from app.core.exceptions import BusinessException
+
 from app.db import get_db
 from app.dependencies import get_current_user
-from app.models.models_model import ModelProvider, ModelType, LoadBalanceStrategy
+from app.models.models_model import ModelProvider, ModelType
 from app.models.user_model import User
-from app.repositories.model_repository import ModelConfigRepository
 from app.schemas import model_schema
 from app.core.response_utils import success
 from app.schemas.response_schema import ApiResponse, PageData
-from app.services.model_service import ModelConfigService, ModelApiKeyService, ModelBaseService
+from app.services.model_service import ModelConfigService, ModelApiKeyService
 from app.core.logging_config import get_api_logger

 # 获取API专用日志器
@@ -26,77 +24,55 @@ router = APIRouter(

@router.get("/type", response_model=ApiResponse)
 def get_model_types():
+    
    return success(msg="获取模型类型成功", data=list(ModelType))


@router.get("/provider", response_model=ApiResponse)
 def get_model_providers():
-    providers = [p for p in ModelProvider if p != ModelProvider.COMPOSITE]
-    return success(msg="获取模型提供商成功", data=providers)
-
-@router.get("/strategy", response_model=ApiResponse)
-def get_model_strategies():
-    return success(msg="获取模型策略成功", data=list(LoadBalanceStrategy))
+    return success(msg="获取模型提供商成功", data=list(ModelProvider))


@router.get("", response_model=ApiResponse)
 def get_model_list(
-        type: Optional[list[str]] = Query(None, description="模型类型筛选（支持多个，如 ?type=LLM 或 ?type=LLM,EMBEDDING）"),
-        capability: Optional[list[str]] = Query(None, description="能力筛选（支持多个，如 ?capability=chat 或 ?capability=chat, embedding）"),
-        provider: Optional[model_schema.ModelProvider] = Query(None, description="提供商筛选(基于API Key)"),
-        is_active: Optional[bool] = Query(None, description="激活状态筛选"),
-        is_public: Optional[bool] = Query(None, description="公开状态筛选"),
-        search: Optional[str] = Query(None, description="搜索关键词"),
-        page: int = Query(1, ge=1, description="页码"),
-        pagesize: int = Query(10, ge=1, le=100, description="每页数量"),
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
+    type: Optional[str] = Query(None, description="模型类型筛选（支持多个，如 ?type=LLM 或 ?type=LLM,EMBEDDING）"),
+    provider: Optional[model_schema.ModelProvider] = Query(None, description="提供商筛选(基于API Key)"),
+    is_active: Optional[bool] = Query(None, description="激活状态筛选"),
+    is_public: Optional[bool] = Query(None, description="公开状态筛选"),
+    search: Optional[str] = Query(None, description="搜索关键词"),
+    page: int = Query(1, ge=1, description="页码"),
+    pagesize: int = Query(10, ge=1, le=100, description="每页数量"),
+    db: Session = Depends(get_db),
+    current_user: User = Depends(get_current_user)
 ):
    """
    获取模型配置列表
-
+    
    支持多个 type 参数：
    - 单个：?type=LLM
    - 多个（逗号分隔）：?type=LLM,EMBEDDING
    - 多个（重复参数）：?type=LLM&type=EMBEDDING
    """
-    api_logger.info(
-        f"获取模型配置列表请求: type={type}, provider={provider}, page={page}, pagesize={pagesize}, tenant_id={current_user.tenant_id}")
-
+    api_logger.info(f"获取模型配置列表请求: type={type}, provider={provider}, page={page}, pagesize={pagesize}, tenant_id={current_user.tenant_id}")
+    
    try:
        # 解析 type 参数（支持逗号分隔）
-        type_list = []
-        if type is not None:
-            flat_type = []
-            for item in type:
-                split_items = [t.strip() for t in item.split(',') if t.strip()]
-                flat_type.extend(split_items)
-
-            unique_flat_type = list(dict.fromkeys(flat_type))
-            type_list = [ModelType(t.lower()) for t in unique_flat_type]
-
-        capability_list = []
-        if capability is not None:
-            flat_capability = []
-            for item in capability:
-                split_items = [c.strip() for c in item.split(', ') if c.strip()]
-                flat_capability.extend(split_items)
-
-            unique_flat_capability = list(dict.fromkeys(flat_capability))
-            capability_list = unique_flat_capability
-
+        type_list = None
+        if type:
+            type_values = [t.strip() for t in type.split(',')]
+            type_list = [model_schema.ModelType(t.lower()) for t in type_values if t]
+        
        api_logger.error(f"获取模型type_list: {type_list}")
        query = model_schema.ModelConfigQuery(
            type=type_list,
            provider=provider,
-            capability=capability_list,
            is_active=is_active,
            is_public=is_public,
            search=search,
            page=page,
            pagesize=pagesize
        )
-
+        
        api_logger.debug(f"开始获取模型配置列表: {query.dict()}")
        result_orm = ModelConfigService.get_model_list(db=db, query=query, tenant_id=current_user.tenant_id)
        result = PageData.model_validate(result_orm)
@@ -107,146 +83,6 @@ def get_model_list(
        raise


-@router.get("/new", response_model=ApiResponse)
-def get_model_list_new(
-    type: Optional[list[str]] = Query(None, description="模型类型筛选（支持多个，如 ?type=LLM 或 ?type=LLM,EMBEDDING）"),
-    provider: Optional[model_schema.ModelProvider] = Query(None, description="提供商筛选(基于ModelConfig)"),
-    is_active: Optional[bool] = Query(None, description="激活状态筛选"),
-    is_public: Optional[bool] = Query(None, description="公开状态筛选"),
-    search: Optional[str] = Query(None, description="搜索关键词"),
-    is_composite: Optional[bool] = Query(None, description="组合模型筛选"),
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """
-    获取模型配置列表
-    
-    支持多个 type 参数：
-    - 单个：?type=LLM
-    - 多个（逗号分隔）：?type=LLM,EMBEDDING
-    - 多个（重复参数）：?type=LLM&type=EMBEDDING
-    """
-    api_logger.info(f"获取模型配置列表请求: type={type}, provider={provider}, tenant_id={current_user.tenant_id}")
-    
-    try:
-        # 解析 type 参数（支持逗号分隔）
-        type_list = []
-        if type is not None:
-            flat_type = []
-            for item in type:
-                split_items = [t.strip() for t in item.split(',') if t.strip()]
-                flat_type.extend(split_items)
-
-            unique_flat_type = list(dict.fromkeys(flat_type))
-            type_list = [ModelType(t.lower()) for t in unique_flat_type]
-        
-        api_logger.info(f"获取模型type_list: {type_list}")
-        query = model_schema.ModelConfigQueryNew(
-            type=type_list,
-            provider=provider,
-            is_active=is_active,
-            is_public=is_public,
-            is_composite=is_composite,
-            search=search
-        )
-        
-        api_logger.debug(f"开始获取模型配置列表: {query.model_dump()}")
-        result = ModelConfigService.get_model_list_new(db=db, query=query, tenant_id=current_user.tenant_id)
-        api_logger.info(f"模型配置列表获取成功: 分组数={len(result)}, 总模型数={sum(len(item['models']) for item in result)}")
-        return success(data=result, msg="模型配置列表获取成功")
-    except Exception as e:
-        api_logger.error(f"获取模型配置列表失败: {str(e)}")
-        raise
-
-
-@router.get("/model_plaza", response_model=ApiResponse)
-def get_model_plaza_list(
-    type: Optional[ModelType] = Query(None, description="模型类型"),
-    provider: Optional[ModelProvider] = Query(None, description="供应商"),
-    is_official: Optional[bool] = Query(None, description="是否官方模型"),
-    is_deprecated: Optional[bool] = Query(None, description="是否弃用"),
-    search: Optional[str] = Query(None, description="搜索关键词"),
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """模型广场查询接口（按供应商分组）"""
-    
-    query = model_schema.ModelBaseQuery(
-        type=type,
-        provider=provider,
-        is_official=is_official,
-        is_deprecated=is_deprecated,
-        search=search
-    )
-    result = ModelBaseService.get_model_base_list(db=db, query=query, tenant_id=current_user.tenant_id)
-    return success(data=result, msg="模型广场列表获取成功")
-
-
-@router.get("/model_plaza/{model_base_id}", response_model=ApiResponse)
-def get_model_base_by_id(
-    model_base_id: uuid.UUID,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """获取基础模型详情"""
-    
-    result = ModelBaseService.get_model_base_by_id(db=db, model_base_id=model_base_id)
-    return success(data=model_schema.ModelBase.model_validate(result), msg="基础模型获取成功")
-
-
-@router.post("/model_plaza", response_model=ApiResponse)
-def create_model_base(
-    data: model_schema.ModelBaseCreate,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """创建基础模型"""
-    
-    result = ModelBaseService.create_model_base(db=db, data=data)
-    return success(data=model_schema.ModelBase.model_validate(result), msg="基础模型创建成功")
-
-
-@router.put("/model_plaza/{model_base_id}", response_model=ApiResponse)
-def update_model_base(
-    model_base_id: uuid.UUID,
-    data: model_schema.ModelBaseUpdate,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """更新基础模型"""
-    
-    # 不允许更改type类型
-    if data.type is not None or data.provider is not None:
-        raise BusinessException("不允许更改模型类型和供应商", BizCode.INVALID_PARAMETER)
-    
-    result = ModelBaseService.update_model_base(db=db, model_base_id=model_base_id, data=data)
-    return success(data=model_schema.ModelBase.model_validate(result), msg="基础模型更新成功")
-
-
-@router.delete("/model_plaza/{model_base_id}", response_model=ApiResponse)
-def delete_model_base(
-    model_base_id: uuid.UUID,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """删除基础模型"""
-    
-    ModelBaseService.delete_model_base(db=db, model_base_id=model_base_id)
-    return success(msg="基础模型删除成功")
-
-
-@router.post("/model_plaza/{model_base_id}/add", response_model=ApiResponse)
-def add_model_from_plaza(
-    model_base_id: uuid.UUID,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """从模型广场添加模型到模型列表"""
-    
-    result = ModelBaseService.add_model_from_plaza(db=db, model_base_id=model_base_id, tenant_id=current_user.tenant_id)
-    return success(data=model_schema.ModelConfig.model_validate(result), msg="模型添加成功")
-
-
@router.get("/{model_id}", response_model=ApiResponse)
 def get_model_by_id(
    model_id: uuid.UUID,
@@ -302,73 +138,6 @@ async def create_model(
        raise


-@router.post("/composite", response_model=ApiResponse)
-async def create_composite_model(
-    model_data: model_schema.CompositeModelCreate,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """
-    创建组合模型
-    
-    - 绑定一个或多个现有的 API Key
-    - 所有 API Key 必须来自非组合模型
-    - 所有 API Key 关联的模型类型必须与组合模型类型一致
-    """
-    api_logger.info(f"创建组合模型请求: {model_data.name}, 用户: {current_user.username}, tenant_id={current_user.tenant_id}")
-    
-    try:
-        result_orm = await ModelConfigService.create_composite_model(db=db, model_data=model_data, tenant_id=current_user.tenant_id)
-        api_logger.info(f"组合模型创建成功: {result_orm.name} (ID: {result_orm.id})")
-        
-        result = model_schema.ModelConfig.model_validate(result_orm)
-        return success(data=result, msg="组合模型创建成功")
-    except Exception as e:
-        api_logger.error(f"创建组合模型失败: {model_data.name} - {str(e)}")
-        raise
-
-
-@router.put("/composite/{model_id}", response_model=ApiResponse)
-async def update_composite_model(
-    model_id: uuid.UUID,
-    model_data: model_schema.CompositeModelCreate,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """更新组合模型"""
-    api_logger.info(f"更新组合模型请求: model_id={model_id}, 用户: {current_user.username}")
-    
-    try:
-        if model_data.type is not None:
-            raise BusinessException("不允许更改模型类型", BizCode.INVALID_PARAMETER)
-        result_orm = await ModelConfigService.update_composite_model(db=db, model_id=model_id, model_data=model_data, tenant_id=current_user.tenant_id)
-        api_logger.info(f"组合模型更新成功: {result_orm.name} (ID: {model_id})")
-        
-        result = model_schema.ModelConfig.model_validate(result_orm)
-        return success(data=result, msg="组合模型更新成功")
-    except Exception as e:
-        api_logger.error(f"更新组合模型失败: model_id={model_id} - {str(e)}")
-        raise
-
-
-@router.delete("/composite/{model_id}", response_model=ApiResponse)
-def delete_composite_model(
-    model_id: uuid.UUID,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """删除组合模型"""
-    api_logger.info(f"删除组合模型请求: model_id={model_id}, 用户: {current_user.username}")
-    
-    try:
-        ModelConfigService.delete_model(db=db, model_id=model_id, tenant_id=current_user.tenant_id)
-        api_logger.info(f"组合模型删除成功: model_id={model_id}")
-        return success(msg="组合模型删除成功")
-    except Exception as e:
-        api_logger.error(f"删除组合模型失败: model_id={model_id} - {str(e)}")
-        raise
-
-
@router.put("/{model_id}", response_model=ApiResponse)
 def update_model(
    model_id: uuid.UUID,
@@ -380,14 +149,6 @@ def update_model(
    更新模型配置
    """
    api_logger.info(f"更新模型配置请求: model_id={model_id}, 用户: {current_user.username}, tenant_id={current_user.tenant_id}")
-
-    if model_data.type is not None or model_data.provider is not None:
-        raise BusinessException("不允许更改模型类型和供应商", BizCode.INVALID_PARAMETER)
-
-    if model_data.is_active:
-        active_keys = ModelApiKeyService.get_api_keys_by_model(db=db, model_config_id=model_id, is_active=model_data.is_active)
-        if not active_keys:
-            raise BusinessException("请先为该模型配置可用的 API Key", BizCode.INVALID_PARAMETER)
    
    try:
        api_logger.debug(f"开始更新模型配置: model_id={model_id}")
@@ -453,55 +214,6 @@ def get_model_api_keys(
        raise


-@router.post("/provider/apikeys", response_model=ApiResponse)
-async def create_model_api_key_by_provider(
-        api_key_data: model_schema.ModelApiKeyCreateByProvider,
-        db: Session = Depends(get_db),
-        current_user: User = Depends(get_current_user)
-):
-    """
-    根据供应商为所有匹配的模型创建API Key
-    """
-    api_logger.info(f"创建API Key请求: provider={api_key_data.provider}, 用户: {current_user.username}")
-
-    try:
-        # 根据tenant_id和provider筛选model_config_id列表
-        model_config_ids = api_key_data.model_config_ids
-        if not model_config_ids:
-            model_config_ids = ModelConfigRepository.get_model_config_ids_by_provider(
-                db=db,
-                tenant_id=current_user.tenant_id,
-                provider=api_key_data.provider
-            )
-        
-        if not model_config_ids:
-            raise BusinessException(f"未找到供应商 {api_key_data.provider} 的模型配置", BizCode.MODEL_NOT_FOUND)
-        
-        # 构造schema并调用service
-        create_data = model_schema.ModelApiKeyCreateByProvider(
-            provider=api_key_data.provider,
-            api_key=api_key_data.api_key,
-            api_base=api_key_data.api_base,
-            description=api_key_data.description,
-            config=api_key_data.config,
-            is_active=api_key_data.is_active,
-            priority=api_key_data.priority,
-            model_config_ids=model_config_ids,
-            capability=api_key_data.capability,
-            is_omni=api_key_data.is_omni
-        )
-        created_keys, failed_models = await ModelApiKeyService.create_api_key_by_provider(db=db, data=create_data)
-        
-        api_logger.info(f"API Key创建成功: 关联{len(created_keys)}个模型")
-        # result_list = [model_schema.ModelApiKey.model_validate(key) for key in created_keys]
-        result = "API Key已存在" if len(created_keys) == 0 and len(failed_models) == 0 else \
-            f"成功为 {len(created_keys)} 个模型创建API Key, 失败模型列表{failed_models}"
-        return success(data=result, msg=f"成功为 {len(created_keys)} 个模型创建API Key")
-    except Exception as e:
-        api_logger.error(f"创建API Key失败: {str(e)}")
-        raise
-
-
@router.post("/{model_id}/apikeys", response_model=ApiResponse, status_code=status.HTTP_201_CREATED)
 async def create_model_api_key(
    model_id: uuid.UUID,
@@ -516,12 +228,11 @@ async def create_model_api_key(
    
    try:
        # 设置模型配置ID
-        api_key_data.model_config_ids = [model_id]
+        api_key_data.model_config_id = model_id
        
        api_logger.debug(f"开始创建模型API Key: {api_key_data.model_name}")
-        result_orm = await ModelApiKeyService.create_api_key(db=db, api_key_data=api_key_data)
-        api_logger.info(f"模型API Key创建成功: {result_orm.model_name} (ID: {result_orm.id})")
-        result = model_schema.ModelApiKey.model_validate(result_orm)
+        result = await ModelApiKeyService.create_api_key(db=db, api_key_data=api_key_data)
+        api_logger.info(f"模型API Key创建成功: {result.model_name} (ID: {result.id})")
        return success(data=result, msg="模型API Key创建成功")
    except Exception as e:
        api_logger.error(f"创建模型API Key失败: {api_key_data.model_name} - {str(e)}")
@@ -623,3 +334,5 @@ async def validate_model_config(
    return success(data=model_schema.ModelValidateResponse(**result), msg="验证完成")


+
+
--- a/api/app/controllers/multi_agent_controller.py
+++ b/api/app/controllers/multi_agent_controller.py
@@ -74,7 +74,7 @@ def get_multi_agent_configs(
            "app_id": str(app_id),
            "default_model_config_id": None,
            "model_parameters": None,
-            "orchestration_mode": "supervisor",
+            "orchestration_mode": "conditional",
            "sub_agents": [],
            "routing_rules": [],
            "execution_config": {
--- a/api/app/controllers/ontology_controller.py
+++ b/api/app/controllers/ontology_controller.py
--- a/api/app/controllers/ontology_secondary_routes.py
+++ b/api/app/controllers/ontology_secondary_routes.py
@@ -1,663 +0,0 @@
-# -*- coding: utf-8 -*-
-"""本体场景和类型路由（续）
-
-由于主Controller文件较大，将剩余路由放在此文件中。
-"""
-
-from uuid import UUID
-from typing import Optional
-
-from fastapi import Depends, Header
-from sqlalchemy.orm import Session
-
-from app.core.error_codes import BizCode
-from app.core.logging_config import get_api_logger, get_business_logger
-from app.core.response_utils import fail, success
-from app.db import get_db
-from app.dependencies import get_current_user
-from app.models.user_model import User
-from app.schemas.ontology_schemas import (
-    SceneResponse,
-    SceneListResponse,
-    PaginationInfo,
-    ClassCreateRequest,
-    ClassUpdateRequest,
-    ClassResponse,
-    ClassListResponse,
-    ClassBatchCreateResponse,
-)
-from app.schemas.response_schema import ApiResponse
-from app.services.ontology_service import OntologyService
-from app.core.memory.llm_tools.openai_client import OpenAIClient
-from app.core.models.base import RedBearModelConfig
-from app.repositories.ontology_class_repository import OntologyClassRepository
-
-
-api_logger = get_api_logger()
-business_logger = get_business_logger()
-
-
-def _get_dummy_ontology_service(db: Session) -> OntologyService:
-    """获取OntologyService实例（不需要LLM）
-    
-    场景和类型管理不需要LLM，创建一个dummy配置。
-    """
-    dummy_config = RedBearModelConfig(
-        model_name="dummy",
-        provider="openai",
-        api_key="dummy",
-        base_url="https://api.openai.com/v1"
-    )
-    llm_client = OpenAIClient(model_config=dummy_config)
-    return OntologyService(llm_client=llm_client, db=db)
-
-
-# 这些函数将被导入到主Controller中
-
-async def scenes_handler(
-    workspace_id: Optional[str] = None,
-    scene_name: Optional[str] = None,
-    page: Optional[int] = None,
-    pagesize: Optional[int] = None,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """获取场景列表（支持模糊搜索和全量查询，全量查询支持分页）
-    
-    当提供 scene_name 参数时，进行模糊搜索（不分页）；
-    当不提供 scene_name 参数时，返回所有场景（支持分页）。
-    
-    Args:
-        workspace_id: 工作空间ID（可选，默认当前用户工作空间）
-        scene_name: 场景名称关键词（可选，支持模糊匹配）
-        page: 页码（可选，从1开始，仅在全量查询时有效）
-        pagesize: 每页数量（可选，仅在全量查询时有效）
-        db: 数据库会话
-        current_user: 当前用户
-    """
-    operation = "search" if scene_name else "list"
-    api_logger.info(
-        f"Scene {operation} requested by user {current_user.id}, "
-        f"workspace_id={workspace_id}, keyword={scene_name}, page={page}, pagesize={pagesize}"
-    )
-    
-    try:
-        # 确定工作空间ID
-        if workspace_id:
-            try:
-                ws_uuid = UUID(workspace_id)
-            except ValueError:
-                api_logger.warning(f"Invalid workspace_id format: {workspace_id}")
-                return fail(BizCode.BAD_REQUEST, "请求参数无效", "无效的工作空间ID格式")
-        else:
-            ws_uuid = current_user.current_workspace_id
-            if not ws_uuid:
-                api_logger.warning(f"User {current_user.id} has no current workspace")
-                return fail(BizCode.BAD_REQUEST, "请求参数无效", "当前用户没有工作空间")
-        
-        # 创建Service
-        service = _get_dummy_ontology_service(db)
-        
-        # 根据是否提供 scene_name 决定查询方式
-        if scene_name and scene_name.strip():
-            # 验证分页参数（模糊搜索也支持分页）
-            if page is not None and page < 1:
-                api_logger.warning(f"Invalid page number: {page}")
-                return fail(BizCode.BAD_REQUEST, "请求参数无效", "页码必须大于0")
-            
-            if pagesize is not None and pagesize < 1:
-                api_logger.warning(f"Invalid pagesize: {pagesize}")
-                return fail(BizCode.BAD_REQUEST, "请求参数无效", "每页数量必须大于0")
-            
-            # 如果只提供了page或pagesize中的一个，返回错误
-            if (page is not None and pagesize is None) or (page is None and pagesize is not None):
-                api_logger.warning(f"Incomplete pagination params: page={page}, pagesize={pagesize}")
-                return fail(BizCode.BAD_REQUEST, "请求参数无效", "分页参数page和pagesize必须同时提供")
-            
-            # 模糊搜索场景（支持分页）
-            scenes = service.search_scenes_by_name(scene_name.strip(), ws_uuid)
-            total = len(scenes)
-            
-            # 如果提供了分页参数，进行分页处理
-            if page is not None and pagesize is not None:
-                start_idx = (page - 1) * pagesize
-                end_idx = start_idx + pagesize
-                scenes = scenes[start_idx:end_idx]
-            
-            # 构建响应
-            items = []
-            for scene in scenes:
-                entity_type = [cls.class_name for cls in scene.classes[:3]] if scene.classes else None
-                type_num = len(scene.classes) if scene.classes else 0
-                
-                items.append(SceneResponse(
-                    scene_id=scene.scene_id,
-                    scene_name=scene.scene_name,
-                    scene_description=scene.scene_description,
-                    type_num=type_num,
-                    entity_type=entity_type,
-                    workspace_id=scene.workspace_id,
-                    created_at=scene.created_at,
-                    updated_at=scene.updated_at,
-                    classes_count=type_num,
-                    is_system_default=scene.is_system_default
-                ))
-            
-            # 构建响应（包含分页信息）
-            if page is not None and pagesize is not None:
-                hasnext = (page * pagesize) < total
-                pagination_info = PaginationInfo(
-                    page=page,
-                    pagesize=pagesize,
-                    total=total,
-                    hasnext=hasnext
-                )
-                response = SceneListResponse(items=items, page=pagination_info)
-            else:
-                response = SceneListResponse(items=items)
-            
-            api_logger.info(
-                f"Scene search completed: found {len(items)} scenes matching '{scene_name}' "
-                f"in workspace {ws_uuid}, total={total}"
-            )
-        else:
-            # 获取所有场景（支持分页）
-            if page is not None and page < 1:
-                api_logger.warning(f"Invalid page number: {page}")
-                return fail(BizCode.BAD_REQUEST, "请求参数无效", "页码必须大于0")
-            
-            if pagesize is not None and pagesize < 1:
-                api_logger.warning(f"Invalid pagesize: {pagesize}")
-                return fail(BizCode.BAD_REQUEST, "请求参数无效", "每页数量必须大于0")
-            
-            # 如果只提供了page或pagesize中的一个，返回错误
-            if (page is not None and pagesize is None) or (page is None and pagesize is not None):
-                api_logger.warning(f"Incomplete pagination params: page={page}, pagesize={pagesize}")
-                return fail(BizCode.BAD_REQUEST, "请求参数无效", "分页参数page和pagesize必须同时提供")
-            
-            scenes, total = service.list_scenes(ws_uuid, page, pagesize)
-            
-            # 构建响应
-            items = []
-            for scene in scenes:
-                entity_type = [cls.class_name for cls in scene.classes[:3]] if scene.classes else None
-                type_num = len(scene.classes) if scene.classes else 0
-                
-                items.append(SceneResponse(
-                    scene_id=scene.scene_id,
-                    scene_name=scene.scene_name,
-                    scene_description=scene.scene_description,
-                    type_num=type_num,
-                    entity_type=entity_type,
-                    workspace_id=scene.workspace_id,
-                    created_at=scene.created_at,
-                    updated_at=scene.updated_at,
-                    classes_count=type_num,
-                    is_system_default=scene.is_system_default
-                ))
-            
-            # 构建响应（包含分页信息）
-            if page is not None and pagesize is not None:
-                hasnext = (page * pagesize) < total
-                pagination_info = PaginationInfo(
-                    page=page,
-                    pagesize=pagesize,
-                    total=total,
-                    hasnext=hasnext
-                )
-                response = SceneListResponse(items=items, page=pagination_info)
-            else:
-                response = SceneListResponse(items=items)
-            
-            api_logger.info(f"Scene list retrieved successfully, count={len(items)}, total={total}")
-        
-        return success(data=response.model_dump(mode='json'), msg="查询成功")
-        
-    except ValueError as e:
-        api_logger.warning(f"Validation error in scene {operation}: {str(e)}")
-        return fail(BizCode.BAD_REQUEST, "请求参数无效", str(e))
-        
-    except RuntimeError as e:
-        api_logger.error(f"Runtime error in scene {operation}: {str(e)}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, "查询失败", str(e))
-        
-    except Exception as e:
-        api_logger.error(f"Unexpected error in scene {operation}: {str(e)}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, "查询失败", str(e))
-
-
-# ==================== 本体类型管理接口 ====================
-
-async def create_class_handler(
-    request: ClassCreateRequest,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user),
-    x_language_type: Optional[str] = None
-):
-    """创建本体类型（统一使用列表形式，支持单个或批量）"""
-    
-    # 根据列表长度判断是单个还是批量
-    count = len(request.classes)
-    mode = "single" if count == 1 else "batch"
-    
-    api_logger.info(
-        f"Class creation ({mode}) requested by user {current_user.id}, "
-        f"scene_id={request.scene_id}, count={count}"
-    )
-    
-    try:
-        # 获取当前工作空间ID
-        workspace_id = current_user.current_workspace_id
-        if not workspace_id:
-            api_logger.warning(f"User {current_user.id} has no current workspace")
-            return fail(BizCode.BAD_REQUEST, "请求参数无效", "当前用户没有工作空间")
-        
-        # 创建Service
-        service = _get_dummy_ontology_service(db)
-        
-        # 准备类型数据
-        classes_data = [
-            {
-                "class_name": item.class_name,
-                "class_description": item.class_description
-            }
-            for item in request.classes
-        ]
-        
-        if count == 1:
-            # 单个创建 - 先检查重名
-            class_data = classes_data[0]
-            existing = OntologyClassRepository(db).get_by_name(class_data["class_name"], request.scene_id)
-            if existing:
-                raise ValueError(f"DUPLICATE_CLASS_NAME:{class_data['class_name']}")
-            ontology_class = service.create_class(
-                scene_id=request.scene_id,
-                class_name=class_data["class_name"],
-                class_description=class_data["class_description"],
-                workspace_id=workspace_id
-            )
-            
-            # 构建单个响应
-            response = ClassResponse(
-                class_id=ontology_class.class_id,
-                class_name=ontology_class.class_name,
-                class_description=ontology_class.class_description,
-                scene_id=ontology_class.scene_id,
-                created_at=ontology_class.created_at,
-                updated_at=ontology_class.updated_at
-            )
-            
-            api_logger.info(f"Class created successfully: {ontology_class.class_id}")
-            
-            return success(data=response.model_dump(mode='json'), msg="类型创建成功")
-            
-        else:
-            # 批量创建
-            created_classes, errors = service.create_classes_batch(
-                scene_id=request.scene_id,
-                classes=classes_data,
-                workspace_id=workspace_id
-            )
-            
-            # 构建批量响应
-            items = []
-            for ontology_class in created_classes:
-                items.append(ClassResponse(
-                    class_id=ontology_class.class_id,
-                    class_name=ontology_class.class_name,
-                    class_description=ontology_class.class_description,
-                    scene_id=ontology_class.scene_id,
-                    created_at=ontology_class.created_at,
-                    updated_at=ontology_class.updated_at
-                ))
-            
-            response = ClassBatchCreateResponse(
-                total=len(classes_data),
-                success_count=len(created_classes),
-                failed_count=len(errors),
-                items=items,
-                errors=errors if errors else None
-            )
-            
-            api_logger.info(
-                f"Batch class creation completed: "
-                f"success={len(created_classes)}, failed={len(errors)}"
-            )
-            
-            return success(data=response.model_dump(mode='json'), msg="批量创建完成")
-        
-    except ValueError as e:
-        err_str = str(e)
-        if err_str.startswith("DUPLICATE_CLASS_NAME:"):
-            class_name = err_str.split(":", 1)[1]
-            api_logger.warning(f"Duplicate class name '{class_name}' in scene {request.scene_id}")
-            from app.core.language_utils import get_language_from_header
-            from fastapi.responses import JSONResponse
-            lang = get_language_from_header(x_language_type)
-            if lang == "en":
-                msg = fail(BizCode.BAD_REQUEST, "Class name already exists", f"A class named \"{class_name}\" already exists in this scene. Please use a different name.")
-            else:
-                msg = fail(BizCode.BAD_REQUEST, "类型名称已存在", f"当前场景下已存在名为「{class_name}」的类型，请使用其他名称")
-            return JSONResponse(status_code=400, content=msg)
-        api_logger.warning(f"Validation error in class creation: {err_str}")
-        return fail(BizCode.BAD_REQUEST, "请求参数无效", err_str)
-
-    except RuntimeError as e:
-        err_str = str(e)
-        if "UniqueViolation" in err_str or "uq_scene_class_name" in err_str:
-            api_logger.warning(f"Duplicate class name in scene {request.scene_id}")
-            from app.core.language_utils import get_language_from_header
-            from fastapi.responses import JSONResponse
-            lang = get_language_from_header(x_language_type)
-            class_name = request.classes[0].class_name if request.classes else ""
-            if lang == "en":
-                msg = fail(BizCode.BAD_REQUEST, "Class name already exists", f"A class named \"{class_name}\" already exists in this scene. Please use a different name.")
-            else:
-                msg = fail(BizCode.BAD_REQUEST, "类型名称已存在", f"当前场景下已存在名为「{class_name}」的类型，请使用其他名称")
-            return JSONResponse(status_code=400, content=msg)
-        api_logger.error(f"Runtime error in class creation: {err_str}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, "类型创建失败", err_str)
-        
-    except Exception as e:
-        api_logger.error(f"Unexpected error in class creation: {str(e)}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, "类型创建失败", str(e))
-
-
-async def update_class_handler(
-    class_id: str,
-    request: ClassUpdateRequest,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """更新本体类型"""
-    api_logger.info(
-        f"Class update requested by user {current_user.id}, "
-        f"class_id={class_id}"
-    )
-    
-    try:
-        # 验证UUID格式
-        try:
-            class_uuid = UUID(class_id)
-        except ValueError:
-            api_logger.warning(f"Invalid class_id format: {class_id}")
-            return fail(BizCode.BAD_REQUEST, "请求参数无效", "无效的类型ID格式")
-        
-        # 获取当前工作空间ID
-        workspace_id = current_user.current_workspace_id
-        if not workspace_id:
-            api_logger.warning(f"User {current_user.id} has no current workspace")
-            return fail(BizCode.BAD_REQUEST, "请求参数无效", "当前用户没有工作空间")
-        
-        # 检查是否为系统默认类型
-        class_repo = OntologyClassRepository(db)
-        ontology_class = class_repo.get_by_id(class_uuid)
-        if ontology_class and ontology_class.is_system_default:
-            business_logger.warning(
-                f"尝试修改系统默认类型: user_id={current_user.id}, "
-                f"class_id={class_id}, class_name={ontology_class.class_name}"
-            )
-            return fail(
-                BizCode.BAD_REQUEST,
-                "系统默认类型不可修改",
-                "该类型为系统预设类型，不允许修改"
-            )
-        
-        # 创建Service
-        service = _get_dummy_ontology_service(db)
-        
-        # 更新类型
-        ontology_class = service.update_class(
-            class_id=class_uuid,
-            class_name=request.class_name,
-            class_description=request.class_description,
-            workspace_id=workspace_id
-        )
-        
-        # 构建响应
-        response = ClassResponse(
-            class_id=ontology_class.class_id,
-            class_name=ontology_class.class_name,
-            class_description=ontology_class.class_description,
-            scene_id=ontology_class.scene_id,
-            created_at=ontology_class.created_at,
-            updated_at=ontology_class.updated_at
-        )
-        
-        api_logger.info(f"Class updated successfully: {class_id}")
-        
-        return success(data=response.model_dump(mode='json'), msg="类型更新成功")
-        
-    except ValueError as e:
-        api_logger.warning(f"Validation error in class update: {str(e)}")
-        return fail(BizCode.BAD_REQUEST, "请求参数无效", str(e))
-        
-    except RuntimeError as e:
-        api_logger.error(f"Runtime error in class update: {str(e)}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, "类型更新失败", str(e))
-        
-    except Exception as e:
-        api_logger.error(f"Unexpected error in class update: {str(e)}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, "类型更新失败", str(e))
-
-
-async def delete_class_handler(
-    class_id: str,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """删除本体类型"""
-    api_logger.info(
-        f"Class deletion requested by user {current_user.id}, "
-        f"class_id={class_id}"
-    )
-    
-    try:
-        # 验证UUID格式
-        try:
-            class_uuid = UUID(class_id)
-        except ValueError:
-            api_logger.warning(f"Invalid class_id format: {class_id}")
-            return fail(BizCode.BAD_REQUEST, "请求参数无效", "无效的类型ID格式")
-        
-        # 获取当前工作空间ID
-        workspace_id = current_user.current_workspace_id
-        if not workspace_id:
-            api_logger.warning(f"User {current_user.id} has no current workspace")
-            return fail(BizCode.BAD_REQUEST, "请求参数无效", "当前用户没有工作空间")
-        
-        # 检查是否为系统默认类型
-        class_repo = OntologyClassRepository(db)
-        ontology_class = class_repo.get_by_id(class_uuid)
-        if ontology_class and ontology_class.is_system_default:
-            business_logger.warning(
-                f"尝试删除系统默认类型: user_id={current_user.id}, "
-                f"class_id={class_id}, class_name={ontology_class.class_name}"
-            )
-            return fail(
-                BizCode.BAD_REQUEST,
-                "系统默认类型不可删除",
-                "该类型为系统预设类型，不允许删除"
-            )
-        
-        # 创建Service
-        service = _get_dummy_ontology_service(db)
-        
-        # 删除类型
-        success_flag = service.delete_class(
-            class_id=class_uuid,
-            workspace_id=workspace_id
-        )
-        
-        api_logger.info(f"Class deleted successfully: {class_id}")
-        
-        return success(data={"deleted": success_flag}, msg="类型删除成功")
-        
-    except ValueError as e:
-        api_logger.warning(f"Validation error in class deletion: {str(e)}")
-        return fail(BizCode.BAD_REQUEST, "请求参数无效", str(e))
-        
-    except RuntimeError as e:
-        api_logger.error(f"Runtime error in class deletion: {str(e)}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, "类型删除失败", str(e))
-        
-    except Exception as e:
-        api_logger.error(f"Unexpected error in class deletion: {str(e)}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, "类型删除失败", str(e))
-
-
-async def get_class_handler(
-    class_id: str,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """获取单个本体类型"""
-    api_logger.info(
-        f"Get class requested by user {current_user.id}, "
-        f"class_id={class_id}"
-    )
-    
-    try:
-        # 验证UUID格式
-        try:
-            class_uuid = UUID(class_id)
-        except ValueError:
-            api_logger.warning(f"Invalid class_id format: {class_id}")
-            return fail(BizCode.BAD_REQUEST, "请求参数无效", "无效的类型ID格式")
-        
-        # 获取当前工作空间ID
-        workspace_id = current_user.current_workspace_id
-        if not workspace_id:
-            api_logger.warning(f"User {current_user.id} has no current workspace")
-            return fail(BizCode.BAD_REQUEST, "请求参数无效", "当前用户没有工作空间")
-        
-        # 创建Service
-        service = _get_dummy_ontology_service(db)
-        
-        # 获取类型（会抛出ValueError如果不存在）
-        ontology_class = service.get_class_by_id(class_uuid, workspace_id)
-        
-        # 构建响应
-        response = ClassResponse(
-            class_id=ontology_class.class_id,
-            class_name=ontology_class.class_name,
-            class_description=ontology_class.class_description,
-            scene_id=ontology_class.scene_id,
-            created_at=ontology_class.created_at,
-            updated_at=ontology_class.updated_at
-        )
-        
-        api_logger.info(f"Class retrieved successfully: {class_id}")
-        
-        return success(data=response.model_dump(mode='json'), msg="查询成功")
-        
-    except ValueError as e:
-        # 类型不存在或无权限访问
-        api_logger.warning(f"Validation error in get class: {str(e)}")
-        return fail(BizCode.NOT_FOUND, "请求参数无效", str(e))
-        
-    except RuntimeError as e:
-        api_logger.error(f"Runtime error in get class: {str(e)}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, "查询失败", str(e))
-        
-    except Exception as e:
-        api_logger.error(f"Unexpected error in get class: {str(e)}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, "查询失败", str(e))
-
-
-async def classes_handler(
-    scene_id: str,
-    class_name: Optional[str] = None,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """获取类型列表（支持模糊搜索和全量查询）
-    
-    当提供 class_name 参数时，进行模糊搜索；
-    当不提供 class_name 参数时，返回场景下的所有类型。
-    
-    Args:
-        scene_id: 场景ID（必填）
-        class_name: 类型名称关键词（可选，支持模糊匹配）
-        db: 数据库会话
-        current_user: 当前用户
-    """
-    operation = "search" if class_name else "list"
-    api_logger.info(
-        f"Class {operation} requested by user {current_user.id}, "
-        f"keyword={class_name}, scene_id={scene_id}"
-    )
-    
-    try:
-        # 验证UUID格式
-        try:
-            scene_uuid = UUID(scene_id)
-        except ValueError:
-            api_logger.warning(f"Invalid scene_id format: {scene_id}")
-            return fail(BizCode.BAD_REQUEST, "请求参数无效", "无效的场景ID格式")
-        
-        # 获取当前工作空间ID
-        workspace_id = current_user.current_workspace_id
-        if not workspace_id:
-            api_logger.warning(f"User {current_user.id} has no current workspace")
-            return fail(BizCode.BAD_REQUEST, "请求参数无效", "当前用户没有工作空间")
-        
-        # 创建Service
-        service = _get_dummy_ontology_service(db)
-        
-        # 获取场景信息
-        scene = service.get_scene_by_id(scene_uuid, workspace_id)
-        if not scene:
-            api_logger.warning(f"Scene not found: {scene_id}")
-            return fail(BizCode.NOT_FOUND, "场景不存在", f"未找到ID为 {scene_id} 的场景")
-        
-        # 根据是否提供 class_name 决定查询方式
-        if class_name and class_name.strip():
-            # 模糊搜索类型
-            classes = service.search_classes_by_name(class_name.strip(), scene_uuid, workspace_id)
-        else:
-            # 获取所有类型
-            classes = service.list_classes_by_scene(scene_uuid, workspace_id)
-        
-        # 构建响应
-        items = []
-        for ontology_class in classes:
-            items.append(ClassResponse(
-                class_id=ontology_class.class_id,
-                class_name=ontology_class.class_name,
-                class_description=ontology_class.class_description,
-                scene_id=ontology_class.scene_id,
-                created_at=ontology_class.created_at,
-                updated_at=ontology_class.updated_at
-            ))
-        
-        response = ClassListResponse(
-            total=len(items),
-            scene_id=scene_uuid,
-            scene_name=scene.scene_name,
-            scene_description=scene.scene_description,
-            is_system_default=scene.is_system_default,
-            items=items
-        )
-        
-        if class_name:
-            api_logger.info(
-                f"Class search completed: found {len(items)} classes matching '{class_name}' "
-                f"in scene {scene_id}"
-            )
-        else:
-            api_logger.info(f"Class list retrieved successfully, count={len(items)}")
-        
-        return success(data=response.model_dump(mode='json'), msg="查询成功")
-        
-    except ValueError as e:
-        api_logger.warning(f"Validation error in class {operation}: {str(e)}")
-        return fail(BizCode.BAD_REQUEST, "请求参数无效", str(e))
-        
-    except RuntimeError as e:
-        api_logger.error(f"Runtime error in class {operation}: {str(e)}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, "查询失败", str(e))
-        
-    except Exception as e:
-        api_logger.error(f"Unexpected error in class {operation}: {str(e)}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, "查询失败", str(e))
--- a/api/app/controllers/prompt_optimizer_controller.py
+++ b/api/app/controllers/prompt_optimizer_controller.py
@@ -1,20 +1,14 @@
-import json
 import uuid

 from fastapi import APIRouter, Depends, Path
 from sqlalchemy.orm import Session
-from starlette.responses import StreamingResponse

 from app.core.logging_config import get_api_logger
 from app.core.response_utils import success
 from app.dependencies import get_current_user, get_db
-from app.schemas.prompt_optimizer_schema import (
-    PromptOptMessage,
-    CreateSessionResponse,
-    SessionHistoryResponse,
-    SessionMessage,
-    PromptSaveRequest
-)
+from app.models.prompt_optimizer_model import RoleType
+from app.schemas.prompt_optimizer_schema import PromptOptMessage, PromptOptModelSet, CreateSessionResponse, \
+    OptimizePromptResponse, SessionHistoryResponse, SessionMessage
 from app.schemas.response_schema import ApiResponse
 from app.services.prompt_optimizer_service import PromptOptimizerService

@@ -76,12 +70,12 @@ def get_prompt_session(
        SessionMessage(role=role, content=content)
        for role, content in history
    ]
-
+    
    result = SessionHistoryResponse(
        session_id=session_id,
        messages=messages
    )
-
+    
    return success(data=result)


@@ -110,140 +104,35 @@ async def get_prompt_opt(
        ApiResponse: Contains the optimized prompt, description, and a list of variables.
    """
    service = PromptOptimizerService(db)
-
-    async def event_generator():
-        yield "event:start\ndata: {}\n\n"
-        try:
-            async for chunk in service.optimize_prompt(
-                    tenant_id=current_user.tenant_id,
-                    model_id=data.model_id,
-                    session_id=session_id,
-                    user_id=current_user.id,
-                    current_prompt=data.current_prompt,
-                    user_require=data.message,
-                    skill=data.skill
-            ):
-                # chunk 是 prompt 的增量内容
-                yield f"event:message\ndata: {json.dumps(chunk, ensure_ascii=False)}\n\n"
-        except Exception as e:
-            yield f"event:error\ndata: {json.dumps(
-                {"error": str(e)},
-                ensure_ascii=False
-            )}\n\n"
-        yield "event:end\ndata: {}\n\n"
-
-    return StreamingResponse(
-        event_generator(),
-        media_type="text/event-stream",
-        headers={
-            "Cache-Control": "no-cache",
-            "Connection": "keep-alive",
-            "X-Accel-Buffering": "no"
-        }
-    )
-
-
-@router.post(
-    "/releases",
-    summary="Get prompt optimization",
-    response_model=ApiResponse
-)
-def save_prompt(
-        data: PromptSaveRequest,
-        db: Session = Depends(get_db),
-        current_user=Depends(get_current_user),
-):
-    """
-       Save a prompt release for the current tenant.
-
-       Args:
-           data (PromptSaveRequest): Request body containing session_id, title, and prompt.
-           db (Session): SQLAlchemy database session, injected via dependency.
-           current_user: Currently authenticated user object, injected via dependency.
-
-       Returns:
-           ApiResponse: Standard API response containing the saved prompt release info:
-               - id: UUID of the prompt release
-               - session_id: associated session
-               - title: prompt title
-               - prompt: prompt content
-               - created_at: timestamp of creation
-
-       Raises:
-           Any database or service exceptions are propagated to the global exception handler.
-       """
-    service = PromptOptimizerService(db)
-    prompt_info = service.save_prompt(
+    service.create_message(
        tenant_id=current_user.tenant_id,
-        session_id=data.session_id,
-        title=data.title,
-        prompt=data.prompt
+        session_id=session_id,
+        user_id=current_user.id,
+        role=RoleType.USER,
+        content=data.message
    )
-    return success(data=prompt_info)
-
-
-@router.delete(
-    "/releases/{prompt_id}",
-    summary="Delete prompt (soft delete)",
-    response_model=ApiResponse
-)
-def delete_prompt(
-        prompt_id: uuid.UUID = Path(..., description="Prompt ID"),
-        db: Session = Depends(get_db),
-        current_user=Depends(get_current_user),
-):
-    """
-    Soft delete a prompt release.
-
-    Args:
-        prompt_id
-        db (Session): Database session
-        current_user: Current logged-in user
-
-    Returns:
-        ApiResponse: Success message confirming deletion
-    """
-    service = PromptOptimizerService(db)
-    service.delete_prompt(
+    opt_result = await service.optimize_prompt(
        tenant_id=current_user.tenant_id,
-        prompt_id=prompt_id
+        model_id=data.model_id,
+        session_id=session_id,
+        user_id=current_user.id,
+        current_prompt=data.current_prompt,
+        user_require=data.message
    )
-    return success(msg="Prompt deleted successfully")
-
-
-@router.get(
-    "/releases/list",
-    summary="Get paginated list of released prompts with optional filter",
-    response_model=ApiResponse
-)
-def get_release_list(
-        page: int = 1,
-        page_size: int = 20,
-        keyword: str | None = None,
-        db: Session = Depends(get_db),
-        current_user=Depends(get_current_user),
-):
-    """
-    Retrieve paginated list of released prompts for the current tenant.
-    Optionally filter by keyword in title.
-
-    Args:
-        page (int): Page number (starting from 1)
-        page_size (int): Number of items per page (max 100)
-        keyword (str | None): Optional keyword to filter prompt titles
-        db (Session): Database session
-        current_user: Current logged-in user
-
-    Returns:
-        ApiResponse: Contains paginated list of prompt releases with metadata
-    """
-    service = PromptOptimizerService(db)
-    result = service.get_release_list(
+    service.create_message(
        tenant_id=current_user.tenant_id,
-        page=max(1, page),
-        page_size=min(max(1, page_size), 100),
-        filter_keyword=keyword
+        session_id=session_id,
+        user_id=current_user.id,
+        role=RoleType.ASSISTANT,
+        content=opt_result.desc
    )
-    return success(data=result)
+    variables = service.parser_prompt_variables(opt_result.prompt)
+    result = {
+        "prompt": opt_result.prompt,
+        "desc": opt_result.desc,
+        "variables": variables
+    }
+    result_schema = OptimizePromptResponse.model_validate(result)
+    return success(data=result_schema)


--- a/api/app/controllers/public_share_controller.py
+++ b/api/app/controllers/public_share_controller.py
@@ -1,35 +1,22 @@
 import hashlib
-import json
 import uuid
-from typing import Annotated

 from fastapi import APIRouter, Depends, Query, Request
 from fastapi.responses import StreamingResponse
 from sqlalchemy.orm import Session

-from app.core.error_codes import BizCode
-from app.core.exceptions import BusinessException
 from app.core.logging_config import get_business_logger
-from app.core.response_utils import success, fail
-from app.db import get_db, get_db_read
+from app.core.response_utils import success
+from app.db import get_db
 from app.dependencies import get_share_user_id, ShareTokenData
-from app.models.app_model import AppType
 from app.repositories import knowledge_repository
-from app.repositories.end_user_repository import EndUserRepository
-from app.repositories.workflow_repository import WorkflowConfigRepository
 from app.schemas import release_share_schema, conversation_schema
 from app.schemas.response_schema import PageData, PageMeta
 from app.services import workspace_service
-from app.services.app_chat_service import AppChatService, get_app_chat_service
-from app.services.app_service import AppService
 from app.services.auth_service import create_access_token
 from app.services.conversation_service import ConversationService
 from app.services.release_share_service import ReleaseShareService
 from app.services.shared_chat_service import SharedChatService
-from app.services.workflow_service import WorkflowService
-from app.models.file_metadata_model import FileMetadata
-from app.utils.app_config_utils import workflow_config_4_app_release, \
-    agent_config_4_app_release, multi_agent_config_4_app_release

 router = APIRouter(prefix="/public/share", tags=["Public Share"])
 logger = get_business_logger()
@@ -75,10 +62,10 @@ def get_or_generate_user_id(payload_user_id: str, request: Request) -> str:
    summary="获取访问 token"
 )
 def get_access_token(
-        share_token: str,
-        payload: release_share_schema.TokenRequest,
-        request: Request,
-        db: Session = Depends(get_db),
+    share_token: str,
+    payload: release_share_schema.TokenRequest,
+    request: Request,
+    db: Session = Depends(get_db),
 ):
    """获取访问 token

@@ -123,9 +110,9 @@ def get_access_token(
    response_model=None
 )
 def get_shared_release(
-        password: str = Query(None, description="访问密码（如果需要）"),
-        share_data: ShareTokenData = Depends(get_share_user_id),
-        db: Session = Depends(get_db),
+    password: str = Query(None, description="访问密码（如果需要）"),
+    share_data: ShareTokenData = Depends(get_share_user_id),
+    db: Session = Depends(get_db),
 ):
    """获取公开分享的发布版本信息

@@ -147,9 +134,9 @@ def get_shared_release(
    summary="验证访问密码"
 )
 def verify_password(
-        payload: release_share_schema.PasswordVerifyRequest,
-        share_data: ShareTokenData = Depends(get_share_user_id),
-        db: Session = Depends(get_db),
+    payload: release_share_schema.PasswordVerifyRequest,
+    share_data: ShareTokenData = Depends(get_share_user_id),
+    db: Session = Depends(get_db),
 ):
    """验证分享的访问密码

@@ -169,11 +156,11 @@ def verify_password(
    summary="获取嵌入代码"
 )
 def get_embed_code(
-        width: str = Query("100%", description="iframe 宽度"),
-        height: str = Query("600px", description="iframe 高度"),
-        request: Request = None,
-        share_data: ShareTokenData = Depends(get_share_user_id),
-        db: Session = Depends(get_db),
+    width: str = Query("100%", description="iframe 宽度"),
+    height: str = Query("600px", description="iframe 高度"),
+    request: Request = None,
+    share_data: ShareTokenData = Depends(get_share_user_id),
+    db: Session = Depends(get_db),
 ):
    """获取嵌入代码

@@ -193,6 +180,7 @@ def get_embed_code(
    return success(data=embed_code)


+
 # ---------- 会话管理接口 ----------

@router.get(
@@ -200,11 +188,11 @@ def get_embed_code(
    summary="获取会话列表"
 )
 def list_conversations(
-        password: str = Query(None, description="访问密码"),
-        page: int = Query(1, ge=1),
-        pagesize: int = Query(20, ge=1, le=100),
-        share_data: ShareTokenData = Depends(get_share_user_id),
-        db: Session = Depends(get_db),
+    password: str = Query(None, description="访问密码"),
+    page: int = Query(1, ge=1),
+    pagesize: int = Query(20, ge=1, le=100),
+    share_data: ShareTokenData = Depends(get_share_user_id),
+    db: Session = Depends(get_db),
 ):
    """获取分享应用的会话列表

@@ -214,16 +202,15 @@ def list_conversations(
    logger.debug(f"share_data:{share_data.user_id}")
    other_id = share_data.user_id
    service = SharedChatService(db)
-    share, release = service.get_release_by_share_token(share_data.share_token, password)
+    share, release = service._get_release_by_share_token(share_data.share_token, password)
+    from app.repositories.end_user_repository import EndUserRepository
    end_user_repo = EndUserRepository(db)
-    app_service = AppService(db)
-    app = app_service._get_app_or_404(share.app_id)
    new_end_user = end_user_repo.get_or_create_end_user(
-        app_id=share.app_id,
-        workspace_id=app.workspace_id,
-        other_id=other_id
-    )
+            app_id=share.app_id,
+            other_id=other_id
+        )
    logger.debug(new_end_user.id)
+    service = SharedChatService(db)
    conversations, total = service.list_conversations(
        share_token=share_data.share_token,
        user_id=str(new_end_user.id),
@@ -243,10 +230,10 @@ def list_conversations(
    summary="获取会话详情（含消息）"
 )
 def get_conversation(
-        conversation_id: uuid.UUID,
-        password: str = Query(None, description="访问密码"),
-        share_data: ShareTokenData = Depends(get_share_user_id),
-        db: Session = Depends(get_db),
+    conversation_id: uuid.UUID,
+    password: str = Query(None, description="访问密码"),
+    share_data: ShareTokenData = Depends(get_share_user_id),
+    db: Session = Depends(get_db),
 ):
    """获取会话详情和消息历史"""
    chat_service = SharedChatService(db)
@@ -260,41 +247,8 @@ def get_conversation(
    conv_service = ConversationService(db)
    messages = conv_service.get_messages(conversation_id)

-    file_ids = []
-    message_file_id_map = {}
-
-    # 第一次遍历：解析 audio_url，收集所有有效的 file_id
-    for idx, m in enumerate(messages):
-        if m.role == "assistant" and m.meta_data:
-            audio_url = m.meta_data.get("audio_url")
-            if not audio_url:
-                continue
-            try:
-                file_id = uuid.UUID(audio_url.rstrip("/").split("/")[-1])
-            except (ValueError, IndexError):
-                # audio_url 无法解析为 UUID，标记为 unknown
-                m.meta_data["audio_status"] = "unknown"
-                continue
-
-            file_ids.append(file_id)
-            message_file_id_map[idx] = file_id
-
-    # 批量查询所有相关的 FileMetadata
-    file_status_map = {}
-    if file_ids:
-        file_metas = (
-            db.query(FileMetadata)
-            .filter(FileMetadata.id.in_(set(file_ids)))
-            .all()
-        )
-        file_status_map = {fm.id: fm.status for fm in file_metas}
-
-    # 第二次遍历：将查询结果映射回消息
-    for idx, file_id in message_file_id_map.items():
-        m = messages[idx]
-        m.meta_data["audio_status"] = file_status_map.get(file_id, "unknown")
-
-    conv_dict = conversation_schema.Conversation.model_validate(conversation).model_dump(mode="json")
+    # 构建响应
+    conv_dict = conversation_schema.Conversation.model_validate(conversation).model_dump()
    conv_dict["messages"] = [
        conversation_schema.Message.model_validate(m) for m in messages
    ]
@@ -309,10 +263,9 @@ def get_conversation(
    summary="发送消息（支持流式和非流式）"
 )
 async def chat(
-        payload: conversation_schema.ChatRequest,
-        share_data: ShareTokenData = Depends(get_share_user_id),
-        db: Session = Depends(get_db),
-        app_chat_service: Annotated[AppChatService, Depends(get_app_chat_service)] = None,
+    payload: conversation_schema.ChatRequest,
+    share_data: ShareTokenData = Depends(get_share_user_id),
+    db: Session = Depends(get_db)
 ):
    """发送消息并获取回复

@@ -335,49 +288,37 @@ async def chat(

    # 提前验证和准备（在流式响应开始前完成）
    # 这样可以确保错误能正确返回，而不是在流式响应中间出错
-
+    from app.models.app_model import AppType
    try:
+        from app.core.exceptions import BusinessException
+        from app.core.error_codes import BizCode
+        from app.services.app_service import AppService
        # 验证分享链接和密码
-        share, release = service.get_release_by_share_token(share_token, password)
+        share, release = service._get_release_by_share_token(share_token, password)

        # # Create end_user_id by concatenating app_id with user_id
        # end_user_id = f"{share.app_id}_{user_id}"

        # Store end_user_id in database with original user_id
+        from app.repositories.end_user_repository import EndUserRepository
        end_user_repo = EndUserRepository(db)
-        app_service = AppService(db)
-        app = app_service._get_app_or_404(share.app_id)
-        workspace_id = app.workspace_id
        new_end_user = end_user_repo.get_or_create_end_user(
            app_id=share.app_id,
-            workspace_id=workspace_id,
            other_id=other_id,
-            original_user_id=user_id
+            original_user_id=user_id  # Save original user_id to other_id
        )

-        # Only extract and set memory_config_id when the end user doesn't have one yet
-        if not new_end_user.memory_config_id:
-            from app.services.memory_config_service import MemoryConfigService
-            memory_config_service = MemoryConfigService(db)
-            memory_config_id, _ = memory_config_service.extract_memory_config_id(release.type, release.config or {})
-            if memory_config_id:
-                new_end_user.memory_config_id = memory_config_id
-                db.commit()
-                db.refresh(new_end_user)
-        end_user_id = str(new_end_user.id)

-        # appid = share.app_id
+        appid=share.app_id
        """获取存储类型和工作空间的ID"""

-        # 直接通过 SQLAlchemy 查询 app（仅查询未删除的应用）
-        # app = db.query(App).filter(
-        #     App.id == appid,
-        #     App.is_active.is_(True)
-        # ).first()
-        # if not app:
-        #     raise BusinessException("应用不存在", BizCode.APP_NOT_FOUND)
+        # 直接通过 SQLAlchemy 查询 app
+        from app.models.app_model import App
+        app = db.query(App).filter(App.id == appid).first()
+        if not app:
+            raise BusinessException("应用不存在", BizCode.APP_NOT_FOUND)

-        # workspace_id = app.workspace_id
+        workspace_id = app.workspace_id

        # 直接从 workspace 获取 storage_type（公开分享场景无需权限检查）
        storage_type = workspace_service.get_workspace_storage_type_without_auth(
@@ -410,19 +351,16 @@ async def chat(
        app_type = release.app.type if release.app else None

        # 根据应用类型验证配置
-        if app_type == AppType.AGENT:
+        if app_type == "agent":
            # Agent 类型：验证模型配置
            model_config_id = release.default_model_config_id
            if not model_config_id:
                raise BusinessException("Agent 应用未配置模型", BizCode.AGENT_CONFIG_MISSING)
-        elif app_type == AppType.MULTI_AGENT:
+        elif app_type == "multi_agent":
            # Multi-Agent 类型：验证多 Agent 配置
            config = release.config or {}
            if not config.get("sub_agents"):
                raise BusinessException("多 Agent 应用未配置子 Agent", BizCode.AGENT_CONFIG_MISSING)
-        elif app_type == AppType.WORKFLOW:
-            # Multi-Agent 类型：验证多 Agent 配置
-            pass
        else:
            raise BusinessException(f"不支持的应用类型: {app_type}", BizCode.APP_TYPE_NOT_SUPPORTED)

@@ -451,25 +389,19 @@ async def chat(

    if app_type == AppType.AGENT:
        # 流式返回
-        agent_config = agent_config_4_app_release(release)
-
-        if not (agent_config.model_parameters.get("deep_thinking", False) and payload.thinking):
-            agent_config.model_parameters["deep_thinking"] = False
-
        if payload.stream:
            async def event_generator():
-                async for event in app_chat_service.agnet_chat_stream(
-                        message=payload.message,
-                        conversation_id=conversation.id,  # 使用已创建的会话 ID
-                        user_id=str(new_end_user.id),  # 转换为字符串
-                        variables=payload.variables,
-                        web_search=payload.web_search,
-                        config=agent_config,
-                        memory=payload.memory,
-                        storage_type=storage_type,
-                        user_rag_memory_id=user_rag_memory_id,
-                        workspace_id=workspace_id,
-                        files=payload.files  # 传递多模态文件
+                async for event in service.chat_stream(
+                    share_token=share_token,
+                    message=payload.message,
+                    conversation_id=conversation.id,  # 使用已创建的会话 ID
+                    user_id=str(new_end_user.id),  # 转换为字符串
+                    variables=payload.variables,
+                    password=password,
+                    web_search=payload.web_search,
+                    memory=payload.memory,
+                    storage_type=storage_type,
+                    user_rag_memory_id=user_rag_memory_id
                ):
                    yield event

@@ -482,34 +414,34 @@ async def chat(
                    "X-Accel-Buffering": "no"
                }
            )
-        result = await app_chat_service.agnet_chat(
+
+        # 非流式返回
+        result = await service.chat(
+            share_token=share_token,
            message=payload.message,
            conversation_id=conversation.id,  # 使用已创建的会话 ID
            user_id=str(new_end_user.id),  # 转换为字符串
            variables=payload.variables,
-            config=agent_config,
+            password=password,
            web_search=payload.web_search,
            memory=payload.memory,
            storage_type=storage_type,
-            user_rag_memory_id=user_rag_memory_id,
-            workspace_id=workspace_id,
-            files=payload.files  # 传递多模态文件
+            user_rag_memory_id=user_rag_memory_id
        )
-        return success(data=conversation_schema.ChatResponse(**result).model_dump(mode="json"))
+        return success(data=conversation_schema.ChatResponse(**result))
    elif app_type == AppType.MULTI_AGENT:
-        # config = workflow_config_4_app_release(release)
-        config = multi_agent_config_4_app_release(release)
+        # 多 Agent 流式返回
        if payload.stream:
            async def event_generator():
-                async for event in app_chat_service.multi_agent_chat_stream(
-
-                        message=payload.message,
-                        conversation_id=conversation.id,  # 使用已创建的会话 ID
-                        user_id=str(new_end_user.id),  # 转换为字符串
-                        variables=payload.variables,
-                        config=config,
-                        web_search=payload.web_search,
-                        memory=payload.memory,
+                async for event in service.multi_agent_chat_stream(
+                    share_token=share_token,
+                    message=payload.message,
+                    conversation_id=conversation.id,  # 使用已创建的会话 ID
+                    user_id=str(new_end_user.id),  # 转换为字符串
+                    variables=payload.variables,
+                    password=password,
+                    web_search=payload.web_search,
+                    memory=payload.memory,
                        storage_type=storage_type,
                        user_rag_memory_id=user_rag_memory_id
                ):
@@ -526,126 +458,22 @@ async def chat(
            )

        # 多 Agent 非流式返回
-        result = await app_chat_service.multi_agent_chat(
-
+        result = await service.multi_agent_chat(
+            share_token=share_token,
            message=payload.message,
            conversation_id=conversation.id,  # 使用已创建的会话 ID
-            user_id=end_user_id,  # 转换为字符串
+            user_id=str(new_end_user.id),  # 转换为字符串
            variables=payload.variables,
-            config=config,
+            password=password,
            web_search=payload.web_search,
            memory=payload.memory,
            storage_type=storage_type,
            user_rag_memory_id=user_rag_memory_id
        )

-        return success(data=conversation_schema.ChatResponse(**result).model_dump(mode="json"))
-    elif app_type == AppType.WORKFLOW:
-        config = workflow_config_4_app_release(release)
-        if not config.id:
-            with get_db_read() as db:
-                source_config = WorkflowConfigRepository(db).get_by_app_id(release.app_id)
-                config.id = source_config.id
-        config.id = uuid.UUID(config.id)
-        if payload.stream:
-            async def event_generator():
-                async for event in app_chat_service.workflow_chat_stream(
-                        message=payload.message,
-                        conversation_id=conversation.id,  # 使用已创建的会话 ID
-                        user_id=end_user_id,  # 转换为字符串
-                        variables=payload.variables,
-                        files=payload.files,
-                        config=config,
-                        web_search=payload.web_search,
-                        memory=payload.memory,
-                        storage_type=storage_type,
-                        user_rag_memory_id=user_rag_memory_id,
-                        app_id=release.app_id,
-                        workspace_id=workspace_id,
-                        release_id=release.id,
-                        public=True
-                ):
-                    event_type = event.get("event", "message")
-                    event_data = event.get("data", {})
-
-                    # 转换为标准 SSE 格式（字符串）
-                    sse_message = f"event: {event_type}\ndata: {json.dumps(event_data, default=str, ensure_ascii=False)}\n\n"
-                    yield sse_message
-
-            return StreamingResponse(
-                event_generator(),
-                media_type="text/event-stream",
-                headers={
-                    "Cache-Control": "no-cache",
-                    "Connection": "keep-alive",
-                    "X-Accel-Buffering": "no"
-                }
-            )
-
-        # 多 Agent 非流式返回
-        result = await app_chat_service.workflow_chat(
-            message=payload.message,
-            conversation_id=conversation.id,  # 使用已创建的会话 ID
-            user_id=end_user_id,  # 转换为字符串
-            variables=payload.variables,
-            files=payload.files,
-            config=config,
-            web_search=payload.web_search,
-            memory=payload.memory,
-            storage_type=storage_type,
-            user_rag_memory_id=user_rag_memory_id,
-            app_id=release.app_id,
-            workspace_id=workspace_id,
-            release_id=release.id
-        )
-        logger.debug(
-            "工作流试运行返回结果",
-            extra={
-                "result_type": str(type(result)),
-                "has_response": "response" in result if isinstance(result, dict) else False
-            }
-        )
-        return success(
-            data=result,
-            msg="工作流任务执行成功"
-        )
-        # return success(data=conversation_schema.ChatResponse(**result).model_dump(mode="json"))
-
+        return success(data=conversation_schema.ChatResponse(**result))
    else:
+        from app.core.exceptions import BusinessException
+        from app.core.error_codes import BizCode
        raise BusinessException(f"不支持的应用类型: {app_type}", BizCode.APP_TYPE_NOT_SUPPORTED)
-
-
-@router.get("/config", summary="获取应用启动配置")
-async def config_query(
-        password: str = Query(None, description="访问密码"),
-        share_data: ShareTokenData = Depends(get_share_user_id),
-        db: Session = Depends(get_db),
-):
-    share_service = SharedChatService(db)
-    share_token = share_data.share_token
-    share, release = share_service.get_release_by_share_token(share_token, password)
-    if release.app.type == AppType.WORKFLOW:
-        workflow_service = WorkflowService(db)
-        content = {
-            "app_type": release.app.type,
-            "variables": workflow_service.get_start_node_variables(release.config),
-            "memory":  workflow_service.is_memory_enable(release.config),
-            "features": release.config.get("features")
-        }
-    elif release.app.type == AppType.AGENT:
-        content = {
-            "app_type": release.app.type,
-            "variables": release.config.get("variables"),
-            "memory": release.config.get("memory", {}).get("enabled"),
-            "features": release.config.get("features"),
-            "model_parameters": release.config.get("model_parameters")
-        }
-    elif release.app.type == AppType.MULTI_AGENT:
-        content = {
-            "app_type": release.app.type,
-            "variables": [],
-            "features": release.config.get("features")
-        }
-    else:
-        return fail(msg="Unsupported app type", code=BizCode.APP_TYPE_NOT_SUPPORTED)
-    return success(data=content)
+        pass
--- a/api/app/controllers/service/init.py
+++ b/api/app/controllers/service/init.py
@@ -4,18 +4,14 @@
 认证方式: API Key
 """
 from fastapi import APIRouter
-from . import app_api_controller, rag_api_knowledge_controller, rag_api_document_controller, rag_api_file_controller, rag_api_chunk_controller, memory_api_controller, end_user_api_controller
+from . import app_api_controller, rag_api_controller, memory_api_controller

 # 创建 V1 API 路由器
 service_router = APIRouter()

 # 注册子路由
 service_router.include_router(app_api_controller.router)
-service_router.include_router(rag_api_knowledge_controller.router)
-service_router.include_router(rag_api_document_controller.router)
-service_router.include_router(rag_api_file_controller.router)
-service_router.include_router(rag_api_chunk_controller.router)
+service_router.include_router(rag_api_controller.router)
 service_router.include_router(memory_api_controller.router)
-service_router.include_router(end_user_api_controller.router)

 __all__ = ["service_router"]
--- a/api/app/controllers/service/app_api_controller.py
+++ b/api/app/controllers/service/app_api_controller.py
@@ -1,5 +1,4 @@
 """App 服务接口 - 基于 API Key 认证"""
-import json
 from typing import Annotated

 from fastapi import APIRouter, Depends, Request, Body
@@ -12,19 +11,18 @@ from app.core.exceptions import BusinessException
 from app.core.logging_config import get_business_logger
 from app.core.response_utils import success
 from app.db import get_db
+from app.dependencies import get_app_or_workspace
 from app.models.app_model import App
 from app.models.app_model import AppType
-from app.models.app_release_model import AppRelease
 from app.repositories import knowledge_repository
 from app.repositories.end_user_repository import EndUserRepository
 from app.schemas import AppChatRequest, conversation_schema
 from app.schemas.api_key_schema import ApiKeyAuth
 from app.services import workspace_service
 from app.services.app_chat_service import AppChatService, get_app_chat_service
-from app.services.app_service import get_app_service, AppService
 from app.services.conversation_service import ConversationService, get_conversation_service
-from app.utils.app_config_utils import workflow_config_4_app_release, \
-    agent_config_4_app_release, multi_agent_config_4_app_release
+from app.utils.app_config_utils import dict_to_multi_agent_config, dict_to_workflow_config, agent_config_4_app_release
+from app.services.app_service import get_app_service, AppService

 router = APIRouter(prefix="/app", tags=["V1 - App API"])
 logger = get_business_logger()
@@ -35,7 +33,6 @@ async def list_apps():
    """列出可访问的应用（占位）"""
    return success(data=[], msg="App API - Coming Soon")

-
 # /v1/app/chat

 # @router.post("/chat")
@@ -62,58 +59,46 @@ async def list_apps():
 #     return success(data={"received": True}, msg="消息已接收")


-def _checkAppConfig(release: AppRelease):
-    if release.type == AppType.AGENT:
-        if not release.config:
+def _checkAppConfig(app: App):
+    if app.type == AppType.AGENT:
+        if not app.current_release.config:
            raise BusinessException("Agent 应用未配置模型", BizCode.AGENT_CONFIG_MISSING)
-    elif release.type == AppType.MULTI_AGENT:
-        if not release.config:
+    elif app.type == AppType.MULTI_AGENT:
+        if not app.current_release.config:
            raise BusinessException("Multi-Agent 应用未配置模型", BizCode.AGENT_CONFIG_MISSING)
-    elif release.type == AppType.WORKFLOW:
-        if not release.config:
+    elif app.type == AppType.WORKFLOW:
+        if not app.current_release.config:
            raise BusinessException("工作流应用未配置模型", BizCode.AGENT_CONFIG_MISSING)
    else:
-        raise BusinessException("不支持的应用类型", BizCode.APP_TYPE_NOT_SUPPORTED)
-
+        raise BusinessException("不支持的应用类型", BizCode.AGENT_CONFIG_MISSING)

@router.post("/chat")
@require_api_key(scopes=["app"])
 async def chat(
-        request: Request,
-        api_key_auth: ApiKeyAuth = None,
-        db: Session = Depends(get_db),
-        conversation_service: Annotated[ConversationService, Depends(get_conversation_service)] = None,
-        app_chat_service: Annotated[AppChatService, Depends(get_app_chat_service)] = None,
-        app_service: Annotated[AppService, Depends(get_app_service)] = None,
-        message: str = Body(..., description="聊天消息内容"),
+    request:Request,
+    api_key_auth: ApiKeyAuth = None,
+    db: Session = Depends(get_db),
+    conversation_service: Annotated[ConversationService, Depends(get_conversation_service)] = None,
+    app_chat_service: Annotated[AppChatService, Depends(get_app_chat_service)] = None,
+    app_service: Annotated[AppService, Depends(get_app_service)] = None,
+    message: str = Body(..., description="聊天消息内容"),
 ):
-    """
-    Agent/Workflow 聊天接口
-
-    - 不传 version：使用当前生效版本（current_release，回滚后为回滚目标版本）
-    - 传 version=release_id：使用指定版本uuid的历史快照，例如 {"version": "{{release_id}}"}
-    """
    body = await request.json()
    payload = AppChatRequest(**body)

-    app = app_service.get_app(api_key_auth.resource_id, api_key_auth.workspace_id)
-
-    # 版本切换：指定 release_id 时查找对应历史快照，否则使用当前激活版本
-    if payload.version is not None:
-        active_release = app_service.get_release_by_id(app.id, payload.version)
-    else:
-        active_release = app.current_release
    other_id = payload.user_id
-    workspace_id = api_key_auth.workspace_id
+    app = app_service.get_app(api_key_auth.resource_id, api_key_auth.workspace_id)
+    other_id = payload.user_id
+    workspace_id = app.workspace_id
    end_user_repo = EndUserRepository(db)
    new_end_user = end_user_repo.get_or_create_end_user(
        app_id=app.id,
-        workspace_id=workspace_id,
        other_id=other_id,
+        original_user_id=other_id  # Save original user_id to other_id
    )
    end_user_id = str(new_end_user.id)
-    web_search = True
-    memory = True
+    web_search=True
+    memory=True
    # 提前验证和准备（在流式响应开始前完成）
    storage_type = workspace_service.get_workspace_storage_type_without_auth(
        db=db,
@@ -140,43 +125,35 @@ async def chat(
            storage_type = 'neo4j'
    app_type = app.type
    # check app config
-    _checkAppConfig(active_release)
+    _checkAppConfig(app)

    # 获取或创建会话（提前验证）
    conversation = conversation_service.create_or_get_conversation(
        app_id=app.id,
        workspace_id=workspace_id,
        user_id=end_user_id,
-        is_draft=False,
-        conversation_id=payload.conversation_id
+        is_draft=False
    )

    if app_type == AppType.AGENT:

-        # print("="*50)
-        # print(app.current_release.default_model_config_id)
-        agent_config = agent_config_4_app_release(active_release)
-        # print(agent_config.default_model_config_id)
-
-        # thinking 开关：仅当 agent 配置了 deep_thinking 且请求 thinking=True 时才启用
-        if not (agent_config.model_parameters.get("deep_thinking", False) and payload.thinking):
-            agent_config.model_parameters["deep_thinking"] = False
-
+        print("="*50)
+        print(app.current_release.default_model_config_id)
+        agent_config = agent_config_4_app_release(app.current_release)
+        print(agent_config.default_model_config_id)
        # 流式返回
        if payload.stream:
            async def event_generator():
                async for event in app_chat_service.agnet_chat_stream(
-                        message=payload.message,
-                        conversation_id=conversation.id,  # 使用已创建的会话 ID
-                        user_id=end_user_id,  # 转换为字符串
-                        variables=payload.variables,
-                        web_search=web_search,
-                        config=agent_config,
-                        memory=memory,
-                        storage_type=storage_type,
-                        user_rag_memory_id=user_rag_memory_id,
-                        workspace_id=workspace_id,
-                        files=payload.files  # 传递多模态文件
+                    message=payload.message,
+                    conversation_id=conversation.id,  # 使用已创建的会话 ID
+                    user_id= end_user_id,  # 转换为字符串
+                    variables=payload.variables,
+                    web_search=web_search,
+                    config=agent_config,
+                    memory=memory,
+                    storage_type=storage_type,
+                    user_rag_memory_id=user_rag_memory_id
                ):
                    yield event

@@ -196,29 +173,27 @@ async def chat(
            conversation_id=conversation.id,  # 使用已创建的会话 ID
            user_id=end_user_id,  # 转换为字符串
            variables=payload.variables,
-            config=agent_config,
+            config= agent_config,
            web_search=web_search,
            memory=memory,
            storage_type=storage_type,
-            user_rag_memory_id=user_rag_memory_id,
-            workspace_id=workspace_id,
-            files=payload.files  # 传递多模态文件
+            user_rag_memory_id=user_rag_memory_id
        )
        return success(data=conversation_schema.ChatResponse(**result).model_dump(mode="json"))
    elif app_type == AppType.MULTI_AGENT:
        # 多 Agent 流式返回
-        config = multi_agent_config_4_app_release(active_release)
+        config = dict_to_multi_agent_config(app.current_release.config,app.id)
        if payload.stream:
            async def event_generator():
                async for event in app_chat_service.multi_agent_chat_stream(

-                        message=payload.message,
-                        conversation_id=conversation.id,  # 使用已创建的会话 ID
-                        user_id=end_user_id,  # 转换为字符串
-                        variables=payload.variables,
-                        config=config,
-                        web_search=web_search,
-                        memory=memory,
+                    message=payload.message,
+                    conversation_id=conversation.id,  # 使用已创建的会话 ID
+                    user_id=end_user_id,  # 转换为字符串
+                    variables=payload.variables,
+                    config=config,
+                    web_search=web_search,
+                    memory=memory,
                        storage_type=storage_type,
                        user_rag_memory_id=user_rag_memory_id
                ):
@@ -236,6 +211,7 @@ async def chat(

        # 多 Agent 非流式返回
        result = await app_chat_service.multi_agent_chat(
+
            message=payload.message,
            conversation_id=conversation.id,  # 使用已创建的会话 ID
            user_id=end_user_id,  # 转换为字符串
@@ -250,31 +226,22 @@ async def chat(
        return success(data=conversation_schema.ChatResponse(**result).model_dump(mode="json"))
    elif app_type == AppType.WORKFLOW:
        # 多 Agent 流式返回
-        config = workflow_config_4_app_release(active_release)
+        config = dict_to_workflow_config(app.current_release.config,app.id)
        if payload.stream:
            async def event_generator():
                async for event in app_chat_service.workflow_chat_stream(
-                        message=payload.message,
-                        conversation_id=conversation.id,  # 使用已创建的会话 ID
-                        user_id=end_user_id,  # 转换为字符串
-                        variables=payload.variables,
-                        files=payload.files,
-                        config=config,
-                        web_search=web_search,
-                        memory=memory,
-                        storage_type=storage_type,
-                        user_rag_memory_id=user_rag_memory_id,
-                        app_id=app.id,
-                        workspace_id=workspace_id,
-                        release_id=active_release.id,
-                        public=True
-                ):
-                    event_type = event.get("event", "message")
-                    event_data = event.get("data", {})

-                    # 转换为标准 SSE 格式（字符串）
-                    sse_message = f"event: {event_type}\ndata: {json.dumps(event_data)}\n\n"
-                    yield sse_message
+                    message=payload.message,
+                    conversation_id=conversation.id,  # 使用已创建的会话 ID
+                    user_id=end_user_id,  # 转换为字符串
+                    variables=payload.variables,
+                    config=config,
+                    web_search=web_search,
+                    memory=memory,
+                        storage_type=storage_type,
+                        user_rag_memory_id=user_rag_memory_id
+                ):
+                    yield event

            return StreamingResponse(
                event_generator(),
@@ -286,7 +253,7 @@ async def chat(
                }
            )

-        # 多 Agent 非流式返回
+        #  非流式返回
        result = await app_chat_service.workflow_chat(

            message=payload.message,
@@ -297,22 +264,12 @@ async def chat(
            web_search=web_search,
            memory=memory,
            storage_type=storage_type,
-            user_rag_memory_id=user_rag_memory_id,
-            files=payload.files,
-            app_id=app.id,
-            workspace_id=workspace_id,
-            release_id=active_release.id
-        )
-        logger.debug(
-            "工作流试运行返回结果",
-            extra={
-                "result_type": str(type(result)),
-                "has_response": "response" in result if isinstance(result, dict) else False
-            }
-        )
-        return success(
-            data=result,
-            msg="工作流任务执行成功"
+            user_rag_memory_id=user_rag_memory_id
        )
+
+        return success(data=conversation_schema.ChatResponse(**result).model_dump(mode="json"))
    else:
+        from app.core.exceptions import BusinessException
+        from app.core.error_codes import BizCode
        raise BusinessException(f"不支持的应用类型: {app_type}", BizCode.APP_TYPE_NOT_SUPPORTED)
+        pass
--- a/api/app/controllers/service/end_user_api_controller.py
+++ b/api/app/controllers/service/end_user_api_controller.py
@@ -1,92 +0,0 @@
-"""End User 服务接口 - 基于 API Key 认证"""
-
-import uuid
-
-from fastapi import APIRouter, Body, Depends, Request
-from sqlalchemy.orm import Session
-
-from app.core.api_key_auth import require_api_key
-from app.core.error_codes import BizCode
-from app.core.exceptions import BusinessException
-from app.core.logging_config import get_business_logger
-from app.core.response_utils import success
-from app.db import get_db
-from app.repositories.end_user_repository import EndUserRepository
-from app.schemas.api_key_schema import ApiKeyAuth
-from app.schemas.memory_api_schema import CreateEndUserRequest, CreateEndUserResponse
-from app.services.memory_config_service import MemoryConfigService
-
-router = APIRouter(prefix="/end_user", tags=["V1 - End User API"])
-logger = get_business_logger()
-
-
-@router.post("/create")
-@require_api_key(scopes=["memory"])
-async def create_end_user(
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    message: str = Body(..., description="Request body"),
-):
-    """
-    Create or retrieve an end user for the workspace.
-
-    Creates a new end user and connects it to a memory configuration.
-    If an end user with the same other_id already exists in the workspace,
-    returns the existing one.
-
-    Optionally accepts a memory_config_id to connect the end user to a specific
-    memory configuration. If not provided, falls back to the workspace default config.
-    """
-    body = await request.json()
-    payload = CreateEndUserRequest(**body)
-    workspace_id = api_key_auth.workspace_id
-
-    logger.info("Create end user request - other_id: %s, workspace_id: %s", payload.other_id, workspace_id)
-
-    # Resolve memory_config_id: explicit > workspace default
-    memory_config_id = None
-    config_service = MemoryConfigService(db)
-
-    if payload.memory_config_id:
-        try:
-            memory_config_id = uuid.UUID(payload.memory_config_id)
-        except ValueError:
-            raise BusinessException(
-                f"Invalid memory_config_id format: {payload.memory_config_id}",
-                BizCode.INVALID_PARAMETER
-            )
-        config = config_service.get_config_with_fallback(memory_config_id, workspace_id)
-        if not config:
-            raise BusinessException(
-                f"Memory config not found: {payload.memory_config_id}",
-                BizCode.MEMORY_CONFIG_NOT_FOUND
-            )
-        memory_config_id = config.config_id
-    else:
-        default_config = config_service.get_workspace_default_config(workspace_id)
-        if default_config:
-            memory_config_id = default_config.config_id
-            logger.info(f"Using workspace default memory config: {memory_config_id}")
-        else:
-            logger.warning(f"No default memory config found for workspace: {workspace_id}")
-
-    end_user_repo = EndUserRepository(db)
-    end_user = end_user_repo.get_or_create_end_user_with_config(
-        app_id=api_key_auth.resource_id,
-        workspace_id=workspace_id,
-        other_id=payload.other_id,
-        memory_config_id=memory_config_id,
-    )
-
-    logger.info(f"End user ready: {end_user.id}")
-
-    result = {
-        "id": str(end_user.id),
-        "other_id": end_user.other_id or "",
-        "other_name": end_user.other_name or "",
-        "workspace_id": str(end_user.workspace_id),
-        "memory_config_id": str(end_user.memory_config_id) if end_user.memory_config_id else None,
-    }
-
-    return success(data=CreateEndUserResponse(**result).model_dump(), msg="End user created successfully")
--- a/api/app/controllers/service/memory_api_controller.py
+++ b/api/app/controllers/service/memory_api_controller.py
@@ -6,9 +6,6 @@ from app.core.response_utils import success
 from app.db import get_db
 from app.schemas.api_key_schema import ApiKeyAuth
 from app.schemas.memory_api_schema import (
-    CreateEndUserRequest,
-    CreateEndUserResponse,
-    ListConfigsResponse,
    MemoryReadRequest,
    MemoryReadResponse,
    MemoryWriteRequest,
@@ -34,16 +31,15 @@ async def write_memory_api_service(
    request: Request,
    api_key_auth: ApiKeyAuth = None,
    db: Session = Depends(get_db),
-    message: str = Body(..., description="Message content"),
+    payload: MemoryWriteRequest = Body(..., embed=False),
+
 ):
    """
    Write memory to storage.
    
    Stores memory content for the specified end user using the Memory API Service.
    """
-    body = await request.json()
-    payload = MemoryWriteRequest(**body)
-    logger.info(f"Memory write request - end_user_id: {payload.end_user_id}, workspace_id: {api_key_auth.workspace_id}")
+    logger.info(f"Memory write request - end_user_id: {payload.end_user_id}")
    
    memory_api_service = MemoryAPIService(db)
    
@@ -66,15 +62,13 @@ async def read_memory_api_service(
    request: Request,
    api_key_auth: ApiKeyAuth = None,
    db: Session = Depends(get_db),
-    message: str = Body(..., description="Query message"),
+    payload: MemoryReadRequest = Body(..., embed=False),
 ):
    """
    Read memory from storage.
    
    Queries and retrieves memories for the specified end user with context-aware responses.
    """
-    body = await request.json()
-    payload = MemoryReadRequest(**body)
    logger.info(f"Memory read request - end_user_id: {payload.end_user_id}")
    
    memory_api_service = MemoryAPIService(db)
@@ -91,55 +85,3 @@ async def read_memory_api_service(
    
    logger.info(f"Memory read successful for end_user: {payload.end_user_id}")
    return success(data=MemoryReadResponse(**result).model_dump(), msg="Memory read successfully")
-
-
-@router.get("/configs")
-@require_api_key(scopes=["memory"])
-async def list_memory_configs(
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    List all memory configs for the workspace.
-    
-    Returns all available memory configurations associated with the authorized workspace.
-    """
-    logger.info(f"List configs request - workspace_id: {api_key_auth.workspace_id}")
-
-    memory_api_service = MemoryAPIService(db)
-
-    result = memory_api_service.list_memory_configs(
-        workspace_id=api_key_auth.workspace_id,
-    )
-
-    logger.info(f"Listed {result['total']} configs for workspace: {api_key_auth.workspace_id}")
-    return success(data=ListConfigsResponse(**result).model_dump(), msg="Configs listed successfully")
-
-
-@router.post("/end_users")
-@require_api_key(scopes=["memory"])
-async def create_end_user(
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    Create an end user.
-    
-    Creates a new end user for the authorized workspace.
-    If an end user with the same other_id already exists, returns the existing one.
-    """
-    body = await request.json()
-    payload = CreateEndUserRequest(**body)
-    logger.info(f"Create end user request - other_id: {payload.other_id}, workspace_id: {api_key_auth.workspace_id}")
-
-    memory_api_service = MemoryAPIService(db)
-
-    result = memory_api_service.create_end_user(
-        workspace_id=api_key_auth.workspace_id,
-        other_id=payload.other_id,
-    )
-
-    logger.info(f"End user ready: {result['id']}")
-    return success(data=CreateEndUserResponse(**result).model_dump(), msg="End user created successfully")
--- a/api/app/controllers/service/rag_api_chunk_controller.py
+++ b/api/app/controllers/service/rag_api_chunk_controller.py
@@ -1,221 +0,0 @@
-"""RAG 服务接口 - 基于 API Key 认证"""
-
-from typing import Any, Optional, Union
-import uuid
-
-from fastapi import APIRouter, Body, Depends, Request, status, Query
-from sqlalchemy.orm import Session
-
-from app.controllers import chunk_controller
-from app.core.api_key_auth import require_api_key
-from app.core.logging_config import get_business_logger
-from app.core.rag.models.chunk import QAChunk
-from app.core.response_utils import success
-from app.db import get_db
-from app.schemas import chunk_schema
-from app.schemas.api_key_schema import ApiKeyAuth
-from app.schemas.response_schema import ApiResponse
-from app.services import api_key_service
-
-
-router = APIRouter(prefix="/chunks", tags=["V1 - RAG API"])
-api_logger = get_business_logger()
-
-
-@router.get("/{kb_id}/{document_id}/previewchunks", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def get_preview_chunks(
-    kb_id: uuid.UUID,
-    document_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    page: int = Query(1, gt=0),  # Default: 1, which must be greater than 0
-    pagesize: int = Query(20, gt=0, le=100),  # Default: 20 items per page, maximum: 100 items
-    keywords: Optional[str] = Query(None, description="The keywords used to match chunk content")
-):
-    """
-    Paged query document block preview list
-    - Support filtering by document_id
-    - Support keyword search for segmented content
-    - Return paging metadata + file list
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await chunk_controller.get_preview_chunks(kb_id=kb_id,
-                                                     document_id=document_id,
-                                                     page=page,
-                                                     pagesize=pagesize,
-                                                     keywords=keywords,
-                                                     db=db,
-                                                     current_user=current_user)
-
-
-@router.get("/{kb_id}/{document_id}/chunks", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def get_chunks(
-    kb_id: uuid.UUID,
-    document_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    page: int = Query(1, gt=0),  # Default: 1, which must be greater than 0
-    pagesize: int = Query(20, gt=0, le=100),  # Default: 20 items per page, maximum: 100 items
-    keywords: Optional[str] = Query(None, description="The keywords used to match chunk content")
-):
-    """
-    Paged query document chunk list
-    - Support filtering by document_id
-    - Support keyword search for segmented content
-    - Return paging metadata + file list
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await chunk_controller.get_chunks(kb_id=kb_id,
-                                             document_id=document_id,
-                                             page=page,
-                                             pagesize=pagesize,
-                                             keywords=keywords,
-                                             db=db,
-                                             current_user=current_user)
-
-
-@router.post("/{kb_id}/{document_id}/chunk", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def create_chunk(
-    kb_id: uuid.UUID,
-    document_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    content: Union[str, QAChunk] = Body(..., description="Content can be either a string or a QAChunk object"),
-):
-    """
-    create chunk
-    """
-    body = await request.json()
-    create_data = chunk_schema.ChunkCreate(**body)
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await chunk_controller.create_chunk(kb_id=kb_id,
-                                               document_id=document_id,
-                                               create_data=create_data,
-                                               db=db,
-                                               current_user=current_user)
-
-
-@router.get("/{kb_id}/{document_id}/{doc_id}", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def get_chunk(
-    kb_id: uuid.UUID,
-    document_id: uuid.UUID,
-    doc_id: str,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    Retrieve document chunk information based on doc_id
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await chunk_controller.get_chunk(kb_id=kb_id,
-                                            document_id=document_id,
-                                            doc_id=doc_id,
-                                            db=db,
-                                            current_user=current_user)
-
-
-@router.put("/{kb_id}/{document_id}/{doc_id}", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def update_chunk(
-    kb_id: uuid.UUID,
-    document_id: uuid.UUID,
-    doc_id: str,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    content: Union[str, QAChunk] = Body(..., description="Content can be either a string or a QAChunk object"),
-):
-    """
-    Update document chunk content
-    """
-    body = await request.json()
-    update_data = chunk_schema.ChunkUpdate(**body)
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await chunk_controller.update_chunk(kb_id=kb_id,
-                                               document_id=document_id,
-                                               doc_id=doc_id,
-                                               update_data=update_data,
-                                               db=db,
-                                               current_user=current_user)
-
-
-@router.delete("/{kb_id}/{document_id}/{doc_id}", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def delete_chunk(
-    kb_id: uuid.UUID,
-    document_id: uuid.UUID,
-    doc_id: str,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    delete document chunk
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await chunk_controller.delete_chunk(kb_id=kb_id,
-                                               document_id=document_id,
-                                               doc_id=doc_id,
-                                               db=db,
-                                               current_user=current_user)
-
-
-@router.get("/retrieve_type", response_model=ApiResponse)
-def get_retrieve_types():
-    return success(msg="Successfully obtained the retrieval type", data=list(chunk_schema.RetrieveType))
-
-
-@router.post("/retrieval", response_model=Any, status_code=status.HTTP_200_OK)
-@require_api_key(scopes=["rag"])
-async def retrieve_chunks(
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    query: str = Body(..., description="question"),
-):
-    """
-    retrieve chunk
-    """
-    body = await request.json()
-    retrieve_data = chunk_schema.ChunkRetrieve(**body)
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await chunk_controller.retrieve_chunks(retrieve_data=retrieve_data,
-                                                  db=db,
-                                                  current_user=current_user)
-
--- a/api/app/controllers/service/rag_api_controller.py
+++ b/api/app/controllers/service/rag_api_controller.py
@@ -0,0 +1,16 @@
+"""RAG 服务接口 - 基于 API Key 认证"""
+from fastapi import APIRouter, Depends
+from sqlalchemy.orm import Session
+
+from app.db import get_db
+from app.core.response_utils import success
+from app.core.logging_config import get_business_logger
+
+router = APIRouter(prefix="/knowledge", tags=["V1 - RAG API"])
+logger = get_business_logger()
+
+
+@router.get("")
+async def list_knowledge():
+    """列出可访问的知识库（占位）"""
+    return success(data=[], msg="RAG API - Coming Soon")
--- a/api/app/controllers/service/rag_api_document_controller.py
+++ b/api/app/controllers/service/rag_api_document_controller.py
@@ -1,172 +0,0 @@
-"""RAG 服务接口 - 基于 API Key 认证"""
-
-from typing import Optional
-import uuid
-
-from fastapi import APIRouter, Body, Depends, Request, Query
-from sqlalchemy.orm import Session
-
-from app.controllers import document_controller
-from app.core.api_key_auth import require_api_key
-from app.core.logging_config import get_business_logger
-from app.db import get_db
-from app.schemas import document_schema
-from app.schemas.api_key_schema import ApiKeyAuth
-from app.schemas.response_schema import ApiResponse
-from app.services import api_key_service
-
-
-router = APIRouter(prefix="/documents", tags=["V1 - RAG API"])
-api_logger = get_business_logger()
-
-
-@router.get("/{kb_id}/documents", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def get_documents(
-    kb_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    parent_id: Optional[uuid.UUID] = Query(None, description="parent folder id when type is Folder"),
-    page: int = Query(1, gt=0),  # Default: 1, which must be greater than 0
-    pagesize: int = Query(20, gt=0, le=100),  # Default: 20 items per page, maximum: 100 items
-    orderby: Optional[str] = Query(None, description="Sort fields, such as: created_at,updated_at"),
-    desc: Optional[bool] = Query(False, description="Is it descending order"),
-    keywords: Optional[str] = Query(None, description="Search keywords (file name)"),
-    document_ids: Optional[str] = Query(None, description="document ids, separated by commas")
-):
-    """
-    Paged query document list
-    - Support filtering by kb_id and parent_id
-    - Support keyword search for file names
-    - Support dynamic sorting
-    - Return paging metadata + file list
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await document_controller.get_documents(kb_id=kb_id,
-                                                   parent_id=parent_id,
-                                                   page=page,
-                                                   pagesize=pagesize,
-                                                   orderby=orderby,
-                                                   desc=desc,
-                                                   keywords=keywords,
-                                                   document_ids=document_ids,
-                                                   db=db,
-                                                   current_user=current_user)
-
-
-@router.post("/document", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def create_document(
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    kb_id: uuid.UUID = Body(..., description="kb id"),
-    file_name: str = Body(..., description="file name"),
-):
-    """
-    create document
-    """
-    body = await request.json()
-    create_data = document_schema.DocumentCreate(**body)
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await document_controller.create_document(create_data=create_data,
-                                                     db=db,
-                                                     current_user=current_user)
-
-
-@router.get("/{document_id}", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def get_document(
-    document_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    Retrieve document information based on document_id
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await document_controller.get_document(document_id=document_id,
-                                                  db=db,
-                                                  current_user=current_user)
-
-
-@router.put("/{document_id}", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def update_document(
-    document_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    file_name: str = Body(None, description="file name (optional)"),
-):
-    """
-    Update document information
-    """
-    body = await request.json()
-    update_data = document_schema.DocumentUpdate(**body)
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await document_controller.update_document(document_id=document_id,
-                                                     update_data=update_data,
-                                                     db=db,
-                                                     current_user=current_user)
-
-
-@router.delete("/{document_id}", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def delete_document(
-    document_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    Delete document
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await document_controller.delete_document(document_id=document_id,
-                                                     db=db,
-                                                     current_user=current_user)
-
-
-@router.post("/{document_id}/chunks", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def parse_documents(
-    document_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    parse document
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await document_controller.parse_documents(document_id=document_id,
-                                                     db=db,
-                                                     current_user=current_user)
-
--- a/api/app/controllers/service/rag_api_file_controller.py
+++ b/api/app/controllers/service/rag_api_file_controller.py
@@ -1,198 +0,0 @@
-"""RAG 服务接口 - 基于 API Key 认证"""
-
-from typing import Any, Optional
-import uuid
-
-from fastapi import APIRouter, Body, Depends, Request, Query, File, UploadFile
-from sqlalchemy.orm import Session
-
-from app.controllers import file_controller
-from app.core.api_key_auth import require_api_key
-from app.core.logging_config import get_business_logger
-from app.db import get_db
-from app.schemas import file_schema
-from app.schemas.api_key_schema import ApiKeyAuth
-from app.schemas.response_schema import ApiResponse
-from app.services import api_key_service
-
-
-router = APIRouter(prefix="/files", tags=["V1 - RAG API"])
-api_logger = get_business_logger()
-
-
-@router.get("/{kb_id}/{parent_id}/files", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def get_files(
-    kb_id: uuid.UUID,
-    parent_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    page: int = Query(1, gt=0),  # Default: 1, which must be greater than 0
-    pagesize: int = Query(20, gt=0, le=100),  # Default: 20 items per page, maximum: 100 items
-    orderby: Optional[str] = Query(None, description="Sort fields, such as: created_at"),
-    desc: Optional[bool] = Query(False, description="Is it descending order"),
-    keywords: Optional[str] = Query(None, description="Search keywords (file name)"),
-):
-    """
-    Paged query file list
-    - Support filtering by kb_id and parent_id
-    - Support keyword search for file names
-    - Support dynamic sorting
-    - Return paging metadata + file list
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id=api_key_auth.workspace_id
-
-    return await file_controller.get_files(kb_id=kb_id,
-                                           parent_id=parent_id,
-                                           page=page,
-                                           pagesize=pagesize,
-                                           orderby=orderby,
-                                           desc=desc,
-                                           keywords=keywords,
-                                           db=db,
-                                           current_user=current_user)
-
-
-@router.post("/folder", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def create_folder(
-    kb_id: uuid.UUID,
-    parent_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    folder_name: str = '/'
-):
-    """
-    Create a new folder
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await file_controller.create_folder(kb_id=kb_id,
-                                               parent_id=parent_id,
-                                               folder_name=folder_name,
-                                               db=db,
-                                               current_user=current_user)
-
-
-@router.post("/file", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def upload_file(
-    kb_id: uuid.UUID,
-    parent_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    file: UploadFile = File(...),
-):
-    """
-    upload file
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await file_controller.upload_file(kb_id=kb_id,
-                                             parent_id=parent_id,
-                                             file=file,
-                                             db=db,
-                                             current_user=current_user)
-
-
-@router.post("/customtext", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def custom_text(
-    kb_id: uuid.UUID,
-    parent_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    title: str = Body(..., description="title"),
-    content: str = Body(..., description="content"),
-):
-    """
-    custom text
-    """
-    body = await request.json()
-    create_data = file_schema.CustomTextFileCreate(**body)
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await file_controller.custom_text(kb_id=kb_id,
-                                             parent_id=parent_id,
-                                             create_data=create_data,
-                                             db=db,
-                                             current_user=current_user)
-
-
-@router.get("/{file_id}", response_model=Any)
-async def get_file(
-    file_id: uuid.UUID,
-    db: Session = Depends(get_db)
-) -> Any:
-    """
-    Download the file based on the file_id
-    - Query file information from the database
-    - Construct the file path and check if it exists
-    - Return a FileResponse to download the file
-    """
-    return await file_controller.get_file(file_id=file_id,
-                                          db=db)
-
-
-@router.put("/{file_id}", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def update_file(
-    file_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    file_name: str = Body(None, description="file name (optional)"),
-):
-    """
-    Update file information (such as file name)
-    - Only specified fields such as file_name are allowed to be modified
-    """
-    body = await request.json()
-    update_data = file_schema.FileUpdate(**body)
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await file_controller.update_file(file_id=file_id,
-                                             update_data=update_data,
-                                             db=db,
-                                             current_user=current_user)
-
-
-@router.delete("/{file_id}", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def delete_file(
-    file_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    Delete a file or folder
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await file_controller.delete_file(file_id=file_id,
-                                             db=db,
-                                             current_user=current_user)
-
--- a/api/app/controllers/service/rag_api_knowledge_controller.py
+++ b/api/app/controllers/service/rag_api_knowledge_controller.py
@@ -1,318 +0,0 @@
-"""RAG 服务接口 - 基于 API Key 认证"""
-
-from typing import Optional, Dict
-import uuid
-
-from fastapi import APIRouter, Body, Depends, Request, Query
-from sqlalchemy.orm import Session
-
-from app.controllers import knowledge_controller
-from app.core.api_key_auth import require_api_key
-from app.core.logging_config import get_business_logger
-from app.core.response_utils import success
-from app.db import get_db
-from app.models import knowledge_model
-from app.schemas import knowledge_schema
-from app.schemas.api_key_schema import ApiKeyAuth
-from app.schemas.response_schema import ApiResponse
-from app.services import api_key_service
-
-
-router = APIRouter(prefix="/knowledges", tags=["V1 - RAG API"])
-api_logger = get_business_logger()
-
-
-@router.get("/knowledgetype", response_model=ApiResponse)
-def get_knowledge_types():
-    return success(msg="Successfully obtained the knowledge type", data=list(knowledge_model.KnowledgeType))
-
-
-@router.get("/permissiontype", response_model=ApiResponse)
-def get_permission_types():
-    return success(msg="Successfully obtained the knowledge permission type", data=list(knowledge_model.PermissionType))
-
-
-@router.get("/parsertype", response_model=ApiResponse)
-def get_parser_types():
-    return success(msg="Successfully obtained the knowledge parser type", data=list(knowledge_model.ParserType))
-
-
-@router.get("/knowledge_graph_entity_types", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def get_knowledge_graph_entity_types(
-    llm_id: uuid.UUID,
-    scenario: str,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    get knowledge graph entity types based on llm_id
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await knowledge_controller.get_knowledge_graph_entity_types(llm_id=llm_id,
-                                                                       scenario=scenario,
-                                                                       db=db,
-                                                                       current_user=current_user)
-
-
-@router.get("/knowledges", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def get_knowledges(
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    parent_id: Optional[uuid.UUID] = Query(None, description="parent folder id"),
-    page: int = Query(1, gt=0),  # Default: 1, which must be greater than 0
-    pagesize: int = Query(20, gt=0, le=100),  # Default: 20 items per page, maximum: 100 items
-    orderby: Optional[str] = Query(None, description="Sort fields, such as: created_at,updated_at"),
-    desc: Optional[bool] = Query(False, description="Is it descending order"),
-    keywords: Optional[str] = Query(None, description="Search keywords (knowledge base name)"),
-    kb_ids: Optional[str] = Query(None, description="Knowledge base ids, separated by commas")
-):
-    """
-    Query the knowledge base list in pages
-    - Support filtering by parent_id
-    -  Support keyword search for knowledge base names
-    - Support dynamic sorting
-    - Return paging metadata + file list
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await knowledge_controller.get_knowledges(parent_id=parent_id,
-                                                     page=page,
-                                                     pagesize=pagesize,
-                                                     orderby=orderby,
-                                                     desc=desc,
-                                                     keywords=keywords,
-                                                     kb_ids=kb_ids,
-                                                     db=db,
-                                                     current_user=current_user)
-
-
-@router.post("/knowledge", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def create_knowledge(
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    name: str = Body(..., description="KB name"),
-):
-    """
-    create knowledge
-    """
-    body = await request.json()
-    create_data = knowledge_schema.KnowledgeCreate(**body)
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await knowledge_controller.create_knowledge(create_data=create_data,
-                                                       db=db,
-                                                       current_user=current_user)
-
-
-@router.get("/{knowledge_id}", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def get_knowledge(
-    knowledge_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    Retrieve knowledge base information based on knowledge_id
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await knowledge_controller.get_knowledge(knowledge_id=knowledge_id,
-                                                    db=db,
-                                                    current_user=current_user)
-
-
-@router.put("/{knowledge_id}", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def update_knowledge(
-    knowledge_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-    name: str = Body(None, description="KB name (optional)"),
-):
-    body = await request.json()
-    update_data = knowledge_schema.KnowledgeUpdate(**body)
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await knowledge_controller.update_knowledge(knowledge_id=knowledge_id,
-                                                       update_data=update_data,
-                                                       db=db,
-                                                       current_user=current_user)
-
-
-@router.delete("/{knowledge_id}", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def delete_knowledge(
-    knowledge_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    Soft-delete knowledge base
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await knowledge_controller.delete_knowledge(knowledge_id=knowledge_id,
-                                                       db=db,
-                                                       current_user=current_user)
-
-
-@router.get("/{knowledge_id}/knowledge_graph", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def get_knowledge_graph(
-    knowledge_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    Retrieve knowledge_graph base information based on knowledge_id
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await knowledge_controller.get_knowledge_graph(knowledge_id=knowledge_id,
-                                                          db=db,
-                                                          current_user=current_user)
-
-
-@router.delete("/{knowledge_id}/knowledge_graph", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def delete_knowledge_graph(
-    knowledge_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    delete knowledge graph
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await knowledge_controller.delete_knowledge_graph(knowledge_id=knowledge_id,
-                                                             db=db,
-                                                             current_user=current_user)
-
-
-@router.post("/{knowledge_id}/knowledge_graph", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def rebuild_knowledge_graph(
-    knowledge_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    rebuild knowledge graph
-    """
-    # 0. Obtain the creator of the api key
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await knowledge_controller.rebuild_knowledge_graph(knowledge_id=knowledge_id,
-                                                              db=db,
-                                                              current_user=current_user)
-
-
-@router.get("/check/yuque/auth", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def check_yuque_auth(
-    yuque_user_id: str,
-    yuque_token: str,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    check yuque auth info
-    """
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    api_logger.info(f"check yuque auth info, username: {current_user.username}")
-
-    return await knowledge_controller.check_yuque_auth(yuque_user_id=yuque_user_id,
-                                                       yuque_token=yuque_token,
-                                                       db=db,
-                                                       current_user=current_user)
-
-
-@router.get("/check/feishu/auth", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def check_feishu_auth(
-    feishu_app_id: str,
-    feishu_app_secret: str,
-    feishu_folder_token: str,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    check feishu auth info
-    """
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    api_logger.info(f"check feishu auth info, username: {current_user.username}")
-
-    return await knowledge_controller.check_feishu_auth(feishu_app_id=feishu_app_id,
-                                                        feishu_app_secret=feishu_app_secret,
-                                                        feishu_folder_token=feishu_folder_token,
-                                                        db=db,
-                                                        current_user=current_user)
-
-
-@router.post("/{knowledge_id}/sync", response_model=ApiResponse)
-@require_api_key(scopes=["rag"])
-async def sync_knowledge(
-    knowledge_id: uuid.UUID,
-    request: Request,
-    api_key_auth: ApiKeyAuth = None,
-    db: Session = Depends(get_db),
-):
-    """
-    sync knowledge base information based on knowledge_id
-    """
-    api_key = api_key_service.ApiKeyService.get_api_key(db, api_key_auth.api_key_id, api_key_auth.workspace_id)
-    current_user = api_key.creator
-    current_user.current_workspace_id = api_key_auth.workspace_id
-
-    return await knowledge_controller.sync_knowledge(knowledge_id=knowledge_id,
-                                                     db=db,
-                                                     current_user=current_user)
-
--- a/api/app/controllers/skill_controller.py
+++ b/api/app/controllers/skill_controller.py
@@ -1,85 +0,0 @@
-"""Skill Controller - 技能市场管理"""
-from fastapi import APIRouter, Depends, Query
-from sqlalchemy.orm import Session
-from typing import Optional
-import uuid
-
-from app.db import get_db
-from app.dependencies import get_current_user
-from app.models import User
-from app.schemas import skill_schema
-from app.schemas.response_schema import PageData, PageMeta
-from app.services.skill_service import SkillService
-from app.core.response_utils import success
-
-router = APIRouter(prefix="/skills", tags=["Skills"])
-
-
-@router.post("", summary="创建技能")
-def create_skill(
-    data: skill_schema.SkillCreate,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """创建技能 - 可以关联现有工具（内置、MCP、自定义）"""
-    tenant_id = current_user.tenant_id
-    skill = SkillService.create_skill(db, data, tenant_id)
-    return success(data=skill_schema.Skill.model_validate(skill), msg="技能创建成功")
-
-
-@router.get("", summary="技能列表")
-def list_skills(
-    search: Optional[str] = Query(None, description="搜索关键词"),
-    is_active: Optional[bool] = Query(None, description="是否激活"),
-    is_public: Optional[bool] = Query(None, description="是否公开"),
-    page: int = Query(1, ge=1, description="页码"),
-    pagesize: int = Query(10, ge=1, le=100, description="每页数量"),
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """技能市场列表 - 包含本工作空间和公开的技能"""
-    tenant_id = current_user.tenant_id
-    skills, total = SkillService.list_skills(
-        db, tenant_id, search, is_active, is_public, page, pagesize
-    )
-    
-    items = [skill_schema.Skill.model_validate(s) for s in skills]
-    meta = PageMeta(page=page, pagesize=pagesize, total=total, hasnext=(page * pagesize) < total)
-    return success(data=PageData(page=meta, items=items), msg="技能市场列表获取成功")
-
-
-@router.get("/{skill_id}", summary="获取技能详情")
-def get_skill(
-    skill_id: uuid.UUID,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """获取技能详情"""
-    tenant_id = current_user.tenant_id
-    skill = SkillService.get_skill(db, skill_id, tenant_id)
-    return success(data=skill_schema.Skill.model_validate(skill), msg="获取技能详情成功")
-
-
-@router.put("/{skill_id}", summary="更新技能")
-def update_skill(
-    skill_id: uuid.UUID,
-    data: skill_schema.SkillUpdate,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """更新技能"""
-    tenant_id = current_user.tenant_id
-    skill = SkillService.update_skill(db, skill_id, data, tenant_id)
-    return success(data=skill_schema.Skill.model_validate(skill), msg="技能更新成功")
-
-
-@router.delete("/{skill_id}", summary="删除技能")
-def delete_skill(
-    skill_id: uuid.UUID,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user)
-):
-    """删除技能"""
-    tenant_id = current_user.tenant_id
-    SkillService.delete_skill(db, skill_id, tenant_id)
-    return success(msg="技能删除成功")
--- a/api/app/controllers/test_controller.py
+++ b/api/app/controllers/test_controller.py
@@ -1,22 +1,23 @@
-from fastapi import APIRouter, Depends, status, HTTPException, Body, Path
-from fastapi.responses import StreamingResponse
+from fastapi import APIRouter, Depends, status, Query, HTTPException
+from langchain_core.messages import HumanMessage, SystemMessage
 from langchain_core.prompts import ChatPromptTemplate
 from sqlalchemy.orm import Session
+from typing import List, Optional
 import uuid

+
 from app.core.models import RedBearLLM, RedBearRerank
 from app.core.models.base import RedBearModelConfig
 from app.core.models.embedding import RedBearEmbeddings
 from app.db import get_db
-from app.models.models_model import ModelApiKey
-from app.core.response_utils import success
-from app.schemas.response_schema import ApiResponse
-from app.schemas.app_schema import AppChatRequest
-from app.services.model_service import ModelConfigService
-from app.services.handoffs_service import get_handoffs_service_for_app, reset_handoffs_service_cache
-from app.services.conversation_service import ConversationService
-from app.core.logging_config import get_api_logger
 from app.dependencies import get_current_user
+from app.models.models_model import ModelApiKey, ModelProvider, ModelType
+from app.models.user_model import User
+from app.schemas import model_schema
+from app.core.response_utils import success
+from app.schemas.response_schema import ApiResponse, PageData
+from app.services.model_service import ModelConfigService, ModelApiKeyService
+from app.core.logging_config import get_api_logger

 # 获取API专用日志器
 api_logger = get_api_logger()
@@ -27,8 +28,6 @@ router = APIRouter(
 )


-# ==================== 原有测试接口 ====================
-
@router.get("/llm/{model_id}", response_model=ApiResponse)
 def test_llm(
    model_id: uuid.UUID,
@@ -51,6 +50,7 @@ def test_llm(
        template = """Question: {question}

 Answer: Let's think step by step."""
+        # ChatPromptTemplate
        prompt = ChatPromptTemplate.from_template(template)
        chain = prompt | llm
        answer = chain.invoke({"question": "What is LangChain?"})
@@ -80,13 +80,13 @@ def test_embedding(
            base_url=apiConfig.api_base
        ))

-    data = [
-        "最近哪家咖啡店评价最好？",
-        "附近有没有推荐的咖啡厅？",
-        "明天天气预报说会下雨。",
-        "北京是中国的首都。",
-        "我想找一个适合学习的地方。"
-    ]
+    data =  [
+            "最近哪家咖啡店评价最好？",
+            "附近有没有推荐的咖啡厅？",
+            "明天天气预报说会下雨。",
+            "北京是中国的首都。",
+            "我想找一个适合学习的地方。"
+        ]
    embeddings = model.embed_documents(data)
    print(embeddings)
    query = "我想找一个适合学习的地方。"
@@ -114,123 +114,13 @@ def test_rerank(
            base_url=apiConfig.api_base
        ))
    query = "最近哪家咖啡店评价最好？"
-    data = [
-        "最近哪家咖啡店评价最好？",
-        "附近有没有推荐的咖啡厅？",
-        "明天天气预报说会下雨。",
-        "北京是中国的首都。",
-        "我想找一个适合学习的地方。"
-    ]
+    data =  [
+            "最近哪家咖啡店评价最好？",
+            "附近有没有推荐的咖啡厅？",
+            "明天天气预报说会下雨。",
+            "北京是中国的首都。",
+            "我想找一个适合学习的地方。"
+        ]
    scores = model.rerank(query=query, documents=data, top_n=3)
    print(scores)
    return success(msg="测试Rerank成功", data={"query": query, "documents": data, "scores": scores})
-
-
-# ==================== Handoffs 测试接口 ====================
-
-@router.post("/handoffs/{app_id}")
-async def test_handoffs(
-    app_id: uuid.UUID = Path(..., description="应用 ID"),
-    request: AppChatRequest = Body(...),
-    current_user=Depends(get_current_user),
-    db: Session = Depends(get_db)
-):
-    """测试 Agent Handoffs 功能
-    
-    演示 LangGraph 实现的多 Agent 协作和动态切换
-    
-    - 从数据库 multi_agent_config 获取 Agent 配置
-    - 根据用户问题自动切换到合适的 Agent
-    - 使用 conversation_id 保持会话状态
-    - 通过 stream 参数控制是否流式输出
-    
-    事件类型（流式）：
-    - start: 开始执行
-    - agent: 当前 Agent 信息
-    - message: 流式消息内容
-    - handoff: Agent 切换事件
-    - end: 执行结束
-    - error: 错误信息
-    """
-    try:
-        workspace_id = current_user.current_workspace_id
-        
-        # 获取或创建会话
-        conversation_service = ConversationService(db)
-        
-        if request.conversation_id:
-            # 验证会话存在
-            conversation = conversation_service.get_conversation(uuid.UUID(request.conversation_id))
-            if not conversation:
-                raise HTTPException(status_code=404, detail="会话不存在")
-            conversation_id = str(conversation.id)
-        else:
-            # 创建新会话
-            conversation = conversation_service.create_or_get_conversation(
-                app_id=app_id,
-                workspace_id=workspace_id,
-                user_id=request.user_id,
-                is_draft=True
-            )
-            conversation_id = str(conversation.id)
-        
-        # 根据 stream 参数决定返回方式
-        if request.stream:
-            # 流式返回
-            service = get_handoffs_service_for_app(app_id, db, streaming=True)
-            return StreamingResponse(
-                service.chat_stream(
-                    message=request.message,
-                    conversation_id=conversation_id
-                ),
-                media_type="text/event-stream",
-                headers={
-                    "Cache-Control": "no-cache",
-                    "Connection": "keep-alive",
-                    "X-Accel-Buffering": "no"
-                }
-            )
-        else:
-            # 非流式返回
-            service = get_handoffs_service_for_app(app_id, db, streaming=False)
-            result = await service.chat(
-                message=request.message,
-                conversation_id=conversation_id
-            )
-            return success(data=result, msg="Handoffs 测试成功")
-        
-    except ValueError as e:
-        raise HTTPException(status_code=400, detail=str(e))
-    except HTTPException:
-        raise
-    except Exception as e:
-        api_logger.error(f"Handoffs 测试失败: {str(e)}")
-        raise HTTPException(status_code=500, detail=str(e))
-
-
-@router.get("/handoffs/{app_id}/agents", response_model=ApiResponse)
-def get_handoff_agents(
-    app_id: uuid.UUID = Path(..., description="应用 ID"),
-    db: Session = Depends(get_db),
-    current_user=Depends(get_current_user)
-):
-    """获取应用的 Handoff Agent 列表"""
-    try:
-        service = get_handoffs_service_for_app(app_id, db, streaming=False)
-        agents = service.get_agents()
-        return success(data={"agents": agents}, msg="获取 Agent 列表成功")
-    except ValueError as e:
-        raise HTTPException(status_code=400, detail=str(e))
-    except Exception as e:
-        api_logger.error(f"获取 Agent 列表失败: {str(e)}")
-        raise HTTPException(status_code=500, detail=str(e))
-
-
-@router.delete("/handoffs/{app_id}/reset")
-def reset_handoff_service(
-    app_id: uuid.UUID = Path(..., description="应用 ID"),
-    current_user=Depends(get_current_user)
-):
-    """重置指定应用的 Handoff 服务缓存"""
-    reset_handoffs_service_cache(app_id)
-    return success(msg="Handoff 服务已重置")
--- a/api/app/controllers/tool_controller.py
+++ b/api/app/controllers/tool_controller.py
@@ -3,11 +3,8 @@ from typing import Optional

 from fastapi import APIRouter, Depends, HTTPException, Query
 from sqlalchemy.orm import Session
-
-from app.core.error_codes import BizCode
 from app.schemas.tool_schema import (
-    ToolCreateRequest, ToolUpdateRequest, ToolExecuteRequest, ParseSchemaRequest,
-    CustomToolTestRequest, ToolActiveUpdate
+    ToolCreateRequest, ToolUpdateRequest, ToolExecuteRequest, ParseSchemaRequest, CustomToolTestRequest
 )

 from app.core.response_utils import success
@@ -17,7 +14,6 @@ from app.models import User
 from app.models.tool_model import ToolType, ToolStatus, AuthType
 from app.services.tool_service import ToolService
 from app.schemas.response_schema import ApiResponse
-from app.core.exceptions import BusinessException

 router = APIRouter(prefix="/tools", tags=["Tool System"])

@@ -64,24 +60,6 @@ async def list_tools(
        raise HTTPException(status_code=500, detail=str(e))


-@router.get("/{tool_id}/methods", response_model=ApiResponse)
-async def get_tool_methods(
-        tool_id: str,
-        current_user: User = Depends(get_current_user),
-        service: ToolService = Depends(get_tool_service)
-):
-    """获取工具的所有方法"""
-    try:
-        methods = await service.get_tool_methods(tool_id, current_user.tenant_id)
-        if methods is None:
-            raise HTTPException(status_code=404, detail="工具不存在")
-        return success(data=methods, msg="获取工具方法成功")
-    except HTTPException:
-        raise
-    except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
-
-
@router.get("/{tool_id}", response_model=ApiResponse)
 async def get_tool(
        tool_id: str,
@@ -103,13 +81,7 @@ async def create_tool(
 ):
    """创建工具"""
    try:
-        # 将 MCP 来源字段合并进 config
-        if request.tool_type == ToolType.MCP:
-            for key in ("source_channel", "market_id", "market_config_id", "mcp_service_id"):
-                val = getattr(request, key, None)
-                if val is not None:
-                    request.config[key] = val
-        tool_id = await service.create_tool(
+        tool_id = service.create_tool(
            name=request.name,
            tool_type=request.tool_type,
            tenant_id=current_user.tenant_id,
@@ -119,12 +91,8 @@ async def create_tool(
            tags=request.tags
        )
        return success(data={"tool_id": tool_id}, msg="工具创建成功")
-    except BusinessException as e:
-        raise HTTPException(status_code=400, detail=e.message)
    except ValueError as e:
        raise HTTPException(status_code=400, detail=str(e))
-    except HTTPException:
-        raise
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

@@ -153,8 +121,6 @@ async def update_tool(
        return success(msg="工具更新成功")
    except ValueError as e:
        raise HTTPException(status_code=400, detail=str(e))
-    except HTTPException:
-        raise
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

@@ -165,7 +131,7 @@ async def delete_tool(
        current_user: User = Depends(get_current_user),
        service: ToolService = Depends(get_tool_service)
 ):
-    """删除工具（逻辑删除，is_active=False）"""
+    """删除工具"""
    try:
        success_flag = service.delete_tool(tool_id, current_user.tenant_id)
        if not success_flag:
@@ -177,32 +143,6 @@ async def delete_tool(
        raise HTTPException(status_code=500, detail=str(e))


-@router.patch("/{tool_id}/active", response_model=ApiResponse)
-async def set_tool_active(
-        tool_id: str,
-        request: ToolActiveUpdate,
-        current_user: User = Depends(get_current_user),
-        service: ToolService = Depends(get_tool_service)
-):
-    """设置工具可用状态（启用/禁用）
-
-    - is_active=true: 启用工具
-    - is_active=false: 禁用工具（等同于删除，但可恢复）
-    """
-    try:
-        success_flag = service.set_tool_active(tool_id, current_user.tenant_id, request.is_active)
-        if not success_flag:
-            raise HTTPException(status_code=404, detail="工具不存在")
-        action = "启用" if request.is_active else "禁用"
-        return success(msg=f"工具已{action}")
-    except ValueError as e:
-        raise HTTPException(status_code=400, detail=str(e))
-    except HTTPException:
-        raise
-    except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
-
-
@router.post("/execution/execute", response_model=ApiResponse)
 async def execute_tool(
        request: ToolExecuteRequest,
@@ -219,8 +159,7 @@ async def execute_tool(
            workspace_id=current_user.current_workspace_id,
            timeout=request.timeout
        )
-        if not result.success:
-            raise HTTPException(status_code=400, detail=result["error"])
+
        return success(
            data={
                "success": result.success,
@@ -231,8 +170,6 @@ async def execute_tool(
            },
            msg="工具执行完成"
        )
-    except HTTPException:
-        raise
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

@@ -261,11 +198,9 @@ async def sync_mcp_tools(
    """同步MCP工具列表"""
    try:
        result = await service.sync_mcp_tools(tool_id, current_user.tenant_id)
-        if not result.get("success", False):
-            raise BusinessException(result.get("message", "工具列表同步失败"), BizCode.BAD_REQUEST)
+        if result["success"] is False:
+            raise HTTPException(status_code=404, detail=result["message"])
        return success(data=result, msg="MCP工具列表同步完成")
-    except BusinessException:
-        raise
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

@@ -288,10 +223,8 @@ async def test_tool_connection(
            # 普通连接测试
            result = await service.test_connection(tool_id, current_user.tenant_id)
        if result["success"] is False:
-            raise BusinessException(result["message"], BizCode.SERVICE_UNAVAILABLE)
+            raise HTTPException(status_code=400, detail=result["message"])
        return success(data=result, msg="连接测试完成")
-    except BusinessException:
-        raise
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

--- a/api/app/controllers/user_controller.py
+++ b/api/app/controllers/user_controller.py
@@ -1,26 +1,16 @@
 from fastapi import APIRouter, Depends
 from sqlalchemy.orm import Session
 import uuid
-from typing import Callable

-from app.core.error_codes import BizCode
-from app.core.exceptions import BusinessException
 from app.db import get_db
 from app.dependencies import get_current_user, get_current_superuser
 from app.models.user_model import User
 from app.schemas import user_schema
-from app.schemas.user_schema import (
-    ChangePasswordRequest,
-    AdminChangePasswordRequest,
-    SendEmailCodeRequest,
-    VerifyEmailCodeRequest,
-    VerifyPasswordRequest)
+from app.schemas.user_schema import ChangePasswordRequest, AdminChangePasswordRequest
 from app.schemas.response_schema import ApiResponse
 from app.services import user_service
 from app.core.logging_config import get_api_logger
 from app.core.response_utils import success
-from app.core.security import verify_password
-from app.i18n.dependencies import get_translator

 # 获取API专用日志器
 api_logger = get_api_logger()
@@ -35,8 +25,7 @@ router = APIRouter(
 def create_superuser(
    user: user_schema.UserCreate,
    db: Session = Depends(get_db),
-    current_superuser: User = Depends(get_current_superuser),
-    t: Callable = Depends(get_translator)
+    current_superuser: User = Depends(get_current_superuser)
 ):
    """创建超级管理员（仅超级管理员可访问）"""
    api_logger.info(f"超级管理员创建请求: {user.username}, email: {user.email}")
@@ -45,7 +34,7 @@ def create_superuser(
    api_logger.info(f"超级管理员创建成功: {result.username} (ID: {result.id})")
    
    result_schema = user_schema.User.model_validate(result)
-    return success(data=result_schema, msg=t("users.create.superuser_success"))
+    return success(data=result_schema, msg="超级管理员创建成功")


@router.delete("/{user_id}", response_model=ApiResponse)
@@ -53,7 +42,6 @@ def delete_user(
    user_id: uuid.UUID,
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
-    t: Callable = Depends(get_translator)
 ):
    """停用用户（软删除）"""
    api_logger.info(f"用户停用请求: user_id={user_id}, 操作者: {current_user.username}")
@@ -61,14 +49,13 @@ def delete_user(
        db=db, user_id_to_deactivate=user_id, current_user=current_user
    )
    api_logger.info(f"用户停用成功: {result.username} (ID: {result.id})")
-    return success(msg=t("users.delete.deactivate_success"))
+    return success(msg="用户停用成功")

@router.post("/{user_id}/activate", response_model=ApiResponse)
 def activate_user(
    user_id: uuid.UUID,
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
-    t: Callable = Depends(get_translator)
 ):
    """激活用户"""
    api_logger.info(f"用户激活请求: user_id={user_id}, 操作者: {current_user.username}")
@@ -79,14 +66,13 @@ def activate_user(
    api_logger.info(f"用户激活成功: {result.username} (ID: {result.id})")
    
    result_schema = user_schema.User.model_validate(result)
-    return success(data=result_schema, msg=t("users.activate.success"))
+    return success(data=result_schema, msg="用户激活成功")


@router.get("", response_model=ApiResponse)
 def get_current_user_info(
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
-    t: Callable = Depends(get_translator)
 ):
    """获取当前用户信息"""
    api_logger.info(f"当前用户信息请求: {current_user.username}")
@@ -106,24 +92,12 @@ def get_current_user_info(
            result_schema.current_workspace_name = current_workspace.name
        
        for ws in result.workspaces:
-            if ws.workspace_id == current_user.current_workspace_id and ws.is_active:
+            if ws.workspace_id == current_user.current_workspace_id:
                result_schema.role = ws.role
                break
    
    api_logger.info(f"当前用户信息获取成功: {result.username}, 角色: {result_schema.role}, 工作空间: {result_schema.current_workspace_name}")
-
-    # 设置权限：如果用户来自 SSO Source，则使用该 Source 的 permissions；否则返回 "all" 表示拥有所有权限
-    if current_user.external_source:
-        from premium.sso.models import SSOSource
-        source = db.query(SSOSource).filter(SSOSource.source_code == current_user.external_source).first()
-        if source and source.permissions:
-            result_schema.permissions = source.permissions
-        else:
-            result_schema.permissions = []
-    else:
-        result_schema.permissions = ["all"]
-
-    return success(data=result_schema, msg=t("users.info.get_success"))
+    return success(data=result_schema, msg="用户信息获取成功")


@router.get("/superusers", response_model=ApiResponse)
@@ -131,7 +105,6 @@ def get_tenant_superusers(
    include_inactive: bool = False,
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_superuser),
-    t: Callable = Depends(get_translator)
 ):
    """获取当前租户下的超管账号列表（仅超级管理员可访问）"""
    api_logger.info(f"获取租户超管列表请求: {current_user.username}")
@@ -144,7 +117,7 @@ def get_tenant_superusers(
    api_logger.info(f"租户超管列表获取成功: count={len(superusers)}")
    
    superusers_schema = [user_schema.User.model_validate(u) for u in superusers]
-    return success(data=superusers_schema, msg=t("users.list.superusers_success"))
+    return success(data=superusers_schema, msg="租户超管列表获取成功")


@router.get("/{user_id}", response_model=ApiResponse)
@@ -152,7 +125,6 @@ def get_user_info_by_id(
    user_id: uuid.UUID,
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
-    t: Callable = Depends(get_translator)
 ):
    """根据用户ID获取用户信息"""
    api_logger.info(f"获取用户信息请求: user_id={user_id}, 操作者: {current_user.username}")
@@ -163,7 +135,7 @@ def get_user_info_by_id(
    api_logger.info(f"用户信息获取成功: {result.username}")
    
    result_schema = user_schema.User.model_validate(result)
-    return success(data=result_schema, msg=t("users.info.get_success"))
+    return success(data=result_schema, msg="用户信息获取成功")


@router.put("/change-password", response_model=ApiResponse)
@@ -171,7 +143,6 @@ async def change_password(
    request: ChangePasswordRequest,
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
-    t: Callable = Depends(get_translator)
 ):
    """修改当前用户密码"""
    api_logger.info(f"用户密码修改请求: {current_user.username}")
@@ -184,7 +155,7 @@ async def change_password(
        current_user=current_user
    )
    api_logger.info(f"用户密码修改成功: {current_user.username}")
-    return success(msg=t("auth.password.change_success"))
+    return success(msg="密码修改成功")


@router.put("/admin/change-password", response_model=ApiResponse)
@@ -192,7 +163,6 @@ async def admin_change_password(
    request: AdminChangePasswordRequest,
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_superuser),
-    t: Callable = Depends(get_translator)
 ):
    """超级管理员修改指定用户的密码"""
    api_logger.info(f"管理员密码修改请求: 管理员 {current_user.username} 修改用户 {request.user_id}")
@@ -207,107 +177,7 @@ async def admin_change_password(
    # 根据是否生成了随机密码来构造响应
    if request.new_password:
        api_logger.info(f"管理员密码修改成功: 用户 {request.user_id}")
-        return success(msg=t("auth.password.change_success"))
+        return success(msg="密码修改成功")
    else:
        api_logger.info(f"管理员密码重置成功: 用户 {request.user_id}, 随机密码已生成")
-        return success(data=generated_password, msg=t("auth.password.reset_success"))
-
-
-@router.post("/verify_pwd", response_model=ApiResponse)
-def verify_pwd(
-    request: VerifyPasswordRequest,
-    current_user: User = Depends(get_current_user),
-    t: Callable = Depends(get_translator)
-):
-    """验证当前用户密码"""
-    api_logger.info(f"用户验证密码请求: {current_user.username}")
-    
-    is_valid = verify_password(request.password, current_user.hashed_password)
-    api_logger.info(f"用户密码验证结果: {current_user.username}, valid={is_valid}")
-    if not is_valid:
-        raise BusinessException(t("users.errors.password_verification_failed"), code=BizCode.VALIDATION_FAILED)
-    return success(data={"valid": is_valid}, msg=t("common.success.retrieved"))
-
-
-@router.post("/send-email-code", response_model=ApiResponse)
-async def send_email_code(
-    request: SendEmailCodeRequest,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user),
-    t: Callable = Depends(get_translator)
-):
-    """发送邮箱验证码"""
-    api_logger.info(f"用户请求发送邮箱验证码: {current_user.username}, email={request.email}")
-    
-    await user_service.send_email_code_method(db=db, email=request.email, user_id=current_user.id)
-    
-    api_logger.info(f"邮箱验证码已发送: {current_user.username}")
-    return success(msg=t("users.email.code_sent"))
-
-
-@router.put("/change-email", response_model=ApiResponse)
-async def change_email(
-    request: VerifyEmailCodeRequest,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user),
-    t: Callable = Depends(get_translator)
-):
-    """验证验证码并修改邮箱"""
-    api_logger.info(f"用户修改邮箱: {current_user.username}, new_email={request.new_email}")
-
-    await user_service.verify_and_change_email(
-        db=db,
-        user_id=current_user.id,
-        new_email=request.new_email,
-        code=request.code
-    )
-    
-    api_logger.info(f"用户邮箱修改成功: {current_user.username}")
-    return success(msg=t("users.email.change_success"))
-
-
-
-@router.get("/me/language", response_model=ApiResponse)
-def get_current_user_language(
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user),
-    t: Callable = Depends(get_translator)
-):
-    """获取当前用户的语言偏好"""
-    api_logger.info(f"获取用户语言偏好: {current_user.username}")
-    
-    language = user_service.get_user_language_preference(
-        db=db,
-        user_id=current_user.id,
-        current_user=current_user
-    )
-    
-    api_logger.info(f"用户语言偏好获取成功: {current_user.username}, language={language}")
-    return success(
-        data=user_schema.LanguagePreferenceResponse(language=language),
-        msg=t("users.language.get_success")
-    )
-
-
-@router.put("/me/language", response_model=ApiResponse)
-def update_current_user_language(
-    request: user_schema.LanguagePreferenceRequest,
-    db: Session = Depends(get_db),
-    current_user: User = Depends(get_current_user),
-    t: Callable = Depends(get_translator)
-):
-    """设置当前用户的语言偏好"""
-    api_logger.info(f"更新用户语言偏好: {current_user.username}, language={request.language}")
-    
-    updated_user = user_service.update_user_language_preference(
-        db=db,
-        user_id=current_user.id,
-        language=request.language,
-        current_user=current_user
-    )
-    
-    api_logger.info(f"用户语言偏好更新成功: {current_user.username}, language={request.language}")
-    return success(
-        data=user_schema.LanguagePreferenceResponse(language=updated_user.preferred_language),
-        msg=t("users.language.update_success")
-    )
+        return success(data=generated_password, msg="密码重置成功")
--- a/api/app/controllers/user_memory_controllers.py
+++ b/api/app/controllers/user_memory_controllers.py
@@ -5,29 +5,23 @@
 from typing import Optional
 import datetime
 from sqlalchemy.orm import Session
-from fastapi import APIRouter, Depends, Header
+from fastapi import APIRouter, Depends

 from app.db import get_db
-from app.core.language_utils import get_language_from_header
 from app.core.logging_config import get_api_logger
 from app.core.response_utils import success, fail
 from app.core.error_codes import BizCode
-from app.core.api_key_utils import timestamp_to_datetime
 from app.services.user_memory_service import (
    UserMemoryService,
+    analytics_node_statistics,
    analytics_memory_types,
    analytics_graph_data,
-    analytics_community_graph_data,
 )
-from app.services.memory_entity_relationship_service import MemoryEntityService, MemoryEmotion, MemoryInteraction
 from app.schemas.response_schema import ApiResponse
 from app.schemas.memory_storage_schema import GenerateCacheRequest
-from app.repositories.workspace_repository import WorkspaceRepository
-from app.repositories.end_user_repository import EndUserRepository
-from app.schemas.end_user_info_schema import (
-    EndUserInfoResponse,
-    EndUserInfoCreate,
-    EndUserInfoUpdate,
+from app.schemas.end_user_schema import (
+    EndUserProfileResponse,
+    EndUserProfileUpdate,
 )
 from app.models.end_user_model import EndUser
 from app.dependencies import get_current_user
@@ -47,27 +41,24 @@ router = APIRouter(

@router.get("/analytics/memory_insight/report", response_model=ApiResponse)
 async def get_memory_insight_report_api(
-        end_user_id: str,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
-) -> dict:
-    """
-    获取缓存的记忆洞察报告
-
-    此接口仅查询数据库中已缓存的记忆洞察数据，不执行生成操作。
-    如需生成新的洞察报告，请使用专门的生成接口。
-    """
-    api_logger.info(f"记忆洞察报告查询请求: end_user_id={end_user_id}, user={current_user.username}")
+    end_user_id: str,  # 使用 end_user_id
+    current_user: User = Depends(get_current_user),
+    db: Session = Depends(get_db),
+    ) -> dict:
+    """获取缓存的记忆洞察报告"""
+    api_logger.info(f"记忆洞察报告请求: end_user_id={end_user_id}, user={current_user.username}")
    try:
        # 调用服务层获取缓存数据
        result = await user_memory_service.get_cached_memory_insight(db, end_user_id)
-
+        
        if result["is_cached"]:
+            # 缓存存在，返回缓存数据
            api_logger.info(f"成功返回缓存的记忆洞察报告: end_user_id={end_user_id}")
            return success(data=result, msg="查询成功")
        else:
+            # 缓存不存在，返回提示消息
            api_logger.info(f"记忆洞察报告缓存不存在: end_user_id={end_user_id}")
-            return success(data=result, msg="数据尚未生成")
+            return success(data=result, msg="查询成功")
    except Exception as e:
        api_logger.error(f"记忆洞察报告查询失败: end_user_id={end_user_id}, error={str(e)}")
        return fail(BizCode.INTERNAL_ERROR, "记忆洞察报告查询失败", str(e))
@@ -75,43 +66,24 @@ async def get_memory_insight_report_api(

@router.get("/analytics/user_summary", response_model=ApiResponse)
 async def get_user_summary_api(
-        end_user_id: str,
-        language_type: str = Header(default=None, alias="X-Language-Type"),
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
-) -> dict:
-    """
-    获取缓存的用户摘要
-
-    此接口仅查询数据库中已缓存的用户摘要数据，不执行生成操作。
-    如需生成新的用户摘要，请使用专门的生成接口。
-    
-    语言控制：
-    - 使用 X-Language-Type Header 指定语言
-    - 如果未传 Header，默认使用中文 (zh)
-    """
-    # 使用集中化的语言校验
-    language = get_language_from_header(language_type)
-
-    workspace_id = current_user.current_workspace_id
-    workspace_repo = WorkspaceRepository(db)
-    workspace_models = workspace_repo.get_workspace_models_configs(workspace_id)
-
-    if workspace_models:
-        model_id = workspace_models.get("llm", None)
-    else:
-        model_id = None
-    api_logger.info(f"用户摘要查询请求: end_user_id={end_user_id}, user={current_user.username}")
+    end_user_id: str,  # 使用 end_user_id
+    current_user: User = Depends(get_current_user),
+    db: Session = Depends(get_db),
+    ) -> dict:
+    """获取缓存的用户摘要"""
+    api_logger.info(f"用户摘要请求: end_user_id={end_user_id}, user={current_user.username}")
    try:
        # 调用服务层获取缓存数据
-        result = await user_memory_service.get_cached_user_summary(db, end_user_id, model_id, language)
-
+        result = await user_memory_service.get_cached_user_summary(db, end_user_id)
+        
        if result["is_cached"]:
+            # 缓存存在，返回缓存数据
            api_logger.info(f"成功返回缓存的用户摘要: end_user_id={end_user_id}")
            return success(data=result, msg="查询成功")
        else:
+            # 缓存不存在，返回提示消息
            api_logger.info(f"用户摘要缓存不存在: end_user_id={end_user_id}")
-            return success(data=result, msg="数据尚未生成")
+            return success(data=result, msg="查询成功")
    except Exception as e:
        api_logger.error(f"用户摘要查询失败: end_user_id={end_user_id}, error={str(e)}")
        return fail(BizCode.INTERNAL_ERROR, "用户摘要查询失败", str(e))
@@ -119,59 +91,49 @@ async def get_user_summary_api(

@router.post("/analytics/generate_cache", response_model=ApiResponse)
 async def generate_cache_api(
-        request: GenerateCacheRequest,
-        language_type: str = Header(default=None, alias="X-Language-Type"),
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
+    request: GenerateCacheRequest,
+    current_user: User = Depends(get_current_user),
+    db: Session = Depends(get_db),
 ) -> dict:
    """
    手动触发缓存生成
-
+    
    - 如果提供 end_user_id，只为该用户生成
    - 如果不提供，为当前工作空间的所有用户生成
-    
-    语言控制：
-    - 使用 X-Language-Type Header 指定语言 ("zh" 中文, "en" 英文)
-    - 如果未传 Header，默认使用中文 (zh)
    """
-    # 使用集中化的语言校验
-    language = get_language_from_header(language_type)
-
    workspace_id = current_user.current_workspace_id
-
+    
    # 检查用户是否已选择工作空间
    if workspace_id is None:
        api_logger.warning(f"用户 {current_user.username} 尝试生成缓存但未选择工作空间")
        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-
-    end_user_id = request.end_user_id
-
+    
+    group_id = request.end_user_id
+    
    api_logger.info(
        f"缓存生成请求: user={current_user.username}, workspace={workspace_id}, "
-        f"end_user_id={end_user_id if end_user_id else '全部用户'}, language={language}"
+        f"end_user_id={group_id if group_id else '全部用户'}"
    )
-
+    
    try:
-        if end_user_id:
+        if group_id:
            # 为单个用户生成
-            api_logger.info(f"开始为单个用户生成缓存: end_user_id={end_user_id}")
-
+            api_logger.info(f"开始为单个用户生成缓存: end_user_id={group_id}")
+            
            # 生成记忆洞察
-            insight_result = await user_memory_service.generate_and_cache_insight(db, end_user_id, workspace_id,
-                                                                                  language=language)
-
+            insight_result = await user_memory_service.generate_and_cache_insight(db, group_id, workspace_id)
+            
            # 生成用户摘要
-            summary_result = await user_memory_service.generate_and_cache_summary(db, end_user_id, workspace_id,
-                                                                                  language=language)
-
+            summary_result = await user_memory_service.generate_and_cache_summary(db, group_id, workspace_id)
+            
            # 构建响应
            result = {
-                "end_user_id": end_user_id,
+                "end_user_id": group_id,
                "insight_success": insight_result["success"],
                "summary_success": summary_result["success"],
                "errors": []
            }
-
+            
            # 收集错误信息
            if not insight_result["success"]:
                result["errors"].append({
@@ -183,29 +145,29 @@ async def generate_cache_api(
                    "type": "summary",
                    "error": summary_result.get("error")
                })
-
+            
            # 记录结果
            if result["insight_success"] and result["summary_success"]:
-                api_logger.info(f"成功为用户 {end_user_id} 生成缓存")
+                api_logger.info(f"成功为用户 {group_id} 生成缓存")
            else:
-                api_logger.warning(f"用户 {end_user_id} 的缓存生成部分失败: {result['errors']}")
-
+                api_logger.warning(f"用户 {group_id} 的缓存生成部分失败: {result['errors']}")
+            
            return success(data=result, msg="生成完成")
-
+            
        else:
            # 为整个工作空间生成
            api_logger.info(f"开始为工作空间 {workspace_id} 批量生成缓存")
-
-            result = await user_memory_service.generate_cache_for_workspace(db, workspace_id, language=language)
-
+            
+            result = await user_memory_service.generate_cache_for_workspace(db, workspace_id)
+            
            # 记录统计信息
            api_logger.info(
                f"工作空间 {workspace_id} 批量生成完成: "
                f"总数={result['total_users']}, 成功={result['successful']}, 失败={result['failed']}"
            )
-
+            
            return success(data=result, msg="批量生成完成")
-
+            
    except Exception as e:
        api_logger.error(f"缓存生成失败: user={current_user.username}, error={str(e)}")
        return fail(BizCode.INTERNAL_ERROR, "缓存生成失败", str(e))
@@ -213,70 +175,67 @@ async def generate_cache_api(

@router.get("/analytics/node_statistics", response_model=ApiResponse)
 async def get_node_statistics_api(
-        end_user_id: str,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
+    end_user_id: str,
+    current_user: User = Depends(get_current_user),
+    db: Session = Depends(get_db),
 ) -> dict:
    workspace_id = current_user.current_workspace_id
-
+    
    # 检查用户是否已选择工作空间
    if workspace_id is None:
        api_logger.warning(f"用户 {current_user.username} 尝试查询节点统计但未选择工作空间")
        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-
-    api_logger.info(
-        f"记忆类型统计请求: end_user_id={end_user_id}, user={current_user.username}, workspace={workspace_id}")
-
+    
+    api_logger.info(f"记忆类型统计请求: end_user_id={end_user_id}, user={current_user.username}, workspace={workspace_id}")
+    
    try:
        # 调用新的记忆类型统计函数
        result = await analytics_memory_types(db, end_user_id)
-
+        
        # 计算总数用于日志
        total_count = sum(item["count"] for item in result)
-        api_logger.info(
-            f"成功获取记忆类型统计: end_user_id={end_user_id}, 总记忆数={total_count}, 类型数={len(result)}")
+        api_logger.info(f"成功获取记忆类型统计: end_user_id={end_user_id}, 总记忆数={total_count}, 类型数={len(result)}")
        return success(data=result, msg="查询成功")
    except Exception as e:
        api_logger.error(f"记忆类型查询失败: end_user_id={end_user_id}, error={str(e)}")
        return fail(BizCode.INTERNAL_ERROR, "记忆类型查询失败", str(e))

-
@router.get("/analytics/graph_data", response_model=ApiResponse)
 async def get_graph_data_api(
-        end_user_id: str,
-        node_types: Optional[str] = None,
-        limit: int = 100,
-        depth: int = 1,
-        center_node_id: Optional[str] = None,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
+    end_user_id: str,
+    node_types: Optional[str] = None,
+    limit: int = 100,
+    depth: int = 1,
+    center_node_id: Optional[str] = None,
+    current_user: User = Depends(get_current_user),
+    db: Session = Depends(get_db),
 ) -> dict:
    workspace_id = current_user.current_workspace_id
-
+    
    # 检查用户是否已选择工作空间
    if workspace_id is None:
        api_logger.warning(f"用户 {current_user.username} 尝试查询图数据但未选择工作空间")
        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-
+    
    # 参数验证
    if limit > 1000:
        limit = 1000
        api_logger.warning("limit 参数超过最大值，已调整为 1000")
-
+    
    if depth > 3:
        depth = 3
        api_logger.warning("depth 参数超过最大值，已调整为 3")
-
+    
    # 解析 node_types 参数
    node_types_list = None
    if node_types:
        node_types_list = [t.strip() for t in node_types.split(",") if t.strip()]
-
+    
    api_logger.info(
        f"图数据查询请求: end_user_id={end_user_id}, user={current_user.username}, "
        f"workspace={workspace_id}, node_types={node_types_list}, limit={limit}, depth={depth}"
    )
-
+    
    try:
        result = await analytics_graph_data(
            db=db,
@@ -286,223 +245,137 @@ async def get_graph_data_api(
            depth=depth,
            center_node_id=center_node_id
        )
+        
        # 检查是否有错误消息
        if "message" in result and result["statistics"]["total_nodes"] == 0:
            api_logger.warning(f"图数据查询返回空结果: {result.get('message')}")
            return success(data=result, msg=result.get("message", "查询成功"))
-
+        
        api_logger.info(
            f"成功获取图数据: end_user_id={end_user_id}, "
            f"nodes={result['statistics']['total_nodes']}, "
            f"edges={result['statistics']['total_edges']}"
        )
        return success(data=result, msg="查询成功")
-
+        
    except Exception as e:
        api_logger.error(f"图数据查询失败: end_user_id={end_user_id}, error={str(e)}")
        return fail(BizCode.INTERNAL_ERROR, "图数据查询失败", str(e))


-@router.get("/analytics/community_graph", response_model=ApiResponse)
-async def get_community_graph_data_api(
-        end_user_id: str,
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
-) -> dict:
-    workspace_id = current_user.current_workspace_id
-
-    if workspace_id is None:
-        api_logger.warning(f"用户 {current_user.username} 尝试查询社区图谱但未选择工作空间")
-        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-
-    api_logger.info(
-        f"社区图谱查询请求: end_user_id={end_user_id}, user={current_user.username}, "
-        f"workspace={workspace_id}"
-    )
-
-    try:
-        result = await analytics_community_graph_data(db=db, end_user_id=end_user_id)
-
-        if "message" in result and result["statistics"]["total_nodes"] == 0:
-            api_logger.warning(f"社区图谱查询返回空结果: {result.get('message')}")
-            return success(data=result, msg=result.get("message", "查询成功"))
-
-        api_logger.info(
-            f"成功获取社区图谱: end_user_id={end_user_id}, "
-            f"nodes={result['statistics']['total_nodes']}, "
-            f"edges={result['statistics']['total_edges']}"
-        )
-        return success(data=result, msg="查询成功")
-
-    except Exception as e:
-        api_logger.error(f"社区图谱查询失败: end_user_id={end_user_id}, error={str(e)}")
-        return fail(BizCode.INTERNAL_ERROR, "社区图谱查询失败", str(e))
-
-#=======================终端用户信息接口=======================
-
-@router.get("/end_user_info", response_model=ApiResponse)
-async def get_end_user_info(
+@router.get("/read_end_user/profile", response_model=ApiResponse)
+async def get_end_user_profile(
    end_user_id: str,
    current_user: User = Depends(get_current_user),
    db: Session = Depends(get_db),
 ) -> dict:
-    """
-    查询终端用户信息记录
-
-    根据 end_user_id 查询单条终端用户信息记录。
-    """
    workspace_id = current_user.current_workspace_id
-
+    
+    # 检查用户是否已选择工作空间
    if workspace_id is None:
-        api_logger.warning(f"用户 {current_user.username} 尝试查询终端用户信息但未选择工作空间")
+        api_logger.warning(f"用户 {current_user.username} 尝试查询用户信息但未选择工作空间")
        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-
+    
    api_logger.info(
-        f"查询终端用户信息请求: end_user_id={end_user_id}, user={current_user.username}, "
+        f"用户信息查询请求: end_user_id={end_user_id}, user={current_user.username}, "
        f"workspace={workspace_id}"
    )
-
-    # 校验 end_user 是否属于当前工作空间
-    end_user_repo = EndUserRepository(db)
-    end_user = end_user_repo.get_end_user_by_id(end_user_id)
-    if end_user is None:
-        return fail(BizCode.USER_NOT_FOUND, "终端用户不存在", "end_user not found")
-    if str(end_user.workspace_id) != str(workspace_id):
-        api_logger.warning(
-            f"用户 {current_user.username} 尝试查询不属于工作空间 {workspace_id} 的终端用户 {end_user_id}"
-        )
-        return fail(BizCode.PERMISSION_DENIED, "该终端用户不属于当前工作空间", "end_user workspace mismatch")
-
-    result = user_memory_service.get_end_user_info(db, end_user_id)
-
-    if result["success"]:
-        api_logger.info(f"成功查询终端用户信息: end_user_id={end_user_id}")
-        return success(data=result["data"], msg="查询成功")
-    else:
-        error_msg = result["error"]
-        api_logger.error(f"查询终端用户信息失败: end_user_id={end_user_id}, error={error_msg}")
+    
+    try:
+        # 查询终端用户
+        end_user = db.query(EndUser).filter(EndUser.id == end_user_id).first()
        
-        if error_msg == "终端用户信息记录不存在":
-            return fail(BizCode.USER_NOT_FOUND, "终端用户信息记录不存在", error_msg)
-        elif error_msg == "无效的终端用户ID格式":
-            return fail(BizCode.INVALID_USER_ID, "无效的终端用户ID格式", error_msg)
-        else:
-            return fail(BizCode.INTERNAL_ERROR, "查询终端用户信息失败", error_msg)
+        if not end_user:
+            api_logger.warning(f"终端用户不存在: end_user_id={end_user_id}")
+            return fail(BizCode.INVALID_PARAMETER, "终端用户不存在", f"end_user_id={end_user_id}")
+        
+        # 构建响应数据
+        profile_data = EndUserProfileResponse(
+            id=end_user.id,
+            other_name=end_user.other_name,
+            position=end_user.position,
+            department=end_user.department,
+            contact=end_user.contact,
+            phone=end_user.phone,
+            hire_date=end_user.hire_date,
+            updatetime_profile=end_user.updatetime_profile
+        )
+        
+        api_logger.info(f"成功获取用户信息: end_user_id={end_user_id}")
+        return success(data=profile_data.model_dump(), msg="查询成功")
+        
+    except Exception as e:
+        api_logger.error(f"用户信息查询失败: end_user_id={end_user_id}, error={str(e)}")
+        return fail(BizCode.INTERNAL_ERROR, "用户信息查询失败", str(e))


-@router.post("/end_user_info/updated", response_model=ApiResponse)
-async def update_end_user_info(
-    info_update: EndUserInfoUpdate,
+@router.post("/updated_end_user/profile", response_model=ApiResponse)
+async def update_end_user_profile(
+    profile_update: EndUserProfileUpdate,
    current_user: User = Depends(get_current_user),
    db: Session = Depends(get_db),
 ) -> dict:
    """
-    更新终端用户信息记录
-
-    根据 end_user_id 更新终端用户信息记录，支持批量更新多个别名。
+    更新终端用户的基本信息
+    
+    该接口可以更新用户的姓名、职位、部门、联系方式、电话和入职日期等信息。
+    所有字段都是可选的，只更新提供的字段。
    
-    示例请求体：
-    {
-      "end_user_id": "a1b2c3d4-e5f6-7890-abcd-ef1234567890",
-      "other_name": "张三1",
-      "aliases": ["小张", "张工"],
-      "meta_data": {"position": "工程师", "department": "技术部"}
-    }
    """
    workspace_id = current_user.current_workspace_id
-    end_user_id = info_update.end_user_id
-
+    end_user_id = profile_update.end_user_id
+    
+    # 检查用户是否已选择工作空间
    if workspace_id is None:
-        api_logger.warning(f"用户 {current_user.username} 尝试更新终端用户信息但未选择工作空间")
+        api_logger.warning(f"用户 {current_user.username} 尝试更新用户信息但未选择工作空间")
        return fail(BizCode.INVALID_PARAMETER, "请先切换到一个工作空间", "current_workspace_id is None")
-
+    
    api_logger.info(
-        f"更新终端用户信息请求: end_user_id={end_user_id}, user={current_user.username}, "
+        f"用户信息更新请求: end_user_id={end_user_id}, user={current_user.username}, "
        f"workspace={workspace_id}"
    )
-
-    # 校验 end_user 是否属于当前工作空间
-    end_user_repo = EndUserRepository(db)
-    end_user = end_user_repo.get_end_user_by_id(end_user_id)
-    if end_user is None:
-        return fail(BizCode.USER_NOT_FOUND, "终端用户不存在", "end_user not found")
-    if str(end_user.workspace_id) != str(workspace_id):
-        api_logger.warning(
-            f"用户 {current_user.username} 尝试更新不属于工作空间 {workspace_id} 的终端用户 {end_user_id}"
-        )
-        return fail(BizCode.PERMISSION_DENIED, "该终端用户不属于当前工作空间", "end_user workspace mismatch")
-
-    # 获取更新数据（排除 end_user_id）
-    update_data = info_update.model_dump(exclude_unset=True, exclude={'end_user_id'})
    
-    result = user_memory_service.update_end_user_info(db, end_user_id, update_data)
-
-    if result["success"]:
-        api_logger.info(f"成功更新终端用户信息: end_user_id={end_user_id}")
-        return success(data=result["data"], msg="更新成功")
-    else:
-        error_msg = result["error"]
-        api_logger.error(f"终端用户信息更新失败: end_user_id={end_user_id}, error={error_msg}")
-        
-        if error_msg == "终端用户信息记录不存在":
-            return fail(BizCode.USER_NOT_FOUND, "终端用户信息记录不存在", error_msg)
-        elif error_msg == "无效的终端用户ID格式":
-            return fail(BizCode.INVALID_USER_ID, "无效的终端用户ID格式", error_msg)
-        else:
-            return fail(BizCode.INTERNAL_ERROR, "终端用户信息更新失败", error_msg)
-
-@router.get("/memory_space/timeline_memories", response_model=ApiResponse)
-async def memory_space_timeline_of_shared_memories(
-        id: str, label: str,
-        language_type: str = Header(default=None, alias="X-Language-Type"),
-        current_user: User = Depends(get_current_user),
-        db: Session = Depends(get_db),
-):
-    # 使用集中化的语言校验
-    language = get_language_from_header(language_type)
-
-    workspace_id = current_user.current_workspace_id
-    workspace_repo = WorkspaceRepository(db)
-    workspace_models = workspace_repo.get_workspace_models_configs(workspace_id)
-
-    if workspace_models:
-        model_id = workspace_models.get("llm", None)
-    else:
-        model_id = None
-    MemoryEntity = MemoryEntityService(id, label)
-    timeline_memories_result = await MemoryEntity.get_timeline_memories_server(model_id, language)
-
-    return success(data=timeline_memories_result, msg="共同记忆时间线")
-
-
-@router.get("/memory_space/relationship_evolution", response_model=ApiResponse)
-async def memory_space_relationship_evolution(id: str, label: str,
-                                              current_user: User = Depends(get_current_user),
-                                              db: Session = Depends(get_db),
-                                              ):
    try:
-        api_logger.info(f"关系演变查询请求: id={id}, table={label}, user={current_user.username}")
-
-        # 获取情绪数据
-        emotion = MemoryEmotion(id, label)
-        emotion_result = await emotion.get_emotion()
-
-        # 获取交互数据
-        interaction = MemoryInteraction(id, label)
-        interaction_result = await interaction.get_interaction_frequency()
-
-        # 关闭连接
-        await emotion.close()
-        await interaction.close()
-
-        result = {
-            "emotion": emotion_result,
-            "interaction": interaction_result
-        }
-
-        api_logger.info(f"关系演变查询成功: id={id}, table={label}")
-        return success(data=result, msg="关系演变")
-
+        # 查询终端用户
+        end_user = db.query(EndUser).filter(EndUser.id == end_user_id).first()
+        
+        if not end_user:
+            api_logger.warning(f"终端用户不存在: end_user_id={end_user_id}")
+            return fail(BizCode.INVALID_PARAMETER, "终端用户不存在", f"end_user_id={end_user_id}")
+        
+        # 更新字段（只更新提供的字段，排除 end_user_id）
+        # 允许 None 值来重置字段（如 hire_date）
+        update_data = profile_update.model_dump(exclude_unset=True, exclude={'end_user_id'})
+        for field, value in update_data.items():
+            setattr(end_user, field, value)
+        
+        # 更新 updated_at 时间戳
+        end_user.updated_at = datetime.datetime.now()
+        
+        # 更新 updatetime_profile 为当前时间戳（毫秒）
+        current_timestamp = int(datetime.datetime.now().timestamp() * 1000)
+        end_user.updatetime_profile = current_timestamp
+        
+        # 提交更改
+        db.commit()
+        db.refresh(end_user)
+        
+        # 构建响应数据
+        profile_data = EndUserProfileResponse(
+            id=end_user.id,
+            other_name=end_user.other_name,
+            position=end_user.position,
+            department=end_user.department,
+            contact=end_user.contact,
+            phone=end_user.phone,
+            hire_date=end_user.hire_date,
+            updatetime_profile=end_user.updatetime_profile
+        )
+        
+        api_logger.info(f"成功更新用户信息: end_user_id={end_user_id}, updated_fields={list(update_data.keys())}, updatetime_profile={current_timestamp}")
+        return success(data=profile_data.model_dump(), msg="更新成功")
+        
    except Exception as e:
-        api_logger.error(f"关系演变查询失败: id={id}, table={label}, error={str(e)}", exc_info=True)
-        return fail(BizCode.INTERNAL_ERROR, "关系演变查询失败", str(e))
+        db.rollback()
+        api_logger.error(f"用户信息更新失败: end_user_id={end_user_id}, error={str(e)}")
+        return fail(BizCode.INTERNAL_ERROR, "用户信息更新失败", str(e))
--- a/api/app/controllers/workflow_controller.py
+++ b/api/app/controllers/workflow_controller.py
@@ -0,0 +1,611 @@
+"""
+工作流 API 控制器
+"""
+
+import logging
+import uuid
+from typing import Annotated
+
+from fastapi import APIRouter, Depends, Path, Query
+from sqlalchemy.orm import Session
+
+from app.db import get_db
+from app.dependencies import get_current_user, cur_workspace_access_guard
+
+from app.models.user_model import User
+from app.models.app_model import App
+from app.services.workflow_service import WorkflowService, get_workflow_service
+from app.schemas.workflow_schema import (
+    WorkflowConfigCreate,
+    WorkflowConfigUpdate,
+    WorkflowConfig,
+    WorkflowValidationResponse,
+    WorkflowExecution,
+    WorkflowNodeExecution,
+    WorkflowExecutionRequest,
+    WorkflowExecutionResponse
+)
+from app.core.response_utils import success, fail
+from app.core.exceptions import BusinessException
+from app.core.error_codes import BizCode
+
+logger = logging.getLogger(__name__)
+
+router = APIRouter(prefix="/apps", tags=["workflow"])
+
+
+# ==================== 工作流配置管理 ====================
+
+@router.post("/{app_id}/workflow")
+@cur_workspace_access_guard()
+async def create_workflow_config(
+    app_id: Annotated[uuid.UUID, Path(description="应用 ID")],
+    config: WorkflowConfigCreate,
+    db: Annotated[Session, Depends(get_db)],
+    current_user: Annotated[User, Depends(get_current_user)],
+    service: Annotated[WorkflowService, Depends(get_workflow_service)]
+):
+    """创建工作流配置
+
+    创建或更新应用的工作流配置。配置会进行基础验证，但允许保存不完整的配置（草稿）。
+    """
+    try:
+        # 验证应用是否存在且属于当前工作空间
+        app = db.query(App).filter(
+            App.id == app_id,
+            App.workspace_id == current_user.current_workspace_id,
+            App.is_active == True
+        ).first()
+
+        if not app:
+            return fail(
+                code=BizCode.NOT_FOUND,
+                msg="应用不存在或无权访问"
+            )
+
+        # 验证应用类型
+        if app.type != "workflow":
+            return fail(
+                code=BizCode.INVALID_PARAMETER,
+                msg=f"应用类型必须为 workflow，当前为 {app.type}"
+            )
+
+        # 创建工作流配置
+        workflow_config = service.create_workflow_config(
+            app_id=app_id,
+            nodes=[node.model_dump() for node in config.nodes],
+            edges=[edge.model_dump() for edge in config.edges],
+            variables=[var.model_dump() for var in config.variables],
+            execution_config=config.execution_config.model_dump(),
+            triggers=[trigger.model_dump() for trigger in config.triggers],
+            validate=True  # 进行基础验证
+        )
+
+        return success(
+            data=WorkflowConfig.model_validate(workflow_config),
+            msg="工作流配置创建成功"
+        )
+
+    except BusinessException as e:
+        logger.warning(f"创建工作流配置失败: {e.message}")
+        return fail(code=e.error_code, msg=e.message)
+    except Exception as e:
+        logger.error(f"创建工作流配置异常: {e}", exc_info=True)
+        return fail(
+            code=BizCode.INTERNAL_ERROR,
+            msg=f"创建工作流配置失败: {str(e)}"
+        )
+
+#
+# @router.get("/{app_id}/workflow")
+# async def get_workflow_config(
+#     app_id: Annotated[uuid.UUID, Path(description="应用 ID")],
+#     db: Annotated[Session, Depends(get_db)],
+#     current_user: Annotated[User, Depends(get_current_user)]
+#
+# ):
+#     """获取工作流配置
+#
+#     获取应用的工作流配置详情。
+#     """
+#     try:
+#         # 验证应用是否存在且属于当前工作空间
+#         app = db.query(App).filter(
+#             App.id == app_id,
+#             App.workspace_id == current_user.current_workspace_id,
+#             App.is_active == True
+#         ).first()
+#
+#         if not app:
+#             return fail(
+#                 code=BizCode.NOT_FOUND,
+#                 msg="应用不存在或无权访问"
+#             )
+#
+#         # 获取工作流配置
+#         service = WorkflowService(db)
+#         workflow_config = service.get_workflow_config(app_id)
+#
+#         if not workflow_config:
+#             return fail(
+#                 code=BizCode.NOT_FOUND,
+#                 msg="工作流配置不存在"
+#             )
+#
+#         return success(
+#             data=WorkflowConfig.model_validate(workflow_config)
+#         )
+#
+#     except Exception as e:
+#         logger.error(f"获取工作流配置异常: {e}", exc_info=True)
+#         return fail(
+#             code=BizCode.INTERNAL_ERROR,
+#             msg=f"获取工作流配置失败: {str(e)}"
+#         )
+
+
+# @router.put("/{app_id}/workflow")
+# async def update_workflow_config(
+#     app_id: Annotated[uuid.UUID, Path(description="应用 ID")],
+#     config: WorkflowConfigUpdate,
+#     db: Annotated[Session, Depends(get_db)],
+#     current_user: Annotated[User, Depends(get_current_user)],
+#     service: Annotated[WorkflowService, Depends(get_workflow_service)]
+# ):
+#     """更新工作流配置
+
+#     更新应用的工作流配置。可以部分更新，未提供的字段保持不变。
+#     """
+#     try:
+#         # 验证应用是否存在且属于当前工作空间
+#         app = db.query(App).filter(
+#             App.id == app_id,
+#             App.workspace_id == current_user.current_workspace_id,
+#             App.is_active == True
+#         ).first()
+
+#         if not app:
+#             return fail(
+#                 code=BizCode.NOT_FOUND,
+#                 msg="应用不存在或无权访问"
+#             )
+
+#         # 更新工作流配置
+#         workflow_config = service.update_workflow_config(
+#             app_id=app_id,
+#             nodes=[node.model_dump() for node in config.nodes] if config.nodes else None,
+#             edges=[edge.model_dump() for edge in config.edges] if config.edges else None,
+#             variables=[var.model_dump() for var in config.variables] if config.variables else None,
+#             execution_config=config.execution_config.model_dump() if config.execution_config else None,
+#             triggers=[trigger.model_dump() for trigger in config.triggers] if config.triggers else None,
+#             validate=True
+#         )
+
+#         return success(
+#             data=WorkflowConfig.model_validate(workflow_config),
+#             msg="工作流配置更新成功"
+#         )
+
+#     except BusinessException as e:
+#         logger.warning(f"更新工作流配置失败: {e.message}")
+#         return fail(code=e.error_code, msg=e.message)
+#     except Exception as e:
+#         logger.error(f"更新工作流配置异常: {e}", exc_info=True)
+#         return fail(
+#             code=BizCode.INTERNAL_ERROR,
+#             msg=f"更新工作流配置失败: {str(e)}"
+#         )
+
+
+@router.delete("/{app_id}/workflow")
+async def delete_workflow_config(
+    app_id: Annotated[uuid.UUID, Path(description="应用 ID")],
+    db: Annotated[Session, Depends(get_db)],
+    current_user: Annotated[User, Depends(get_current_user)],
+    service: Annotated[WorkflowService, Depends(get_workflow_service)]
+):
+    """删除工作流配置
+
+    删除应用的工作流配置。
+    """
+    try:
+        # 验证应用是否存在且属于当前工作空间
+        app = db.query(App).filter(
+            App.id == app_id,
+            App.workspace_id == current_user.current_workspace_id,
+            App.is_active == True
+        ).first()
+
+        if not app:
+            return fail(
+                code=BizCode.NOT_FOUND,
+                msg="应用不存在或无权访问"
+            )
+
+        # 删除工作流配置
+        deleted = service.delete_workflow_config(app_id)
+
+        if not deleted:
+            return fail(
+                code=BizCode.NOT_FOUND,
+                msg="工作流配置不存在"
+            )
+
+        return success(msg="工作流配置删除成功")
+
+    except Exception as e:
+        logger.error(f"删除工作流配置异常: {e}", exc_info=True)
+        return fail(
+            code=BizCode.INTERNAL_ERROR,
+            msg=f"删除工作流配置失败: {str(e)}"
+        )
+
+
+@router.post("/{app_id}/workflow/validate")
+async def validate_workflow_config(
+    app_id: Annotated[uuid.UUID, Path(description="应用 ID")],
+    db: Annotated[Session, Depends(get_db)],
+    current_user: Annotated[User, Depends(get_current_user)],
+    service: Annotated[WorkflowService, Depends(get_workflow_service)],
+    for_publish: Annotated[bool, Query(description="是否为发布验证")] = False
+):
+    """验证工作流配置
+
+    验证工作流配置是否有效。可以选择是否进行发布级别的严格验证。
+    """
+    try:
+        # 验证应用是否存在且属于当前工作空间
+        app = db.query(App).filter(
+            App.id == app_id,
+            App.workspace_id == current_user.current_workspace_id,
+            App.is_active == True
+        ).first()
+
+        if not app:
+            return fail(
+                code=BizCode.NOT_FOUND,
+                msg="应用不存在或无权访问"
+            )
+
+        # 验证工作流配置
+
+        if for_publish:
+            is_valid, errors = service.validate_workflow_config_for_publish(app_id)
+        else:
+            workflow_config = service.get_workflow_config(app_id)
+            if not workflow_config:
+                return fail(
+                    code=BizCode.NOT_FOUND,
+                    msg="工作流配置不存在"
+                )
+
+            from app.core.workflow.validator import validate_workflow_config as validate_config
+            config_dict = {
+                "nodes": workflow_config.nodes,
+                "edges": workflow_config.edges,
+                "variables": workflow_config.variables,
+                "execution_config": workflow_config.execution_config,
+                "triggers": workflow_config.triggers
+            }
+            is_valid, errors = validate_config(config_dict, for_publish=False)
+
+        return success(
+            data=WorkflowValidationResponse(
+                is_valid=is_valid,
+                errors=errors,
+                warnings=[]
+            )
+        )
+
+    except BusinessException as e:
+        logger.warning(f"验证工作流配置失败: {e.message}")
+        return fail(code=e.error_code, msg=e.message)
+    except Exception as e:
+        logger.error(f"验证工作流配置异常: {e}", exc_info=True)
+        return fail(
+            code=BizCode.INTERNAL_ERROR,
+            msg=f"验证工作流配置失败: {str(e)}"
+        )
+
+
+# ==================== 工作流执行管理 ====================
+
+@router.get("/{app_id}/workflow/executions")
+async def get_workflow_executions(
+    app_id: Annotated[uuid.UUID, Path(description="应用 ID")],
+    db: Annotated[Session, Depends(get_db)],
+    current_user: Annotated[User, Depends(get_current_user)],
+    service: Annotated[WorkflowService, Depends(get_workflow_service)],
+    limit: Annotated[int, Query(ge=1, le=100)] = 50,
+    offset: Annotated[int, Query(ge=0)] = 0
+):
+    """获取工作流执行记录列表
+
+    获取应用的工作流执行历史记录。
+    """
+    try:
+        # 验证应用是否存在且属于当前工作空间
+        app = db.query(App).filter(
+            App.id == app_id,
+            App.workspace_id == current_user.current_workspace_id,
+            App.is_active == True
+        ).first()
+
+        if not app:
+            return fail(
+                code=BizCode.NOT_FOUND,
+                msg="应用不存在或无权访问"
+            )
+
+        # 获取执行记录
+        executions = service.get_executions_by_app(app_id, limit, offset)
+
+        # 获取统计信息
+        statistics = service.get_execution_statistics(app_id)
+
+        return success(
+            data={
+                "executions": [WorkflowExecution.model_validate(e) for e in executions],
+                "statistics": statistics,
+                "pagination": {
+                    "limit": limit,
+                    "offset": offset,
+                    "total": statistics["total"]
+                }
+            }
+        )
+
+    except Exception as e:
+        logger.error(f"获取工作流执行记录异常: {e}", exc_info=True)
+        return fail(
+            code=BizCode.INTERNAL_ERROR,
+            msg=f"获取工作流执行记录失败: {str(e)}"
+        )
+
+
+@router.get("/workflow/executions/{execution_id}")
+async def get_workflow_execution(
+    execution_id: Annotated[str, Path(description="执行 ID")],
+    db: Annotated[Session, Depends(get_db)],
+    current_user: Annotated[User, Depends(get_current_user)],
+    service: Annotated[WorkflowService, Depends(get_workflow_service)]
+):
+    """获取工作流执行详情
+
+    获取单个工作流执行的详细信息，包括所有节点的执行记录。
+    """
+    try:
+        # 获取执行记录
+        execution = service.get_execution(execution_id)
+
+        if not execution:
+            return fail(
+                code=BizCode.NOT_FOUND,
+                msg="执行记录不存在"
+            )
+
+        # 验证应用是否属于当前工作空间
+        app = db.query(App).filter(
+            App.id == execution.app_id,
+            App.workspace_id == current_user.current_workspace_id,
+            App.is_active == True
+        ).first()
+
+        if not app:
+            return fail(
+                code=BizCode.NOT_FOUND,
+                msg="无权访问该执行记录"
+            )
+
+        # 获取节点执行记录
+        node_executions = service.node_execution_repo.get_by_execution_id(execution.id)
+
+        return success(
+            data={
+                "execution": WorkflowExecution.model_validate(execution),
+                "node_executions": [
+                    WorkflowNodeExecution.model_validate(ne) for ne in node_executions
+                ]
+            }
+        )
+
+    except Exception as e:
+        logger.error(f"获取工作流执行详情异常: {e}", exc_info=True)
+        return fail(
+            code=BizCode.INTERNAL_ERROR,
+            msg=f"获取工作流执行详情失败: {str(e)}"
+        )
+
+
+
+# ==================== 工作流执行 ====================
+
+@router.post("/{app_id}/workflow/run")
+async def run_workflow(
+    app_id: Annotated[uuid.UUID, Path(description="应用 ID")],
+    request: WorkflowExecutionRequest,
+    db: Annotated[Session, Depends(get_db)],
+    current_user: Annotated[User, Depends(get_current_user)],
+    service: Annotated[WorkflowService, Depends(get_workflow_service)]
+):
+    """执行工作流
+
+    执行工作流并返回结果。支持流式和非流式两种模式。
+
+    **非流式模式**：等待工作流执行完成后返回完整结果。
+
+    **流式模式**：实时返回执行过程中的事件（节点开始、节点完成、工作流完成等）。
+    """
+    try:
+        # 验证应用是否存在且属于当前工作空间
+        app = db.query(App).filter(
+            App.id == app_id,
+            App.workspace_id == current_user.current_workspace_id,
+            App.is_active == True
+        ).first()
+
+        if not app:
+            return fail(
+                code=BizCode.NOT_FOUND,
+                msg="应用不存在或无权访问"
+            )
+
+        # 验证应用类型
+        if app.type != "workflow":
+            return fail(
+                code=BizCode.INVALID_PARAMETER,
+                msg=f"应用类型必须为 workflow，当前为 {app.type}"
+            )
+
+        # 准备输入数据
+        input_data = {
+            "message": request.message or "",
+            "variables": request.variables
+        }
+
+        # 执行工作流
+
+        if request.stream:
+            # 流式执行
+            from fastapi.responses import StreamingResponse
+            import json
+
+            async def event_generator():
+                """生成 SSE 事件
+                
+                SSE 格式：
+                event: <event_type>
+                data: <json_data>
+                
+                支持的事件类型：
+                - workflow_start: 工作流开始
+                - workflow_end: 工作流结束
+                - node_start: 节点开始执行
+                - node_end: 节点执行完成
+                - node_chunk: 中间节点的流式输出
+                - message: 最终消息的流式输出（End 节点及其相邻节点）
+                """
+                try:
+                    async for event in await service.run_workflow(
+                        app_id=app_id,
+                        input_data=input_data,
+                        triggered_by=current_user.id,
+                        conversation_id=uuid.UUID(request.conversation_id) if request.conversation_id else None,
+                        stream=True
+                    ):
+                        # 提取事件类型和数据
+                        event_type = event.get("event", "message")
+                        event_data = event.get("data", {})
+                        
+                        # 转换为标准 SSE 格式（字符串）
+                        # event: <type>
+                        # data: <json>
+                        sse_message = f"event: {event_type}\ndata: {json.dumps(event_data)}\n\n"
+                        yield sse_message
+                        
+                except Exception as e:
+                    logger.error(f"流式执行异常: {e}", exc_info=True)
+                    # 发送错误事件
+                    sse_error = f"event: error\ndata: {json.dumps({'error': str(e)})}\n\n"
+                    yield sse_error
+
+            return StreamingResponse(
+                event_generator(),
+                media_type="text/event-stream",
+                headers={
+                    "Cache-Control": "no-cache",
+                    "Connection": "keep-alive",
+                    "X-Accel-Buffering": "no"  # 禁用 nginx 缓冲
+                }
+            )
+        else:
+            # 非流式执行
+            result = await service.run_workflow(
+                app_id=app_id,
+                input_data=input_data,
+                triggered_by=current_user.id,
+                conversation_id=uuid.UUID(request.conversation_id) if request.conversation_id else None,
+                stream=False
+            )
+
+            return success(
+                data=WorkflowExecutionResponse(
+                    execution_id=result["execution_id"],
+                    status=result["status"],
+                    output=result.get("output"),
+                    output_data=result.get("output_data"),
+                    error_message=result.get("error_message"),
+                    elapsed_time=result.get("elapsed_time"),
+                    token_usage=result.get("token_usage")
+                ),
+                msg="工作流执行完成"
+            )
+
+    except BusinessException as e:
+        logger.warning(f"执行工作流失败: {e.message}")
+        return fail(code=e.error_code, msg=e.message)
+    except Exception as e:
+        logger.error(f"执行工作流异常: {e}", exc_info=True)
+        return fail(
+            code=BizCode.INTERNAL_ERROR,
+            msg=f"执行工作流失败: {str(e)}"
+        )
+
+
+@router.post("/workflow/executions/{execution_id}/cancel")
+async def cancel_workflow_execution(
+    execution_id: Annotated[str, Path(description="执行 ID")],
+    db: Annotated[Session, Depends(get_db)],
+    current_user: Annotated[User, Depends(get_current_user)],
+    service: Annotated[WorkflowService, Depends(get_workflow_service)]
+):
+    """取消工作流执行
+
+    取消正在运行的工作流执行。
+
+    **注意**：当前版本仅更新状态为 cancelled，实际的执行取消功能待实现。
+    """
+    try:
+        # 获取执行记录
+        execution = service.get_execution(execution_id)
+
+        if not execution:
+            return fail(
+                code=BizCode.NOT_FOUND,
+                msg="执行记录不存在"
+            )
+
+        # 验证应用是否属于当前工作空间
+        app = db.query(App).filter(
+            App.id == execution.app_id,
+            App.workspace_id == current_user.current_workspace_id,
+            App.is_active == True
+        ).first()
+
+        if not app:
+            return fail(
+                code=BizCode.NOT_FOUND,
+                msg="无权访问该执行记录"
+            )
+
+        # 检查执行状态
+        if execution.status not in ["pending", "running"]:
+            return fail(
+                code=BizCode.INVALID_PARAMETER,
+                msg=f"无法取消状态为 {execution.status} 的执行"
+            )
+
+        # 更新状态为 cancelled
+        service.update_execution_status(execution_id, "cancelled")
+
+        return success(msg="工作流执行已取消")
+
+    except BusinessException as e:
+        logger.warning(f"取消工作流执行失败: {e.message}")
+        return fail(code=e.error_code, msg=e.message)
+    except Exception as e:
+        logger.error(f"取消工作流执行异常: {e}", exc_info=True)
+        return fail(
+            code=BizCode.INTERNAL_ERROR,
+            msg=f"取消工作流执行失败: {str(e)}"
+        )
--- a/api/app/controllers/workspace_controller.py
+++ b/api/app/controllers/workspace_controller.py
@@ -1,7 +1,7 @@
 import uuid
 from typing import List, Optional

-from fastapi import APIRouter, Depends, Header, HTTPException, Query, status
+from fastapi import APIRouter, Depends, HTTPException, Query, status
 from sqlalchemy.orm import Session

 from app.core.logging_config import get_api_logger
@@ -14,12 +14,6 @@ from app.dependencies import (
    get_current_user,
    workspace_access_guard,
 )
-from app.i18n.dependencies import get_current_language, get_translator
-from app.i18n.serializers import (
-    WorkspaceSerializer,
-    WorkspaceMemberSerializer,
-    WorkspaceInviteSerializer
-)
 from app.models.tenant_model import Tenants
 from app.models.user_model import User
 from app.models.workspace_model import InviteStatus
@@ -71,9 +65,7 @@ def get_workspaces(
    include_current: bool = Query(True, description="是否包含当前工作空间"),
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
-    current_tenant: Tenants = Depends(get_current_tenant),
-    language: str = Depends(get_current_language),
-    t: callable = Depends(get_translator)
+    current_tenant: Tenants = Depends(get_current_tenant)
 ):
    """获取当前租户下用户参与的所有工作空间

@@ -96,50 +88,25 @@ def get_workspaces(
        )

    api_logger.info(f"成功获取 {len(workspaces)} 个工作空间")
-    
-    # 使用序列化器添加国际化字段
-    serializer = WorkspaceSerializer()
-    workspaces_data = [WorkspaceResponse.model_validate(w).model_dump() for w in workspaces]
-    workspaces_i18n = serializer.serialize_list(workspaces_data, language)
-    
-    return success(data=workspaces_i18n, msg=t("workspace.list_retrieved"))
+    workspaces_schema = [WorkspaceResponse.model_validate(w) for w in workspaces]
+    return success(data=workspaces_schema, msg="工作空间列表获取成功")


@router.post("", response_model=ApiResponse)
 def create_workspace(
    workspace: WorkspaceCreate,
-    language_type: str = Header(default="zh", alias="X-Language-Type"),
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_superuser),
-    language: str = Depends(get_current_language),
-    t: callable = Depends(get_translator)
 ):
    """创建新的工作空间"""
-    from app.core.language_utils import get_language_from_header
-    
-    # 验证并获取语言参数
-    language = get_language_from_header(language_type)
-    
-    api_logger.info(
-        f"用户 {current_user.username} 请求创建工作空间: {workspace.name}, "
-        f"language={language}"
-    )
+    api_logger.info(f"用户 {current_user.username} 请求创建工作空间: {workspace.name}")

    result = workspace_service.create_workspace(
-        db=db, workspace=workspace, user=current_user, language=language
-    )
+        db=db, workspace=workspace, user=current_user)

-    api_logger.info(
-        f"工作空间创建成功 - 名称: {workspace.name}, ID: {result.id}, "
-        f"创建者: {current_user.username}, language={language}"
-    )
-    
-    # 使用序列化器添加国际化字段
-    serializer = WorkspaceSerializer()
-    result_data = WorkspaceResponse.model_validate(result).model_dump()
-    result_i18n = serializer.serialize(result_data, language)
-    
-    return success(data=result_i18n, msg=t("workspace.created"))
+    api_logger.info(f"工作空间创建成功 - 名称: {workspace.name}, ID: {result.id}, 创建者: {current_user.username}")
+    result_schema = WorkspaceResponse.model_validate(result)
+    return success(data=result_schema, msg="工作空间创建成功")

@router.put("", response_model=ApiResponse)
@cur_workspace_access_guard()
@@ -147,8 +114,6 @@ def update_workspace(
    workspace: WorkspaceUpdate,
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
-    language: str = Depends(get_current_language),
-    t: callable = Depends(get_translator)
 ):
    """更新工作空间"""
    workspace_id = current_user.current_workspace_id
@@ -161,21 +126,14 @@ def update_workspace(
        user=current_user,
    )
    api_logger.info(f"工作空间更新成功 - ID: {workspace_id}, 用户: {current_user.username}")
-    
-    # 使用序列化器添加国际化字段
-    serializer = WorkspaceSerializer()
-    result_data = WorkspaceResponse.model_validate(result).model_dump()
-    result_i18n = serializer.serialize(result_data, language)
-    
-    return success(data=result_i18n, msg=t("workspace.updated"))
+    result_schema = WorkspaceResponse.model_validate(result)
+    return success(data=result_schema, msg="工作空间更新成功")

@router.get("/members", response_model=ApiResponse)
@cur_workspace_access_guard()
 def get_cur_workspace_members(
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
-    language: str = Depends(get_current_language),
-    t: callable = Depends(get_translator)
 ):
    """获取工作空间成员列表（关系序列化）"""
    api_logger.info(f"用户 {current_user.username} 请求获取工作空间 {current_user.current_workspace_id} 的成员列表")
@@ -186,14 +144,8 @@ def get_cur_workspace_members(
        user=current_user,
    )
    api_logger.info(f"工作空间成员列表获取成功 - ID: {current_user.current_workspace_id}, 数量: {len(members)}")
-    
-    # 转换为表格项并使用序列化器添加国际化字段
    table_items = _convert_members_to_table_items(members)
-    serializer = WorkspaceMemberSerializer()
-    members_data = [item.model_dump() for item in table_items]
-    members_i18n = serializer.serialize_list(members_data, language)
-    
-    return success(data=members_i18n, msg=t("workspace.members.list_retrieved"))
+    return success(data=table_items, msg="工作空间成员列表获取成功")


@router.put("/members", response_model=ApiResponse)
@@ -203,7 +155,6 @@ def update_workspace_members(
    updates: List[WorkspaceMemberUpdate],
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
-    t: callable = Depends(get_translator)
 ):
    workspace_id = current_user.current_workspace_id
    api_logger.info(f"用户 {current_user.username} 请求更新工作空间 {workspace_id} 的成员角色")
@@ -214,7 +165,7 @@ def update_workspace_members(
        user=current_user,
    )
    api_logger.info(f"工作空间成员角色更新成功 - ID: {workspace_id}, 数量: {len(members)}")
-    return success(msg=t("workspace.members.role_updated"))
+    return success(msg="成员角色更新成功")


@router.delete("/members/{member_id}", response_model=ApiResponse)
@@ -223,7 +174,6 @@ def delete_workspace_member(
    member_id: uuid.UUID,
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
-    t: callable = Depends(get_translator)
 ):
    workspace_id = current_user.current_workspace_id
    api_logger.info(f"用户 {current_user.username} 请求删除工作空间 {workspace_id} 的成员 {member_id}")
@@ -235,7 +185,7 @@ def delete_workspace_member(
        user=current_user,
    )
    api_logger.info(f"工作空间成员删除成功 - ID: {workspace_id}, 成员: {member_id}")
-    return success(msg=t("workspace.members.deleted"))
+    return success(msg="成员删除成功")


 # 创建空间协作邀请
@@ -245,8 +195,6 @@ def create_workspace_invite(
    invite_data: WorkspaceInviteCreate,
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
-    language: str = Depends(get_current_language),
-    t: callable = Depends(get_translator)
 ):
    """创建工作空间邀请"""
    workspace_id = current_user.current_workspace_id
@@ -259,12 +207,7 @@ def create_workspace_invite(
        user=current_user
    )
    api_logger.info(f"工作空间邀请创建成功 - 工作空间: {workspace_id}, 邮箱: {invite_data.email}")
-    
-    # 使用序列化器添加国际化字段
-    serializer = WorkspaceInviteSerializer()
-    result_i18n = serializer.serialize(result, language)
-    
-    return success(data=result_i18n, msg=t("workspace.invites.created"))
+    return success(data=result, msg="邀请创建成功")


@router.get("/invites", response_model=ApiResponse)
@@ -276,8 +219,6 @@ def get_workspace_invites(
    offset: int = Query(0, ge=0),
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
-    language: str = Depends(get_current_language),
-    t: callable = Depends(get_translator)
 ):
    """获取工作空间邀请列表"""
    workspace_id = current_user.current_workspace_id
@@ -292,30 +233,18 @@ def get_workspace_invites(
        offset=offset
    )
    api_logger.info(f"成功获取 {len(invites)} 个邀请记录")
-    
-    # 使用序列化器添加国际化字段
-    serializer = WorkspaceInviteSerializer()
-    invites_i18n = serializer.serialize_list(invites, language)
-    
-    return success(data=invites_i18n, msg=t("workspace.invites.list_retrieved"))
+    return success(data=invites, msg="邀请列表获取成功")


@public_router.get("/invites/validate/{token}", response_model=ApiResponse)
 def get_workspace_invite_info(
    token: str,
    db: Session = Depends(get_db),
-    language: str = Depends(get_current_language),
-    t: callable = Depends(get_translator)
 ):
    """获取工作空间邀请用户信息（无需认证）"""
    result = workspace_service.validate_invite_token(db=db, token=token)
    api_logger.info(f"工作空间邀请验证成功 - 邀请: {token}")
-    
-    # 使用序列化器添加国际化字段
-    serializer = WorkspaceInviteSerializer()
-    result_i18n = serializer.serialize(result, language)
-    
-    return success(data=result_i18n, msg=t("workspace.invites.validated"))
+    return success(data=result, msg="邀请验证成功")


@router.delete("/invites/{invite_id}", response_model=ApiResponse)
@@ -325,8 +254,6 @@ def revoke_workspace_invite(
    invite_id: uuid.UUID,
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
-    language: str = Depends(get_current_language),
-    t: callable = Depends(get_translator)
 ):
    """撤销工作空间邀请"""
    workspace_id = current_user.current_workspace_id
@@ -339,12 +266,7 @@ def revoke_workspace_invite(
        user=current_user
    )
    api_logger.info(f"工作空间邀请撤销成功 - 邀请: {invite_id}")
-    
-    # 使用序列化器添加国际化字段
-    serializer = WorkspaceInviteSerializer()
-    result_i18n = serializer.serialize(result, language)
-    
-    return success(data=result_i18n, msg=t("workspace.invites.revoked"))
+    return success(data=result, msg="邀请撤销成功")

 # ==================== 公开邀请接口（无需认证） ====================

@@ -367,7 +289,6 @@ def switch_workspace(
    workspace_id: uuid.UUID,
    db: Session = Depends(get_db),
    current_user: User = Depends(get_current_user),
-    t: callable = Depends(get_translator)
 ):
    """切换工作空间"""
    api_logger.info(f"用户 {current_user.username} 请求切换工作空间为 {workspace_id}")
@@ -378,7 +299,7 @@ def switch_workspace(
        user=current_user,
    )
    api_logger.info(f"成功切换工作空间为 {workspace_id}")
-    return success(msg=t("workspace.switched"))
+    return success(msg="工作空间切换成功")


@router.get("/storage", response_model=ApiResponse)
@@ -386,7 +307,6 @@ def switch_workspace(
 def get_workspace_storage_type(
        db: Session = Depends(get_db),
        current_user: User = Depends(get_current_user),
-        t: callable = Depends(get_translator)
 ):
    """获取当前工作空间的存储类型"""
    workspace_id = current_user.current_workspace_id
@@ -398,7 +318,7 @@ def get_workspace_storage_type(
        user=current_user
    )
    api_logger.info(f"成功获取工作空间 {workspace_id} 的存储类型: {storage_type}")
-    return success(data={"storage_type": storage_type}, msg=t("workspace.storage.type_retrieved"))
+    return success(data={"storage_type": storage_type}, msg="存储类型获取成功")


@router.get("/workspace_models", response_model=ApiResponse)
@@ -406,8 +326,6 @@ def get_workspace_storage_type(
 def workspace_models_configs(
        db: Session = Depends(get_db),
        current_user: User = Depends(get_current_user),
-        language: str = Depends(get_current_language),
-        t: callable = Depends(get_translator)
 ):
    """获取当前工作空间的模型配置（llm, embedding, rerank）"""
    workspace_id = current_user.current_workspace_id
@@ -423,14 +341,14 @@ def workspace_models_configs(
        api_logger.warning(f"工作空间 {workspace_id} 不存在或无权访问")
        raise HTTPException(
            status_code=status.HTTP_404_NOT_FOUND,
-            detail=t("workspace.not_found")
+            detail="工作空间不存在或无权访问"
        )

    api_logger.info(
        f"成功获取工作空间 {workspace_id} 的模型配置: "
        f"llm={configs.get('llm')}, embedding={configs.get('embedding')}, rerank={configs.get('rerank')}"
    )
-    return success(data=WorkspaceModelsConfig.model_validate(configs), msg=t("workspace.models.config_retrieved"))
+    return success(data=WorkspaceModelsConfig.model_validate(configs), msg="模型配置获取成功")


@router.put("/workspace_models", response_model=ApiResponse)
@@ -439,7 +357,6 @@ def update_workspace_models_configs(
        models_update: WorkspaceModelsUpdate,
        db: Session = Depends(get_db),
        current_user: User = Depends(get_current_user),
-        t: callable = Depends(get_translator)
 ):
    """更新当前工作空间的模型配置（llm, embedding, rerank）"""
    workspace_id = current_user.current_workspace_id
@@ -456,5 +373,5 @@ def update_workspace_models_configs(
        f"成功更新工作空间 {workspace_id} 的模型配置: "
        f"llm={updated_workspace.llm}, embedding={updated_workspace.embedding}, rerank={updated_workspace.rerank}"
    )
-    return success(data=WorkspaceModelsConfig.model_validate(updated_workspace), msg=t("workspace.models.config_updated"))
+    return success(data=WorkspaceModelsConfig.model_validate(updated_workspace), msg="模型配置更新成功")

--- a/api/app/core/init.py
+++ b/api/app/core/init.py
@@ -1,4 +0,0 @@
-# -*- coding: UTF-8 -*-
-# Author: Eternity
-# @Email: 1533512157@qq.com
-# @Time : 2026/2/9 16:24
--- a/api/app/core/agent/agent_middleware.py
+++ b/api/app/core/agent/agent_middleware.py
@@ -1,162 +0,0 @@
-"""Agent Middleware - 动态技能过滤"""
-import uuid
-from typing import List, Dict, Any, Optional
-from langchain_core.runnables import RunnablePassthrough
-
-from app.services.skill_service import SkillService
-from app.repositories.skill_repository import SkillRepository
-
-
-class AgentMiddleware:
-    """Agent 中间件 - 用于动态过滤和加载技能"""
-    
-    def __init__(self, skills: Optional[dict] = None):
-        """
-        初始化中间件
-        
-        Args:
-            skills: 技能配置字典 {"enabled": bool, "all_skills": bool, "skill_ids": [...]}
-        """
-        self.skills = skills or {}
-        self.enabled = self.skills.get('enabled', False)
-        self.all_skills = self.skills.get('all_skills', False)
-        self.skill_ids = self.skills.get('skill_ids', [])
-
-    @staticmethod
-    def filter_tools(
-        tools: List, 
-        message: str = "", 
-        skill_configs: Dict[str, Any] = None,
-        tool_to_skill_map: Dict[str, str] = None
-    ) -> tuple[List, List[str]]:
-        """
-        根据消息内容和技能配置动态过滤工具
-        
-        Args:
-            tools: 所有可用工具列表
-            message: 用户消息（可用于智能过滤）
-            skill_configs: 技能配置字典 {skill_id: {"keywords": [...], "enabled": True, "prompt": "..."}}
-            tool_to_skill_map: 工具到技能的映射 {tool_name: skill_id}
-        
-        Returns:
-            (过滤后的工具列表, 激活的技能ID列表)
-        """
-        if not tools:
-            return [], []
-        
-        # 如果没有技能配置，返回所有工具
-        if not skill_configs:
-            return tools, []
-        
-        # 基于关键词匹配激活技能
-        activated_skill_ids = []
-        message_lower = message.lower()
-        
-        for skill_id, config in skill_configs.items():
-            if not config.get('enabled', True):
-                continue
-            
-            keywords = config.get('keywords', [])
-            # 如果没有关键词限制，或消息包含关键词，则激活该技能
-            if not keywords or any(kw.lower() in message_lower for kw in keywords):
-                activated_skill_ids.append(skill_id)
-        
-        # 如果没有工具映射关系，返回所有工具
-        if not tool_to_skill_map:
-            return tools, activated_skill_ids
-        
-        # 根据激活的技能过滤工具
-        filtered_tools = []
-        for tool in tools:
-            tool_name = getattr(tool, 'name', str(id(tool)))
-            # 如果工具不属于任何skill（base_tools），或者工具所属的skill被激活，则保留
-            if tool_name not in tool_to_skill_map or tool_to_skill_map[tool_name] in activated_skill_ids:
-                filtered_tools.append(tool)
-        
-        return filtered_tools, activated_skill_ids
-    
-    def load_skill_tools(self, db, tenant_id: uuid.UUID, base_tools: List = None) -> tuple[List, Dict[str, Any], Dict[str, str]]:
-        """
-        加载技能关联的工具
-        
-        Args:
-            db: 数据库会话
-            tenant_id: 租户id
-            base_tools: 基础工具列表
-        
-        Returns:
-            (工具列表, 技能配置字典, 工具到技能的映射 {tool_name: skill_id})
-        """
-
-        tools_dict = {}
-        tool_to_skill_map = {}  # 工具名称到技能ID的映射
-        
-        if base_tools:
-            for tool in base_tools:
-                tool_name = getattr(tool, 'name', str(id(tool)))
-                tools_dict[tool_name] = tool
-                # base_tools 不属于任何 skill，不加入映射
-
-        skill_configs = {}
-        skill_ids_to_load = []
-        
-        # 如果启用技能且 all_skills 为 True，加载租户下所有激活的技能
-        if self.enabled and self.all_skills:
-            skills, _ = SkillRepository.list_skills(db, tenant_id, is_active=True, page=1, pagesize=1000)
-            skill_ids_to_load = [str(skill.id) for skill in skills]
-        elif self.enabled and self.skill_ids:
-            skill_ids_to_load = self.skill_ids
-        
-        if skill_ids_to_load:
-            for skill_id in skill_ids_to_load:
-                try:
-                    skill = SkillRepository.get_by_id(db, uuid.UUID(skill_id), tenant_id)
-                    if skill and skill.is_active:
-                        # 保存技能配置（包含prompt）
-                        config = skill.config or {}
-                        config['prompt'] = skill.prompt
-                        config['name'] = skill.name
-                        skill_configs[skill_id] = config
-                except Exception:
-                    continue
-            
-            # 加载技能工具并获取映射关系
-            skill_tools, skill_tool_map = SkillService.load_skill_tools(db, skill_ids_to_load, tenant_id)
-            
-            # 只添加不冲突的 skill_tools
-            for tool in skill_tools:
-                tool_name = getattr(tool, 'name', str(id(tool)))
-                if tool_name not in tools_dict:
-                    tools_dict[tool_name] = tool
-                    # 复制映射关系
-                    if tool_name in skill_tool_map:
-                        tool_to_skill_map[tool_name] = skill_tool_map[tool_name]
-        
-        return list(tools_dict.values()), skill_configs, tool_to_skill_map
-
-    @staticmethod
-    def get_active_prompts(activated_skill_ids: List[str], skill_configs: Dict[str, Any]) -> str:
-        """
-        根据激活的技能ID获取对应的提示词
-        
-        Args:
-            activated_skill_ids: 被激活的技能ID列表
-            skill_configs: 技能配置字典
-        
-        Returns:
-            合并后的提示词
-        """
-        prompts = []
-        for skill_id in activated_skill_ids:
-            config = skill_configs.get(skill_id, {})
-            prompt = config.get('prompt')
-            name = config.get('name', 'Skill')
-            if prompt:
-                prompts.append(f"# {name}\n{prompt}")
-        
-        return "\n\n".join(prompts) if prompts else ""
-
-    @staticmethod
-    def create_runnable():
-        """创建可运行的中间件"""
-        return RunnablePassthrough()
--- a/api/app/core/agent/langchain_agent.py
+++ b/api/app/core/agent/langchain_agent.py
@@ -7,18 +7,20 @@ LangChain Agent 封装
 - 支持流式输出
 - 使用 RedBearLLM 支持多提供商
 """
-
+import os
 import time
 from typing import Any, AsyncGenerator, Dict, List, Optional, Sequence

+from app.core.logging_config import get_business_logger
+from app.core.memory.agent.utils.redis_tool import store
+from app.core.models import RedBearLLM, RedBearModelConfig
+from app.models.models_model import ModelType
+from app.services.memory_konwledges_server import write_rag
+from app.services.task_service import get_task_memory_write_result
+from app.tasks import write_message_task
 from langchain.agents import create_agent
 from langchain_core.messages import AIMessage, BaseMessage, HumanMessage, SystemMessage
 from langchain_core.tools import BaseTool
-from langgraph.errors import GraphRecursionError
-
-from app.core.logging_config import get_business_logger
-from app.core.models import RedBearLLM, RedBearModelConfig
-from app.models.models_model import ModelType

 logger = get_business_logger()

@@ -26,22 +28,16 @@ logger = get_business_logger()
 class LangChainAgent:

    def __init__(
-            self,
-            model_name: str,
-            api_key: str,
-            provider: str = "openai",
-            api_base: Optional[str] = None,
-            is_omni: bool = False,
-            temperature: float = 0.7,
-            max_tokens: int = 2000,
-            system_prompt: Optional[str] = None,
-            tools: Optional[Sequence[BaseTool]] = None,
-            streaming: bool = False,
-            max_iterations: Optional[int] = None,  # 最大迭代次数（None 表示自动计算）
-            max_tool_consecutive_calls: int = 3,  # 单个工具最大连续调用次数
-            deep_thinking: bool = False,  # 是否启用深度思考模式
-            thinking_budget_tokens: Optional[int] = None,  # 深度思考 token 预算
-            capability: Optional[List[str]] = None  # 模型能力列表，用于校验是否支持深度思考
+        self,
+        model_name: str,
+        api_key: str,
+        provider: str = "openai",
+        api_base: Optional[str] = None,
+        temperature: float = 0.7,
+        max_tokens: int = 2000,
+        system_prompt: Optional[str] = None,
+        tools: Optional[Sequence[BaseTool]] = None,
+        streaming: bool = False
    ):
        """初始化 LangChain Agent

@@ -54,45 +50,13 @@ class LangChainAgent:
            max_tokens: 最大 token 数
            system_prompt: 系统提示词
            tools: 工具列表（可选，框架自动走 ReAct 循环）
-            streaming: 是否启用流式输出
-            max_iterations: 最大迭代次数（None 表示自动计算：基础 5 次 + 每个工具 2 次）
-            max_tool_consecutive_calls: 单个工具最大连续调用次数（默认 3 次）
+            streaming: 是否启用流式输出（默认 True）
        """
        self.model_name = model_name
        self.provider = provider
+        self.system_prompt = system_prompt or "你是一个专业的AI助手"
        self.tools = tools or []
        self.streaming = streaming
-        self.is_omni = is_omni
-        self.max_tool_consecutive_calls = max_tool_consecutive_calls
-        self.deep_thinking = deep_thinking and ("thinking" in (capability or []))
-
-        # 工具调用计数器：记录每个工具的连续调用次数
-        self.tool_call_counter: Dict[str, int] = {}
-        self.last_tool_called: Optional[str] = None
-
-        # 根据工具数量动态调整最大迭代次数
-        # 基础值 + 每个工具额外的调用机会
-        if max_iterations is None:
-            # 自动计算：基础 5 次 + 每个工具 2 次额外机会
-            self.max_iterations = 5 + len(self.tools) * 2
-        else:
-            self.max_iterations = max_iterations
-
-        self.system_prompt = system_prompt or "你是一个专业的AI助手"
-
-        logger.debug(
-            f"Agent 迭代次数配置: max_iterations={self.max_iterations}, "
-            f"tool_count={len(self.tools)}, "
-            f"max_tool_consecutive_calls={self.max_tool_consecutive_calls}, "
-            f"auto_calculated={max_iterations is None}"
-        )
-
-        # 根据 capability 校验是否真正支持深度思考
-        actual_deep_thinking = self.deep_thinking
-        if deep_thinking and not actual_deep_thinking:
-            logger.warning(
-                f"模型 {model_name} 不支持深度思考（capability 中无 'thinking'），已自动关闭 deep_thinking"
-            )

        # 创建 RedBearLLM（支持多提供商）
        model_config = RedBearModelConfig(
@@ -100,14 +64,10 @@ class LangChainAgent:
            provider=provider,
            api_key=api_key,
            base_url=api_base,
-            is_omni=is_omni,
-            deep_thinking=actual_deep_thinking,
-            thinking_budget_tokens=thinking_budget_tokens if actual_deep_thinking else None,
-            support_thinking="thinking" in (capability or []),
            extra_params={
                "temperature": temperature,
                "max_tokens": max_tokens,
-                "streaming": streaming
+                "streaming": streaming  # 使用参数控制流式
            }
        )

@@ -120,14 +80,11 @@ class LangChainAgent:
        if streaming and hasattr(self._underlying_llm, 'streaming'):
            self._underlying_llm.streaming = True

-        # 包装工具以跟踪连续调用次数
-        wrapped_tools = self._wrap_tools_with_tracking(self.tools) if self.tools else None
-
        # 使用 create_agent 创建 agent graph（LangChain 1.x 标准方式）
        # 无论是否有工具，都使用 agent 统一处理
        self.agent = create_agent(
            model=self.llm,
-            tools=wrapped_tools,
+            tools=self.tools if self.tools else None,
            system_prompt=self.system_prompt
        )

@@ -139,92 +96,17 @@ class LangChainAgent:
                "has_api_base": bool(api_base),
                "temperature": temperature,
                "streaming": streaming,
-                "max_iterations": self.max_iterations,
-                "max_tool_consecutive_calls": self.max_tool_consecutive_calls,
                "tool_count": len(self.tools),
                "tool_names": [tool.name for tool in self.tools] if self.tools else [],
-                # "tool_count": len(self.tools)
+                "tool_count": len(self.tools)
            }
        )

-    def _wrap_tools_with_tracking(self, tools: Sequence[BaseTool]) -> List[BaseTool]:
-        """包装工具以跟踪连续调用次数
-        
-        Args:
-            tools: 原始工具列表
-            
-        Returns:
-            List[BaseTool]: 包装后的工具列表
-        """
-        from langchain_core.tools import StructuredTool
-        from functools import wraps
-
-        wrapped_tools = []
-
-        for original_tool in tools:
-            tool_name = original_tool.name
-            original_func = original_tool.func if hasattr(original_tool, 'func') else None
-
-            if not original_func:
-                # 如果无法获取原始函数，直接使用原工具
-                wrapped_tools.append(original_tool)
-                continue
-
-            # 创建包装函数
-            def make_wrapped_func(tool_name, original_func):
-                """创建包装函数的工厂函数，避免闭包问题"""
-
-                @wraps(original_func)
-                def wrapped_func(*args, **kwargs):
-                    """包装后的工具函数，跟踪连续调用次数"""
-                    # 检查是否是连续调用同一个工具
-                    if self.last_tool_called == tool_name:
-                        self.tool_call_counter[tool_name] = self.tool_call_counter.get(tool_name, 0) + 1
-                    else:
-                        # 切换到新工具，重置计数器
-                        self.tool_call_counter[tool_name] = 1
-                        self.last_tool_called = tool_name
-
-                    current_count = self.tool_call_counter[tool_name]
-
-                    logger.debug(
-                        f"工具调用: {tool_name}, 连续调用次数: {current_count}/{self.max_tool_consecutive_calls}"
-                    )
-
-                    # 检查是否超过最大连续调用次数
-                    if current_count > self.max_tool_consecutive_calls:
-                        logger.warning(
-                            f"工具 '{tool_name}' 连续调用次数已达上限 ({self.max_tool_consecutive_calls})，"
-                            f"返回提示信息"
-                        )
-                        return (
-                            f"工具 '{tool_name}' 已连续调用 {self.max_tool_consecutive_calls} 次，"
-                            f"未找到有效结果。请尝试其他方法或直接回答用户的问题。"
-                        )
-
-                    # 调用原始工具函数
-                    return original_func(*args, **kwargs)
-
-                return wrapped_func
-
-            # 使用 StructuredTool 创建新工具
-            wrapped_tool = StructuredTool(
-                name=original_tool.name,
-                description=original_tool.description,
-                func=make_wrapped_func(tool_name, original_func),
-                args_schema=original_tool.args_schema if hasattr(original_tool, 'args_schema') else None
-            )
-
-            wrapped_tools.append(wrapped_tool)
-
-        return wrapped_tools
-
    def _prepare_messages(
-            self,
-            message: str,
-            history: Optional[List[Dict[str, str]]] = None,
-            context: Optional[str] = None,
-            files: Optional[List[Dict[str, Any]]] = None
+        self,
+        message: str,
+        history: Optional[List[Dict[str, str]]] = None,
+        context: Optional[str] = None
    ) -> List[BaseMessage]:
        """准备消息列表

@@ -232,14 +114,14 @@ class LangChainAgent:
            message: 用户消息
            history: 历史消息列表
            context: 上下文信息
-            files: 多模态文件内容列表（已处理）

        Returns:
            List[BaseMessage]: 消息列表
        """
-        messages:list = [SystemMessage(content=self.system_prompt)]
+        messages = []

        # 添加系统提示词
+        messages.append(SystemMessage(content=self.system_prompt))

        # 添加历史消息
        if history:
@@ -254,94 +136,56 @@ class LangChainAgent:
        if context:
            user_content = f"参考信息：\n{context}\n\n用户问题：\n{user_content}"

-        # 构建用户消息（支持多模态）
-        if files and len(files) > 0:
-            content_parts = self._build_multimodal_content(user_content, files)
-            messages.append(HumanMessage(content=content_parts))
-        else:
-            # 纯文本消息
-            messages.append(HumanMessage(content=user_content))
+        messages.append(HumanMessage(content=user_content))

        return messages
+    async def term_memory_save(self,messages,end_user_end,aimessages):
+        '''短长期存储redis，为不影响正常使用6句一段话，存储用户名加一个前缀，当数据存够6条返回给neo4j'''
+        end_user_end=f"Term_{end_user_end}"
+        print(messages)
+        print(aimessages)
+        session_id = store.save_session(
+                        userid=end_user_end,
+                        messages=messages,
+                        apply_id=end_user_end,
+                        group_id=end_user_end,
+                        aimessages=aimessages
+                    )
+        store.delete_duplicate_sessions()
+        # logger.info(f'Redis_Agent:{end_user_end};{session_id}')
+        return session_id
+    async def term_memory_redis_read(self,end_user_end):
+        end_user_end = f"Term_{end_user_end}"
+        history = store.find_user_apply_group(end_user_end, end_user_end, end_user_end)
+        # logger.info(f'Redis_Agent:{end_user_end};{history}')
+        messagss_list=[]
+        for messages in history:
+            query = messages.get("Query")
+            aimessages = messages.get("Answer")
+            messagss_list.append(f'用户:{query}。AI回复:{aimessages}')
+        return messagss_list

-    @staticmethod
-    def _extract_tokens_from_message(msg) -> int:
-        """从 AIMessage 或类似对象中提取 total_tokens，兼容多种 provider 格式

-        支持的格式：
-        - response_metadata.token_usage.total_tokens (OpenAI/ChatOpenAI)
-        - response_metadata.usage.total_tokens (部分 provider)
-        - usage_metadata.total_tokens (LangChain 新版)
-        """
-        total = 0
-        # 1. response_metadata
-        response_meta = getattr(msg, "response_metadata", None)
-        if response_meta and isinstance(response_meta, dict):
-            # 尝试 token_usage 路径
-            token_usage = response_meta.get("token_usage") or response_meta.get("usage", {})
-            if isinstance(token_usage, dict):
-                total = token_usage.get("total_tokens", 0)
-        # 2. usage_metadata（LangChain 新版 AIMessage 属性）
-        if not total:
-            usage_meta = getattr(msg, "usage_metadata", None)
-            if usage_meta:
-                if isinstance(usage_meta, dict):
-                    total = usage_meta.get("total_tokens", 0)
-                else:
-                    total = getattr(usage_meta, "total_tokens", 0)
-        return total or 0
-
-    def _build_multimodal_content(self, text: str, files: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
-        """
-        构建多模态消息内容
-        
-        Args:
-            text: 文本内容
-            files: 文件列表（已由 MultimodalService 处理为对应 provider 的格式）
-            
-        Returns:
-            List[Dict]: 消息内容列表
-        """
-        # 根据 provider 使用不同的文本格式
-        # if (self.provider.lower() in [ModelProvider.BEDROCK, ModelProvider.OPENAI, ModelProvider.XINFERENCE,
-        #                               ModelProvider.GPUSTACK] or (
-        #         self.provider.lower() == ModelProvider.DASHSCOPE and self.is_omni)):
-        #     # Anthropic/Bedrock/Xinference/Gpustack/Openai: {"type": "text", "text": "..."}
-        #     content_parts = [{"type": "text", "text": text}]
-        # else:
-        #     # 通义千问等: {"text": "..."}
-        #     content_parts = [{"type": "text", "text": text}]
-        content_parts = [{"type": "text", "text": text}]
-
-        # 添加文件内容
-        # MultimodalService 已经根据 provider 返回了正确格式，直接使用
-        content_parts.extend(files)
-
-        logger.debug(
-            f"构建多模态消息: provider={self.provider}, "
-            f"parts={len(content_parts)}, "
-            f"files={len(files)}"
-        )
-
-        return content_parts
-
-    @staticmethod
-    def _extract_reasoning_content(msg) -> str:
-        """从 AIMessage 中提取深度思考内容（reasoning_content）
-
-        所有 provider 统一通过 additional_kwargs.reasoning_content 传递：
-        - DeepSeek-R1 / QwQ: 原生字段
-        - Volcano (Doubao-thinking): 由 VolcanoChatOpenAI 从 delta.reasoning_content 注入
-        """
-        additional = getattr(msg, "additional_kwargs", None) or {}
-        return additional.get("reasoning_content") or additional.get("reasoning", "")
+    async def write(self,storage_type,end_user_id,message,user_rag_memory_id,actual_end_user_id,content,actual_config_id):
+        if storage_type == "rag":
+            await write_rag(end_user_id, message, user_rag_memory_id)
+            logger.info(f'RAG_Agent:{end_user_id};{user_rag_memory_id}')
+        else:
+            write_id = write_message_task.delay(actual_end_user_id, content, actual_config_id, storage_type,
+                                                user_rag_memory_id)
+            write_status = get_task_memory_write_result(str(write_id))
+            logger.info(f'Agent:{actual_end_user_id};{write_status}')

    async def chat(
            self,
            message: str,
            history: Optional[List[Dict[str, str]]] = None,
            context: Optional[str] = None,
-            files: Optional[List[Dict[str, Any]]] = None
+            end_user_id: Optional[str] = None,
+            config_id: Optional[str] = None,  # 添加这个参数
+            storage_type: Optional[str] = None,
+            user_rag_memory_id: Optional[str] = None,
+            memory_flag: Optional[bool] = True
    ) -> Dict[str, Any]:
        """执行对话

@@ -349,15 +193,44 @@ class LangChainAgent:
            message: 用户消息
            history: 历史消息列表 [{"role": "user/assistant", "content": "..."}]
            context: 上下文信息（如知识库检索结果）
-            files: 多模态文件

        Returns:
            Dict: 包含 content 和元数据的字典
        """
+        message_chat= message
        start_time = time.time()
+        actual_config_id = config_id
+        # If config_id is None, try to get from end_user's connected config
+        if actual_config_id is None and end_user_id:
+            try:
+                from app.db import get_db
+                from app.services.memory_agent_service import (
+                    get_end_user_connected_config,
+                )
+                db = next(get_db())
+                try:
+                    connected_config = get_end_user_connected_config(end_user_id, db)
+                    actual_config_id = connected_config.get("memory_config_id")
+                except Exception as e:
+                    logger.warning(f"Failed to get connected config for end_user {end_user_id}: {e}")
+                finally:
+                    db.close()
+            except Exception as e:
+                logger.warning(f"Failed to get db session: {e}")
+        actual_end_user_id = end_user_id if end_user_id is not None else "unknown"
+        logger.info(f'写入类型{storage_type,str(end_user_id), message, str(user_rag_memory_id)}')
+        print(f'写入类型{storage_type,str(end_user_id), message, str(user_rag_memory_id)}')
+
+        history_term_memory=await self.term_memory_redis_read(end_user_id)
+        if memory_flag:
+            if len(history_term_memory)>=4 and storage_type != "rag":
+                history_term_memory=';'.join(history_term_memory)
+                logger.info(f'写入短长期：{storage_type, str(end_user_id), history_term_memory, str(user_rag_memory_id)}')
+                await self.write(storage_type,end_user_id,history_term_memory,user_rag_memory_id,actual_end_user_id,history_term_memory,actual_config_id)
+            await self.write(storage_type,end_user_id,message,user_rag_memory_id,actual_end_user_id,message,actual_config_id)
        try:
-            # 准备消息列表（支持多模态）
-            messages = self._prepare_messages(message, history, context, files)
+            # 准备消息列表
+            messages = self._prepare_messages(message, history, context)

            logger.debug(
                "准备调用 LangChain Agent",
@@ -365,84 +238,25 @@ class LangChainAgent:
                    "has_context": bool(context),
                    "has_history": bool(history),
                    "has_tools": bool(self.tools),
-                    "has_files": bool(files),
-                    "message_count": len(messages),
-                    "max_iterations": self.max_iterations
+                    "message_count": len(messages)
                }
            )

            # 统一使用 agent.invoke 调用
-            # 通过 recursion_limit 限制最大迭代次数，防止工具调用死循环
-            try:
-                result = await self.agent.ainvoke(
-                    {"messages": messages},
-                    config={"recursion_limit": self.max_iterations}
-                )
-            except (RecursionError, GraphRecursionError) as e:
-                logger.warning(
-                    f"Agent 达到最大迭代次数限制 ({self.max_iterations})，可能存在工具调用循环",
-                    extra={"error": str(e)}
-                )
-                # 返回一个友好的错误提示
-                return {
-                    "content": f"抱歉，我在处理您的请求时遇到了问题。已达到最大处理步骤限制（{self.max_iterations}次）。请尝试简化您的问题或稍后再试。",
-                    "model": self.model_name,
-                    "elapsed_time": time.time() - start_time,
-                    "usage": {
-                        "prompt_tokens": 0,
-                        "completion_tokens": 0,
-                        "total_tokens": 0
-                    }
-                }
+            result = await self.agent.ainvoke({"messages": messages})

            # 获取最后的 AI 消息
            output_messages = result.get("messages", [])
            content = ""
-
-            logger.debug(f"输出消息数量: {len(output_messages)}")
-            total_tokens = 0
-            reasoning_content = ""
            for msg in reversed(output_messages):
                if isinstance(msg, AIMessage):
-                    logger.debug(f"找到 AI 消息，content 类型: {type(msg.content)}")
-                    logger.debug(f"AI 消息内容: {msg.content}")
-
-                    # 处理多模态响应：content 可能是字符串或列表
-                    if isinstance(msg.content, str):
-                        content = msg.content
-                        logger.debug(f"提取字符串内容，长度: {len(content)}")
-                    elif isinstance(msg.content, list):
-                        # 多模态响应：提取文本部分
-                        logger.debug(f"多模态响应，列表长度: {len(msg.content)}")
-                        text_parts = []
-                        for item in msg.content:
-                            logger.debug(f"处理项: {item}")
-                            if isinstance(item, dict):
-                                # 通义千问格式: {"text": "..."}
-                                if "text" in item:
-                                    text = item.get("text", "")
-                                    text_parts.append(text)
-                                    logger.debug(f"提取文本: {text[:100]}...")
-                                # OpenAI 格式: {"type": "text", "text": "..."}
-                                elif item.get("type") == "text":
-                                    text = item.get("text", "")
-                                    text_parts.append(text)
-                                    logger.debug(f"提取文本: {text[:100]}...")
-                            elif isinstance(item, str):
-                                text_parts.append(item)
-                                logger.debug(f"提取字符串: {item[:100]}...")
-                        content = "".join(text_parts)
-                        logger.debug(f"合并后内容长度: {len(content)}")
-                    else:
-                        content = str(msg.content)
-                        logger.debug(f"转换为字符串: {content[:100]}...")
-                    total_tokens = self._extract_tokens_from_message(msg)
-                    reasoning_content = self._extract_reasoning_content(msg) if self.deep_thinking else ""
+                    content = msg.content
                    break

-            logger.info(f"最终提取的内容长度: {len(content)}")
-
            elapsed_time = time.time() - start_time
+            if memory_flag:
+                await self.write(storage_type,end_user_id,content,user_rag_memory_id,actual_end_user_id,content,actual_config_id)
+                await self.term_memory_save(message_chat,end_user_id,content)
            response = {
                "content": content,
                "model": self.model_name,
@@ -450,11 +264,9 @@ class LangChainAgent:
                "usage": {
                    "prompt_tokens": 0,
                    "completion_tokens": 0,
-                    "total_tokens": total_tokens
+                    "total_tokens": 0
                }
            }
-            if reasoning_content:
-                response["reasoning_content"] = reasoning_content

            logger.debug(
                "Agent 调用完成",
@@ -471,24 +283,25 @@ class LangChainAgent:
            raise

    async def chat_stream(
-            self,
-            message: str,
-            history: Optional[List[Dict[str, str]]] = None,
-            context: Optional[str] = None,
-            files: Optional[List[Dict[str, Any]]] = None
-    ) -> AsyncGenerator[str | int | dict[str, str], None]:
+        self,
+        message: str,
+        history: Optional[List[Dict[str, str]]] = None,
+        context: Optional[str] = None,
+        end_user_id:Optional[str] = None,
+        config_id: Optional[str] = None,
+        storage_type:Optional[str] = None,
+        user_rag_memory_id:Optional[str] = None,
+        memory_flag: Optional[bool] = True
+    ) -> AsyncGenerator[str, None]:
        """执行流式对话

        Args:
            message: 用户消息
            history: 历史消息列表
            context: 上下文信息
-            files: 多模态文件

        Yields:
            str: 消息内容块
-            int: token 统计
-            Dict: 深度思考内容 {"type": "reasoning", "content": "..."}
        """
        logger.info("=" * 80)
        logger.info(" chat_stream 方法开始执行")
@@ -496,129 +309,90 @@ class LangChainAgent:
        logger.info(f"  Has tools: {bool(self.tools)}")
        logger.info(f"  Tool count: {len(self.tools) if self.tools else 0}")
        logger.info("=" * 80)
+        message_chat = message
+        actual_config_id = config_id
+        # If config_id is None, try to get from end_user's connected config
+        if actual_config_id is None and end_user_id:
+            try:
+                from app.db import get_db
+                from app.services.memory_agent_service import (
+                    get_end_user_connected_config,
+                )
+                db = next(get_db())
+                try:
+                    connected_config = get_end_user_connected_config(end_user_id, db)
+                    actual_config_id = connected_config.get("memory_config_id")
+                except Exception as e:
+                    logger.warning(f"Failed to get connected config for end_user {end_user_id}: {e}")
+                finally:
+                    db.close()
+            except Exception as e:
+                logger.warning(f"Failed to get db session: {e}")
+
+        history_term_memory = await self.term_memory_redis_read(end_user_id)
+        if memory_flag:
+            if len(history_term_memory) >= 4 and storage_type != "rag":
+                history_term_memory = ';'.join(history_term_memory)
+                logger.info(
+                    f'写入短长期：{storage_type, str(end_user_id), history_term_memory, str(user_rag_memory_id)}')
+                await self.write(storage_type, end_user_id, history_term_memory, user_rag_memory_id, end_user_id,
+                                 history_term_memory, actual_config_id)
+
+            await self.write(storage_type, end_user_id, message, user_rag_memory_id, end_user_id, message, actual_config_id)
        try:
-            # 准备消息列表（支持多模态）
-            messages = self._prepare_messages(message, history, context, files)
+            # 准备消息列表
+            messages = self._prepare_messages(message, history, context)

            logger.debug(
-                f"准备流式调用，has_tools={bool(self.tools)}, has_files={bool(files)}, message_count={len(messages)}"
+                f"准备流式调用，has_tools={bool(self.tools)}, message_count={len(messages)}"
            )

            chunk_count = 0
+            yielded_content = False

            # 统一使用 agent 的 astream_events 实现流式输出
            logger.debug("使用 Agent astream_events 实现流式输出")
-            full_content = ''
-            full_reasoning = ''
+            full_content=''
            try:
-                last_event = {}
                async for event in self.agent.astream_events(
-                        {"messages": messages},
-                        version="v2",
-                        config={"recursion_limit": self.max_iterations}
+                    {"messages": messages},
+                    version="v2"
                ):
-                    last_event = event
                    chunk_count += 1
                    kind = event.get("event")
-
+                    
                    # 处理所有可能的流式事件
                    if kind == "on_chat_model_stream":
                        # LLM 流式输出
                        chunk = event.get("data", {}).get("chunk")
-                        if chunk and hasattr(chunk, "content"):
-                            # 提取深度思考内容（仅在启用深度思考时）
-                            if self.deep_thinking:
-                                reasoning_chunk = self._extract_reasoning_content(chunk)
-                                if reasoning_chunk:
-                                    full_reasoning += reasoning_chunk
-                                    yield {"type": "reasoning", "content": reasoning_chunk}
-
-                            # 处理多模态响应：content 可能是字符串或列表
-                            chunk_content = chunk.content
-                            if isinstance(chunk_content, str) and chunk_content:
-                                full_content += chunk_content
-                                yield chunk_content
-                            elif isinstance(chunk_content, list):
-                                # 多模态响应：提取文本部分
-                                for item in chunk_content:
-                                    if isinstance(item, dict):
-                                        # 通义千问格式: {"text": "..."}
-                                        if "text" in item:
-                                            text = item.get("text", "")
-                                            if text:
-                                                full_content += text
-                                                yield text
-                                        # OpenAI 格式: {"type": "text", "text": "..."}
-                                        elif item.get("type") == "text":
-                                            text = item.get("text", "")
-                                            if text:
-                                                full_content += text
-                                                yield text
-                                    elif isinstance(item, str):
-                                        full_content += item
-                                        yield item
-
+                        full_content+=chunk.content
+                        if chunk and hasattr(chunk, "content") and chunk.content:
+                            yield chunk.content
+                            yielded_content = True
+                    
                    elif kind == "on_llm_stream":
                        # 另一种 LLM 流式事件
                        chunk = event.get("data", {}).get("chunk")
                        if chunk:
-                            if hasattr(chunk, "content"):
-                                # 提取深度思考内容（仅在启用深度思考时）
-                                if self.deep_thinking:
-                                    reasoning_chunk = self._extract_reasoning_content(chunk)
-                                    if reasoning_chunk:
-                                        full_reasoning += reasoning_chunk
-                                        yield {"type": "reasoning", "content": reasoning_chunk}
-
-                                chunk_content = chunk.content
-                                if isinstance(chunk_content, str) and chunk_content:
-                                    full_content += chunk_content
-                                    yield chunk_content
-                                elif isinstance(chunk_content, list):
-                                    # 多模态响应：提取文本部分
-                                    for item in chunk_content:
-                                        if isinstance(item, dict):
-                                            # 通义千问格式: {"text": "..."}
-                                            if "text" in item:
-                                                text = item.get("text", "")
-                                                if text:
-                                                    full_content += text
-                                                    yield text
-                                            # OpenAI 格式: {"type": "text", "text": "..."}
-                                            elif item.get("type") == "text":
-                                                text = item.get("text", "")
-                                                if text:
-                                                    full_content += text
-                                                    yield text
-                                        elif isinstance(item, str):
-                                            full_content += item
-                                            yield item
+                            if hasattr(chunk, "content") and chunk.content:
+                                full_content+=chunk.content
+                                yield chunk.content
+                                yielded_content = True
                            elif isinstance(chunk, str):
-                                full_content += chunk
                                yield chunk
-
+                                yielded_content = True
+                    
                    # 记录工具调用（可选）
                    elif kind == "on_tool_start":
                        logger.debug(f"工具调用开始: {event.get('name')}")
                    elif kind == "on_tool_end":
                        logger.debug(f"工具调用结束: {event.get('name')}")
-
+                
                logger.debug(f"Agent 流式完成，共 {chunk_count} 个事件")
-                # 统计token消耗
-                output_messages = last_event.get("data", {}).get("output", {}).get("messages", [])
-                for msg in reversed(output_messages):
-                    if isinstance(msg, AIMessage):
-                        stream_total_tokens = self._extract_tokens_from_message(msg)
-                        logger.info(f"流式 token 统计: total_tokens={stream_total_tokens}")
-                        yield stream_total_tokens
-                        break
-
-            except GraphRecursionError:
-                logger.warning(
-                    f"Agent 达到最大迭代次数限制 ({self.max_iterations})，模型可能不支持正确的工具调用停止判断"
-                )
-                if not full_content:
-                    yield "抱歉，我在处理您的请求时遇到了问题（已达最大处理步骤限制）。请尝试简化问题或更换模型后重试。"
+                if memory_flag:
+                    await self.write(storage_type, end_user_id,full_content, user_rag_memory_id, end_user_id,full_content, actual_config_id)
+                    await self.term_memory_save(message_chat, end_user_id, full_content)
+                
            except Exception as e:
                logger.error(f"Agent astream_events 失败: {str(e)}", exc_info=True)
                raise
@@ -632,3 +406,5 @@ class LangChainAgent:
            logger.info("=" * 80)
            logger.info("chat_stream 方法执行结束")
            logger.info("=" * 80)
+
+
--- a/api/app/core/api_key_utils.py
+++ b/api/app/core/api_key_utils.py
@@ -3,7 +3,7 @@ import secrets
 from typing import Optional, Union
 from datetime import datetime

-from app.models.api_key_model import ApiKeyType
+from app.schemas.api_key_schema import ApiKeyType
 from fastapi import Response
 from fastapi.responses import JSONResponse

--- a/api/app/core/config.py
+++ b/api/app/core/config.py
@@ -1,43 +1,23 @@
+import json
 import os
 from pathlib import Path
-from typing import Annotated, Optional
+from typing import Any, Dict, Optional

 from dotenv import load_dotenv
-from pydantic import Field, TypeAdapter

 load_dotenv()

-
 class Settings:
-    # ========================================================================
-    # Deployment Mode Configuration
-    # ========================================================================
-    # community: 社区版（开源，功能受限）
-    # cloud: SaaS 云服务版（全功能，按量计费）
-    # enterprise: 企业私有化版（License 控制）
-    DEPLOYMENT_MODE: str = os.getenv("DEPLOYMENT_MODE", "community")
-
-    # License 配置（企业版）
-    LICENSE_FILE: str = os.getenv("LICENSE_FILE", "/etc/app/license.json")
-    LICENSE_SERVER_URL: str = os.getenv("LICENSE_SERVER_URL", "https://license.yourcompany.com")
-
-    # 计费服务配置（SaaS 版）
-    BILLING_SERVICE_URL: str = os.getenv("BILLING_SERVICE_URL", "")
-
-    # 基础 URL（用于 SSO 回调等）
-    BASE_URL: str = os.getenv("BASE_URL", "http://localhost:8000")
-    FRONTEND_URL: str = os.getenv("FRONTEND_URL", "http://localhost:3000")
-
    ENABLE_SINGLE_WORKSPACE: bool = os.getenv("ENABLE_SINGLE_WORKSPACE", "true").lower() == "true"
    # API Keys Configuration
    OPENAI_API_KEY: str = os.getenv("OPENAI_API_KEY", "")
    DASHSCOPE_API_KEY: str = os.getenv("DASHSCOPE_API_KEY", "")
-
+    
    # Neo4j Configuration (记忆系统数据库)
    NEO4J_URI: str = os.getenv("NEO4J_URI", "bolt://1.94.111.67:7687")
    NEO4J_USERNAME: str = os.getenv("NEO4J_USERNAME", "neo4j")
    NEO4J_PASSWORD: str = os.getenv("NEO4J_PASSWORD", "")
-
+    
    # Database configuration (Postgres)
    DB_HOST: str = os.getenv("DB_HOST", "127.0.0.1")
    DB_PORT: int = int(os.getenv("DB_PORT", "5432"))
@@ -57,7 +37,7 @@ class Settings:
    REDIS_PORT: int = int(os.getenv("REDIS_PORT", "6379"))
    REDIS_DB: int = int(os.getenv("REDIS_DB", "1"))
    REDIS_PASSWORD: str = os.getenv("REDIS_PASSWORD", "")
-
+    
    # ElasticSearch configuration
    ELASTICSEARCH_HOST: str = os.getenv("ELASTICSEARCH_HOST", "https://127.0.0.1")
    ELASTICSEARCH_PORT: int = int(os.getenv("ELASTICSEARCH_PORT", "9200"))
@@ -68,7 +48,7 @@ class Settings:
    ELASTICSEARCH_REQUEST_TIMEOUT: int = int(os.getenv("ELASTICSEARCH_REQUEST_TIMEOUT", "100000"))
    ELASTICSEARCH_RETRY_ON_TIMEOUT: bool = os.getenv("ELASTICSEARCH_RETRY_ON_TIMEOUT", "True").lower() == "true"
    ELASTICSEARCH_MAX_RETRIES: int = int(os.getenv("ELASTICSEARCH_MAX_RETRIES", "10"))
-
+    
    # Xinference configuration
    XINFERENCE_URL: str = os.getenv("XINFERENCE_URL", "http://127.0.0.1")

@@ -77,45 +57,23 @@ class Settings:
    LANGCHAIN_TRACING: bool = os.getenv("LANGCHAIN_TRACING", "false").lower() == "true"
    LANGCHAIN_API_KEY: str = os.getenv("LANGCHAIN_API_KEY", "")
    LANGCHAIN_ENDPOINT: str = os.getenv("LANGCHAIN_ENDPOINT", "")
-
+    
    # LLM Request Configuration
    LLM_TIMEOUT: float = float(os.getenv("LLM_TIMEOUT", "120.0"))
    LLM_MAX_RETRIES: int = int(os.getenv("LLM_MAX_RETRIES", "2"))
-
+    
    # JWT Token Configuration
    SECRET_KEY: str = os.getenv("SECRET_KEY", "a_default_secret_key_that_is_long_and_random")
    ALGORITHM: str = "HS256"
    ACCESS_TOKEN_EXPIRE_MINUTES: int = int(os.getenv("ACCESS_TOKEN_EXPIRE_MINUTES", "30"))
    REFRESH_TOKEN_EXPIRE_DAYS: int = int(os.getenv("REFRESH_TOKEN_EXPIRE_DAYS", "7"))
-
+    
    # Single Sign-On configuration
    ENABLE_SINGLE_SESSION: bool = os.getenv("ENABLE_SINGLE_SESSION", "false").lower() == "true"

-    # SSO 免登配置
-    SSO_TOKEN_EXPIRE_SECONDS: int = int(os.getenv("SSO_TOKEN_EXPIRE_SECONDS", "300"))
-    SSO_TRUSTED_SOURCES_CONFIG: str = os.getenv("SSO_TRUSTED_SOURCES_CONFIG", "{}")
-
    # File Upload
    MAX_FILE_SIZE: int = int(os.getenv("MAX_FILE_SIZE", "52428800"))
-    MAX_FILE_COUNT: int = int(os.getenv("MAX_FILE_COUNT", "20"))
    FILE_PATH: str = os.getenv("FILE_PATH", "/files")
-    FILE_URL_EXPIRES: int = int(os.getenv("FILE_URL_EXPIRES", "3600"))
-
-    # Storage Configuration
-    STORAGE_TYPE: str = os.getenv("STORAGE_TYPE", "local")
-
-    # Aliyun OSS Configuration
-    OSS_ENDPOINT: str = os.getenv("OSS_ENDPOINT", "")
-    OSS_ACCESS_KEY_ID: str = os.getenv("OSS_ACCESS_KEY_ID", "")
-    OSS_ACCESS_KEY_SECRET: str = os.getenv("OSS_ACCESS_KEY_SECRET", "")
-    OSS_BUCKET_NAME: str = os.getenv("OSS_BUCKET_NAME", "")
-
-    # AWS S3 Configuration
-    S3_REGION: str = os.getenv("S3_REGION", "")
-    S3_ACCESS_KEY_ID: str = os.getenv("S3_ACCESS_KEY_ID", "")
-    S3_SECRET_ACCESS_KEY: str = os.getenv("S3_SECRET_ACCESS_KEY", "")
-    S3_BUCKET_NAME: str = os.getenv("S3_BUCKET_NAME", "")
-    S3_ENDPOINT_URL: str = os.getenv("S3_ENDPOINT_URL", "")

    # VOLC ASR settings
    VOLC_APP_KEY: str = os.getenv("VOLC_APP_KEY", "")
@@ -128,20 +86,19 @@ class Settings:
    LANGFUSE_PUBLIC_KEY: str = os.getenv("LANGFUSE_PUBLIC_KEY", "")
    LANGFUSE_SECRET_KEY: str = os.getenv("LANGFUSE_SECRET_KEY", "")
    LANGFUSE_HOST: str = os.getenv("LANGFUSE_HOST", "")
-
+    
    # Server Configuration
    SERVER_IP: str = os.getenv("SERVER_IP", "127.0.0.1")
-    FILE_LOCAL_SERVER_URL: str = os.getenv("FILE_LOCAL_SERVER_URL", "http://localhost:8000/api")

    # ========================================================================
    # Internal Configuration (not in .env, used by application code)
    # ========================================================================
-
+    
    # Superuser settings (internal defaults)
    FIRST_SUPERUSER_EMAIL: str = os.getenv("FIRST_SUPERUSER_EMAIL", "admin@example.com")
    FIRST_SUPERUSER_USERNAME: str = os.getenv("FIRST_SUPERUSER_USERNAME", "admin")
    FIRST_SUPERUSER_PASSWORD: str = os.getenv("FIRST_SUPERUSER_PASSWORD", "admin_password")
-
+    
    # Generic File Upload (internal)
    GENERIC_FILE_PATH: str = os.getenv("GENERIC_FILE_PATH", "/uploads")
    ENABLE_FILE_COMPRESSION: bool = os.getenv("ENABLE_FILE_COMPRESSION", "false").lower() == "true"
@@ -158,49 +115,6 @@ class Settings:
        if origin.strip()
    ]

-    # Language Configuration
-    # Supported values: "zh" (Chinese), "en" (English)
-    # This controls the language used for memory summary titles and other generated content
-    DEFAULT_LANGUAGE: str = os.getenv("DEFAULT_LANGUAGE", "zh")
-
-    # ========================================================================
-    # Internationalization (i18n) Configuration
-    # ========================================================================
-    # Default language for API responses
-    I18N_DEFAULT_LANGUAGE: str = os.getenv("I18N_DEFAULT_LANGUAGE", "zh")
-    
-    # Supported languages (comma-separated)
-    I18N_SUPPORTED_LANGUAGES: list[str] = [
-        lang.strip()
-        for lang in os.getenv("I18N_SUPPORTED_LANGUAGES", "zh,en").split(",")
-        if lang.strip()
-    ]
-    
-    # Core locales directory (community edition)
-    # Use absolute path to work from any working directory
-    I18N_CORE_LOCALES_DIR: str = os.getenv(
-        "I18N_CORE_LOCALES_DIR",
-        os.path.join(os.path.dirname(os.path.dirname(__file__)), "locales")
-    )
-    
-    # Premium locales directory (enterprise edition, optional)
-    I18N_PREMIUM_LOCALES_DIR: Optional[str] = os.getenv("I18N_PREMIUM_LOCALES_DIR", None)
-    
-    # Enable translation cache
-    I18N_ENABLE_TRANSLATION_CACHE: bool = os.getenv("I18N_ENABLE_TRANSLATION_CACHE", "true").lower() == "true"
-    
-    # LRU cache size for hot translations
-    I18N_LRU_CACHE_SIZE: int = int(os.getenv("I18N_LRU_CACHE_SIZE", "1000"))
-    
-    # Enable hot reload of translation files
-    I18N_ENABLE_HOT_RELOAD: bool = os.getenv("I18N_ENABLE_HOT_RELOAD", "false").lower() == "true"
-    
-    # Fallback language when translation is missing
-    I18N_FALLBACK_LANGUAGE: str = os.getenv("I18N_FALLBACK_LANGUAGE", "zh")
-    
-    # Log missing translations
-    I18N_LOG_MISSING_TRANSLATIONS: bool = os.getenv("I18N_LOG_MISSING_TRANSLATIONS", "true").lower() == "true"
-
    # Logging settings
    LOG_LEVEL: str = os.getenv("LOG_LEVEL", "INFO")
    LOG_FORMAT: str = os.getenv("LOG_FORMAT", "%(asctime)s - %(name)s - %(levelname)s - %(message)s")
@@ -209,7 +123,7 @@ class Settings:
    LOG_BACKUP_COUNT: int = int(os.getenv("LOG_BACKUP_COUNT", "5"))
    LOG_TO_CONSOLE: bool = os.getenv("LOG_TO_CONSOLE", "true").lower() == "true"
    LOG_TO_FILE: bool = os.getenv("LOG_TO_FILE", "true").lower() == "true"
-
+    
    # Sensitive Data Filtering
    ENABLE_SENSITIVE_DATA_FILTER: bool = os.getenv("ENABLE_SENSITIVE_DATA_FILTER", "true").lower() == "true"

@@ -228,87 +142,29 @@ class Settings:
    LOG_STREAM_BUFFER_SIZE: int = int(os.getenv("LOG_STREAM_BUFFER_SIZE", "8192"))  # 8KB
    LOG_FILE_MAX_SIZE_MB: int = int(os.getenv("LOG_FILE_MAX_SIZE_MB", "10"))  # 10MB

+
    # Celery configuration (internal)
-    # NOTE: 变量名不以 CELERY_ 开头，避免被 Celery CLI 的前缀匹配机制劫持
-    # 详见 docs/celery-env-bug-report.md
-    # 默认使用 Redis 作为 broker 和 backend，与业务缓存隔离
-    # 如需使用 RabbitMQ，在 .env 中设置 CELERY_BROKER_URL=amqp://user:pass@host:5672/vhost
-    REDIS_DB_CELERY_BROKER: int = int(os.getenv("REDIS_DB_CELERY_BROKER", "3"))
-    REDIS_DB_CELERY_BACKEND: int = int(os.getenv("REDIS_DB_CELERY_BACKEND", "4"))
-
-    # SMTP Email Configuration
-    SMTP_SERVER: str = os.getenv("SMTP_SERVER", "smtp.gmail.com")
-    SMTP_PORT: int = int(os.getenv("SMTP_PORT", "587"))
-    SMTP_USER: str = os.getenv("SMTP_USER", "")
-    SMTP_PASSWORD: str = os.getenv("SMTP_PASSWORD", "")
-
+    CELERY_BROKER: int = int(os.getenv("CELERY_BROKER", "1"))
+    CELERY_BACKEND: int = int(os.getenv("CELERY_BACKEND", "2"))
    REFLECTION_INTERVAL_SECONDS: float = float(os.getenv("REFLECTION_INTERVAL_SECONDS", "300"))
    HEALTH_CHECK_SECONDS: float = float(os.getenv("HEALTH_CHECK_SECONDS", "600"))
-    REFLECTION_INTERVAL_TIME: Optional[str] = int(os.getenv("REFLECTION_INTERVAL_TIME", 30))
-
+    MEMORY_INCREMENT_INTERVAL_HOURS: float = float(os.getenv("MEMORY_INCREMENT_INTERVAL_HOURS", "24"))
+    DEFAULT_WORKSPACE_ID: Optional[str] = os.getenv("DEFAULT_WORKSPACE_ID", None)
+    REFLECTION_INTERVAL_TIME:Optional[str] = int(os.getenv("REFLECTION_INTERVAL_TIME", 30))
+    
    # Memory Cache Regeneration Configuration
    MEMORY_CACHE_REGENERATION_HOURS: int = int(os.getenv("MEMORY_CACHE_REGENERATION_HOURS", "24"))

-    # Celery Beat Schedule Configuration (定时任务执行频率)
-    MEMORY_INCREMENT_HOUR: int = TypeAdapter(
-        Annotated[int, Field(ge=0, le=23, description="cron hour [0, 23]")]
-    ).validate_python(int(os.getenv("MEMORY_INCREMENT_HOUR", "2")))
-    MEMORY_INCREMENT_MINUTE: int = TypeAdapter(
-        Annotated[int, Field(ge=0, le=59, description="cron minute [0, 59]")]
-    ).validate_python(int(os.getenv("MEMORY_INCREMENT_MINUTE", "0")))
-    WORKSPACE_REFLECTION_INTERVAL_SECONDS: int = TypeAdapter(
-        Annotated[int, Field(ge=1, description="reflection interval in seconds, must be >= 1")]
-    ).validate_python(int(os.getenv("WORKSPACE_REFLECTION_INTERVAL_SECONDS", "30")))
-    FORGETTING_CYCLE_INTERVAL_HOURS: int = TypeAdapter(
-        Annotated[int, Field(ge=1, description="forgetting cycle interval in hours, must be >= 1")]
-    ).validate_python(int(os.getenv("FORGETTING_CYCLE_INTERVAL_HOURS", "24")))
-    
-    IMPLICIT_EMOTIONS_UPDATE_HOUR: int = int(os.getenv("IMPLICIT_EMOTIONS_UPDATE_HOUR", "2"))
-    # implicit_emotions_update: 每天几分执行（分钟，0-59）
-    IMPLICIT_EMOTIONS_UPDATE_MINUTE: int = int(os.getenv("IMPLICIT_EMOTIONS_UPDATE_MINUTE", "0"))  
    # Memory Module Configuration (internal)
-    
    MEMORY_OUTPUT_DIR: str = os.getenv("MEMORY_OUTPUT_DIR", "logs/memory-output")
    MEMORY_CONFIG_DIR: str = os.getenv("MEMORY_CONFIG_DIR", "app/core/memory")
-
+    
    # Tool Management Configuration
    TOOL_CONFIG_DIR: str = os.getenv("TOOL_CONFIG_DIR", "app/core/tools")
    TOOL_EXECUTION_TIMEOUT: int = int(os.getenv("TOOL_EXECUTION_TIMEOUT", "60"))
    TOOL_MAX_CONCURRENCY: int = int(os.getenv("TOOL_MAX_CONCURRENCY", "10"))
    ENABLE_TOOL_MANAGEMENT: bool = os.getenv("ENABLE_TOOL_MANAGEMENT", "true").lower() == "true"
-
-    # official environment system version
-    SYSTEM_VERSION: str = os.getenv("SYSTEM_VERSION", "v0.2.1")
-
-    # model square loading
-    LOAD_MODEL: bool = os.getenv("LOAD_MODEL", "false").lower() == "true"
-
-    # workflow config
-    WORKFLOW_IMPORT_CACHE_TIMEOUT: int = int(os.getenv("WORKFLOW_IMPORT_CACHE_TIMEOUT", 1800))
-    WORKFLOW_NODE_TIMEOUT: int = int(os.getenv("WORKFLOW_NODE_TIMEOUT", 600))
-
-    # ========================================================================
-    # General Ontology Type Configuration
-    # ========================================================================
-    # 通用本体文件路径列表（逗号分隔）
-    GENERAL_ONTOLOGY_FILES: str = os.getenv("GENERAL_ONTOLOGY_FILES", "api/app/core/memory/ontology_services/General_purpose_entity.ttl")
-
-    # 是否启用通用本体类型功能
-    ENABLE_GENERAL_ONTOLOGY_TYPES: bool = os.getenv("ENABLE_GENERAL_ONTOLOGY_TYPES", "true").lower() == "true"
-
-    # Prompt 中最大类型数量
-    MAX_ONTOLOGY_TYPES_IN_PROMPT: int = int(os.getenv("MAX_ONTOLOGY_TYPES_IN_PROMPT", "50"))
-
-    # 核心通用类型列表（逗号分隔）
-    CORE_GENERAL_TYPES: str = os.getenv(
-        "CORE_GENERAL_TYPES",
-        "Person,Organization,Company,GovernmentAgency,Place,Location,City,Country,Building,"
-        "Event,SportsEvent,SocialEvent,Work,Book,Film,Software,Concept,TopicalConcept,AcademicSubject"
-    )
-
-    # 实验模式开关（允许通过 API 动态切换本体配置）
-    ONTOLOGY_EXPERIMENT_MODE: bool = os.getenv("ONTOLOGY_EXPERIMENT_MODE", "true").lower() == "true"
-
+    
    def get_memory_output_path(self, filename: str = "") -> str:
        """
        Get the full path for memory module output files.
@@ -323,7 +179,7 @@ class Settings:
        if filename:
            return str(base_path / filename)
        return str(base_path)
-
+    
    def ensure_memory_output_dir(self) -> None:
        """
        Ensure the memory output directory exists.
--- a/api/app/core/error_codes.py
+++ b/api/app/core/error_codes.py
@@ -19,7 +19,6 @@ class BizCode(IntEnum):
    TENANT_NOT_FOUND = 3002
    WORKSPACE_NO_ACCESS = 3003
    WORKSPACE_INVITE_NOT_FOUND = 3004
-    WORKSPACE_ACCESS_DENIED = 3005
    # API Key 管理（3xxx）
    API_KEY_NOT_FOUND = 3007
    API_KEY_DUPLICATE_NAME = 3008
@@ -41,14 +40,12 @@ class BizCode(IntEnum):
    FILE_NOT_FOUND = 4006
    APP_NOT_FOUND = 4007
    RELEASE_NOT_FOUND = 4008
-    USER_NO_ACCESS = 4009

    # 冲突/状态（5xxx）
    DUPLICATE_NAME = 5001
    RESOURCE_ALREADY_EXISTS = 5002
    VERSION_ALREADY_EXISTS = 5003
    STATE_CONFLICT = 5004
-    RESOURCE_IN_USE = 5005

    # 应用发布（6xxx）
    PUBLISH_FAILED = 6001
@@ -85,13 +82,6 @@ class BizCode(IntEnum):
    MEMORY_WRITE_FAILED = 9501
    MEMORY_READ_FAILED = 9502
    MEMORY_CONFIG_NOT_FOUND = 9503
-    
-    # Implicit Memory API（96xx）
-    INVALID_USER_ID = 9601
-    INSUFFICIENT_DATA = 9602
-    INVALID_FILTER_PARAMS = 9603
-    ANALYSIS_FAILED = 9604
-    PROFILE_STORAGE_ERROR = 9605

    # 系统（100xx）
    INTERNAL_ERROR = 10001
@@ -113,28 +103,24 @@ HTTP_MAPPING = {
    BizCode.TOKEN_EXPIRED: 401,
    BizCode.TOKEN_BLACKLISTED: 401,
    BizCode.FORBIDDEN: 403,
-    BizCode.TENANT_NOT_FOUND: 400,
+    BizCode.TENANT_NOT_FOUND: 404,
    BizCode.WORKSPACE_NO_ACCESS: 403,
-    BizCode.WORKSPACE_INVITE_NOT_FOUND: 400,
-    BizCode.WORKSPACE_ACCESS_DENIED: 403,
-    BizCode.NOT_FOUND: 400,
+    BizCode.NOT_FOUND: 404,
    BizCode.USER_NOT_FOUND: 200,
-    BizCode.USER_NO_ACCESS: 401,
-    BizCode.WORKSPACE_NOT_FOUND: 400,
-    BizCode.MODEL_NOT_FOUND: 400,
-    BizCode.KNOWLEDGE_NOT_FOUND: 400,
-    BizCode.DOCUMENT_NOT_FOUND: 400,
-    BizCode.FILE_NOT_FOUND: 400,
-    BizCode.APP_NOT_FOUND: 400,
-    BizCode.RELEASE_NOT_FOUND: 400,
+    BizCode.WORKSPACE_NOT_FOUND: 404,
+    BizCode.MODEL_NOT_FOUND: 404,
+    BizCode.KNOWLEDGE_NOT_FOUND: 404,
+    BizCode.DOCUMENT_NOT_FOUND: 404,
+    BizCode.FILE_NOT_FOUND: 404,
+    BizCode.APP_NOT_FOUND: 404,
+    BizCode.RELEASE_NOT_FOUND: 404,
    BizCode.DUPLICATE_NAME: 409,
    BizCode.RESOURCE_ALREADY_EXISTS: 409,
    BizCode.VERSION_ALREADY_EXISTS: 409,
    BizCode.STATE_CONFLICT: 409,
-    BizCode.RESOURCE_IN_USE: 409,
    BizCode.PUBLISH_FAILED: 500,
    BizCode.NO_DRAFT_TO_PUBLISH: 400,
-    BizCode.ROLLBACK_TARGET_NOT_FOUND: 400,
+    BizCode.ROLLBACK_TARGET_NOT_FOUND: 404,
    BizCode.APP_TYPE_NOT_SUPPORTED: 400,
    BizCode.AGENT_CONFIG_MISSING: 400,
    BizCode.SHARE_DISABLED: 403,
@@ -173,13 +159,6 @@ HTTP_MAPPING = {
    BizCode.MEMORY_READ_FAILED: 500,
    BizCode.MEMORY_CONFIG_NOT_FOUND: 400,
    
-    # Implicit Memory API 错误码映射
-    BizCode.INVALID_USER_ID: 400,
-    BizCode.INSUFFICIENT_DATA: 400,
-    BizCode.INVALID_FILTER_PARAMS: 400,
-    BizCode.ANALYSIS_FAILED: 500,
-    BizCode.PROFILE_STORAGE_ERROR: 500,
-    
    BizCode.INTERNAL_ERROR: 500,
    BizCode.DB_ERROR: 500,
    BizCode.SERVICE_UNAVAILABLE: 503,
--- a/api/app/core/language_utils.py
+++ b/api/app/core/language_utils.py
@@ -1,82 +0,0 @@
-# -*- coding: utf-8 -*-
-"""语言处理工具模块
-
-本模块提供集中化的语言校验和处理功能，确保整个应用中语言参数的一致性。
-
-Functions:
-    validate_language: 校验语言参数，确保其为有效值
-    get_language_from_header: 从请求头获取并校验语言参数
-"""
-
-from typing import Optional
-
-from app.core.logging_config import get_logger
-
-logger = get_logger(__name__)
-
-# 支持的语言列表
-SUPPORTED_LANGUAGES = {"zh", "en"}
-
-# 默认回退语言
-DEFAULT_LANGUAGE = "zh"
-
-
-def validate_language(language: Optional[str]) -> str:
-    """
-    校验语言参数，确保其为有效值。
-    
-    Args:
-        language: 待校验的语言代码，可以是 None、"zh"、"en" 或其他值
-        
-    Returns:
-        有效的语言代码（"zh" 或 "en"）
-        
-    Examples:
-        >>> validate_language("zh")
-        'zh'
-        >>> validate_language("en")
-        'en'
-        >>> validate_language("EN")  # 大小写不敏感
-        'en'
-        >>> validate_language(None)  # None 回退到默认值
-        'zh'
-        >>> validate_language("fr")  # 不支持的语言回退到默认值
-        'zh'
-    """
-    if language is None:
-        return DEFAULT_LANGUAGE
-    
-    # 标准化：转小写并去除空白
-    lang = str(language).lower().strip()
-    
-    if lang in SUPPORTED_LANGUAGES:
-        return lang
-    
-    logger.warning(
-        f"无效的语言参数 '{language}'，已回退到默认值 '{DEFAULT_LANGUAGE}'。"
-        f"支持的语言: {SUPPORTED_LANGUAGES}"
-    )
-    return DEFAULT_LANGUAGE
-
-
-def get_language_from_header(language_type: Optional[str]) -> str:
-    """
-    从请求头获取并校验语言参数。
-    
-    这是一个便捷函数，用于在 controller 层统一处理 X-Language-Type Header。
-    
-    Args:
-        language_type: 从 X-Language-Type Header 获取的语言值
-        
-    Returns:
-        有效的语言代码（"zh" 或 "en"）
-        
-    Examples:
-        >>> get_language_from_header(None)  # Header 未传递
-        'zh'
-        >>> get_language_from_header("en")
-        'en'
-        >>> get_language_from_header("invalid")  # 无效值回退
-        'zh'
-    """
-    return validate_language(language_type)
--- a/api/app/core/logging_config.py
+++ b/api/app/core/logging_config.py
@@ -38,56 +38,6 @@ class SensitiveDataLoggingFilter(logging.Filter):
        return True


-class Neo4jSuccessNotificationFilter(logging.Filter):
-    """Neo4j 日志过滤器：过滤成功/信息性状态的通知，保留真正的警告和错误
-    
-    Neo4j 驱动会以 WARNING 级别记录所有数据库通知，包括成功的操作。
-    这个过滤器会过滤掉以下 GQL 状态码的通知，只保留真正的警告和错误：
-      - 00000: 成功完成 (successful completion)
-      - 00N00: 无数据 (no data)
-      - 00NA0: 无数据，信息性通知 (no data, informational notification)
-    
-    使用正则表达式进行更严格的匹配，避免误过滤无关的警告。
-    """
-    
-    import re
-    
-    # 编译正则表达式以提高性能
-    # 匹配所有"成功/信息性"的 GQL 状态码：
-    # 00000 = 成功完成, 00N00 = 无数据, 00NA0 = 无数据信息性通知
-    GQL_STATUS_PATTERN = re.compile(r"gql_status=['\"](00000|00N00|00NA0)['\"]")
-    
-    # 匹配 status_description 中的成功完成或信息性通知消息
-    SUCCESS_DESC_PATTERN = re.compile(r"status_description=['\"]note:\s*(successful\s+completion|no\s+data)['\"]", re.IGNORECASE)
-    
-    def filter(self, record: logging.LogRecord) -> bool:
-        """
-        过滤 Neo4j 成功通知
-        
-        Args:
-            record: 日志记录
-            
-        Returns:
-            True表示允许记录，False表示拒绝（过滤掉）
-        """
-        # 只处理 INFO 和 WARNING 级别的日志
-        # Neo4j 驱动对 severity='INFORMATION' 的通知使用 INFO 级别，
-        # 对 severity='WARNING' 的通知使用 WARNING 级别
-        if record.levelno not in (logging.INFO, logging.WARNING):
-            return True
-        
-        # 检查是否是 Neo4j 的成功通知
-        message = str(record.msg)
-        
-        # 使用正则表达式进行更严格的匹配
-        # 这样可以避免误过滤包含这些子字符串但不是 Neo4j 通知的日志
-        if self.GQL_STATUS_PATTERN.search(message) or self.SUCCESS_DESC_PATTERN.search(message):
-            return False  # 过滤掉这条日志
-        
-        # 保留其他所有日志（包括真正的警告和错误）
-        return True
-
-
 class LoggingConfig:
    """全局日志配置类"""
    
@@ -115,22 +65,6 @@ class LoggingConfig:
        # 清除现有处理器
        root_logger.handlers.clear()
        
-        # Neo4j 通知过滤器 - 挂在 handler 上确保所有传播上来的日志都能被过滤
-        neo4j_filter = Neo4jSuccessNotificationFilter()
-        
-        # 抑制 Neo4j 通知日志
-        # Neo4j 驱动内部会给 neo4j.notifications logger 配置自己的 handler，
-        # 导致日志绕过根 logger 的 filter 直接输出。
-        # 多管齐下确保过滤生效：
-        # 1. 设置 neo4j.notifications 级别为 WARNING（过滤 INFO 级别的 00NA0 通知）
-        # 2. 在所有 neo4j logger 上添加 filter（过滤 WARNING 级别的成功通知）
-        # 3. 在根 handler 上也添加 filter（兜底）
-        neo4j_notifications_logger = logging.getLogger("neo4j.notifications")
-        neo4j_notifications_logger.setLevel(logging.WARNING)
-        for neo4j_logger_name in ["neo4j", "neo4j.io", "neo4j.pool", "neo4j.notifications"]:
-            neo4j_logger = logging.getLogger(neo4j_logger_name)
-            neo4j_logger.addFilter(neo4j_filter)
-        
        # 创建格式化器
        formatter = logging.Formatter(
            fmt=settings.LOG_FORMAT,
@@ -146,7 +80,6 @@ class LoggingConfig:
            console_handler.setFormatter(formatter)
            console_handler.setLevel(getattr(logging, settings.LOG_LEVEL.upper()))
            console_handler.addFilter(sensitive_filter)
-            console_handler.addFilter(neo4j_filter)
            root_logger.addHandler(console_handler)
        
        # 文件处理器（带轮转）
@@ -160,7 +93,6 @@ class LoggingConfig:
            file_handler.setFormatter(formatter)
            file_handler.setLevel(getattr(logging, settings.LOG_LEVEL.upper()))
            file_handler.addFilter(sensitive_filter)
-            file_handler.addFilter(neo4j_filter)
            root_logger.addHandler(file_handler)
        
        cls._initialized = True
@@ -529,9 +461,8 @@ def log_time(step_name: str, duration: float, log_file: str = "logs/time.log") -
        # Fallback to console only if file write fails
        print(f"Warning: Could not write to timing log: {e}")
    
-    # Always log at INFO level (avoids Celery treating stdout as WARNING)
-    _timing_logger = logging.getLogger(__name__)
-    _timing_logger.info(f"✓ {step_name}: {duration:.2f}s")
+    # Always print to console (backward compatible behavior)
+    print(f"✓ {step_name}: {duration:.2f}s")


 def get_agent_logger(name: str = "agent_service", 
--- a/api/app/core/memory/agent/init.py
+++ b/api/app/core/memory/agent/init.py
--- a/api/app/core/memory/agent/langgraph_graph/init.py
+++ b/api/app/core/memory/agent/langgraph_graph/init.py
@@ -0,0 +1,16 @@
+"""
+LangGraph Graph package for memory agent.
+
+This package provides the LangGraph workflow orchestrator with modular
+node implementations, routing logic, and state management.
+
+Package structure:
+- read_graph: Main graph factory for read operations
+- write_graph: Main graph factory for write operations
+- nodes: LangGraph node implementations
+- routing: State routing logic
+- state: State management utilities
+"""
+from app.core.memory.agent.langgraph_graph.read_graph import make_read_graph
+
+__all__ = ['make_read_graph']
--- a/api/app/core/memory/agent/langgraph_graph/nodes/init.py
+++ b/api/app/core/memory/agent/langgraph_graph/nodes/init.py
@@ -4,7 +4,7 @@ LangGraph node implementations.
 This module contains custom node implementations for the LangGraph workflow.
 """

-# from app.core.memory.agent.langgraph_graph.nodes.tool_node import ToolExecutionNode
-# from app.core.memory.agent.langgraph_graph.nodes.input_node import create_input_message
-#
-# __all__ = ["ToolExecutionNode", "create_input_message"]
+from app.core.memory.agent.langgraph_graph.nodes.tool_node import ToolExecutionNode
+from app.core.memory.agent.langgraph_graph.nodes.input_node import create_input_message
+
+__all__ = ["ToolExecutionNode", "create_input_message"]
--- a/api/app/core/memory/agent/langgraph_graph/nodes/data_nodes.py
+++ b/api/app/core/memory/agent/langgraph_graph/nodes/data_nodes.py
@@ -1,45 +0,0 @@
-from app.core.memory.agent.utils.llm_tools import ReadState, WriteState
-from app.schemas.memory_agent_schema import AgentMemoryDataset
-
-
-def content_input_node(state: ReadState) -> ReadState:
-    """
-    Start node - Extract content and maintain state information
-
-    Extracts the content from the first message in the state and returns it
-    as the data field while preserving all other state information.
-
-    Args:
-        state: ReadState containing messages and other state data
-
-    Returns:
-        ReadState: Updated state with extracted content in data field
-    """
-
-    content = state['messages'][0].content if state.get('messages') else ''
-    # Return content and maintain all state information
-    for pronoun in AgentMemoryDataset.PRONOUN:
-        content = content.replace(pronoun, AgentMemoryDataset.NAME)
-
-    return {"data": content}
-
-
-def content_input_write(state: WriteState) -> WriteState:
-    """
-    Start node - Extract content and maintain state information for write operations
-
-    Extracts the content from the first message in the state for write operations.
-
-    Args:
-        state: WriteState containing messages and other state data
-
-    Returns:
-        WriteState: Updated state with extracted content in data field
-    """
-
-    content = state['messages'][0].content if state.get('messages') else ''
-    # Return content and maintain all state information
-    for pronoun in AgentMemoryDataset.PRONOUN:
-        content = content.replace(pronoun, AgentMemoryDataset.NAME)
-
-    return {"data": content}
--- a/api/app/core/memory/agent/langgraph_graph/nodes/input_node.py
+++ b/api/app/core/memory/agent/langgraph_graph/nodes/input_node.py
@@ -0,0 +1,150 @@
+"""
+Input node for LangGraph workflow entry point.
+
+This module provides the create_input_message function which processes initial
+user input with multimodal support and creates the first tool call message.
+"""
+
+import logging
+import re
+import uuid
+from datetime import datetime
+from typing import Any, Dict
+
+from app.core.memory.agent.utils.multimodal import MultimodalProcessor
+from app.schemas.memory_config_schema import MemoryConfig
+from langchain_core.messages import AIMessage
+
+logger = logging.getLogger(__name__)
+
+
+async def create_input_message(
+    state: Dict[str, Any],
+    tool_name: str,
+    session_id: str,
+    search_switch: str,
+    apply_id: str,
+    group_id: str,
+    multimodal_processor: MultimodalProcessor,
+    memory_config: MemoryConfig,
+) -> Dict[str, Any]:
+    """
+    Create initial tool call message from user input.
+    
+    This function:
+    1. Extracts the last message content from state
+    2. Processes multimodal inputs (images/audio) using the multimodal processor
+    3. Generates a unique message ID
+    4. Extracts namespace from session_id
+    5. Handles verified_data extraction for backward compatibility
+    6. Returns AIMessage with complete tool_calls structure
+    
+    Args:
+        state: LangGraph state dictionary containing messages
+        tool_name: Name of the tool to invoke (typically "Split_The_Problem")
+        session_id: Session identifier (format: "call_id_{namespace}")
+        search_switch: Search routing parameter
+        apply_id: Application identifier
+        group_id: Group identifier
+        multimodal_processor: Processor for handling image/audio inputs
+        memory_config: MemoryConfig object containing all configuration
+        
+    Returns:
+        State update with AIMessage containing tool_call
+        
+    Examples:
+        >>> state = {"messages": [HumanMessage(content="What is AI?")]}
+        >>> result = await create_input_message(
+        ...     state, "Split_The_Problem", "call_id_user123", "0", "app1", "group1", processor, config
+        ... )
+        >>> result["messages"][0].tool_calls[0]["name"]
+        'Split_The_Problem'
+    """
+    messages = state.get("messages", [])
+    
+    # Extract last message content
+    if messages:
+        last_message = messages[-1].content if hasattr(messages[-1], 'content') else str(messages[-1])
+    else:
+        logger.warning("[create_input_message] No messages in state, using empty string")
+        last_message = ""
+    
+    logger.debug(f"[create_input_message] Original input: {last_message[:100]}...")
+    
+    # Process multimodal input (images/audio)
+    try:
+        processed_content = await multimodal_processor.process_input(last_message)
+        if processed_content != last_message:
+            logger.info(
+                f"[create_input_message] Multimodal processing converted input "
+                f"from {len(last_message)} to {len(processed_content)} chars"
+            )
+        last_message = processed_content
+    except Exception as e:
+        logger.error(
+            f"[create_input_message] Multimodal processing failed: {e}",
+            exc_info=True
+        )
+        # Continue with original content
+    
+    # Generate unique message ID
+    uuid_str = uuid.uuid4()
+    time_str = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
+    
+    # Extract namespace from session_id
+    # Expected format: "call_id_{namespace}" or similar
+    try:
+        namespace = str(session_id).split('_id_')[1]
+    except (IndexError, AttributeError):
+        logger.warning(
+            f"[create_input_message] Could not extract namespace from session_id: {session_id}"
+        )
+        namespace = "unknown"
+    
+    # Handle verified_data extraction (backward compatibility)
+    # This regex-based extraction is kept for compatibility with existing data formats
+    if 'verified_data' in str(last_message):
+        try:
+            messages_last = str(last_message).replace('\\n', '').replace('\\', '')
+            query_match = re.findall(r'"query": "(.*?)",', messages_last)
+            if query_match:
+                last_message = query_match[0]
+                logger.debug(
+                    f"[create_input_message] Extracted query from verified_data: {last_message}"
+                )
+        except Exception as e:
+            logger.warning(
+                f"[create_input_message] Failed to extract query from verified_data: {e}"
+            )
+    
+    # Construct tool call message
+    tool_call_id = f"{session_id}_{uuid_str}"
+    
+    logger.info(
+        f"[create_input_message] Creating tool call for '{tool_name}' "
+        f"with ID: {tool_call_id}"
+    )
+    
+    # Build tool arguments
+    tool_args = {
+        "sentence": last_message,
+        "sessionid": session_id,
+        "messages_id": str(uuid_str),
+        "search_switch": search_switch,
+        "apply_id": apply_id,
+        "group_id": group_id,
+        "memory_config": memory_config,
+    }
+    
+    return {
+        "messages": [
+            AIMessage(
+                content="",
+                tool_calls=[{
+                    "name": tool_name,
+                    "args": tool_args,
+                    "id": tool_call_id
+                }]
+            )
+        ]
+    }
--- a/api/app/core/memory/agent/langgraph_graph/nodes/perceptual_retrieve_node.py
+++ b/api/app/core/memory/agent/langgraph_graph/nodes/perceptual_retrieve_node.py
@@ -1,408 +0,0 @@
-"""
-Perceptual Memory Retrieval Node & Service
-
-Provides PerceptualSearchService for searching perceptual memories (vision, audio,
-text, conversation) from Neo4j using keyword fulltext + embedding semantic search
-with BM25+embedding fusion reranking.
-
-Also provides the perceptual_retrieve_node for use as a LangGraph node.
-"""
-import asyncio
-import math
-from typing import List, Dict, Any, Optional
-
-from app.core.logging_config import get_agent_logger
-from app.core.memory.agent.utils.llm_tools import ReadState
-from app.core.memory.utils.data.text_utils import escape_lucene_query
-from app.repositories.neo4j.graph_search import (
-    search_perceptual,
-    search_perceptual_by_embedding,
-)
-from app.repositories.neo4j.neo4j_connector import Neo4jConnector
-
-logger = get_agent_logger(__name__)
-
-
-class PerceptualSearchService:
-    """
-    感知记忆检索服务。
-
-    封装关键词全文检索 + 向量语义检索 + BM25/embedding 融合排序的完整流程。
-    调用方只需提供 query / keywords、end_user_id、memory_config，即可获得
-    格式化并排序后的感知记忆列表和拼接文本。
-
-    Usage:
-        service = PerceptualSearchService(end_user_id=..., memory_config=...)
-        results = await service.search(query="...", keywords=[...], limit=10)
-        # results = {"memories": [...], "content": "...", "keyword_raw": N, "embedding_raw": M}
-    """
-
-    DEFAULT_ALPHA = 0.6
-    DEFAULT_CONTENT_SCORE_THRESHOLD = 0.5
-
-    def __init__(
-            self,
-            end_user_id: str,
-            memory_config: Any,
-            alpha: float = DEFAULT_ALPHA,
-            content_score_threshold: float = DEFAULT_CONTENT_SCORE_THRESHOLD,
-    ):
-        self.end_user_id = end_user_id
-        self.memory_config = memory_config
-        self.alpha = alpha
-        self.content_score_threshold = content_score_threshold
-
-    async def search(
-            self,
-            query: str,
-            keywords: Optional[List[str]] = None,
-            limit: int = 10,
-    ) -> Dict[str, Any]:
-        """
-        执行感知记忆检索（关键词 + 向量并行），融合排序后返回结果。
-
-        对 embedding 命中但 keyword 未命中的结果，补查全文索引获取 BM25 分数，
-        确保所有结果都同时具备 BM25 和 embedding 两个维度的评分。
-
-        Args:
-            query: 原始用户查询（用于向量检索和 BM25 补查）
-            keywords: 关键词列表（用于全文检索），为 None 时使用 [query]
-            limit: 最大返回数量
-
-        Returns:
-            {
-                "memories": [格式化后的记忆 dict, ...],
-                "content": "拼接的纯文本摘要",
-                "keyword_raw": int,
-                "embedding_raw": int,
-            }
-        """
-        if keywords is None:
-            keywords = [query] if query else []
-
-        connector = Neo4jConnector()
-        try:
-            kw_task = self._keyword_search(connector, keywords, limit)
-            emb_task = self._embedding_search(connector, query, limit)
-
-            kw_results, emb_results = await asyncio.gather(
-                kw_task, emb_task, return_exceptions=True
-            )
-            if isinstance(kw_results, Exception):
-                logger.warning(f"[PerceptualSearch] keyword search error: {kw_results}")
-                kw_results = []
-            if isinstance(emb_results, Exception):
-                logger.warning(f"[PerceptualSearch] embedding search error: {emb_results}")
-                emb_results = []
-
-            # 补查 BM25：找出 embedding 命中但 keyword 未命中的 id，
-            # 用原始 query 对这些节点补查全文索引拿 BM25 score
-            kw_ids = {r.get("id") for r in kw_results if r.get("id")}
-            emb_only_ids = {r.get("id") for r in emb_results if r.get("id") and r.get("id") not in kw_ids}
-
-            if emb_only_ids and query:
-                backfill = await self._bm25_backfill(connector, query, emb_only_ids, limit)
-                # 把补查到的 BM25 score 注入到 embedding 结果中
-                backfill_map = {r["id"]: r.get("score", 0) for r in backfill}
-                for r in emb_results:
-                    rid = r.get("id", "")
-                    if rid in backfill_map:
-                        r["bm25_backfill_score"] = backfill_map[rid]
-                logger.info(
-                    f"[PerceptualSearch] BM25 backfill: {len(emb_only_ids)} embedding-only ids, "
-                    f"{len(backfill_map)} got BM25 scores"
-                )
-
-            reranked = self._rerank(kw_results, emb_results, limit)
-
-            memories = []
-            content_parts = []
-            for record in reranked:
-                fmt = self._format_result(record)
-                fmt["score"] = round(record.get("content_score", 0), 4)
-                memories.append(fmt)
-                content_parts.append(self._build_content_text(fmt))
-
-            logger.info(
-                f"[PerceptualSearch] {len(memories)} results after rerank "
-                f"(keyword_raw={len(kw_results)}, embedding_raw={len(emb_results)})"
-            )
-            return {
-                "memories": memories,
-                "content": "\n\n".join(content_parts),
-                "keyword_raw": len(kw_results),
-                "embedding_raw": len(emb_results),
-            }
-        finally:
-            await connector.close()
-
-    async def _bm25_backfill(
-            self,
-            connector: Neo4jConnector,
-            query: str,
-            target_ids: set,
-            limit: int,
-    ) -> List[dict]:
-        """
-        对指定 id 集合补查全文索引 BM25 score。
-
-        用原始 query 查全文索引，只保留 id 在 target_ids 中的结果。
-        """
-        escaped = escape_lucene_query(query)
-        if not escaped.strip():
-            return []
-        try:
-            r = await search_perceptual(
-                connector=connector, query=escaped,
-                end_user_id=self.end_user_id,
-                limit=limit * 5,  # 多查一些以提高命中率
-            )
-            all_hits = r.get("perceptuals", [])
-            return [h for h in all_hits if h.get("id") in target_ids]
-        except Exception as e:
-            logger.warning(f"[PerceptualSearch] BM25 backfill failed: {e}")
-            return []
-
-    async def _keyword_search(
-            self,
-            connector: Neo4jConnector,
-            keywords: List[str],
-            limit: int,
-    ) -> List[dict]:
-        """并发对每个关键词做全文检索，去重后按 score 降序返回 top N 原始结果。"""
-        seen_ids: set = set()
-        all_results: List[dict] = []
-
-        async def _one(kw: str):
-            escaped = escape_lucene_query(kw)
-            if not escaped.strip():
-                return []
-            r = await search_perceptual(
-                connector=connector, query=escaped,
-                end_user_id=self.end_user_id, limit=limit,
-            )
-            return r.get("perceptuals", [])
-
-        tasks = [_one(kw) for kw in keywords[:10]]
-        batch = await asyncio.gather(*tasks, return_exceptions=True)
-
-        for result in batch:
-            if isinstance(result, Exception):
-                logger.warning(f"[PerceptualSearch] keyword sub-query error: {result}")
-                continue
-            for rec in result:
-                rid = rec.get("id", "")
-                if rid and rid not in seen_ids:
-                    seen_ids.add(rid)
-                    all_results.append(rec)
-
-        all_results.sort(key=lambda x: float(x.get("score", 0)), reverse=True)
-        return all_results[:limit]
-
-    async def _embedding_search(
-            self,
-            connector: Neo4jConnector,
-            query_text: str,
-            limit: int,
-    ) -> List[dict]:
-        """向量语义检索，返回原始结果（不做阈值过滤）。"""
-        try:
-            from app.core.memory.llm_tools.openai_embedder import OpenAIEmbedderClient
-            from app.core.models.base import RedBearModelConfig
-            from app.db import get_db_context
-            from app.services.memory_config_service import MemoryConfigService
-
-            with get_db_context() as db:
-                cfg = MemoryConfigService(db).get_embedder_config(
-                    str(self.memory_config.embedding_model_id)
-                )
-            client = OpenAIEmbedderClient(RedBearModelConfig(**cfg))
-
-            r = await search_perceptual_by_embedding(
-                connector=connector, embedder_client=client,
-                query_text=query_text, end_user_id=self.end_user_id,
-                limit=limit,
-            )
-            return r.get("perceptuals", [])
-        except Exception as e:
-            logger.warning(f"[PerceptualSearch] embedding search failed: {e}")
-            return []
-
-    def _rerank(
-            self,
-            keyword_results: List[dict],
-            embedding_results: List[dict],
-            limit: int,
-    ) -> List[dict]:
-        """BM25 + embedding 融合排序。
-
-        对 embedding 结果中带有 bm25_backfill_score 的条目，
-        将其与 keyword 结果合并后统一归一化，确保 BM25 分数在同一尺度上。
-        """
-        # 把补查的 BM25 score 合并到 keyword_results 中统一归一化
-        emb_backfill_items = []
-        for item in embedding_results:
-            backfill_score = item.get("bm25_backfill_score")
-            if backfill_score is not None and item.get("id"):
-                emb_backfill_items.append({"id": item["id"], "score": backfill_score})
-
-        # 合并后统一归一化 BM25 scores
-        all_bm25_items = keyword_results + emb_backfill_items
-        all_bm25_items = self._normalize_scores(all_bm25_items)
-
-        # 建立 id -> normalized BM25 score 的映射
-        bm25_norm_map: Dict[str, float] = {}
-        for item in all_bm25_items:
-            item_id = item.get("id", "")
-            if item_id:
-                bm25_norm_map[item_id] = float(item.get("normalized_score", 0))
-
-        # 归一化 embedding scores
-        embedding_results = self._normalize_scores(embedding_results)
-
-        # 合并
-        combined: Dict[str, dict] = {}
-        for item in keyword_results:
-            item_id = item.get("id", "")
-            if not item_id:
-                continue
-            combined[item_id] = item.copy()
-            combined[item_id]["bm25_score"] = bm25_norm_map.get(item_id, 0)
-            combined[item_id]["embedding_score"] = 0.0
-
-        for item in embedding_results:
-            item_id = item.get("id", "")
-            if not item_id:
-                continue
-            if item_id in combined:
-                combined[item_id]["embedding_score"] = item.get("normalized_score", 0)
-            else:
-                combined[item_id] = item.copy()
-                combined[item_id]["bm25_score"] = bm25_norm_map.get(item_id, 0)
-                combined[item_id]["embedding_score"] = item.get("normalized_score", 0)
-
-        for item in combined.values():
-            bm25 = float(item.get("bm25_score", 0) or 0)
-            emb = float(item.get("embedding_score", 0) or 0)
-            item["content_score"] = self.alpha * bm25 + (1 - self.alpha) * emb
-
-        results = list(combined.values())
-        before = len(results)
-        results = [r for r in results if r["content_score"] >= self.content_score_threshold]
-        results.sort(key=lambda x: x["content_score"], reverse=True)
-        results = results[:limit]
-
-        logger.info(
-            f"[PerceptualSearch] rerank: merged={before}, after_threshold={len(results)} "
-            f"(alpha={self.alpha}, threshold={self.content_score_threshold})"
-        )
-        return results
-
-    @staticmethod
-    def _normalize_scores(items: List[dict], field: str = "score") -> List[dict]:
-        """Z-score + sigmoid 归一化。"""
-        if not items:
-            return items
-        scores = [float(it.get(field, 0) or 0) for it in items]
-        if len(scores) <= 1:
-            for it in items:
-                it[f"normalized_{field}"] = 1.0
-            return items
-        mean = sum(scores) / len(scores)
-        var = sum((s - mean) ** 2 for s in scores) / len(scores)
-        std = math.sqrt(var)
-        if std == 0:
-            for it in items:
-                it[f"normalized_{field}"] = 1.0
-        else:
-            for it, s in zip(items, scores):
-                z = (s - mean) / std
-                it[f"normalized_{field}"] = 1 / (1 + math.exp(-z))
-        return items
-
-    @staticmethod
-    def _format_result(record: dict) -> dict:
-        return {
-            "id": record.get("id", ""),
-            "perceptual_type": record.get("perceptual_type", ""),
-            "file_name": record.get("file_name", ""),
-            "file_path": record.get("file_path", ""),
-            "summary": record.get("summary", ""),
-            "topic": record.get("topic", ""),
-            "domain": record.get("domain", ""),
-            "keywords": record.get("keywords", []),
-            "created_at": str(record.get("created_at", "")),
-            "file_type": record.get("file_type", ""),
-            "score": record.get("score", 0),
-        }
-
-    @staticmethod
-    def _build_content_text(formatted: dict) -> str:
-        parts = []
-        if formatted["summary"]:
-            parts.append(formatted["summary"])
-        if formatted["topic"]:
-            parts.append(f"[主题: {formatted['topic']}]")
-        if formatted["keywords"]:
-            kw_list = formatted["keywords"]
-            if isinstance(kw_list, list):
-                parts.append(f"[关键词: {', '.join(kw_list)}]")
-        if formatted["file_name"]:
-            parts.append(f"[文件: {formatted['file_name']}]")
-        return " ".join(parts)
-
-
-def _extract_keywords_from_problems(problem_extension: dict) -> List[str]:
-    """Extract search keywords from problem extension results."""
-    keywords = []
-    context = problem_extension.get("context", {})
-    if isinstance(context, dict):
-        for original_q, extended_qs in context.items():
-            keywords.append(original_q)
-            if isinstance(extended_qs, list):
-                keywords.extend(extended_qs)
-    return keywords
-
-
-async def perceptual_retrieve_node(state: ReadState) -> ReadState:
-    """
-    LangGraph node: perceptual memory retrieval.
-
-    Uses PerceptualSearchService to run keyword + embedding search with
-    BM25 fusion reranking, then writes results to state['perceptual_data'].
-    """
-    end_user_id = state.get("end_user_id", "")
-    problem_extension = state.get("problem_extension", {})
-    original_query = state.get("data", "")
-    memory_config = state.get("memory_config", None)
-
-    logger.info(f"Perceptual_Retrieve: start, end_user_id={end_user_id}")
-
-    keywords = _extract_keywords_from_problems(problem_extension)
-    if not keywords:
-        keywords = [original_query] if original_query else []
-
-    logger.info(f"Perceptual_Retrieve: {len(keywords)} keywords extracted")
-
-    service = PerceptualSearchService(
-        end_user_id=end_user_id,
-        memory_config=memory_config,
-    )
-    search_result = await service.search(
-        query=original_query,
-        keywords=keywords,
-        limit=10,
-    )
-
-    result = {
-        "memories": search_result["memories"],
-        "content": search_result["content"],
-        "_intermediate": {
-            "type": "perceptual_retrieve",
-            "title": "感知记忆检索",
-            "data": search_result["memories"],
-            "query": original_query,
-            "result_count": len(search_result["memories"]),
-        },
-    }
-    return {"perceptual_data": result}
--- a/api/app/core/memory/agent/langgraph_graph/nodes/problem_nodes.py
+++ b/api/app/core/memory/agent/langgraph_graph/nodes/problem_nodes.py
@@ -1,281 +0,0 @@
-import json
-import os
-import time
-
-from app.core.logging_config import get_agent_logger
-from app.core.memory.agent.models.problem_models import ProblemExtensionResponse
-from app.core.memory.agent.services.optimized_llm_service import LLMServiceMixin
-from app.core.memory.agent.utils.llm_tools import (
-    PROJECT_ROOT_,
-    ReadState,
-)
-from app.core.memory.agent.utils.redis_tool import store
-from app.core.memory.agent.utils.session_tools import SessionService
-from app.core.memory.agent.utils.template_tools import TemplateService
-from app.db import get_db_context
-
-template_root = os.path.join(PROJECT_ROOT_, 'memory', 'agent', 'utils', 'prompt')
-logger = get_agent_logger(__name__)
-
-
-class ProblemNodeService(LLMServiceMixin):
-    """
-    Problem processing node service class
-    
-    Handles problem decomposition and extension operations using LLM services.
-    Inherits from LLMServiceMixin to provide structured LLM calling capabilities.
-    
-    Attributes:
-        template_service: Service for rendering Jinja2 templates
-    """
-
-    def __init__(self):
-        super().__init__()
-        self.template_service = TemplateService(template_root)
-
-
-# Create global service instance
-problem_service = ProblemNodeService()
-
-
-async def Split_The_Problem(state: ReadState) -> ReadState:
-    """
-    Problem decomposition node
-    
-    Breaks down complex user queries into smaller, more manageable sub-problems.
-    Uses LLM to analyze the input and generate structured problem decomposition
-    with question types and reasoning.
-    
-    Args:
-        state: ReadState containing user input and configuration
-        
-    Returns:
-        ReadState: Updated state with problem decomposition results
-    """
-    # 从状态中获取数据
-    content = state.get('data', '')
-    end_user_id = state.get('end_user_id', '')
-    memory_config = state.get('memory_config', None)
-
-    history = await SessionService(store).get_history(end_user_id, end_user_id, end_user_id)
-
-    # 生成 JSON schema 以指导 LLM 输出正确格式
-    json_schema = ProblemExtensionResponse.model_json_schema()
-
-    system_prompt = await problem_service.template_service.render_template(
-        template_name='problem_breakdown_prompt.jinja2',
-        operation_name='split_the_problem',
-        history=history,
-        sentence=content,
-        json_schema=json_schema
-    )
-
-    try:
-        # 使用优化的LLM服务
-        with get_db_context() as db_session:
-            structured = await problem_service.call_llm_structured(
-                state=state,
-                db_session=db_session,
-                system_prompt=system_prompt,
-                response_model=ProblemExtensionResponse,
-                fallback_value=[]
-            )
-
-        # 添加更详细的日志记录
-        logger.info(f"Split_The_Problem: 开始处理问题分解，内容长度: {len(content)}")
-
-        # Validate structured response
-        if not structured or not hasattr(structured, 'root'):
-            logger.warning("Split_The_Problem: 结构化响应为空或格式不正确")
-            split_result = json.dumps([], ensure_ascii=False)
-        elif not structured.root:
-            logger.warning("Split_The_Problem: 结构化响应的root为空")
-            split_result = json.dumps([], ensure_ascii=False)
-        else:
-            split_result = json.dumps(
-                [item.model_dump() for item in structured.root],
-                ensure_ascii=False
-            )
-
-        split_result_dict = []
-        for index, item in enumerate(json.loads(split_result)):
-            split_data = {
-                "id": f"Q{index + 1}",
-                "question": item['extended_question'],
-                "type": item['type'],
-                "reason": item['reason']
-            }
-            split_result_dict.append(split_data)
-
-        logger.info(f"Split_The_Problem: 成功生成 {len(structured.root) if structured.root else 0} 个分解项")
-
-        result = {
-            "context": split_result,
-            "original": content,
-            "_intermediate": {
-                "type": "problem_split",
-                "title": "问题拆分",
-                "data": split_result_dict,
-                "original_query": content
-            }
-        }
-
-    except Exception as e:
-        logger.error(
-            f"Split_The_Problem failed: {e}",
-            exc_info=True
-        )
-
-        # Provide more detailed error information
-        error_details = {
-            "error_type": type(e).__name__,
-            "error_message": str(e),
-            "content_length": len(content),
-            "llm_model_id": str(memory_config.llm_model_id) if memory_config else None
-        }
-
-        logger.error(f"Split_The_Problem error details: {error_details}")
-
-        # Create default empty result
-        result = {
-            "context": json.dumps([], ensure_ascii=False),
-            "original": content,
-            "error": str(e),
-            "_intermediate": {
-                "type": "problem_split",
-                "title": "问题拆分",
-                "data": [],
-                "original_query": content,
-                "error": error_details
-            }
-        }
-
-    # Return updated state including spit_context field
-    return {"spit_data": result}
-
-
-async def Problem_Extension(state: ReadState) -> ReadState:
-    """
-    Problem extension node
-    
-    Extends the decomposed problems from Split_The_Problem node by generating
-    additional related questions and organizing them by original question.
-    Uses LLM to create comprehensive question extensions for better memory retrieval.
-    
-    Args:
-        state: ReadState containing decomposed problems and configuration
-        
-    Returns:
-        ReadState: Updated state with extended problem results
-    """
-    # Get original data and decomposition results
-    start = time.time()
-    content = state.get('data', '')
-    data = state.get('spit_data', '')['context']
-    end_user_id = state.get('end_user_id', '')
-    storage_type = state.get('storage_type', '')
-    user_rag_memory_id = state.get('user_rag_memory_id', '')
-    memory_config = state.get('memory_config', None)
-
-    databasets = {}
-    try:
-        data = json.loads(data)
-        for i in data:
-            databasets[i['extended_question']] = i['type']
-    except (json.JSONDecodeError, KeyError, TypeError) as e:
-        logger.error(f"Problem_Extension: 数据解析失败: {e}")
-        # 使用空字典作为fallback
-        databasets = {}
-        data = []
-
-    history = await SessionService(store).get_history(end_user_id, end_user_id, end_user_id)
-
-    # 生成 JSON schema 以指导 LLM 输出正确格式
-    json_schema = ProblemExtensionResponse.model_json_schema()
-
-    system_prompt = await problem_service.template_service.render_template(
-        template_name='Problem_Extension_prompt.jinja2',
-        operation_name='problem_extension',
-        history=history,
-        questions=databasets,
-        json_schema=json_schema
-    )
-
-    try:
-        # 使用优化的LLM服务
-        with get_db_context() as db_session:
-            response_content = await problem_service.call_llm_structured(
-                state=state,
-                db_session=db_session,
-                system_prompt=system_prompt,
-                response_model=ProblemExtensionResponse,
-                fallback_value=[]
-            )
-
-        logger.info(f"Problem_Extension: 开始处理问题扩展，问题数量: {len(databasets)}")
-
-        # Validate structured response
-        if not response_content or not hasattr(response_content, 'root'):
-            logger.warning("Problem_Extension: 结构化响应为空或格式不正确")
-            aggregated_dict = {}
-        elif not response_content.root:
-            logger.warning("Problem_Extension: 结构化响应的root为空")
-            aggregated_dict = {}
-        else:
-            # Aggregate results by original question
-            aggregated_dict = {}
-            for item in response_content.root:
-                try:
-                    key = getattr(item, "original_question", None) or (
-                        item.get("original_question") if isinstance(item, dict) else None
-                    )
-                    value = getattr(item, "extended_question", None) or (
-                        item.get("extended_question") if isinstance(item, dict) else None
-                    )
-                    if not key or not value:
-                        logger.warning(f"Problem_Extension: 跳过无效项: key={key}, value={value}")
-                        continue
-                    aggregated_dict.setdefault(key, []).append(value)
-                except Exception as item_error:
-                    logger.warning(f"Problem_Extension: 处理项目时出错: {item_error}")
-                    continue
-
-        logger.info(f"Problem_Extension: 成功生成 {len(aggregated_dict)} 个扩展问题组")
-
-    except Exception as e:
-        logger.error(
-            f"LLM call failed for Problem_Extension: {e}",
-            exc_info=True
-        )
-
-        # Provide more detailed error information
-        error_details = {
-            "error_type": type(e).__name__,
-            "error_message": str(e),
-            "questions_count": len(databasets),
-            "llm_model_id": str(memory_config.llm_model_id) if memory_config else None
-        }
-
-        logger.error(f"Problem_Extension error details: {error_details}")
-        aggregated_dict = {}
-
-    logger.info("Problem extension")
-    logger.info(f"Problem extension result: {aggregated_dict}")
-
-    # Emit intermediate output for frontend
-    result = {
-        "context": aggregated_dict,
-        "original": data,
-        "storage_type": storage_type,
-        "user_rag_memory_id": user_rag_memory_id,
-        "_intermediate": {
-            "type": "problem_extension",
-            "title": "问题扩展",
-            "data": aggregated_dict,
-            "original_query": content,
-            "storage_type": storage_type,
-            "user_rag_memory_id": user_rag_memory_id
-        }
-    }
-
-    return {"problem_extension": result}
--- a/api/app/core/memory/agent/langgraph_graph/nodes/retrieve_nodes.py
+++ b/api/app/core/memory/agent/langgraph_graph/nodes/retrieve_nodes.py
@@ -1,509 +0,0 @@
-# ===== 标准库 =====
-import asyncio
-import json
-import os
-
-# ===== 第三方库 =====
-from langchain.agents import create_agent
-from langchain_openai import ChatOpenAI
-
-from app.core.logging_config import get_agent_logger
-from app.core.memory.agent.langgraph_graph.tools.tool import (
-    create_hybrid_retrieval_tool_sync,
-    create_time_retrieval_tool,
-    extract_tool_message_content,
-)
-from app.core.memory.agent.services.search_service import SearchService
-from app.core.memory.agent.utils.llm_tools import (
-    ReadState,
-    deduplicate_entries,
-    merge_to_key_value_pairs,
-)
-from app.core.rag.nlp.search import knowledge_retrieval
-from app.db import get_db_context
-from app.schemas import model_schema
-from app.services.memory_config_service import MemoryConfigService
-from app.services.model_service import ModelConfigService
-
-logger = get_agent_logger(__name__)
-
-
-async def rag_config(state):
-    """
-    Configure RAG (Retrieval-Augmented Generation) settings
-    
-    Creates configuration for knowledge base retrieval including similarity thresholds,
-    weights, and reranker settings.
-    
-    Args:
-        state: Current state containing user_rag_memory_id
-        
-    Returns:
-        dict: RAG configuration dictionary
-    """
-    user_rag_memory_id = state.get('user_rag_memory_id', '')
-    kb_config = {
-        "knowledge_bases": [
-            {
-                "kb_id": user_rag_memory_id,
-                "similarity_threshold": 0.7,
-                "vector_similarity_weight": 0.5,
-                "top_k": 10,
-                "retrieve_type": "participle"
-            }
-        ],
-        "merge_strategy": "weight",
-        "reranker_id": os.getenv('reranker_id'),
-        "reranker_top_k": 10
-    }
-    return kb_config
-
-
-async def rag_knowledge(state, question):
-    """
-    Retrieve knowledge using RAG approach
-    
-    Performs knowledge retrieval from configured knowledge bases using the
-    provided question and returns formatted results.
-    
-    Args:
-        state: Current state containing configuration
-        question: Question to search for
-        
-    Returns:
-        tuple: (retrieval_knowledge, clean_content, cleaned_query, raw_results)
-    """
-    kb_config = await rag_config(state)
-    end_user_id = state.get('end_user_id', '')
-    user_rag_memory_id = state.get("user_rag_memory_id", '')
-    retrieve_chunks_result = knowledge_retrieval(question, kb_config, [str(end_user_id)])
-    try:
-        retrieval_knowledge = [i.page_content for i in retrieve_chunks_result]
-        clean_content = '\n\n'.join(retrieval_knowledge)
-        cleaned_query = question
-        raw_results = clean_content
-        logger.info(f" Using RAG storage with memory_id={user_rag_memory_id}")
-    except Exception:
-        retrieval_knowledge = []
-        clean_content = ''
-        raw_results = ''
-        cleaned_query = question
-        logger.info(f"No content retrieved from knowledge base: {user_rag_memory_id}")
-    return retrieval_knowledge, clean_content, cleaned_query, raw_results
-
-
-async def llm_infomation(state: ReadState) -> ReadState:
-    """
-    Get LLM configuration information from state
-    
-    Retrieves model configuration details including model ID and tenant ID
-    from the memory configuration in the current state.
-    
-    Args:
-        state: ReadState containing memory configuration
-        
-    Returns:
-        ReadState: Model configuration as Pydantic model
-    """
-    memory_config = state.get('memory_config', None)
-    model_id = memory_config.llm_model_id
-    tenant_id = memory_config.tenant_id
-
-    # Use existing memory_config instead of re-querying database
-    # or use thread-safe database access
-    with get_db_context() as db:
-        result_orm = ModelConfigService.get_model_by_id(db=db, model_id=model_id, tenant_id=tenant_id)
-        result_pydantic = model_schema.ModelConfig.model_validate(result_orm)
-    return result_pydantic
-
-
-async def clean_databases(data) -> str:
-    """
-    Simplified database search result cleaning function
-    
-    Processes and cleans search results from various sources including
-    reranked results and time-based search results. Extracts text content
-    from structured data and returns as formatted string.
-    
-    Args:
-        data: Search result data (can be string, dict, or other types)
-        
-    Returns:
-        str: Cleaned content string
-    """
-    try:
-        # Parse JSON string
-        if isinstance(data, str):
-            try:
-                data = json.loads(data)
-            except json.JSONDecodeError:
-                return data
-
-        if not isinstance(data, dict):
-            return str(data)
-
-        # Get result data
-        # with open("搜索结果.json","w",encoding='utf-8') as f:
-        #     f.write(json.dumps(data, indent=4, ensure_ascii=False))
-        results = data.get('results', data)
-        if not isinstance(results, dict):
-            return str(results)
-
-        # Collect all content
-        content_list = []
-
-        # Process reranked results
-        reranked = results.get('reranked_results', {})
-        if reranked:
-            for category in ['summaries', 'communities', 'statements', 'chunks', 'entities']:
-                items = reranked.get(category, [])
-                if isinstance(items, list):
-                    content_list.extend(items)
-        # Process time search results
-        time_search = results.get('time_search', {})
-        if time_search:
-            if isinstance(time_search, dict):
-                statements = time_search.get('statements', time_search.get('time_search', []))
-                if isinstance(statements, list):
-                    content_list.extend(statements)
-            elif isinstance(time_search, list):
-                content_list.extend(time_search)
-
-        # Extract text content，对 community 按 name 去重（多次 tool 调用会产生重复）
-        text_parts = []
-        seen_community_names = set()
-        for item in content_list:
-            if isinstance(item, dict):
-                # community 节点用 name 去重
-                if 'member_count' in item or 'core_entities' in item:
-                    community_name = item.get('name') or item.get('id', '')
-                    if community_name in seen_community_names:
-                        continue
-                    seen_community_names.add(community_name)
-                text = item.get('statement') or item.get('content') or item.get('summary', '')
-                if text:
-                    text_parts.append(text)
-            elif isinstance(item, str):
-                text_parts.append(item)
-
-        return '\n'.join(text_parts).strip()
-
-    except Exception as e:
-        logger.error(f"clean_databases failed: {e}", exc_info=True)
-        return str(data)
-
-
-async def retrieve_nodes(state: ReadState) -> ReadState:
-    """
-    Retrieve information using simplified search approach
-    
-    Processes extended problems from previous nodes and performs retrieval
-    using either RAG or hybrid search based on storage type. Handles concurrent
-    processing of multiple questions and deduplicates results.
-    
-    Args:
-        state: ReadState containing problem extensions and configuration
-        
-    Returns:
-        ReadState: Updated state with retrieval results and intermediate outputs
-    """
-
-    problem_extension = state.get('problem_extension', '')['context']
-    storage_type = state.get('storage_type', '')
-    user_rag_memory_id = state.get('user_rag_memory_id', '')
-    end_user_id = state.get('end_user_id', '')
-    memory_config = state.get('memory_config', None)
-    original = state.get('data', '')
-    problem_list = []
-    for key, values in problem_extension.items():
-        for data in values:
-            problem_list.append(data)
-    logger.info(f"Retrieve: storage_type={storage_type}, user_rag_memory_id={user_rag_memory_id}")
-
-    # Create async task to process individual questions
-    async def process_question_nodes(idx, question):
-        try:
-            # Prepare search parameters based on storage type
-            search_params = {
-                "end_user_id": end_user_id,
-                "question": question,
-                "return_raw_results": True
-            }
-            if storage_type == "rag" and user_rag_memory_id:
-                retrieval_knowledge, clean_content, cleaned_query, raw_results = await rag_knowledge(state, question)
-            else:
-                clean_content, cleaned_query, raw_results = await SearchService().execute_hybrid_search(
-                    **search_params, memory_config=memory_config
-                )
-
-            return {
-                "Query_small": cleaned_query,
-                "Result_small": clean_content,
-                "_intermediate": {
-                    "type": "search_result",
-                    "query": cleaned_query,
-                    "raw_results": raw_results,
-                    "index": idx + 1,
-                    "total": len(problem_list)
-                }
-            }
-
-        except Exception as e:
-            logger.error(
-                f"Retrieve: hybrid_search failed for question '{question}': {e}",
-                exc_info=True
-            )
-            # Return empty result for this question
-            return {
-                "Query_small": question,
-                "Result_small": "",
-                "_intermediate": {
-                    "type": "search_result",
-                    "query": question,
-                    "raw_results": [],
-                    "index": idx + 1,
-                    "total": len(problem_list)
-                }
-            }
-
-    # Process all questions concurrently
-    tasks = [process_question_nodes(idx, question) for idx, question in enumerate(problem_list)]
-    databases_anser = await asyncio.gather(*tasks)
-    databases_data = {
-        "Query": original,
-        "Expansion_issue": databases_anser
-    }
-
-    # Collect intermediate outputs before deduplication
-    intermediate_outputs = []
-    for item in databases_anser:
-        if '_intermediate' in item:
-            intermediate_outputs.append(item['_intermediate'])
-
-    # Deduplicate and merge results
-    deduplicated_data = deduplicate_entries(databases_data['Expansion_issue'])
-    deduplicated_data_merged = merge_to_key_value_pairs(
-        deduplicated_data,
-        'Query_small',
-        'Result_small'
-    )
-
-    # Restructure for Verify/Retrieve_Summary compatibility
-    keys, val = [], []
-    for item in deduplicated_data_merged:
-        for items_key, items_value in item.items():
-            keys.append(items_key)
-            val.append(items_value)
-
-    send_verify = []
-    for i, j in zip(keys, val, strict=False):
-        if j != ['']:
-            send_verify.append({
-                "Query_small": i,
-                "Answer_Small": j
-            })
-
-    dup_databases = {
-        "Query": original,
-        "Expansion_issue": send_verify,
-        "_intermediate_outputs": intermediate_outputs  # Preserve intermediate outputs
-    }
-
-    logger.info(f"Collected {len(intermediate_outputs)} intermediate outputs from search results")
-    return {'retrieve': dup_databases}
-
-
-async def retrieve(state: ReadState) -> ReadState:
-    """
-    Advanced retrieve function using LangChain agents and tools
-    
-    Uses LangChain agents with specialized retrieval tools (time-based and hybrid)
-    to perform sophisticated information retrieval. Supports both RAG and traditional
-    memory storage approaches with concurrent processing and result deduplication.
-    
-    Args:
-        state: ReadState containing problem extensions and configuration
-        
-    Returns:
-        ReadState: Updated state with retrieval results and intermediate outputs
-    """
-    # Get end_user_id from state
-    import time
-    start = time.time()
-    problem_extension = state.get('problem_extension', '')['context']
-    storage_type = state.get('storage_type', '')
-    user_rag_memory_id = state.get('user_rag_memory_id', '')
-    end_user_id = state.get('end_user_id', '')
-    memory_config = state.get('memory_config', None)
-    original = state.get('data', '')
-    problem_list = []
-    for key, values in problem_extension.items():
-        for data in values:
-            problem_list.append(data)
-    logger.info(f"Retrieve: storage_type={storage_type}, user_rag_memory_id={user_rag_memory_id}")
-    databases_anser = []
-
-    async def get_llm_info():
-        with get_db_context() as db:  # 使用同步数据库上下文管理器
-            config_service = MemoryConfigService(db)
-            return await llm_infomation(state)
-
-    llm_config = await get_llm_info()
-    api_key_obj = llm_config.api_keys[0]
-    api_key = api_key_obj.api_key
-    api_base = api_key_obj.api_base
-    model_name = api_key_obj.model_name
-    llm = ChatOpenAI(
-        model=model_name,
-        api_key=api_key,
-        base_url=api_base,
-        temperature=0.2,
-    )
-
-    time_retrieval_tool = create_time_retrieval_tool(end_user_id)
-    search_params = {
-        "end_user_id": end_user_id,
-        "return_raw_results": True,
-        "include": ["summaries", "statements", "chunks", "entities", "communities"],
-    }
-    hybrid_retrieval = create_hybrid_retrieval_tool_sync(memory_config, **search_params)
-    agent = create_agent(
-        llm,
-        tools=[time_retrieval_tool, hybrid_retrieval],
-        system_prompt=f"我是检索专家，可以根据适合的工具进行检索。当前使用的end_user_id是: {end_user_id}"
-    )
-
-    # Create async task to process individual questions
-    import asyncio
-
-    # Define semaphore at module level to limit maximum concurrency
-    SEMAPHORE = asyncio.Semaphore(5)  # Limit to maximum 5 concurrent database operations
-
-    async def process_question(idx, question):
-        async with SEMAPHORE:  # Limit concurrency
-            try:
-                if storage_type == "rag" and user_rag_memory_id:
-                    retrieval_knowledge, clean_content, cleaned_query, raw_results = await rag_knowledge(state,
-                                                                                                         question)
-                else:
-                    cleaned_query = question
-                    # Use asyncio to run synchronous agent.invoke in thread pool
-                    import asyncio
-                    response = await asyncio.get_event_loop().run_in_executor(
-                        None,
-                        lambda: agent.invoke({"messages": question})
-                    )
-                    tool_results = extract_tool_message_content(response)
-                    if tool_results == None:
-                        raw_results = []
-                        clean_content = ''
-                    else:
-                        raw_results = tool_results['content']
-                        clean_content = await clean_databases(raw_results)
-
-                        # 社区展开：从 tool 返回结果中提取命中的 community，
-                        # 沿 BELONGS_TO_COMMUNITY 关系拉取关联 Statement 追加到 clean_content
-                        _expanded_stmts_to_write = []
-                        try:
-                            results_dict = raw_results.get('results', {}) if isinstance(raw_results, dict) else {}
-                            reranked = results_dict.get('reranked_results', {})
-                            community_hits = reranked.get('communities', [])
-                            if not community_hits:
-                                community_hits = results_dict.get('communities', [])
-                            if community_hits:
-                                from app.core.memory.agent.services.search_service import expand_communities_to_statements
-                                _expanded_stmts_to_write, new_texts = await expand_communities_to_statements(
-                                    community_results=community_hits,
-                                    end_user_id=end_user_id,
-                                    existing_content=clean_content,
-                                )
-                                if new_texts:
-                                    clean_content = clean_content + '\n' + '\n'.join(new_texts)
-                        except Exception as parse_err:
-                            logger.warning(f"[Retrieve] 解析社区命中结果失败，跳过展开: {parse_err}")
-
-                        try:
-                            raw_results = raw_results['results']
-                            # 写回展开结果，接口返回中可见（已在 helper 中清洗过字段）
-                            if _expanded_stmts_to_write and isinstance(raw_results, dict):
-                                raw_results.setdefault('reranked_results', {})['expanded_statements'] = _expanded_stmts_to_write
-                        except Exception:
-                            raw_results = []
-
-                return {
-                    "Query_small": cleaned_query,
-                    "Result_small": clean_content,
-                    "_intermediate": {
-                        "type": "search_result",
-                        "query": cleaned_query,
-                        "raw_results": raw_results,
-                        "index": idx + 1,
-                        "total": len(problem_list)
-                    }
-                }
-
-            except Exception as e:
-                logger.error(
-                    f"Retrieve: hybrid_search failed for question '{question}': {e}",
-                    exc_info=True
-                )
-                # Return empty result for this question
-                return {
-                    "Query_small": question,
-                    "Result_small": "",
-                    "_intermediate": {
-                        "type": "search_result",
-                        "query": question,
-                        "raw_results": [],
-                        "index": idx + 1,
-                        "total": len(problem_list)
-                    }
-                }
-
-    # Process all questions concurrently
-    import asyncio
-    tasks = [process_question(idx, question) for idx, question in enumerate(problem_list)]
-    databases_anser = await asyncio.gather(*tasks)
-    databases_data = {
-        "Query": original,
-        "Expansion_issue": databases_anser
-    }
-
-    # Collect intermediate outputs before deduplication
-    intermediate_outputs = []
-    for item in databases_anser:
-        if '_intermediate' in item:
-            intermediate_outputs.append(item['_intermediate'])
-
-    # Deduplicate and merge results
-    deduplicated_data = deduplicate_entries(databases_data['Expansion_issue'])
-    deduplicated_data_merged = merge_to_key_value_pairs(
-        deduplicated_data,
-        'Query_small',
-        'Result_small'
-    )
-
-    # Restructure for Verify/Retrieve_Summary compatibility
-    keys, val = [], []
-    for item in deduplicated_data_merged:
-        for items_key, items_value in item.items():
-            keys.append(items_key)
-            val.append(items_value)
-
-    send_verify = []
-    for i, j in zip(keys, val, strict=False):
-        if j != ['']:
-            send_verify.append({
-                "Query_small": i,
-                "Answer_Small": j
-            })
-
-    dup_databases = {
-        "Query": original,
-        "Expansion_issue": send_verify,
-        "_intermediate_outputs": intermediate_outputs  # Preserve intermediate outputs
-    }
-    # with open('retrieve_text.json', 'w') as f:
-    #     json.dump(dup_databases, f, indent=4)
-    logger.info(f"Collected {len(intermediate_outputs)} intermediate outputs from search results")
-    return {'retrieve': dup_databases}
--- a/api/app/core/memory/agent/langgraph_graph/nodes/summary_nodes.py
+++ b/api/app/core/memory/agent/langgraph_graph/nodes/summary_nodes.py
@@ -1,584 +0,0 @@
-import asyncio
-import os
-import time
-
-from app.core.logging_config import get_agent_logger, log_time
-from app.core.memory.agent.langgraph_graph.nodes.perceptual_retrieve_node import (
-    PerceptualSearchService,
-)
-from app.core.memory.agent.models.summary_models import (
-    RetrieveSummaryResponse,
-    SummaryResponse,
-)
-from app.core.memory.agent.services.optimized_llm_service import LLMServiceMixin
-from app.core.memory.agent.services.search_service import SearchService
-from app.core.memory.agent.utils.llm_tools import (
-    PROJECT_ROOT_,
-    ReadState,
-)
-from app.core.memory.agent.utils.redis_tool import store
-from app.core.memory.agent.utils.session_tools import SessionService
-from app.core.memory.agent.utils.template_tools import TemplateService
-from app.core.rag.nlp.search import knowledge_retrieval
-from app.db import get_db_context
-
-template_root = os.path.join(PROJECT_ROOT_, 'memory', 'agent', 'utils', 'prompt')
-logger = get_agent_logger(__name__)
-
-
-class SummaryNodeService(LLMServiceMixin):
-    """
-    Summary node service class
-    
-    Handles summary generation operations using LLM services. Inherits from 
-    LLMServiceMixin to provide structured LLM calling capabilities for 
-    generating summaries from retrieved information.
-    
-    Attributes:
-        template_service: Service for rendering Jinja2 templates
-    """
-
-    def __init__(self):
-        super().__init__()
-        self.template_service = TemplateService(template_root)
-
-
-# Create global service instance
-summary_service = SummaryNodeService()
-
-
-async def rag_config(state):
-    """
-    Configure RAG (Retrieval-Augmented Generation) settings for summary operations
-    
-    Creates configuration for knowledge base retrieval including similarity thresholds,
-    weights, and reranker settings specifically for summary generation.
-    
-    Args:
-        state: Current state containing user_rag_memory_id
-        
-    Returns:
-        dict: RAG configuration dictionary with knowledge base settings
-    """
-    user_rag_memory_id = state.get('user_rag_memory_id', '')
-    kb_config = {
-        "knowledge_bases": [
-            {
-                "kb_id": user_rag_memory_id,
-                "similarity_threshold": 0.7,
-                "vector_similarity_weight": 0.5,
-                "top_k": 10,
-                "retrieve_type": "participle"
-            }
-        ],
-        "merge_strategy": "weight",
-        "reranker_id": os.getenv('reranker_id'),
-        "reranker_top_k": 10
-    }
-    return kb_config
-
-
-async def rag_knowledge(state, question):
-    """
-    Retrieve knowledge using RAG approach for summary generation
-    
-    Performs knowledge retrieval from configured knowledge bases using the
-    provided question and returns formatted results for summary processing.
-    
-    Args:
-        state: Current state containing configuration
-        question: Question to search for in knowledge base
-        
-    Returns:
-        tuple: (retrieval_knowledge, clean_content, cleaned_query, raw_results)
-            - retrieval_knowledge: List of retrieved knowledge chunks
-            - clean_content: Formatted content string
-            - cleaned_query: Processed query string
-            - raw_results: Raw retrieval results
-    """
-    kb_config = await rag_config(state)
-    end_user_id = state.get('end_user_id', '')
-    user_rag_memory_id = state.get("user_rag_memory_id", '')
-    retrieve_chunks_result = knowledge_retrieval(question, kb_config, [str(end_user_id)])
-    try:
-        retrieval_knowledge = [i.page_content for i in retrieve_chunks_result]
-        clean_content = '\n\n'.join(retrieval_knowledge)
-        cleaned_query = question
-        raw_results = clean_content
-        logger.info(f" Using RAG storage with memory_id={user_rag_memory_id}")
-    except  Exception:
-        retrieval_knowledge = []
-        clean_content = ''
-        raw_results = ''
-        cleaned_query = question
-        logger.info(f"No content retrieved from knowledge base: {user_rag_memory_id}")
-    return retrieval_knowledge, clean_content, cleaned_query, raw_results
-
-
-async def summary_history(state: ReadState) -> ReadState:
-    """
-    Retrieve conversation history for summary context
-    
-    Gets the conversation history for the current user to provide context
-    for summary generation operations.
-    
-    Args:
-        state: ReadState containing end_user_id
-        
-    Returns:
-        ReadState: Conversation history data
-    """
-    end_user_id = state.get("end_user_id", '')
-    history = await SessionService(store).get_history(end_user_id, end_user_id, end_user_id)
-    return history
-
-
-async def summary_llm(state: ReadState, history, retrieve_info, template_name, operation_name, response_model,
-                      search_mode) -> str:
-    """
-    Enhanced summary_llm function with better error handling and data validation
-    
-    Generates summaries using LLM with structured output. Includes fallback mechanisms
-    for handling LLM failures and provides robust error recovery.
-    
-    Args:
-        state: ReadState containing current context
-        history: Conversation history for context
-        retrieve_info: Retrieved information to summarize
-        template_name: Jinja2 template name for prompt generation
-        operation_name: Type of operation (summary, input_summary, retrieve_summary)
-        response_model: Pydantic model for structured output
-        search_mode: Search mode flag ("0" for simple, "1" for complex)
-        
-    Returns:
-        str: Generated summary text or fallback message
-    """
-    data = state.get("data", '')
-
-    # Build system prompt
-    if str(search_mode) == "0":
-        system_prompt = await summary_service.template_service.render_template(
-            template_name=template_name,
-            operation_name=operation_name,
-            data=retrieve_info,
-            query=data
-        )
-    else:
-        system_prompt = await summary_service.template_service.render_template(
-            template_name=template_name,
-            operation_name=operation_name,
-            query=data,
-            history=history,
-            retrieve_info=retrieve_info
-        )
-    try:
-        # Use optimized LLM service for structured output
-        with get_db_context() as db_session:
-            structured = await summary_service.call_llm_structured(
-                state=state,
-                db_session=db_session,
-                system_prompt=system_prompt,
-                response_model=response_model,
-                fallback_value=None
-            )
-        # Validate structured response
-        if structured is None:
-            logger.warning("LLM返回None，使用默认回答")
-            return "信息不足，无法回答"
-
-        # Extract answer based on operation type
-        if operation_name == "summary":
-            aimessages = getattr(structured, 'query_answer', None) or "信息不足，无法回答"
-        else:
-            # Handle RetrieveSummaryResponse
-            if hasattr(structured, 'data') and structured.data:
-                aimessages = getattr(structured.data, 'query_answer', None) or "信息不足，无法回答"
-            else:
-                logger.warning("结构化响应缺少data字段")
-                aimessages = "信息不足，无法回答"
-
-        # Validate answer is not empty
-        if not aimessages or aimessages.strip() == "":
-            aimessages = "信息不足，无法回答"
-
-        return aimessages
-
-    except Exception as e:
-        logger.error(f"结构化输出失败: {e}", exc_info=True)
-
-        # Try unstructured output as fallback
-        try:
-            logger.info("尝试非结构化输出作为fallback")
-            response = await summary_service.call_llm_simple(
-                state=state,
-                db_session=db_session,
-                system_prompt=system_prompt,
-                fallback_message="信息不足，无法回答"
-            )
-
-            if response and response.strip():
-                # Simple response cleaning
-                cleaned_response = response.strip()
-                # Remove possible JSON markers
-                if cleaned_response.startswith('```'):
-                    lines = cleaned_response.split('\n')
-                    cleaned_response = '\n'.join(lines[1:-1])
-
-                return cleaned_response
-            else:
-                return "信息不足，无法回答"
-
-        except Exception as fallback_error:
-            logger.error(f"Fallback也失败: {fallback_error}")
-            return "信息不足，无法回答"
-
-
-async def summary_redis_save(state: ReadState, aimessages) -> ReadState:
-    """
-    Save summary results to Redis session storage
-    
-    Stores the generated summary and user query in Redis for session management
-    and conversation history tracking.
-    
-    Args:
-        state: ReadState containing user and query information
-        aimessages: Generated summary message to save
-        
-    Returns:
-        ReadState: Updated state after saving to Redis
-    """
-    data = state.get("data", '')
-    end_user_id = state.get("end_user_id", '')
-    await SessionService(store).save_session(
-        user_id=end_user_id,
-        query=data,
-        apply_id=end_user_id,
-        end_user_id=end_user_id,
-        ai_response=aimessages
-    )
-    await SessionService(store).cleanup_duplicates()
-    logger.info(f"sessionid: {aimessages} 写入成功")
-
-
-async def summary_prompt(state: ReadState, aimessages, raw_results) -> ReadState:
-    """
-    Format summary results for different output types
-    
-    Creates structured output formats for both input summary and retrieval summary
-    operations, including metadata and intermediate results for frontend display.
-    
-    Args:
-        state: ReadState containing storage and user information
-        aimessages: Generated summary message
-        raw_results: Raw search/retrieval results
-        
-    Returns:
-        tuple: (input_summary, retrieve_summary) formatted result dictionaries
-    """
-    storage_type = state.get("storage_type", '')
-    user_rag_memory_id = state.get("user_rag_memory_id", '')
-    data = state.get("data", '')
-    input_summary = {
-        "status": "success",
-        "summary_result": aimessages,
-        "storage_type": storage_type,
-        "user_rag_memory_id": user_rag_memory_id,
-        "_intermediate": {
-            "type": "input_summary",
-            "title": "快速答案",
-            "summary": aimessages,
-            "query": data,
-            "raw_results": raw_results,
-            "search_mode": "quick_search",
-            "storage_type": storage_type,
-            "user_rag_memory_id": user_rag_memory_id
-        }
-    }
-    retrieve = {
-        "status": "success",
-        "summary_result": aimessages,
-        "storage_type": storage_type,
-        "user_rag_memory_id": user_rag_memory_id,
-        "_intermediate": {
-            "type": "retrieval_summary",
-            "title": "快速检索",
-            "summary": aimessages,
-            "query": data,
-            "storage_type": storage_type,
-            "user_rag_memory_id": user_rag_memory_id
-        }
-    }
-
-    return input_summary, retrieve
-
-
-async def Input_Summary(state: ReadState) -> ReadState:
-    """
-    Generate quick input summary from retrieved information
-    
-    Performs fast retrieval and generates a quick summary response for user queries.
-    This function prioritizes speed by only searching summary nodes and provides
-    immediate feedback to users.
-    
-    Args:
-        state: ReadState containing user query, storage configuration, and context
-        
-    Returns:
-        ReadState: Dictionary containing summary results with status and metadata
-    """
-    start = time.time()
-    storage_type = state.get("storage_type", '')
-    memory_config = state.get('memory_config', None)
-    user_rag_memory_id = state.get("user_rag_memory_id", '')
-    data = state.get("data", '')
-    end_user_id = state.get("end_user_id", '')
-    logger.info(f"Input_Summary: storage_type={storage_type}, user_rag_memory_id={user_rag_memory_id}")
-    history = await summary_history(state)
-    search_params = {
-        "end_user_id": end_user_id,
-        "question": data,
-        "return_raw_results": True,
-        "include": ["summaries", "communities"]  # MemorySummary 和 Community 同为高维度概括节点
-    }
-
-    try:
-        if storage_type != "rag":
-
-            async def _perceptual_search():
-                service = PerceptualSearchService(
-                    end_user_id=end_user_id,
-                    memory_config=memory_config,
-                )
-                return await service.search(query=data, limit=5)
-
-            hybrid_task = SearchService().execute_hybrid_search(
-                **search_params,
-                memory_config=memory_config,
-                expand_communities=False,
-            )
-            perceptual_task = _perceptual_search()
-
-            gather_results = await asyncio.gather(
-                hybrid_task, perceptual_task, return_exceptions=True
-            )
-            hybrid_result = gather_results[0]
-            perceptual_results = gather_results[1]
-
-            # 处理 hybrid search 异常
-            if isinstance(hybrid_result, Exception):
-                raise hybrid_result
-            retrieve_info, question, raw_results = hybrid_result
-
-            # 处理感知记忆结果
-            if isinstance(perceptual_results, Exception):
-                logger.warning(f"[Input_Summary] perceptual search failed: {perceptual_results}")
-                perceptual_results = []
-
-            # 拼接感知记忆内容到 retrieve_info
-            if perceptual_results and isinstance(perceptual_results, dict):
-                perceptual_content = perceptual_results.get("content", "")
-                if perceptual_content:
-                    retrieve_info = f"{retrieve_info}\n\n<history-files>\n{perceptual_content}"
-                    count = len(perceptual_results.get("memories", []))
-                    logger.info(f"[Input_Summary] appended {count} perceptual memories (reranked)")
-
-            # 调试：打印 community 检索结果数量
-            if raw_results and isinstance(raw_results, dict):
-                reranked = raw_results.get('reranked_results', {})
-                community_hits = reranked.get('communities', [])
-                logger.debug(f"[Input_Summary] community 命中数: {len(community_hits)}, "
-                             f"summary 命中数: {len(reranked.get('summaries', []))}")
-        else:
-            retrieval_knowledge, retrieve_info, question, raw_results = await rag_knowledge(state, data)
-    except Exception as e:
-        logger.error(f"Input_Summary: hybrid_search failed, using empty results: {e}", exc_info=True)
-        retrieve_info, question, raw_results = "", data, []
-    try:
-        # aimessages=await summary_llm(state,history,retrieve_info,'Retrieve_Summary_prompt.jinja2',
-        #                              'input_summary',RetrieveSummaryResponse)
-        # logger.info(f"快速答案总结==>>:{storage_type}--{user_rag_memory_id}--{aimessages}")
-        summary_result = await summary_prompt(state, retrieve_info, retrieve_info)
-        summary = summary_result[0]
-    except Exception as e:
-        logger.error(f"Input_Summary failed: {e}", exc_info=True)
-        summary = {
-            "status": "fail",
-            "summary_result": "信息不足，无法回答",
-            "storage_type": storage_type,
-            "user_rag_memory_id": user_rag_memory_id,
-            "error": str(e)
-        }
-    end = time.time()
-    duration = end - start
-    log_time('检索', duration)
-    return {"summary": summary}
-
-
-async def Retrieve_Summary(state: ReadState) -> ReadState:
-    """
-    Generate comprehensive summary from retrieved expansion issues
-    
-    Processes retrieved expansion issues and generates a detailed summary using LLM.
-    This function handles complex retrieval results and provides comprehensive answers
-    based on expanded query results.
-    
-    Args:
-        state: ReadState containing retrieve data with expansion issues
-        
-    Returns:
-        ReadState: Dictionary containing comprehensive summary results
-    """
-    retrieve = state.get("retrieve", '')
-    history = await summary_history(state)
-    import json
-    with open("检索.json", "w", encoding='utf-8') as f:
-        f.write(json.dumps(retrieve, indent=4, ensure_ascii=False))
-    retrieve = retrieve.get("Expansion_issue", [])
-    start = time.time()
-    retrieve_info_str = []
-    for data in retrieve:
-        if data == '':
-            retrieve_info_str = ''
-        else:
-            for key, value in data.items():
-                if key == 'Answer_Small':
-                    for i in value:
-                        retrieve_info_str.append(i)
-    retrieve_info_str = list(set(retrieve_info_str))
-    retrieve_info_str = '\n'.join(retrieve_info_str)
-
-    # Merge perceptual memory content
-    perceptual_data = state.get("perceptual_data", {})
-    perceptual_content = perceptual_data.get("content", "") if isinstance(perceptual_data, dict) else ""
-    if perceptual_content:
-        retrieve_info_str = f"{retrieve_info_str}\n\n<history-file-input>\n{perceptual_content}</history-file-input>"
-
-    aimessages = await summary_llm(
-        state,
-        history,
-        retrieve_info_str,
-        'direct_summary_prompt.jinja2',
-        'retrieve_summary', RetrieveSummaryResponse,
-        "1"
-    )
-    if '信息不足，无法回答' not in str(aimessages) or str(aimessages) != "":
-        await summary_redis_save(state, aimessages)
-    if aimessages == '':
-        aimessages = '信息不足，无法回答'
-    logger.info(f"Summary after retrieval: {aimessages}")
-    end = time.time()
-    try:
-        duration = end - start
-    except Exception:
-        duration = 0.0
-    log_time('Retrieval summary', duration)
-
-    # Fixed coroutine call - await first, then access return value
-    summary_result = await summary_prompt(state, aimessages, retrieve_info_str)
-    summary = summary_result[1]
-    return {"summary": summary}
-
-
-async def Summary(state: ReadState) -> ReadState:
-    """
-    Generate final comprehensive summary from verified data
-    
-    Creates the final summary using verified expansion issues and conversation history.
-    This function processes verified data to generate the most comprehensive and
-    accurate response to user queries.
-    
-    Args:
-        state: ReadState containing verified data and query information
-        
-    Returns:
-        ReadState: Dictionary containing final summary results
-    """
-    start = time.time()
-    query = state.get("data", '')
-    verify = state.get("verify", '')
-    verify_expansion_issue = verify.get("verified_data", '')
-    retrieve_info_str = ''
-    for data in verify_expansion_issue:
-        for key, value in data.items():
-            if key == 'answer_small':
-                for i in value:
-                    retrieve_info_str += i + '\n'
-    history = await summary_history(state)
-
-    # Merge perceptual memory content
-    perceptual_data = state.get("perceptual_data", {})
-    perceptual_content = perceptual_data.get("content", "") if isinstance(perceptual_data, dict) else ""
-    if perceptual_content:
-        retrieve_info_str = f"{retrieve_info_str}\n\n<history-file-input>\n{perceptual_content}</history-file-input>"
-
-    data = {
-        "query": query,
-        "history": history,
-        "retrieve_info": retrieve_info_str
-    }
-    aimessages = await  summary_llm(state, history, data,
-                                    'summary_prompt.jinja2', 'summary', SummaryResponse, 0)
-
-    if '信息不足，无法回答' not in str(aimessages) or str(aimessages) != "":
-        await summary_redis_save(state, aimessages)
-    if aimessages == '':
-        aimessages = '信息不足，无法回答'
-    try:
-        duration = time.time() - start
-    except Exception:
-        duration = 0.0
-    log_time('Retrieval summary', duration)
-
-    # Fixed coroutine call - await first, then access return value
-    summary_result = await summary_prompt(state, aimessages, retrieve_info_str)
-    summary = summary_result[1]
-    return {"summary": summary}
-
-
-async def Summary_fails(state: ReadState) -> ReadState:
-    """
-    Generate fallback summary when normal summary process fails
-    
-    Provides a fallback summary generation mechanism when the standard summary
-    process encounters errors or fails to produce satisfactory results. Uses
-    a specialized failure template to handle edge cases.
-    
-    Args:
-        state: ReadState containing verified data and failure context
-        
-    Returns:
-        ReadState: Dictionary containing fallback summary results
-    """
-    storage_type = state.get("storage_type", '')
-    user_rag_memory_id = state.get("user_rag_memory_id", '')
-    history = await summary_history(state)
-    query = state.get("data", '')
-    verify = state.get("verify", '')
-    verify_expansion_issue = verify.get("verified_data", '')
-    retrieve_info_str = ''
-    for data in verify_expansion_issue:
-        for key, value in data.items():
-            if key == 'answer_small':
-                for i in value:
-                    retrieve_info_str += i + '\n'
-
-    # Merge perceptual memory content
-    perceptual_data = state.get("perceptual_data", {})
-    perceptual_content = perceptual_data.get("content", "") if isinstance(perceptual_data, dict) else ""
-    if perceptual_content:
-        retrieve_info_str = f"{retrieve_info_str}\n\n<history-file-input>\n{perceptual_content}</history-file-input>"
-
-    data = {
-        "query": query,
-        "history": history,
-        "retrieve_info": retrieve_info_str
-    }
-    aimessages = await summary_llm(state, history, data,
-                                   'fail_summary_prompt.jinja2', 'summary', SummaryResponse, 0)
-    result = {
-        "status": "success",
-        "summary_result": aimessages,
-        "storage_type": storage_type,
-        "user_rag_memory_id": user_rag_memory_id
-    }
-    return {"summary": result}
--- a/api/app/core/memory/agent/langgraph_graph/nodes/tool_node.py
+++ b/api/app/core/memory/agent/langgraph_graph/nodes/tool_node.py
@@ -0,0 +1,234 @@
+"""
+Tool execution node for LangGraph workflow.
+
+This module provides the ToolExecutionNode class which wraps tool execution
+with parameter transformation logic using the ParameterBuilder service.
+"""
+
+import logging
+import time
+from typing import Any, Callable, Dict
+
+from app.core.memory.agent.langgraph_graph.state.extractors import (
+    extract_content_payload,
+    extract_tool_call_id,
+)
+from app.core.memory.agent.mcp_server.services.parameter_builder import ParameterBuilder
+from app.schemas.memory_config_schema import MemoryConfig
+from langchain_core.messages import AIMessage
+from langgraph.prebuilt import ToolNode
+
+logger = logging.getLogger(__name__)
+
+
+class ToolExecutionNode:
+    """
+    Custom LangGraph node that wraps tool execution with parameter transformation.
+    
+    This node extracts content from previous tool results, transforms parameters
+    based on tool type using ParameterBuilder, and invokes the tool with the
+    correct argument structure.
+    
+    Attributes:
+        tool_node: LangGraph ToolNode wrapping the actual tool
+        id: Node identifier for message IDs
+        tool_name: Name of the tool being executed
+        namespace: Namespace for session management
+        search_switch: Search routing parameter
+        apply_id: Application identifier
+        group_id: Group identifier
+        parameter_builder: Service for building tool-specific arguments
+        memory_config: MemoryConfig object containing all configuration
+    """
+
+    def __init__(
+        self,
+        tool: Callable,
+        node_id: str,
+        namespace: str,
+        search_switch: str,
+        apply_id: str,
+        group_id: str,
+        parameter_builder: ParameterBuilder,
+        storage_type: str,
+        user_rag_memory_id: str,
+        memory_config: MemoryConfig,
+    ):
+        """
+        Initialize the tool execution node.
+        
+        Args:
+            tool: The tool function to execute
+            node_id: Identifier for this node (used in message IDs)
+            namespace: Namespace for session management
+            search_switch: Search routing parameter
+            apply_id: Application identifier
+            group_id: Group identifier
+            parameter_builder: Service for building tool-specific arguments
+            storage_type: Storage type for the workspace
+            user_rag_memory_id: User RAG memory identifier
+            memory_config: MemoryConfig object containing all configuration
+        """
+        self.tool_node = ToolNode([tool])
+        self.id = node_id
+        self.tool_name = tool.name if hasattr(tool, 'name') else str(tool)
+        self.namespace = namespace
+        self.search_switch = search_switch
+        self.apply_id = apply_id
+        self.group_id = group_id
+        self.parameter_builder = parameter_builder
+        self.storage_type = storage_type
+        self.user_rag_memory_id = user_rag_memory_id
+        self.memory_config = memory_config
+
+        logger.info(
+            f"[ToolExecutionNode] Initialized node '{self.id}' for tool '{self.tool_name}'"
+        )
+    
+    async def __call__(self, state: Dict[str, Any]) -> Dict[str, Any]:
+        """
+        Execute the tool with transformed parameters.
+        
+        This method:
+        1. Extracts the last message from state
+        2. Extracts tool call ID using state extractors
+        3. Extracts content payload using state extractors
+        4. Builds tool arguments using parameter builder
+        5. Constructs AIMessage with tool_calls
+        6. Invokes the tool and returns the result
+        
+        Args:
+            state: LangGraph state dictionary
+            
+        Returns:
+            Updated state with tool result in messages
+        """
+        messages = state.get("messages", [])
+        logger.debug( self.tool_name)
+        
+        if not messages:
+            logger.warning(f"[ToolExecutionNode] {self.id} - No messages in state")
+            return {"messages": [AIMessage(content="Error: No messages in state")]}
+        
+        last_message = messages[-1]
+        logger.debug(
+            f"[ToolExecutionNode] {self.id} - Processing message at {time.time()}"
+        )
+        
+        try:
+            # Extract tool call ID using state extractors
+            tool_call_id = extract_tool_call_id(last_message)
+            logger.debug(f"[ToolExecutionNode] {self.id} - Extracted tool_call_id: {tool_call_id}")
+            
+        except ValueError as e:
+            logger.error(
+                f"[ToolExecutionNode] {self.id} - Failed to extract tool call ID: {e}"
+            )
+            return {"messages": [AIMessage(content=f"Error: {str(e)}")]}
+        
+        try:
+            # Extract content payload using state extractors
+            content = extract_content_payload(last_message)
+            logger.debug(
+                f"[ToolExecutionNode] {self.id} - Extracted content type: {type(content)}, content_keys: {list(content.keys()) if isinstance(content, dict) else 'N/A'}"
+            )
+            # Log raw message content for debugging
+            if hasattr(last_message, 'content'):
+                raw = last_message.content
+                logger.debug(f"[ToolExecutionNode] {self.id} - Raw message content (first 500 chars): {str(raw)[:500]}")
+            
+        except Exception as e:
+            logger.error(
+                f"[ToolExecutionNode] {self.id} - Failed to extract content: {e}",
+                exc_info=True
+            )
+            content = {}
+        
+        try:
+            # Build tool arguments using parameter builder
+            tool_args = self.parameter_builder.build_tool_args(
+                tool_name=self.tool_name,
+                content=content,
+                tool_call_id=tool_call_id,
+                search_switch=self.search_switch,
+                apply_id=self.apply_id,
+                group_id=self.group_id,
+                memory_config=self.memory_config,
+                storage_type=self.storage_type,
+                user_rag_memory_id=self.user_rag_memory_id,
+            )
+            logger.debug(
+                f"[ToolExecutionNode] {self.id} - Built tool args with keys: {list(tool_args.keys())}"
+            )
+            
+        except Exception as e:
+            logger.error(
+                f"[ToolExecutionNode] {self.id} - Failed to build tool args: {e}",
+                exc_info=True
+            )
+            return {"messages": [AIMessage(content=f"Error building arguments: {str(e)}")]}
+        
+        # Construct tool input message
+        tool_input = {
+            "messages": [
+                AIMessage(
+                    content="",
+                    tool_calls=[{
+                        "name": self.tool_name,
+                        "args": tool_args,
+                        "id": f"{self.id}_{tool_call_id}",
+                    }]
+                )
+            ]
+        }
+        
+        try:
+            # Invoke the tool
+            result = await self.tool_node.ainvoke(tool_input)
+            
+            logger.debug(
+                f"[ToolExecutionNode] {self.id} - Tool execution completed"
+            )
+            
+            # Check for error in tool response
+            error_entry = None
+            if result and "messages" in result:
+                for msg in result["messages"]:
+                    if hasattr(msg, 'content'):
+                        try:
+                            import json
+                            content = msg.content
+                            if isinstance(content, str):
+                                parsed = json.loads(content)
+                                if isinstance(parsed, dict) and "error" in parsed:
+                                    error_msg = parsed["error"]
+                                    logger.warning(
+                                        f"[ToolExecutionNode] {self.id} - Tool returned error: {error_msg}"
+                                    )
+                                    error_entry = {"tool": self.tool_name, "error": error_msg, "node_id": self.id}
+                        except (json.JSONDecodeError, TypeError):
+                            pass
+            
+            # Return result with error tracking if error was found
+            if error_entry:
+                result["errors"] = [error_entry]
+            
+            return result
+            
+        except Exception as e:
+            logger.error(
+                f"[ToolExecutionNode] {self.id} - Tool execution failed: {e}",
+                exc_info=True
+            )
+            # Track error in state and return error message
+            from langchain_core.messages import ToolMessage
+            error_entry = {"tool": self.tool_name, "error": str(e), "node_id": self.id}
+            return {
+                "messages": [
+                    ToolMessage(
+                        content=f"Error executing tool: {str(e)}",
+                        tool_call_id=f"{self.id}_{tool_call_id}"
+                    )
+                ],
+                "errors": [error_entry]
+            }
--- a/api/app/core/memory/agent/langgraph_graph/nodes/verification_nodes.py
+++ b/api/app/core/memory/agent/langgraph_graph/nodes/verification_nodes.py
@@ -1,184 +0,0 @@
-import asyncio
-import os
-
-from app.core.logging_config import get_agent_logger
-from app.core.memory.agent.models.verification_models import VerificationResult
-from app.core.memory.agent.services.optimized_llm_service import LLMServiceMixin
-from app.core.memory.agent.utils.llm_tools import (
-    PROJECT_ROOT_,
-    ReadState,
-)
-from app.core.memory.agent.utils.redis_tool import store
-from app.core.memory.agent.utils.session_tools import SessionService
-from app.core.memory.agent.utils.template_tools import TemplateService
-from app.db import get_db_context
-
-template_root = os.path.join(PROJECT_ROOT_, 'memory', 'agent', 'utils', 'prompt')
-logger = get_agent_logger(__name__)
-
-
-class VerificationNodeService(LLMServiceMixin):
-    """
-    Verification node service class
-    
-    Handles data verification operations using LLM services. Inherits from 
-    LLMServiceMixin to provide structured LLM calling capabilities for 
-    verifying and validating retrieved information.
-    
-    Attributes:
-        template_service: Service for rendering Jinja2 templates
-    """
-
-    def __init__(self):
-        super().__init__()
-        self.template_service = TemplateService(template_root)
-
-
-# Create global service instance
-verification_service = VerificationNodeService()
-
-
-async def Verify_prompt(state: ReadState, messages_deal: VerificationResult):
-    """
-    Process verification results and generate output format
-    
-    Transforms VerificationResult objects into structured output format suitable
-    for frontend consumption. Handles conversion of VerificationItem objects to
-    dictionary format and adds metadata for tracking.
-    
-    Args:
-        state: ReadState containing storage and user configuration
-        messages_deal: VerificationResult containing verification outcomes
-        
-    Returns:
-        dict: Formatted verification result with status and metadata
-    """
-    storage_type = state.get('storage_type', '')
-    user_rag_memory_id = state.get('user_rag_memory_id', '')
-    data = state.get('data', '')
-
-    # Convert VerificationItem objects to dictionary list
-    verified_data = []
-    if messages_deal.expansion_issue:
-        for item in messages_deal.expansion_issue:
-            if hasattr(item, 'model_dump'):
-                verified_data.append(item.model_dump())
-            elif isinstance(item, dict):
-                verified_data.append(item)
-
-    Verify_result = {
-        "status": messages_deal.split_result,
-        "verified_data": verified_data,
-        "storage_type": storage_type,
-        "user_rag_memory_id": user_rag_memory_id,
-        "_intermediate": {
-            "type": "verification",
-            "title": "Data Verification",
-            "result": messages_deal.split_result,
-            "reason": messages_deal.reason or "验证完成",
-            "query": messages_deal.query,
-            "verified_count": len(verified_data),
-            "storage_type": storage_type,
-            "user_rag_memory_id": user_rag_memory_id
-        }
-    }
-    return Verify_result
-
-
-async def Verify(state: ReadState):
-    logger.info("=== Verify 节点开始执行 ===")
-    try:
-        content = state.get('data', '')
-        end_user_id = state.get('end_user_id', '')
-        memory_config = state.get('memory_config', None)
-
-        logger.info(f"Verify: content={content[:50] if content else 'empty'}..., end_user_id={end_user_id}")
-
-        history = await SessionService(store).get_history(end_user_id, end_user_id, end_user_id)
-        logger.info(f"Verify: 获取历史记录完成，history length={len(history)}")
-
-        retrieve = state.get("retrieve", {})
-        logger.info(
-            f"Verify: retrieve data type={type(retrieve)}, keys={retrieve.keys() if isinstance(retrieve, dict) else 'N/A'}")
-
-        retrieve_expansion = retrieve.get("Expansion_issue", []) if isinstance(retrieve, dict) else []
-        logger.info(f"Verify: Expansion_issue length={len(retrieve_expansion)}")
-
-        messages = {
-            "Query": content,
-            "Expansion_issue": retrieve_expansion
-        }
-
-        logger.info("Verify: 开始渲染模板")
-
-        # Generate JSON schema to guide LLM output format
-        json_schema = VerificationResult.model_json_schema()
-
-        system_prompt = await verification_service.template_service.render_template(
-            template_name='split_verify_prompt.jinja2',
-            operation_name='split_verify_prompt',
-            history=history,
-            sentence=messages,
-            json_schema=json_schema
-        )
-        logger.info(f"Verify: 模板渲染完成，prompt length={len(system_prompt)}")
-
-        # 使用优化的LLM服务，添加超时保护
-        logger.info("Verify: 开始调用 LLM")
-        try:
-            # Add asyncio.wait_for timeout wrapper to prevent infinite waiting
-            # Timeout set to 150 seconds (slightly longer than LLM config's 120 seconds)
-
-            with get_db_context() as db_session:
-                structured = await asyncio.wait_for(
-                    verification_service.call_llm_structured(
-                        state=state,
-                        db_session=db_session,
-                        system_prompt=system_prompt,
-                        response_model=VerificationResult,
-                        fallback_value={
-                            "query": content,
-                            "history": history if isinstance(history, list) else [],
-                            "expansion_issue": [],
-                            "split_result": "failed",
-                            "reason": "验证失败或超时"
-                        }
-                    ),
-                    timeout=150.0  # 150 second timeout
-                )
-            logger.info(f"Verify: LLM 调用完成，result={structured}")
-        except asyncio.TimeoutError:
-            logger.error("Verify: LLM 调用超时（150秒），使用 fallback 值")
-            structured = VerificationResult(
-                query=content,
-                history=history if isinstance(history, list) else [],
-                expansion_issue=[],
-                split_result="failed",
-                reason="LLM调用超时"
-            )
-
-        result = await Verify_prompt(state, structured)
-        logger.info("=== Verify 节点执行完成 ===")
-        return {"verify": result}
-
-    except Exception as e:
-        logger.error(f"Verify 节点执行失败: {e}", exc_info=True)
-        # 返回失败的验证结果
-        return {
-            "verify": {
-                "status": "failed",
-                "verified_data": [],
-                "storage_type": state.get('storage_type', ''),
-                "user_rag_memory_id": state.get('user_rag_memory_id', ''),
-                "_intermediate": {
-                    "type": "verification",
-                    "title": "Data Verification",
-                    "result": "failed",
-                    "reason": f"验证过程出错: {str(e)}",
-                    "query": state.get('data', ''),
-                    "verified_count": 0,
-                    "storage_type": state.get('storage_type', ''),
-                    "user_rag_memory_id": state.get('user_rag_memory_id', '')
-                }
-            }
-        }
--- a/api/app/core/memory/agent/langgraph_graph/nodes/write_nodes.py
+++ b/api/app/core/memory/agent/langgraph_graph/nodes/write_nodes.py
@@ -1,67 +0,0 @@
-from app.cache.memory.interest_memory import InterestMemoryCache
-from app.core.memory.agent.utils.llm_tools import WriteState
-from app.core.memory.agent.utils.write_tools import write
-from app.core.logging_config import get_agent_logger
-
-logger = get_agent_logger(__name__)
-
-
-async def write_node(state: WriteState) -> WriteState:
-    """
-        Write data to the database/file system.
-
-        Args:
-            state: WriteState containing messages, end_user_id, memory_config, and language
-
-        Returns:
-            dict: Contains 'write_result' with status and data fields
-        """
-    messages = state.get('messages', [])
-    end_user_id = state.get('end_user_id', '')
-    memory_config = state.get('memory_config', '')
-    language = state.get('language', 'zh')  # 默认中文
-
-    # Convert LangChain messages to structured format expected by write()
-    structured_messages = []
-    for msg in messages:
-        if hasattr(msg, 'type') and hasattr(msg, 'content'):
-            # Map LangChain message types to role names
-            role = 'user' if msg.type == 'human' else 'assistant' if msg.type == 'ai' else msg.type
-            structured_messages.append({
-                "role": role,
-                "content": msg.content  # content is now guaranteed to be a string
-            })
-
-    try:
-        result = await write(
-            messages=structured_messages,
-            end_user_id=end_user_id,
-            memory_config=memory_config,
-            language=language,
-        )
-        logger.info(f"Write completed successfully! Config: {memory_config.config_name}")
-
-        # 写入 neo4j 成功后，删除该用户的兴趣分布缓存，确保下次请求重新生成
-        for lang in ["zh", "en"]:
-            deleted = await InterestMemoryCache.delete_interest_distribution(
-                end_user_id=end_user_id,
-                language=lang,
-            )
-            if deleted:
-                logger.info(f"Invalidated interest distribution cache: end_user_id={end_user_id}, language={lang}")
-
-        write_result = {
-            "status": "success",
-            "data": structured_messages,
-            "config_id": memory_config.config_id,
-            "config_name": memory_config.config_name,
-        }
-        return {"write_result": write_result}
-
-    except Exception as e:
-        logger.error(f"Data_write failed: {e}", exc_info=True)
-        write_result = {
-            "status": "error",
-            "message": str(e),
-        }
-        return {"write_result": write_result}
--- a/api/app/core/memory/agent/langgraph_graph/read_graph.py
+++ b/api/app/core/memory/agent/langgraph_graph/read_graph.py
@@ -1,89 +1,469 @@
-#!/usr/bin/env python3
+import json
+import os
+import re
+import time
+import warnings
 from contextlib import asynccontextmanager
+from typing import Literal

-from langchain_core.messages import HumanMessage
-from langgraph.constants import START, END
+from app.core.logging_config import get_agent_logger
+from app.core.memory.agent.langgraph_graph.nodes import (
+    ToolExecutionNode,
+    create_input_message,
+)
+from app.core.memory.agent.mcp_server.services.parameter_builder import ParameterBuilder
+from app.core.memory.agent.utils.llm_tools import COUNTState, ReadState
+from app.core.memory.agent.utils.multimodal import MultimodalProcessor
+from app.schemas.memory_config_schema import MemoryConfig
+from dotenv import load_dotenv
+from langchain_core.messages import AIMessage
+from langgraph.checkpoint.memory import InMemorySaver
+from langgraph.constants import END, START
 from langgraph.graph import StateGraph
+from langgraph.prebuilt import ToolNode

-from app.db import get_db
-from app.services.memory_config_service import MemoryConfigService
+logger = get_agent_logger(__name__)

-from app.core.memory.agent.utils.llm_tools import ReadState
-from app.core.memory.agent.langgraph_graph.nodes.data_nodes import content_input_node
-from app.core.memory.agent.langgraph_graph.nodes.problem_nodes import (
-    Split_The_Problem,
-    Problem_Extension,
-)
-from app.core.memory.agent.langgraph_graph.nodes.retrieve_nodes import (
-    retrieve_nodes,
-)
-from app.core.memory.agent.langgraph_graph.nodes.perceptual_retrieve_node import (
-    perceptual_retrieve_node,
-)
-from app.core.memory.agent.langgraph_graph.nodes.summary_nodes import (
-    Input_Summary,
-    Retrieve_Summary,
-    Summary_fails,
-    Summary,
-)
-from app.core.memory.agent.langgraph_graph.nodes.verification_nodes import Verify
-from app.core.memory.agent.langgraph_graph.routing.routers import (
-    Split_continue,
-    Retrieve_continue,
-    Verify_continue,
-)
+warnings.filterwarnings("ignore", category=RuntimeWarning)
+load_dotenv()
+redishost=os.getenv("REDISHOST")
+redisport=os.getenv('REDISPORT')
+redisdb=os.getenv('REDISDB')
+redispassword=os.getenv('REDISPASSWORD')
+counter = COUNTState(limit=3)
+
+# Update loop count in workflow
+async def update_loop_count(state):
+    """Update loop counter"""
+    current_count = state.get("loop_count", 0)
+    return {"loop_count": current_count + 1}
+
+
+def Verify_continue(state: ReadState) -> Literal["Summary", "Summary_fails", "content_input"]:
+    messages = state["messages"]
+
+    # Add boundary check
+    if not messages:
+        return END
+    counter.add(1)  # Increment by 1
+
+    loop_count = counter.get_total()
+    logger.debug(f"[should_continue] Current loop count: {loop_count}")
+
+    last_message = messages[-1]
+    last_message_str = str(last_message).replace('\\', '')
+    status_tools = re.findall(r'"split_result": "(.*?)"', last_message_str)
+    logger.debug(f"Status tools: {status_tools}")
+
+    if "success" in status_tools:
+        counter.reset()
+        return "Summary"
+    elif "failed" in status_tools:
+        if loop_count < 2:  # Maximum loop count is 3
+            return "content_input"
+        else:
+            counter.reset()
+            return "Summary_fails"
+    else:
+        # Add default return value to avoid returning None
+        counter.reset()
+        return "Summary"  # Default based on business requirements
+
+
+def Retrieve_continue(state) -> Literal["Verify", "Retrieve_Summary"]:
+    """
+    Determine routing based on search_switch value.
+
+    Args:
+        state: State dictionary containing search_switch
+
+    Returns:
+        Next node to execute
+    """
+    # Direct dictionary access instead of regex parsing
+    search_switch = state.get("search_switch")
+
+    # Handle case where search_switch might be in messages
+    if search_switch is None and "messages" in state:
+        messages = state.get("messages", [])
+        if messages:
+            last_message = messages[-1]
+            # Try to extract from tool_calls args
+            if hasattr(last_message, "tool_calls") and last_message.tool_calls:
+                for tool_call in last_message.tool_calls:
+                    if isinstance(tool_call, dict) and "args" in tool_call:
+                        search_switch = tool_call["args"].get("search_switch")
+                        break
+
+    # Convert to string for comparison if needed
+    if search_switch is not None:
+        search_switch = str(search_switch)
+        if search_switch == '0':
+            return 'Verify'
+        elif search_switch == '1':
+            return 'Retrieve_Summary'
+
+    # Add default return value to avoid returning None
+    return 'Retrieve_Summary'  # Default based on business logic
+
+
+def Split_continue(state) -> Literal["Split_The_Problem", "Input_Summary"]:
+    """
+    Determine routing based on search_switch value.
+
+    Args:
+        state: State dictionary containing search_switch
+
+    Returns:
+        Next node to execute
+    """
+    logger.debug(f"Split_continue state: {state}")
+
+    # Direct dictionary access instead of regex parsing
+    search_switch = state.get("search_switch")
+
+    # Handle case where search_switch might be in messages
+    if search_switch is None and "messages" in state:
+        messages = state.get("messages", [])
+        if messages:
+            last_message = messages[-1]
+            # Try to extract from tool_calls args
+            if hasattr(last_message, "tool_calls") and last_message.tool_calls:
+                for tool_call in last_message.tool_calls:
+                    if isinstance(tool_call, dict) and "args" in tool_call:
+                        search_switch = tool_call["args"].get("search_switch")
+                        break
+
+    # Convert to string for comparison if needed
+    if search_switch is not None:
+        search_switch = str(search_switch)
+        if search_switch == '2':
+            return 'Input_Summary'
+    return 'Split_The_Problem'  # Default case
+
+
+class ProblemExtensionNode:
+    def __init__(self, tool, id, namespace, search_switch, apply_id, group_id, storage_type="", user_rag_memory_id=""):
+        self.tool_node = ToolNode([tool])
+        self.id = id
+        self.tool_name = tool.name if hasattr(tool, 'name') else str(tool)
+        self.namespace = namespace
+        self.search_switch = search_switch
+        self.apply_id = apply_id
+        self.group_id = group_id
+        self.storage_type = storage_type
+        self.user_rag_memory_id = user_rag_memory_id
+
+    async def __call__(self, state):
+        messages = state["messages"]
+        last_message = messages[-1] if messages else ""
+        logger.debug(f"ProblemExtensionNode {self.id} - Current time: {time.time()} - Message: {last_message}")
+        if self.tool_name == 'Input_Summary':
+            tool_call = re.findall("'id': '(.*?)'", str(last_message))[0]
+        else:
+            tool_call = str(re.findall(r"tool_call_id=.*?'(.*?)'", str(last_message))[0]).replace('\\', '').split('_id')[1]
+        
+        # Try to extract actual content payload from previous tool result
+        raw_msg = last_message.content if hasattr(last_message, 'content') else str(last_message)
+        extracted_payload = None
+        # Capture ToolMessage content field (supports single/double quotes), avoid greedy matching
+        m = re.search(r"content=(?:\"|\')(.*?)(?:\"|\'),\s*name=", raw_msg, flags=re.S)
+        if m:
+            extracted_payload = m.group(1)
+        else:
+            # Fallback: use raw string directly
+            extracted_payload = raw_msg
+
+        # Try to parse content as JSON first
+        try:
+            content = json.loads(extracted_payload)
+        except Exception:
+            # Try to extract JSON fragment from text and parse
+            parsed = None
+            candidates = re.findall(r"[\[{].*[\]}]", extracted_payload, flags=re.S)
+            for cand in candidates:
+                try:
+                    parsed = json.loads(cand)
+                    break
+                except Exception:
+                    continue
+            # If still fails, use raw string as content
+            content = parsed if parsed is not None else extracted_payload
+
+        # Build correct parameters based on tool name
+        tool_args = {}
+
+        if self.tool_name == "Verify":
+            # Verify tool requires context and usermessages parameters
+            if isinstance(content, dict):
+                tool_args["context"] = content
+            else:
+                tool_args["context"] = {"content": content}
+            tool_args["usermessages"] = str(tool_call)
+            tool_args["apply_id"] = str(self.apply_id)
+            tool_args["group_id"] = str(self.group_id)
+        elif self.tool_name == "Retrieve":
+            # Retrieve tool requires context and usermessages parameters
+            if isinstance(content, dict):
+                tool_args["context"] = content
+            else:
+                tool_args["context"] = {"content": content}
+            tool_args["usermessages"] = str(tool_call)
+            tool_args["search_switch"] = str(self.search_switch)
+            tool_args["apply_id"] = str(self.apply_id)
+            tool_args["group_id"] = str(self.group_id)
+        elif self.tool_name == "Summary":
+            # Summary tool requires string type context parameter
+            if isinstance(content, dict):
+                # Convert dict to JSON string
+                tool_args["context"] = json.dumps(content, ensure_ascii=False)
+            else:
+                tool_args["context"] = str(content)
+            tool_args["usermessages"] = str(tool_call)
+            tool_args["apply_id"] = str(self.apply_id)
+            tool_args["group_id"] = str(self.group_id)
+        elif self.tool_name == "Summary_fails":
+            # Summary_fails tool requires string type context parameter
+            if isinstance(content, dict):
+                # Convert dict to JSON string
+                tool_args["context"] = json.dumps(content, ensure_ascii=False)
+            else:
+                tool_args["context"] = str(content)
+            tool_args["usermessages"] = str(tool_call)
+            tool_args["apply_id"] = str(self.apply_id)
+            tool_args["group_id"] = str(self.group_id)
+        elif self.tool_name == 'Input_Summary':
+            tool_args["context"] = str(last_message)
+            tool_args["usermessages"] = str(tool_call)
+            tool_args["search_switch"] = str(self.search_switch)
+            tool_args["apply_id"] = str(self.apply_id)
+            tool_args["group_id"] = str(self.group_id)
+            tool_args["storage_type"] = getattr(self, 'storage_type', "")
+            tool_args["user_rag_memory_id"] = getattr(self, 'user_rag_memory_id', "")
+        elif self.tool_name == 'Retrieve_Summary':
+            # Retrieve_Summary expects dict directly, not JSON string
+            # content might be a JSON string, try to parse it
+            if isinstance(content, str):
+                try:
+                    parsed_content = json.loads(content)
+                    # Check if it has a "context" key
+                    if isinstance(parsed_content, dict) and "context" in parsed_content:
+                        tool_args["context"] = parsed_content["context"]
+                    else:
+                        tool_args["context"] = parsed_content
+                except json.JSONDecodeError:
+                    # If parsing fails, wrap the string
+                    tool_args["context"] = {"content": content}
+            elif isinstance(content, dict):
+                # Check if content has a "context" key that needs unwrapping
+                if "context" in content:
+                    tool_args["context"] = content["context"]
+                else:
+                    tool_args["context"] = content
+            else:
+                tool_args["context"] = {"content": str(content)}
+
+            tool_args["usermessages"] = str(tool_call)
+            tool_args["apply_id"] = str(self.apply_id)
+            tool_args["group_id"] = str(self.group_id)
+        else:
+            # Other tools use context parameter
+            if isinstance(content, dict):
+                tool_args["context"] = content
+            else:
+                tool_args["context"] = {"content": content}
+            tool_args["usermessages"] = str(tool_call)
+            tool_args["apply_id"] = str(self.apply_id)
+            tool_args["group_id"] = str(self.group_id)
+
+
+        tool_input = {
+            "messages": [
+                AIMessage(
+                    content="",
+                    tool_calls=[{
+                        "name": self.tool_name,
+                        "args": tool_args,
+                        "id": self.id + f"{tool_call}",
+                    }]
+                )
+            ]
+        }
+        result = await self.tool_node.ainvoke(tool_input)
+        result_text = str(result)
+
+        return {"messages": [AIMessage(content=result_text)]}


@asynccontextmanager
-async def make_read_graph():
+async def make_read_graph(namespace, tools, search_switch, apply_id, group_id, memory_config: MemoryConfig, storage_type=None, user_rag_memory_id=None):
    """
-    Create and return a LangGraph workflow for memory reading operations
+    Create a read graph workflow for memory operations.
    
-    Builds a state graph workflow that handles memory retrieval, problem analysis,
-    verification, and summarization. The workflow includes nodes for content input,
-    problem splitting, retrieval, verification, and various summary operations.
-    
-    Yields:
-        StateGraph: Compiled LangGraph workflow for memory reading
-        
-    Raises:
-        Exception: If workflow creation fails
+    Args:
+        namespace: Namespace identifier
+        tools: MCP tools loaded from session
+        search_switch: Search mode switch ("0", "1", or "2")
+        apply_id: Application identifier
+        group_id: Group identifier
+        memory_config: MemoryConfig object containing all configuration
+        storage_type: Storage type (optional)
+        user_rag_memory_id: User RAG memory ID (optional)
    """
-    try:
-        # Build workflow graph
-        workflow = StateGraph(ReadState)    
-        workflow.add_node("content_input", content_input_node)
-        workflow.add_node("Split_The_Problem", Split_The_Problem)
-        workflow.add_node("Problem_Extension", Problem_Extension)
-        workflow.add_node("Input_Summary", Input_Summary)
-        workflow.add_node("Retrieve", retrieve_nodes)
-        # workflow.add_node("Retrieve", retrieve)
-        workflow.add_node("Perceptual_Retrieve", perceptual_retrieve_node)
-        workflow.add_node("Verify", Verify)
-        workflow.add_node("Retrieve_Summary", Retrieve_Summary)
-        workflow.add_node("Summary", Summary)
-        workflow.add_node("Summary_fails", Summary_fails)
+    memory = InMemorySaver()
+    tool = [i.name for i in tools]
+    logger.info(f"Initializing read graph with tools: {tool}")
+    logger.info(f"Using memory_config: {memory_config.config_name} (id={memory_config.config_id})")
+    
+    # Extract tool functions
+    Split_The_Problem_ = next((t for t in tools if t.name == "Split_The_Problem"), None)
+    Problem_Extension_ = next((t for t in tools if t.name == "Problem_Extension"), None)
+    Retrieve_ = next((t for t in tools if t.name == "Retrieve"), None)
+    Verify_ = next((t for t in tools if t.name == "Verify"), None)
+    Summary_ = next((t for t in tools if t.name == "Summary"), None)
+    Summary_fails_ = next((t for t in tools if t.name == "Summary_fails"), None)
+    Retrieve_Summary_ = next((t for t in tools if t.name == "Retrieve_Summary"), None)
+    Input_Summary_ = next((t for t in tools if t.name == "Input_Summary"), None)
+    
+    # Instantiate services
+    parameter_builder = ParameterBuilder()
+    multimodal_processor = MultimodalProcessor()
+    
+    # Create nodes using new modular components
+    Split_The_Problem_node = ToolNode([Split_The_Problem_])
+    
+    Problem_Extension_node = ToolExecutionNode(
+        tool=Problem_Extension_,
+        node_id="Problem_Extension_id",
+        namespace=namespace,
+        search_switch=search_switch,
+        apply_id=apply_id,
+        group_id=group_id,
+        parameter_builder=parameter_builder,
+        storage_type=storage_type,
+        user_rag_memory_id=user_rag_memory_id,
+        memory_config=memory_config,
+    )

-        # Add edges to define workflow flow
-        workflow.add_edge(START, "content_input")
-        workflow.add_conditional_edges("content_input", Split_continue)
-        workflow.add_edge("Input_Summary", END)
-        workflow.add_edge("Split_The_Problem", "Problem_Extension")
-        # After Problem_Extension, retrieve perceptual memory first, then main Retrieve
-        workflow.add_edge("Problem_Extension", "Perceptual_Retrieve")
-        workflow.add_edge("Perceptual_Retrieve", "Retrieve")
-        workflow.add_conditional_edges("Retrieve", Retrieve_continue)
-        workflow.add_edge("Retrieve_Summary", END)
-        workflow.add_conditional_edges("Verify", Verify_continue)
-        workflow.add_edge("Summary_fails", END)
-        workflow.add_edge("Summary", END)
+    Retrieve_node = ToolExecutionNode(
+        tool=Retrieve_,
+        node_id="Retrieve_id",
+        namespace=namespace,
+        search_switch=search_switch,
+        apply_id=apply_id,
+        group_id=group_id,
+        parameter_builder=parameter_builder,
+        storage_type=storage_type,
+        user_rag_memory_id=user_rag_memory_id,
+        memory_config=memory_config,
+    )

-        # workflow.add_edge("Retrieve", END)
+    Verify_node = ToolExecutionNode(
+        tool=Verify_,
+        node_id="Verify_id",
+        namespace=namespace,
+        search_switch=search_switch,
+        apply_id=apply_id,
+        group_id=group_id,
+        parameter_builder=parameter_builder,
+        storage_type=storage_type,
+        user_rag_memory_id=user_rag_memory_id,
+        memory_config=memory_config,
+    )
+    
+    Summary_node = ToolExecutionNode(
+        tool=Summary_,
+        node_id="Summary_id",
+        namespace=namespace,
+        search_switch=search_switch,
+        apply_id=apply_id,
+        group_id=group_id,
+        parameter_builder=parameter_builder,
+        storage_type=storage_type,
+        user_rag_memory_id=user_rag_memory_id,
+        memory_config=memory_config,
+    )

-        # Compile workflow
-        graph = workflow.compile()
-        yield graph
+    Summary_fails_node = ToolExecutionNode(
+        tool=Summary_fails_,
+        node_id="Summary_fails_id",
+        namespace=namespace,
+        search_switch=search_switch,
+        apply_id=apply_id,
+        group_id=group_id,
+        parameter_builder=parameter_builder,
+        storage_type=storage_type,
+        user_rag_memory_id=user_rag_memory_id,
+        memory_config=memory_config,
+    )

-    except Exception as e:
-        logger.error(f"创建工作流失败: {e}")
-        raise
+    Retrieve_Summary_node = ToolExecutionNode(
+        tool=Retrieve_Summary_,
+        node_id="Retrieve_Summary_id",
+        namespace=namespace,
+        search_switch=search_switch,
+        apply_id=apply_id,
+        group_id=group_id,
+        parameter_builder=parameter_builder,
+        storage_type=storage_type,
+        user_rag_memory_id=user_rag_memory_id,
+        memory_config=memory_config,
+    )
+
+    Input_Summary_node = ToolExecutionNode(
+        tool=Input_Summary_,
+        node_id="Input_Summary_id",
+        namespace=namespace,
+        search_switch=search_switch,
+        apply_id=apply_id,
+        group_id=group_id,
+        parameter_builder=parameter_builder,
+        storage_type=storage_type,
+        user_rag_memory_id=user_rag_memory_id,
+        memory_config=memory_config,
+    )
+
+    async def content_input_node(state):
+        state_search_switch = state.get("search_switch", search_switch)
+
+        tool_name = "Input_Summary" if state_search_switch == '2' else "Split_The_Problem"
+        session_prefix = "input_summary_call_id" if state_search_switch == '2' else "split_call_id"
+
+        return await create_input_message(
+            state=state,
+            tool_name=tool_name,
+            session_id=f"{session_prefix}_{namespace}",
+            search_switch=search_switch,
+            apply_id=apply_id,
+            group_id=group_id,
+            multimodal_processor=multimodal_processor,
+            memory_config=memory_config,
+        )
+
+    
+    # Build workflow graph
+    workflow = StateGraph(ReadState)
+    workflow.add_node("content_input", content_input_node)
+    workflow.add_node("Split_The_Problem", Split_The_Problem_node)
+    workflow.add_node("Problem_Extension", Problem_Extension_node)
+    workflow.add_node("Retrieve", Retrieve_node)
+    workflow.add_node("Verify", Verify_node)
+    workflow.add_node("Summary", Summary_node)
+    workflow.add_node("Summary_fails", Summary_fails_node)
+    workflow.add_node("Retrieve_Summary", Retrieve_Summary_node)
+    workflow.add_node("Input_Summary", Input_Summary_node)
+
+    # Add edges using imported routers
+    workflow.add_edge(START, "content_input")
+    workflow.add_conditional_edges("content_input", Split_continue)
+    workflow.add_edge("Input_Summary", END)
+    workflow.add_edge("Split_The_Problem", "Problem_Extension")
+    workflow.add_edge("Problem_Extension", "Retrieve")
+    workflow.add_conditional_edges("Retrieve", Retrieve_continue)
+    workflow.add_edge("Retrieve_Summary", END)
+    workflow.add_conditional_edges("Verify", Verify_continue)
+    workflow.add_edge("Summary_fails", END)
+    workflow.add_edge("Summary", END)
+
+    graph = workflow.compile(checkpointer=memory)
+    yield graph
--- a/api/app/core/memory/agent/langgraph_graph/routing/init.py
+++ b/api/app/core/memory/agent/langgraph_graph/routing/init.py
@@ -0,0 +1,13 @@
+"""LangGraph routing logic."""
+
+from app.core.memory.agent.langgraph_graph.routing.routers import (
+    Verify_continue,
+    Retrieve_continue,
+    Split_continue,
+)
+
+__all__ = [
+    "Verify_continue",
+    "Retrieve_continue",
+    "Split_continue",
+]
--- a/api/app/core/memory/agent/langgraph_graph/routing/routers.py
+++ b/api/app/core/memory/agent/langgraph_graph/routing/routers.py
@@ -1,64 +1,123 @@
+"""
+Routing functions for LangGraph conditional edges.
+
+This module provides routing functions that determine the next node to execute
+based on state values. All functions return Literal types for type safety.
+"""
+
+import logging
+import re
 from typing import Literal

-from app.core.logging_config import get_agent_logger
+from app.core.memory.agent.langgraph_graph.state.extractors import extract_search_switch
 from app.core.memory.agent.utils.llm_tools import ReadState, COUNTState

-logger = get_agent_logger(__name__)
+logger = logging.getLogger(__name__)
+
+# Global counter for Verify routing
 counter = COUNTState(limit=3)


-def Split_continue(state: ReadState) -> Literal["Split_The_Problem", "Input_Summary"]:
-    """
-    Determine routing based on search_switch value.
-
-    Args:
-        state: State dictionary containing search_switch
-
-    Returns:
-        Next node to execute
-    """
-    logger.debug(f"Split_continue state: {state}")
-    search_switch = state.get('search_switch', '')
-    if search_switch is not None:
-        search_switch = str(search_switch)
-        if search_switch == '2':
-            return 'Input_Summary'
-    return 'Split_The_Problem'  # 默认情况
-
-
-def Retrieve_continue(state) -> Literal["Verify", "Retrieve_Summary"]:
-    """
-    Determine routing based on search_switch value.
-
-    Args:
-        state: State dictionary containing search_switch
-
-    Returns:
-        Next node to execute
-    """
-    search_switch = state.get('search_switch', '')
-    if search_switch is not None:
-        search_switch = str(search_switch)
-        if search_switch == '0':
-            return 'Verify'
-        elif search_switch == '1':
-            return 'Retrieve_Summary'
-    return 'Retrieve_Summary'  # Default based on business logic
-
-
 def Verify_continue(state: ReadState) -> Literal["Summary", "Summary_fails", "content_input"]:
-    status = state.get('verify', '')['status']
-    # loop_count = counter.get_total()
-    if "success" in status:
-        # counter.reset()
+    """
+    Determine routing after Verify node based on verification result.
+    
+    This function checks the verification result in the last message and routes to:
+    - Summary: if verification succeeded
+    - content_input: if verification failed and retry limit not reached
+    - Summary_fails: if verification failed and retry limit reached
+    
+    Args:
+        state: LangGraph state containing messages
+        
+    Returns:
+        Next node name as Literal type
+    """
+    messages = state.get("messages", [])
+    
+    # Boundary check
+    if not messages:
+        logger.warning("[Verify_continue] No messages in state, defaulting to Summary")
+        counter.reset()
        return "Summary"
-    elif "failed" in status:
-        # if loop_count < 2:  # Maximum loop count is 3
-        #     return "content_input"
-        # else:
-        # counter.reset()
-        return "Summary_fails"
+    
+    # Increment counter
+    counter.add(1)
+    loop_count = counter.get_total()
+    logger.debug(f"[Verify_continue] Current loop count: {loop_count}")
+    
+    # Extract verification result from last message
+    last_message = messages[-1]
+    last_message_str = str(last_message).replace('\\', '')
+    status_tools = re.findall(r'"split_result": "(.*?)"', last_message_str)
+    logger.debug(f"[Verify_continue] Status tools: {status_tools}")
+    
+    # Route based on verification result
+    if "success" in status_tools:
+        counter.reset()
+        return "Summary"
+    elif "failed" in status_tools:
+        if loop_count < 2:  # Max retry count is 2
+            return "content_input"
+        else:
+            counter.reset()
+            return "Summary_fails"
    else:
-        # Add default return value to avoid returning None
-        # counter.reset()
-        return "Summary"  # Default based on business requirements
+        # Default to Summary if status is unclear
+        counter.reset()
+        return "Summary"
+
+
+def Retrieve_continue(state: dict) -> Literal["Verify", "Retrieve_Summary"]:
+    """
+    Determine routing after Retrieve node based on search_switch value.
+    
+    This function routes based on the search_switch parameter:
+    - search_switch == '0': Route to Verify (verification needed)
+    - search_switch == '1': Route to Retrieve_Summary (direct summary)
+    
+    Args:
+        state: LangGraph state dictionary
+        
+    Returns:
+        Next node name as Literal type
+    """
+    search_switch = extract_search_switch(state)
+    
+    logger.debug(f"[Retrieve_continue] search_switch: {search_switch}")
+    
+    if search_switch == '0':
+        return 'Verify'
+    elif search_switch == '1':
+        return 'Retrieve_Summary'
+    
+    # Default to Retrieve_Summary
+    logger.debug("[Retrieve_continue] No valid search_switch, defaulting to Retrieve_Summary")
+    return 'Retrieve_Summary'
+
+
+def Split_continue(state: dict) -> Literal["Split_The_Problem", "Input_Summary"]:
+    """
+    Determine routing after content_input node based on search_switch value.
+    
+    This function routes based on the search_switch parameter:
+    - search_switch == '2': Route to Input_Summary (direct input summary)
+    - Otherwise: Route to Split_The_Problem (problem decomposition)
+    
+    Args:
+        state: LangGraph state dictionary
+        
+    Returns:
+        Next node name as Literal type
+    """
+    logger.debug(f"[Split_continue] state keys: {state.keys()}")
+    
+    search_switch = extract_search_switch(state)
+    
+    logger.debug(f"[Split_continue] search_switch: {search_switch}")
+    
+    if search_switch == '2':
+        return 'Input_Summary'
+    
+    # Default to Split_The_Problem
+    return 'Split_The_Problem'
--- a/api/app/core/memory/agent/langgraph_graph/routing/write_router.py
+++ b/api/app/core/memory/agent/langgraph_graph/routing/write_router.py
@@ -1,273 +0,0 @@
-import json
-import os
-
-from app.core.logging_config import get_agent_logger
-from app.core.memory.agent.langgraph_graph.tools.write_tool import format_parsing, messages_parse
-from app.core.memory.agent.models.write_aggregate_model import WriteAggregateModel
-from app.core.memory.agent.utils.llm_tools import PROJECT_ROOT_
-from app.core.memory.agent.utils.redis_tool import count_store
-from app.core.memory.agent.utils.redis_tool import write_store
-from app.core.memory.agent.utils.template_tools import TemplateService
-from app.core.memory.utils.llm.llm_utils import MemoryClientFactory
-from app.db import get_db_context
-from app.repositories.memory_short_repository import LongTermMemoryRepository
-from app.schemas.memory_agent_schema import AgentMemory_Long_Term
-from app.services.task_service import get_task_memory_write_result
-from app.tasks import write_message_task
-from app.utils.config_utils import resolve_config_id
-
-logger = get_agent_logger(__name__)
-template_root = os.path.join(PROJECT_ROOT_, 'memory', 'agent', 'utils', 'prompt')
-
-
-async def write(
-        storage_type,
-        end_user_id,
-        user_message,
-        ai_message,
-        user_rag_memory_id,
-        actual_end_user_id,
-        actual_config_id,
-        long_term_messages=None
-):
-    """
-    Write memory with structured message support
-
-    Handles memory writing operations for different storage types (Neo4j/RAG).
-    Supports both individual message pairs and batch long-term message processing.
-
-    Args:
-        storage_type: Storage type identifier ("neo4j" or "rag")
-        end_user_id: Terminal user identifier
-        user_message: User message content
-        ai_message: AI response content
-        user_rag_memory_id: RAG memory identifier
-        actual_end_user_id: Actual user identifier for storage
-        actual_config_id: Configuration identifier
-        long_term_messages: Optional list of structured messages for batch processing
-
-    Logic explanation:
-    - RAG mode: Combines user_message and ai_message into string format, maintains original logic
-    - Neo4j mode: Uses structured message lists
-      1. If both user_message and ai_message are not empty: Creates paired messages [user, assistant]
-      2. If only user_message exists: Creates single user message [user] (for historical memory scenarios)
-      3. Each message is converted to independent Chunk, preserving speaker field
-    """
-
-    if long_term_messages is None:
-        long_term_messages = []
-    with get_db_context() as db:
-        actual_config_id = resolve_config_id(actual_config_id, db)
-        # Neo4j mode: Use structured message lists
-        structured_messages = []
-
-        # Always add user message (if not empty)
-        if isinstance(user_message, str) and user_message.strip() != "":
-            structured_messages.append({"role": "user", "content": user_message})
-
-        # Only add assistant message when AI reply is not empty
-        if isinstance(ai_message, str) and ai_message.strip() != "":
-            structured_messages.append({"role": "assistant", "content": ai_message})
-
-        # If long_term_messages provided, use it to replace structured_messages
-        if long_term_messages and isinstance(long_term_messages, list):
-            structured_messages = long_term_messages
-        elif long_term_messages and isinstance(long_term_messages, str):
-            # If it's a JSON string, parse it first
-            try:
-                structured_messages = json.loads(long_term_messages)
-            except json.JSONDecodeError:
-                logger.error(f"Failed to parse long_term_messages as JSON: {long_term_messages}")
-
-        # If no messages, return directly
-        if not structured_messages:
-            logger.warning(f"No messages to write for user {actual_end_user_id}")
-            return
-
-        logger.info(
-            f"[WRITE] Submitting Celery task - user={actual_end_user_id}, messages={len(structured_messages)}, config={actual_config_id}")
-        write_id = write_message_task.delay(
-            actual_end_user_id,  # end_user_id: User ID
-            structured_messages,  # message: JSON string format message list
-            str(actual_config_id),  # config_id: Configuration ID string
-            storage_type,  # storage_type: "neo4j"
-            user_rag_memory_id or ""  # user_rag_memory_id: RAG memory ID (not used in Neo4j mode)
-        )
-        logger.info(f"[WRITE] Celery task submitted - task_id={write_id}")
-        write_status = get_task_memory_write_result(str(write_id))
-        logger.info(f'[WRITE] Task result - user={actual_end_user_id}, status={write_status}')
-
-
-async def term_memory_save(end_user_id, strategy_type, scope):
-    """
-    Save long-term memory data to database
-
-    Handles the storage of long-term memory data based on different strategies
-    (chunk-based or aggregate-based) and manages the transition from short-term
-    to long-term memory storage.
-
-    Args:
-        end_user_id: User identifier for memory association
-        strategy_type: Memory storage strategy type (STRATEGY_CHUNK or STRATEGY_AGGREGATE)
-        scope: Scope/window size for memory processing
-    """
-    with get_db_context() as db_session:
-        repo = LongTermMemoryRepository(db_session)
-
-        from app.core.memory.agent.utils.redis_tool import write_store
-        result = write_store.get_session_by_userid(end_user_id)
-        if not result:
-            logger.warning(f"No write data found for user {end_user_id}")
-            return
-        if strategy_type in [AgentMemory_Long_Term.STRATEGY_CHUNK, AgentMemory_Long_Term.STRATEGY_AGGREGATE]:
-            data = await format_parsing(result, "dict")
-            chunk_data = data[:scope]
-            if len(chunk_data) == scope:
-                repo.upsert(end_user_id, chunk_data)
-                logger.info(f'---------写入短长期-----------')
-        else:
-            long_time_data = write_store.find_user_recent_sessions(end_user_id, 5)
-            long_messages = await messages_parse(long_time_data)
-            repo.upsert(end_user_id, long_messages)
-            logger.info(f'写入短长期：')
-
-
-async def window_dialogue(end_user_id, langchain_messages, memory_config, scope):
-    """
-    Process dialogue based on window size and write to Neo4j
-
-    Manages conversation data based on a sliding window approach. When the window
-    reaches the specified scope size, it triggers long-term memory storage to Neo4j.
-
-    Args:
-        end_user_id: Terminal user identifier
-        memory_config: Memory configuration object containing settings
-        langchain_messages: Original message data list
-        scope: Window size determining when to trigger long-term storage
-    """
-    is_end_user_has_history = count_store.get_sessions_count(end_user_id)
-    if is_end_user_has_history:
-        end_user_visit_count, redis_messages = is_end_user_has_history
-    else:
-        count_store.save_sessions_count(end_user_id, 1, langchain_messages)
-        return
-    end_user_visit_count += 1
-    if end_user_visit_count < scope:
-        redis_messages.extend(langchain_messages)
-        count_store.update_sessions_count(end_user_id, end_user_visit_count, redis_messages)
-    else:
-        logger.info('写入长期记忆NEO4J')
-        redis_messages.extend(langchain_messages)
-        # Get config_id (if memory_config is an object, extract config_id; otherwise use directly)
-        if hasattr(memory_config, 'config_id'):
-            config_id = memory_config.config_id
-        else:
-            config_id = memory_config
-
-        write_message_task.delay(
-            end_user_id,  # end_user_id: User ID
-            redis_messages,  # message: JSON string format message list
-            config_id,  # config_id: Configuration ID string
-            AgentMemory_Long_Term.STORAGE_NEO4J,  # storage_type: "neo4j"
-            ""  # user_rag_memory_id: RAG memory ID (not used in Neo4j mode)
-        )
-        count_store.update_sessions_count(end_user_id, 0, [])
-
-
-async def memory_long_term_storage(end_user_id, memory_config, time):
-    """
-    Process memory storage based on time intervals and write to Neo4j
-
-    Retrieves Redis data based on time intervals and writes it to Neo4j for
-    long-term storage. This function handles time-based memory consolidation.
-
-    Args:
-        end_user_id: Terminal user identifier
-        memory_config: Memory configuration object containing settings
-        time: Time interval for data retrieval
-    """
-    long_time_data = write_store.find_user_recent_sessions(end_user_id, time)
-    format_messages = long_time_data
-    messages = []
-    memory_config = memory_config.config_id
-    for i in format_messages:
-        message = json.loads(i['Query'])
-        messages += message
-    if format_messages:
-        await write(AgentMemory_Long_Term.STORAGE_NEO4J, end_user_id, "", "", None, end_user_id,
-                    memory_config, messages)
-
-
-async def aggregate_judgment(end_user_id: str, ori_messages: list, memory_config) -> dict:
-    """
-    Aggregation judgment function: determine if input sentence and historical messages describe the same event
-
-    Uses LLM-based analysis to determine whether new messages should be aggregated with existing
-    historical data or stored as separate events. This helps optimize memory storage and retrieval.
-    
-    Args:
-        end_user_id: Terminal user identifier
-        ori_messages: Original message list, format like [{"role": "user", "content": "..."}, {"role": "assistant", "content": "..."}]
-        memory_config: Memory configuration object containing LLM settings
-
-    Returns:
-        dict: Aggregation judgment result containing is_same_event flag and processed output
-    """
-    history = None
-    try:
-        # 1. Get historical session data (using new method)
-        result = write_store.get_all_sessions_by_end_user_id(end_user_id)
-        history = await format_parsing(result)
-        if not result:
-            history = []
-        else:
-            history = await format_parsing(result)
-        json_schema = WriteAggregateModel.model_json_schema()
-        template_service = TemplateService(template_root)
-        system_prompt = await template_service.render_template(
-            template_name='write_aggregate_judgment.jinja2',
-            operation_name='aggregate_judgment',
-            history=history,
-            sentence=ori_messages,
-            json_schema=json_schema
-        )
-        with get_db_context() as db_session:
-            factory = MemoryClientFactory(db_session)
-            llm_client = factory.get_llm_client(memory_config.llm_model_id)
-            messages = [
-                {
-                    "role": "user",
-                    "content": system_prompt
-                }
-            ]
-            structured = await llm_client.response_structured(
-                messages=messages,
-                response_model=WriteAggregateModel
-            )
-        output_value = structured.output
-        if isinstance(output_value, list):
-            output_value = [
-                {"role": msg.role, "content": msg.content}
-                for msg in output_value
-            ]
-
-        result_dict = {
-            "is_same_event": structured.is_same_event,
-            "output": output_value
-        }
-        if not structured.is_same_event:
-            logger.info(result_dict)
-            await write("neo4j", end_user_id, "", "", None, end_user_id,
-                        memory_config.config_id, output_value)
-        return result_dict
-
-    except Exception as e:
-        logger.error(f"[aggregate_judgment] 发生错误: {e}", exc_info=True)
-
-        return {
-            "is_same_event": False,
-            "output": ori_messages,
-            "messages": ori_messages,
-            "history": history if 'history' in locals() else [],
-            "error": str(e)
-        }
--- a/api/app/core/memory/agent/langgraph_graph/state/init.py
+++ b/api/app/core/memory/agent/langgraph_graph/state/init.py
@@ -0,0 +1,13 @@
+"""LangGraph state management utilities."""
+
+from app.core.memory.agent.langgraph_graph.state.extractors import (
+    extract_search_switch,
+    extract_tool_call_id,
+    extract_content_payload,
+)
+
+__all__ = [
+    "extract_search_switch",
+    "extract_tool_call_id",
+    "extract_content_payload",
+]
--- a/api/app/core/memory/agent/langgraph_graph/state/extractors.py
+++ b/api/app/core/memory/agent/langgraph_graph/state/extractors.py
@@ -0,0 +1,179 @@
+"""
+State extraction utilities for type-safe access to LangGraph state values.
+
+This module provides utility functions for extracting values from LangGraph state
+dictionaries with proper error handling and sensible defaults.
+"""
+
+import json
+import logging
+from typing import Any, Optional
+
+logger = logging.getLogger(__name__)
+
+def extract_search_switch(state: dict) -> Optional[str]:
+    """
+    Extract search_switch from state or messages.
+    """
+
+    search_switch = state.get("search_switch")
+
+    if search_switch is not None:
+        return str(search_switch)
+
+    # Try to extract from messages
+    messages = state.get("messages", [])
+    if not messages:
+        return None
+
+    # 从最新的消息开始查找
+    for message in reversed(messages):
+        # 尝试从 tool_calls 中提取
+        if hasattr(message, "tool_calls") and message.tool_calls:
+            for tool_call in message.tool_calls:
+                if isinstance(tool_call, dict):
+                    # 从 tool_call 的 args 中提取
+                    if "args" in tool_call and isinstance(tool_call["args"], dict):
+                        search_switch = tool_call["args"].get("search_switch")
+                        if search_switch is not None:
+                            return str(search_switch)
+                    # 直接从 tool_call 中提取
+                    search_switch = tool_call.get("search_switch")
+                    if search_switch is not None:
+                        return str(search_switch)
+
+        # 尝试从 content 中提取（如果是 JSON 格式）
+        if hasattr(message, "content"):
+            try:
+                import json
+                if isinstance(message.content, str):
+                    content_data = json.loads(message.content)
+                    if isinstance(content_data, dict):
+                        search_switch = content_data.get("search_switch")
+                        if search_switch is not None:
+                            return str(search_switch)
+            except (json.JSONDecodeError, ValueError):
+                pass
+
+    return None
+
+
+def extract_tool_call_id(message: Any) -> str:
+    """
+    Extract tool call ID from message using structured attributes.
+    
+    This function extracts the tool call ID from a message object, handling both
+    direct attribute access and tool_calls list structures.
+    
+    Args:
+        message: Message object (typically ToolMessage or AIMessage)
+        
+    Returns:
+        Tool call ID as string
+        
+    Raises:
+        ValueError: If tool call ID cannot be extracted
+        
+    Examples:
+        >>> message = ToolMessage(content="...", tool_call_id="call_123")
+        >>> extract_tool_call_id(message)
+        'call_123'
+    """
+    # Try direct attribute access for ToolMessage
+    if hasattr(message, "tool_call_id"):
+        tool_call_id = message.tool_call_id
+        if tool_call_id:
+            return str(tool_call_id)
+    
+    # Try extracting from tool_calls list for AIMessage
+    if hasattr(message, "tool_calls") and message.tool_calls:
+        tool_call = message.tool_calls[0]
+        if isinstance(tool_call, dict) and "id" in tool_call:
+            return str(tool_call["id"])
+    
+    # Try extracting from id attribute
+    if hasattr(message, "id"):
+        message_id = message.id
+        if message_id:
+            return str(message_id)
+    
+    # If all else fails, raise an error
+    raise ValueError(f"Could not extract tool call ID from message: {type(message)}")
+
+
+def extract_content_payload(message: Any) -> Any:
+    """
+    Extract content payload from ToolMessage, parsing JSON if needed.
+    
+    This function extracts the content from a message and attempts to parse it as JSON
+    if it appears to be a JSON string. It handles various message formats and provides
+    sensible fallbacks.
+    
+    Args:
+        message: Message object (typically ToolMessage)
+        
+    Returns:
+        Parsed content (dict, list, or str)
+        
+    Examples:
+        >>> message = ToolMessage(content='{"key": "value"}')
+        >>> extract_content_payload(message)
+        {'key': 'value'}
+        
+        >>> message = ToolMessage(content='plain text')
+        >>> extract_content_payload(message)
+        'plain text'
+    """
+    # Extract raw content
+    # For ToolMessages (responses from tools), extract from content
+    if hasattr(message, "content"):
+        raw_content = message.content
+        logger.info(f"extract_content_payload: raw_content type={type(raw_content)}, value={str(raw_content)[:500]}")
+        
+        # Handle MCP content format: [{'type': 'text', 'text': '...'}]
+        if isinstance(raw_content, list):
+            for block in raw_content:
+                if isinstance(block, dict) and block.get('type') == 'text':
+                    raw_content = block.get('text', '')
+                    logger.info(f"extract_content_payload: extracted text from MCP format: {str(raw_content)[:300]}")
+                    break
+        
+        # If content is empty and this is an AIMessage with tool_calls,
+        # extract from args (this handles the initial tool call from content_input)
+        if not raw_content and hasattr(message, "tool_calls") and message.tool_calls:
+            tool_call = message.tool_calls[0]
+            if isinstance(tool_call, dict) and "args" in tool_call:
+                return tool_call["args"]
+    else:
+        raw_content = str(message)
+    
+    # If content is already a dict or list, return it directly
+    if isinstance(raw_content, (dict, list)):
+        logger.info(f"extract_content_payload: returning raw dict/list with keys={list(raw_content.keys()) if isinstance(raw_content, dict) else 'list'}")
+        return raw_content
+    
+    # Try to parse as JSON
+    if isinstance(raw_content, str):
+        # First, try direct JSON parsing
+        try:
+            parsed = json.loads(raw_content)
+            logger.info(f"extract_content_payload: parsed JSON, keys={list(parsed.keys()) if isinstance(parsed, dict) else 'list'}")
+            return parsed
+        except (json.JSONDecodeError, ValueError):
+            pass
+        
+        # If that fails, try to extract JSON from the string
+        # This handles cases where the content is embedded in a larger string
+        import re
+        json_candidates = re.findall(r'[\[{].*[\]}]', raw_content, flags=re.DOTALL)
+        for candidate in json_candidates:
+            try:
+                parsed = json.loads(candidate)
+                logger.info(f"extract_content_payload: parsed JSON from candidate, keys={list(parsed.keys()) if isinstance(parsed, dict) else 'list'}")
+                return parsed
+            except (json.JSONDecodeError, ValueError):
+                continue
+    
+    # If all parsing attempts fail, return the raw content
+    logger.info(f"extract_content_payload: returning raw content (parsing failed)")
+    return raw_content
--- a/api/app/core/memory/agent/langgraph_graph/tools/tool.py
+++ b/api/app/core/memory/agent/langgraph_graph/tools/tool.py
@@ -1,405 +0,0 @@
-import asyncio
-import json
-from datetime import datetime, timedelta
-
-from langchain.tools import tool
-from pydantic import BaseModel, Field
-
-from app.core.memory.src.search import (
-    search_by_temporal,
-    search_by_keyword_temporal,
-)
-
-
-def extract_tool_message_content(response):
-    """
-    Extract ToolMessage content and tool names from agent response
-
-    Parses agent response messages to extract tool execution results and metadata.
-    Handles JSON parsing and provides structured access to tool output data.
-
-    Args:
-        response: Agent response dictionary containing messages
-
-    Returns:
-        dict: Dictionary containing tool_name and parsed content, or None if no tool message found
-            - tool_name: Name of the executed tool
-            - content: Parsed tool execution result (JSON or raw text)
-    """
-    messages = response.get('messages', [])
-
-    for message in messages:
-        if hasattr(message, 'tool_call_id') and hasattr(message, 'content'):
-            # This is a ToolMessage
-            tool_content = message.content
-            tool_name = None
-
-            # Try to get tool name
-            if hasattr(message, 'name'):
-                tool_name = message.name
-            elif hasattr(message, 'tool_name'):
-                tool_name = message.tool_name
-
-            try:
-                # Parse JSON content
-                parsed_content = json.loads(tool_content)
-                return {
-                    'tool_name': tool_name,
-                    'content': parsed_content
-                }
-            except json.JSONDecodeError:
-                # If not JSON format, return content directly
-                return {
-                    'tool_name': tool_name,
-                    'content': tool_content
-                }
-
-    return None
-
-
-class TimeRetrievalInput(BaseModel):
-    """
-    Input schema for time retrieval tool
-
-    Defines the expected input parameters for time-based retrieval operations.
-    Used for validation and documentation of tool parameters.
-
-    Attributes:
-        context: User input query content for search
-        end_user_id: Group ID for filtering search results, defaults to test user
-    """
-    context: str = Field(description="用户输入的查询内容")
-    end_user_id: str = Field(default="88a459f5_text09", description="组ID，用于过滤搜索结果")
-
-
-def create_time_retrieval_tool(end_user_id: str):
-    """
-    Create a TimeRetrieval tool with specific end_user_id (synchronous version) for searching statements by time range
-
-    Creates a specialized time-based retrieval tool that searches for statements within
-    specified time ranges. Includes field cleaning functionality to remove unnecessary
-    metadata from search results.
-
-    Args:
-        end_user_id: User identifier for scoping search results
-
-    Returns:
-        function: Configured TimeRetrievalWithGroupId tool function
-    """
-
-    def clean_temporal_result_fields(data):
-        """
-        Clean unnecessary fields from temporal search results and modify structure
-
-        Removes metadata fields that are not needed for end-user consumption and
-        restructures the response format for better usability.
-        
-        Args:
-            data: Data to be cleaned (dict, list, or other types)
-            
-        Returns:
-            Cleaned data with unnecessary fields removed
-        """
-        # List of fields to filter out
-        fields_to_remove = {
-            'id', 'apply_id', 'user_id', 'chunk_id', 'created_at',
-            'valid_at', 'invalid_at', 'statement_ids'
-        }
-
-        if isinstance(data, dict):
-            cleaned = {}
-            for key, value in data.items():
-                if key == 'statements' and isinstance(value, dict) and 'statements' in value:
-                    # Change statements: {"statements": [...]} to time_search: {"statements": [...]}
-                    cleaned_value = clean_temporal_result_fields(value)
-                    # Further change internal statements to time_search
-                    if 'statements' in cleaned_value:
-                        cleaned['results'] = {
-                            'time_search': cleaned_value['statements']
-                        }
-                    else:
-                        cleaned['results'] = cleaned_value
-                elif key not in fields_to_remove:
-                    cleaned[key] = clean_temporal_result_fields(value)
-            return cleaned
-        elif isinstance(data, list):
-            return [clean_temporal_result_fields(item) for item in data]
-        else:
-            return data
-
-    @tool
-    def TimeRetrievalWithGroupId(context: str, start_date: str = None, end_date: str = None,
-                                 end_user_id_param: str = None, clean_output: bool = True) -> str:
-        """
-        Optimized time retrieval tool, combines time range search only (synchronous version), automatically filters unnecessary metadata fields
-
-        Performs time-based search operations with automatic metadata filtering. Supports
-        flexible date range specification and provides clean, user-friendly output.
-
-        Explicit parameters:
-        - context: Query context content
-        - start_date: Start time (optional, format: YYYY-MM-DD)
-        - end_date: End time (optional, format: YYYY-MM-DD)
-        - end_user_id_param: Group ID (optional, overrides default group ID)
-        - clean_output: Whether to clean metadata fields from output
-        - end_date needs to be obtained based on user description, output format uses strftime("%Y-%m-%d")
-
-        Returns:
-            str: JSON formatted search results with temporal data
-        """
-
-        async def _async_search():
-            # Use passed parameters or default values
-            actual_end_user_id = end_user_id_param or end_user_id
-            actual_end_date = end_date or datetime.now().strftime("%Y-%m-%d")
-            actual_start_date = start_date or (datetime.now() - timedelta(days=7)).strftime("%Y-%m-%d")
-            
-            # Basic time search
-            results = await search_by_temporal(
-                end_user_id=actual_end_user_id,
-                start_date=actual_start_date,
-                end_date=actual_end_date,
-                limit=10
-            )
-            
-            # Clean unnecessary fields from results
-            if clean_output:
-                cleaned_results = clean_temporal_result_fields(results)
-            else:
-                cleaned_results = results
-
-            return json.dumps(cleaned_results, ensure_ascii=False, indent=2)
-
-        return asyncio.run(_async_search())
-
-    @tool
-    def KeywordTimeRetrieval(context: str, days_back: int = 7, start_date: str = None, end_date: str = None,
-                             clean_output: bool = True) -> str:
-        """
-        Optimized keyword time retrieval tool, combines keyword and time range search (synchronous version), automatically filters unnecessary metadata fields
-
-        Performs combined keyword and temporal search operations with automatic metadata
-        filtering. Provides more targeted search results by combining content relevance
-        with time-based filtering.
-
-        Explicit parameters:
-        - context: Query content for keyword matching
-        - days_back: Number of days to search backwards, default 7 days
-        - start_date: Start time (optional, format: YYYY-MM-DD)
-        - end_date: End time (optional, format: YYYY-MM-DD)
-        - clean_output: Whether to clean metadata fields from output
-        - end_date needs to be obtained based on user description, output format uses strftime("%Y-%m-%d")
-
-        Returns:
-            str: JSON formatted search results combining keyword and temporal data
-        """
-
-        async def _async_search():
-            actual_end_date = end_date or datetime.now().strftime("%Y-%m-%d")
-            actual_start_date = start_date or (datetime.now() - timedelta(days=days_back)).strftime("%Y-%m-%d")
-
-            # Keyword time search
-            results = await search_by_keyword_temporal(
-                query_text=context,
-                end_user_id=end_user_id,
-                start_date=actual_start_date,
-                end_date=actual_end_date,
-                limit=15
-            )
-            
-            # Clean unnecessary fields from results
-            if clean_output:
-                cleaned_results = clean_temporal_result_fields(results)
-            else:
-                cleaned_results = results
-
-            return json.dumps(cleaned_results, ensure_ascii=False, indent=2)
-
-        return asyncio.run(_async_search())
-
-    return TimeRetrievalWithGroupId
-
-
-def create_hybrid_retrieval_tool_async(memory_config, **search_params):
-    """
-    Create hybrid retrieval tool using run_hybrid_search for hybrid retrieval, optimize output format and filter unnecessary fields
-
-    Creates an advanced hybrid search tool that combines multiple search strategies
-    (keyword, vector, hybrid) with automatic result cleaning and formatting.
-    
-    Args:
-        memory_config: Memory configuration object containing LLM and search settings
-        **search_params: Search parameters including end_user_id, limit, include, etc.
-
-    Returns:
-        function: Configured HybridSearch tool function with async capabilities
-    """
-
-    def clean_result_fields(data):
-        """
-        Recursively clean unnecessary fields from results
-
-        Removes metadata fields that are not needed for end-user consumption,
-        improving readability and reducing response size.
-        
-        Args:
-            data: Data to be cleaned (can be dict, list, or other types)
-            
-        Returns:
-            Cleaned data with unnecessary fields removed
-        """
-        # List of fields to filter out
-        # TODO: fact_summary functionality temporarily disabled, will be enabled after future development
-        fields_to_remove = {
-            'invalid_at', 'valid_at', 'chunk_id_from_rel', 'entity_ids',
-            'expired_at', 'created_at', 'chunk_id', 'apply_id',
-            'user_id', 'statement_ids', 'updated_at', "chunk_ids", "fact_summary"
-        }
-        # 注意：'id' 字段保留，community 展开时需要用 community id 查询成员 statements
-
-        if isinstance(data, dict):
-            # Clean dictionary
-            cleaned = {}
-            for key, value in data.items():
-                if key not in fields_to_remove:
-                    cleaned[key] = clean_result_fields(value)  # Recursively clean nested data
-            return cleaned
-        elif isinstance(data, list):
-            # Clean each element in list
-            return [clean_result_fields(item) for item in data]
-        else:
-            # Return other types directly
-            return data
-
-    @tool
-    async def HybridSearch(
-        context: str, 
-        search_type: str = "hybrid",
-        limit: int = 10,
-        end_user_id: str = None,
-        rerank_alpha: float = 0.6,
-        use_forgetting_rerank: bool = False,
-        use_llm_rerank: bool = False,
-        clean_output: bool = True  # New: whether to clean output fields
-    ) -> str:
-        """
-        Optimized hybrid retrieval tool, supports keyword, vector and hybrid search, automatically filters unnecessary metadata fields
-
-        Provides comprehensive search capabilities combining multiple search strategies
-        with intelligent result ranking and automatic metadata filtering for clean output.
-        
-        Args:
-            context: Query content for search
-            search_type: Search type ('keyword', 'embedding', 'hybrid')
-            limit: Result quantity limit
-            end_user_id: Group ID for filtering search results
-            rerank_alpha: Reranking weight parameter for result scoring
-            use_forgetting_rerank: Whether to use forgetting-based reranking
-            use_llm_rerank: Whether to use LLM-based reranking
-            clean_output: Whether to clean metadata fields from output
-
-        Returns:
-            str: JSON formatted comprehensive search results
-        """
-        try:
-            # Import run_hybrid_search function
-            from app.core.memory.src.search import run_hybrid_search
-            
-            # Merge parameters, prioritize passed parameters
-            final_params = {
-                "query_text": context,
-                "search_type": search_type,
-                "end_user_id": end_user_id or search_params.get("end_user_id"),
-                "limit": limit or search_params.get("limit", 10),
-                "include": search_params.get("include", ["summaries", "statements", "chunks", "entities", "communities"]),
-                "output_path": None,  # Don't save to file
-                "memory_config": memory_config,
-                "rerank_alpha": rerank_alpha,
-                "use_forgetting_rerank": use_forgetting_rerank,
-                "use_llm_rerank": use_llm_rerank
-            }
-            
-            # Execute hybrid retrieval
-            raw_results = await run_hybrid_search(**final_params)
-            
-            # Clean unnecessary fields from results
-            if clean_output:
-                cleaned_results = clean_result_fields(raw_results)
-            else:
-                cleaned_results = raw_results
-            
-            # Format return results
-            formatted_results = {
-                "search_query": context,
-                "search_type": search_type,
-                "results": cleaned_results
-            }
-
-            return json.dumps(formatted_results, ensure_ascii=False, indent=2, default=str)
-
-        except Exception as e:
-            error_result = {
-                "error": f"混合检索失败: {str(e)}",
-                "search_query": context,
-                "search_type": search_type,
-                "timestamp": datetime.now().isoformat()
-            }
-            return json.dumps(error_result, ensure_ascii=False, indent=2)
-
-    return HybridSearch
-
-
-def create_hybrid_retrieval_tool_sync(memory_config, **search_params):
-    """
-    Create synchronous version of hybrid retrieval tool, optimize output format and filter unnecessary fields
-
-    Creates a synchronous wrapper around the async hybrid search functionality,
-    making it compatible with synchronous tool execution environments.
-    
-    Args:
-        memory_config: Memory configuration object containing search settings
-        **search_params: Search parameters for configuration
-
-    Returns:
-        function: Configured HybridSearchSync tool function
-    """
-
-    @tool
-    def HybridSearchSync(
-            context: str,
-            search_type: str = "hybrid",
-            limit: int = 10,
-            end_user_id: str = None,
-            clean_output: bool = True
-    ) -> str:
-        """
-        Optimized hybrid retrieval tool (synchronous version), automatically filters unnecessary metadata fields
-
-        Provides the same hybrid search capabilities as the async version but in a
-        synchronous execution context. Automatically handles async-to-sync conversion.
-        
-        Args:
-            context: Query content for search
-            search_type: Search type ('keyword', 'embedding', 'hybrid')
-            limit: Result quantity limit
-            end_user_id: Group ID for filtering search results
-            clean_output: Whether to clean metadata fields from output
-
-        Returns:
-            str: JSON formatted search results
-        """
-
-        async def _async_search():
-            # Create async tool and execute
-            async_tool = create_hybrid_retrieval_tool_async(memory_config, **search_params)
-            return await async_tool.ainvoke({
-                "context": context,
-                "search_type": search_type,
-                "limit": limit,
-                "end_user_id": end_user_id,
-                "clean_output": clean_output
-            })
-
-        return asyncio.run(_async_search())
-
-    return HybridSearchSync
--- a/api/app/core/memory/agent/langgraph_graph/tools/write_tool.py
+++ b/api/app/core/memory/agent/langgraph_graph/tools/write_tool.py
@@ -1,106 +0,0 @@
-import json
-
-from langchain_core.messages import HumanMessage, AIMessage
-
-
-async def format_parsing(messages: list, type: str = 'string'):
-    """
-    Format and parse message lists into different output types
-
-    Processes message lists from storage and converts them into either string format
-    or dictionary format based on the specified type parameter. Handles JSON parsing
-    and role-based message organization.
-    
-    Args:
-        messages: List of message objects from storage containing message data
-        type: Return type specification ('string' for text format, 'dict' for key-value pairs)
-        
-    Returns:
-        list: Formatted message list in the specified format
-            - 'string': List of formatted text messages with role prefixes
-            - 'dict': List of dictionaries mapping user messages to AI responses
-    """
-    result = []
-    user = []
-    ai = []
-
-    for message in messages:
-        hstory_messages = message['messages']
-        for history_messag in hstory_messages.strip().splitlines():
-            history_messag = json.loads(history_messag)
-            for content in history_messag:
-                role = content['role']
-                content = content['content']
-                if type == "string":
-                    if role == 'human' or role == "user":
-                        content = '用户:' + content
-                    else:
-                        content = 'AI:' + content
-                    result.append(content)
-                if type == "dict":
-                    if role == 'human' or role == "user":
-                        user.append(content)
-                    else:
-                        ai.append(content)
-    if type == "dict":
-        for key, values in zip(user, ai):
-            result.append({key: values})
-    return result
-
-
-async def messages_parse(messages: list | dict):
-    """
-    Parse messages from storage format into user-AI conversation pairs
-
-    Extracts and organizes conversation data from stored message format,
-    separating user and AI messages and pairing them for database storage.
-
-    Args:
-        messages: List or dictionary containing stored message data with Query fields
-
-    Returns:
-        list: List of dictionaries containing user-AI message pairs for database storage
-    """
-    user = []
-    ai = []
-    database = []
-    for message in messages:
-        Query = message['Query']
-        Query = json.loads(Query)
-        for data in Query:
-            role = data['role']
-            if role == "human":
-                user.append(data['content'])
-            if role == "ai":
-                ai.append(data['content'])
-    for key, values in zip(user, ai):
-        database.append({key, values})
-    return database
-
-
-async def agent_chat_messages(user_content, ai_content):
-    """
-    Create structured chat message format for agent conversations
-
-    Formats user and AI content into a standardized message structure suitable
-    for agent processing and storage. Creates role-based message objects.
-
-    Args:
-        user_content: User's message content string
-        ai_content: AI's response content string
-
-    Returns:
-        list: List of structured message dictionaries with role and content fields
-    """
-    messages = [
-        {
-            "role": "user",
-            "content": f"{user_content}"
-        },
-        {
-            "role": "assistant",
-            "content": f"{ai_content}"
-        }
-
-    ]
-    return messages
--- a/api/app/core/memory/agent/langgraph_graph/write_graph.py
+++ b/api/app/core/memory/agent/langgraph_graph/write_graph.py
@@ -1,94 +1,80 @@
+import asyncio
+import json
+import sys
 import warnings
+from contextlib import asynccontextmanager

 from app.core.logging_config import get_agent_logger
-from app.core.memory.agent.langgraph_graph.routing.write_router import memory_long_term_storage, window_dialogue, \
-    aggregate_judgment
-from app.core.memory.agent.utils.redis_tool import write_store
-from app.db import get_db_context
-from app.schemas.memory_agent_schema import AgentMemory_Long_Term
-from app.services.memory_config_service import MemoryConfigService
-from app.services.memory_konwledges_server import write_rag
+from app.core.memory.agent.utils.llm_tools import WriteState
+from app.schemas.memory_config_schema import MemoryConfig
+from langchain_core.messages import AIMessage
+from langgraph.constants import END, START
+from langgraph.graph import StateGraph
+from langgraph.prebuilt import ToolNode

 warnings.filterwarnings("ignore", category=RuntimeWarning)
+
 logger = get_agent_logger(__name__)

+if sys.platform.startswith("win"):
+    asyncio.set_event_loop_policy(asyncio.WindowsSelectorEventLoopPolicy())

-async def long_term_storage(
-        long_term_type: str,
-        langchain_messages: list,
-        memory_config_id: str,
-        end_user_id: str,
-        scope: int = 6
-):
+
+@asynccontextmanager
+async def make_write_graph(user_id, tools, apply_id, group_id, memory_config: MemoryConfig):
    """
-    Handle long-term memory storage with different strategies
-
-    Supports multiple storage strategies including chunk-based, time-based,
-    and aggregate judgment approaches for long-term memory persistence.
-
+    Create a write graph workflow for memory operations.
+    
    Args:
-        long_term_type: Storage strategy type ('chunk', 'time', 'aggregate')
-        langchain_messages: List of messages to store
-        memory_config_id: Memory configuration identifier
-        end_user_id: User group identifier
-        scope: Scope parameter for chunk-based storage (default: 6)
+        user_id: User identifier
+        tools: MCP tools loaded from session
+        apply_id: Application identifier
+        group_id: Group identifier
+        memory_config: MemoryConfig object containing all configuration
    """
-    if langchain_messages is None:
-        langchain_messages = []
+    logger.info("Loading MCP tools: %s", [t.name for t in tools])
+    logger.info(f"Using memory_config: {memory_config.config_name} (id={memory_config.config_id})")

-    write_store.save_session_write(end_user_id, langchain_messages)
-    # 获取数据库会话
-    with get_db_context() as db_session:
-        config_service = MemoryConfigService(db_session)
-        memory_config = config_service.load_memory_config(
-            config_id=memory_config_id,  # 改为整数
-            service_name="MemoryAgentService"
-        )
-        if long_term_type == AgentMemory_Long_Term.STRATEGY_CHUNK:
-            # Dialogue window with 6 rounds of conversation
-            await window_dialogue(end_user_id, langchain_messages, memory_config, scope)
-        if long_term_type == AgentMemory_Long_Term.STRATEGY_TIME:
-            # Time-based strategy
-            await memory_long_term_storage(end_user_id, memory_config, AgentMemory_Long_Term.TIME_SCOPE)
-        if long_term_type == AgentMemory_Long_Term.STRATEGY_AGGREGATE:
-            # Aggregate judgment
-            await aggregate_judgment(end_user_id, langchain_messages, memory_config)
+    data_write_tool = next((t for t in tools if t.name == "Data_write"), None)
+
+    if not data_write_tool:
+        logger.error("Data_write tool not found", exc_info=True)
+        raise ValueError("Data_write tool not found")
+
+    write_node = ToolNode([data_write_tool])
+
+    async def call_model(state):
+        messages = state["messages"]
+        last_message = messages[-1]
+        content = last_message[1] if isinstance(last_message, tuple) else last_message.content
+
+        # Call Data_write directly with memory_config
+        write_params = {
+            "content": content,
+            "apply_id": apply_id,
+            "group_id": group_id,
+            "user_id": user_id,
+            "memory_config": memory_config,
+        }
+        logger.debug(f"Passing memory_config to Data_write: {memory_config.config_id}")
+
+        write_result = await data_write_tool.ainvoke(write_params)
+
+        if isinstance(write_result, dict):
+            result_content = write_result.get("data", str(write_result))
+        else:
+            result_content = str(write_result)
+        logger.info("Write content: %s", result_content)
+        return {"messages": [AIMessage(content=result_content)]}
+
+    workflow = StateGraph(WriteState)
+    workflow.add_node("content_input", call_model)
+    workflow.add_node("save_neo4j", write_node)
+    workflow.add_edge(START, "content_input")
+    workflow.add_edge("content_input", "save_neo4j")
+    workflow.add_edge("save_neo4j", END)
+
+    graph = workflow.compile()


-async def write_long_term(
-        storage_type: str,
-        end_user_id: str,
-        messages: list[dict],
-        user_rag_memory_id: str,
-        actual_config_id: str
-):
-    """
-    Write long-term memory with different storage types
-
-    Handles both RAG-based storage and traditional memory storage approaches.
-    For traditional storage, uses chunk-based strategy with paired user-AI messages.
-
-    Args:
-        storage_type: Type of storage (RAG or traditional)
-        end_user_id: User group identifier
-        messages: message list
-        user_rag_memory_id: RAG memory identifier
-        actual_config_id: Actual configuration ID
-    """
-    from app.core.memory.agent.langgraph_graph.routing.write_router import term_memory_save
-    if storage_type == AgentMemory_Long_Term.STORAGE_RAG:
-        message_content = []
-        for message in messages:
-            message_content.append(f'{message.get("role")}:{message.get("content")}')
-        messages_string = "\n".join(message_content)
-        await write_rag(end_user_id, messages_string, user_rag_memory_id)
-    else:
-        # AI reply writing (user messages and AI replies paired, written as complete dialogue at once)
-        CHUNK = AgentMemory_Long_Term.STRATEGY_CHUNK
-        SCOPE = AgentMemory_Long_Term.DEFAULT_SCOPE
-        await long_term_storage(long_term_type=CHUNK,
-                                langchain_messages=messages,
-                                memory_config_id=actual_config_id,
-                                end_user_id=end_user_id,
-                                scope=SCOPE)
-        await term_memory_save(end_user_id, CHUNK, scope=SCOPE)
+    yield graph
--- a/api/app/core/memory/agent/mcp_server/init.py
+++ b/api/app/core/memory/agent/mcp_server/init.py
@@ -0,0 +1,28 @@
+"""
+MCP Server package for memory agent.
+
+This package provides the FastMCP server implementation with context-based
+dependency injection for tool functions.
+
+Package structure:
+- server: FastMCP server initialization and context setup
+- tools: MCP tool implementations
+- models: Pydantic response models
+- services: Business logic services
+"""
+# from app.core.memory.agent.mcp_server.server import (
+#     mcp,
+#     initialize_context,
+#     main,
+#     get_context_resource
+# )
+
+# # Import tools to register them (but don't export them)
+# from app.core.memory.agent.mcp_server import tools
+
+# __all__ = [
+#     'mcp',
+#     'initialize_context',
+#     'main',
+#     'get_context_resource',
+# ]
--- a/api/app/core/memory/agent/mcp_server/mcp_instance.py
+++ b/api/app/core/memory/agent/mcp_server/mcp_instance.py
@@ -0,0 +1,11 @@
+"""
+MCP Server Instance
+
+This module contains the FastMCP server instance that is shared across all modules.
+It's in a separate file to avoid circular import issues.
+"""
+from mcp.server.fastmcp import FastMCP
+
+# Initialize FastMCP server instance
+# This instance is shared across all tool modules
+mcp = FastMCP('data_flow')
--- a/api/app/core/memory/agent/mcp_server/models/init.py
+++ b/api/app/core/memory/agent/mcp_server/models/init.py
--- a/api/app/core/memory/agent/mcp_server/models/problem_models.py
+++ b/api/app/core/memory/agent/mcp_server/models/problem_models.py
--- a/Show More
+++ b/Show More
				`@@ -1 +0,0 @@`
				`"""Configuration module for application settings."""`