From 34a89c48731346fd6d8905054f1d1cafa4505811 Mon Sep 17 00:00:00 2001
From: chiguyong <chiguyong@beyondsoft.com>
Date: Wed, 1 Jul 2026 02:03:51 +0800
Subject: [PATCH] refactor(llm+memory+client): remove Any from type signatures

Eliminate 172 Any usages across llm/, memory/, client/ via:
- TypeAlias (MetadataValue, MetadataDict, RAGSearchResult, etc.)
- object for arbitrary dict/value types
- TYPE_CHECKING Protocol for Redis/Quota/RAG/Graph services
- TYPE_CHECKING import + string annotations for forward refs
- Remove unused Any imports (18 F401 fixed)

Tests: 253 passed (llm 21 failures are pre-existing litellm env issue)
ruff: All checks passed
---
 src/agentkit/client/sync.py                   |  25 ++-
 src/agentkit/llm/cache.py                     |  54 +++++-
 src/agentkit/llm/cache_key.py                 |   3 +-
 src/agentkit/llm/config.py                    |  14 +-
 src/agentkit/llm/gateway.py                   |  43 ++++-
 src/agentkit/llm/migration.py                 |  11 +-
 src/agentkit/llm/protocol.py                  |  13 +-
 src/agentkit/llm/providers/anthropic.py       | 135 ++++++++-------
 src/agentkit/llm/providers/doubao.py          |   3 +-
 src/agentkit/llm/providers/gemini.py          | 145 +++++++++-------
 .../llm/providers/litellm_provider.py         |  31 ++--
 src/agentkit/llm/providers/usage_store.py     |   8 +-
 src/agentkit/llm/providers/wenxin.py          |   3 +-
 src/agentkit/llm/providers/yuanbao.py         |   3 +-
 src/agentkit/llm/remote_provider.py           |  11 +-
 src/agentkit/llm/retry.py                     |  14 +-
 src/agentkit/memory/adapters/base.py          |   9 +-
 src/agentkit/memory/adapters/confluence.py    |  34 ++--
 src/agentkit/memory/adapters/feishu.py        |  42 ++---
 src/agentkit/memory/adapters/generic_http.py  |  34 ++--
 src/agentkit/memory/base.py                   |  26 ++-
 src/agentkit/memory/chunking.py               |  90 ++++++----
 src/agentkit/memory/contextual_retrieval.py   |  14 +-
 src/agentkit/memory/document_loader.py        |  37 +++--
 src/agentkit/memory/embedder.py               |  12 +-
 src/agentkit/memory/episodic.py               | 147 ++++++++++-------
 src/agentkit/memory/http_rag.py               |  84 ++++++----
 src/agentkit/memory/knowledge_base.py         |  10 +-
 src/agentkit/memory/local_rag.py              | 155 ++++++++++--------
 src/agentkit/memory/multi_source_retriever.py |   7 +-
 src/agentkit/memory/profile.py                |  23 ++-
 src/agentkit/memory/query_transformer.py      |  24 ++-
 src/agentkit/memory/rag_loop.py               |  29 ++--
 src/agentkit/memory/relevance_scorer.py       |  10 +-
 src/agentkit/memory/retriever.py              |  71 ++++----
 src/agentkit/memory/semantic.py               | 103 ++++++++----
 src/agentkit/memory/working.py                |  29 ++--
 37 files changed, 905 insertions(+), 601 deletions(-)

diff --git a/src/agentkit/client/sync.py b/src/agentkit/client/sync.py
index 7edb326..8f5710a 100644
--- a/src/agentkit/client/sync.py
+++ b/src/agentkit/client/sync.py
@@ -34,12 +34,19 @@ import os
 import sqlite3
 from datetime import datetime, timezone
 from pathlib import Path
-from typing import Any, Callable
+from typing import Callable, TypeAlias
 
 import httpx
 
 logger = logging.getLogger(__name__)
 
+# 缓存的配置项 — 技能/工作流配置为 JSON 反序列化后的字典，值为标量或嵌套结构。
+# 服务器返回的 skills/workflows 列表元素是 dict（model_dump/to_dict 输出），
+# 其中可能包含 list/dict 等容器，因此使用 object 作为值类型。
+SkillConfigDict: TypeAlias = dict[str, object]
+WorkflowConfigDict: TypeAlias = dict[str, object]
+SyncedConfigPayload: TypeAlias = dict[str, object]
+
 
 # ── Defaults ──────────────────────────────────────────────────────────
 
@@ -100,8 +107,8 @@ class ConfigSync:
 
         # In-memory cache (mirrors the SQLite cache for fast access)
         self._version: str | None = None
-        self._skills: list[dict[str, Any]] = []
-        self._workflows: list[dict[str, Any]] = []
+        self._skills: list[SkillConfigDict] = []
+        self._workflows: list[WorkflowConfigDict] = []
         self._last_synced_at: str | None = None
 
     # ── Lifecycle ─────────────────────────────────────────────────
@@ -232,15 +239,15 @@ class ConfigSync:
         """Return the current cached config version hash."""
         return self._version
 
-    def get_skills(self) -> list[dict[str, Any]]:
+    def get_skills(self) -> list[SkillConfigDict]:
         """Return the cached skill configs."""
         return list(self._skills)
 
-    def get_workflows(self) -> list[dict[str, Any]]:
+    def get_workflows(self) -> list[WorkflowConfigDict]:
         """Return the cached workflow configs."""
         return list(self._workflows)
 
-    def get_all(self) -> dict[str, Any]:
+    def get_all(self) -> SyncedConfigPayload:
         """Return all cached configs as a single dict."""
         return {
             "version": self._version,
@@ -249,14 +256,14 @@ class ConfigSync:
             "synced_at": self._last_synced_at,
         }
 
-    def get_skill(self, name: str) -> dict[str, Any] | None:
+    def get_skill(self, name: str) -> SkillConfigDict | None:
         """Return a single skill config by name, or ``None``."""
         for skill in self._skills:
             if skill.get("name") == name:
                 return skill
         return None
 
-    def get_workflow(self, workflow_id: str) -> dict[str, Any] | None:
+    def get_workflow(self, workflow_id: str) -> WorkflowConfigDict | None:
         """Return a single workflow config by ID, or ``None``."""
         for wf in self._workflows:
             if wf.get("workflow_id") == workflow_id:
@@ -281,7 +288,7 @@ class ConfigSync:
             conn.executescript(_CACHE_SCHEMA)
             conn.commit()
 
-    def _save_to_cache(self, data: dict[str, Any]) -> None:
+    def _save_to_cache(self, data: SyncedConfigPayload) -> None:
         """Save the synced configs to the local SQLite cache."""
         now = datetime.now(timezone.utc).isoformat()
         with sqlite3.connect(str(self.cache_db_path)) as conn:
diff --git a/src/agentkit/llm/cache.py b/src/agentkit/llm/cache.py
index b0f334c..0919920 100644
--- a/src/agentkit/llm/cache.py
+++ b/src/agentkit/llm/cache.py
@@ -14,7 +14,7 @@ import logging
 import time
 from collections import OrderedDict
 from dataclasses import dataclass, field
-from typing import TYPE_CHECKING, Any, Protocol, runtime_checkable
+from typing import TYPE_CHECKING, Protocol, runtime_checkable
 
 from agentkit.llm.protocol import LLMResponse, TokenUsage, ToolCall
 from agentkit.utils.vector_math import compute_cosine_similarity
@@ -25,6 +25,52 @@ if TYPE_CHECKING:
 logger = logging.getLogger(__name__)
 
 
+# ---------------------------------------------------------------------------
+# TYPE_CHECKING Protocols — 避免 Any，描述运行时 lazy import 的第三方对象
+# ---------------------------------------------------------------------------
+
+
+if TYPE_CHECKING:
+
+    class _RedisLike(Protocol):
+        """Redis 客户端最小契约（仅覆盖本模块用到的方法）。"""
+
+        async def get(self, key: str) -> bytes | str | None: ...
+
+        async def mget(self, keys: list[str]) -> list[bytes | str | None]: ...
+
+        async def set(self, key: str, value: bytes | str, ex: int | None = None) -> None: ...
+
+        async def smembers(self, key: str) -> set[bytes | str]: ...
+
+        async def sadd(self, name: str, *values: str) -> int: ...
+
+        async def srem(self, name: str, *values: str) -> int: ...
+
+        async def scard(self, name: str) -> int: ...
+
+        async def delete(self, *names: str) -> int: ...
+
+        def pipeline(self) -> "_RedisPipelineLike": ...
+
+    class _RedisPipelineLike(Protocol):
+        """Redis pipeline 最小契约。"""
+
+        def get(self, key: str) -> "_RedisPipelineLike": ...
+
+        def set(
+            self, key: str, value: bytes | str, ex: int | None = None
+        ) -> "_RedisPipelineLike": ...
+
+        def delete(self, *names: str) -> "_RedisPipelineLike": ...
+
+        def sadd(self, name: str, *values: str) -> "_RedisPipelineLike": ...
+
+        def srem(self, name: str, *values: str) -> "_RedisPipelineLike": ...
+
+        async def execute(self) -> list[object]: ...
+
+
 # ---------------------------------------------------------------------------
 # Data Classes
 # ---------------------------------------------------------------------------
@@ -328,7 +374,7 @@ class RedisLLMCache:
         self._semantic_ttl = semantic_ttl
         self._similarity_threshold = similarity_threshold
         self._max_entries_to_scan = max_entries_to_scan
-        self._redis: Any = None
+        self._redis: _RedisLike | None = None
         self._fallback: InMemoryLLMCache | None = fallback  # For auto-degradation
         self._degraded = False  # True if Redis is unreachable
 
@@ -691,7 +737,7 @@ class LitellmCacheManager:
 
     def __init__(self, config: LitellmCacheConfig):
         self._config = config
-        self._cache_instance: Any = None  # litellm.caching.Cache 实例
+        self._cache_instance: object | None = None  # litellm.caching.Cache 实例
         self._hits = 0
         self._misses = 0
 
@@ -709,7 +755,7 @@ class LitellmCacheManager:
         litellm.cache = None
         self._cache_instance = None
 
-    def _create_cache_instance(self) -> Any:
+    def _create_cache_instance(self) -> object:
         """根据 backend 配置创建 LiteLLM Cache 实例。
 
         auto 模式按优先级尝试：RedisSemanticCache → RedisCache → InMemoryCache。
diff --git a/src/agentkit/llm/cache_key.py b/src/agentkit/llm/cache_key.py
index 3a5211b..50dc348 100644
--- a/src/agentkit/llm/cache_key.py
+++ b/src/agentkit/llm/cache_key.py
@@ -2,14 +2,13 @@
 
 import hashlib
 import json
-from typing import Any
 
 
 def generate_cache_key(
     model: str,
     messages: list[dict[str, str]],
     temperature: float,
-    tools: list[dict[str, Any]] | None = None,
+    tools: list[dict[str, object]] | None = None,
     tool_choice: str = "auto",
     max_tokens: int = 2000,
     user_id: str | None = None,
diff --git a/src/agentkit/llm/config.py b/src/agentkit/llm/config.py
index 1ee2aa9..3df6e61 100644
--- a/src/agentkit/llm/config.py
+++ b/src/agentkit/llm/config.py
@@ -3,12 +3,12 @@
 import json
 import logging
 from dataclasses import dataclass, field
-from typing import Any, TYPE_CHECKING
+from typing import TYPE_CHECKING
 
 from agentkit.llm.retry import CircuitBreakerConfig, RetryConfig
 
 if TYPE_CHECKING:
-    from agentkit.channels.secrets import SecretsStore
+    from agentkit.channels.secrets import SecretEntry, SecretsStore
 
 logger = logging.getLogger(__name__)
 
@@ -56,7 +56,7 @@ class ProviderConfig:
 
     api_key: str
     base_url: str
-    models: dict[str, dict[str, Any]] = field(default_factory=dict)
+    models: dict[str, dict[str, object]] = field(default_factory=dict)
     type: str = "openai"  # "openai" | "anthropic" | "gemini"
     max_tokens: int = 4096  # Anthropic: default max_tokens
     timeout: float = 120.0  # Anthropic: request timeout
@@ -168,18 +168,18 @@ class ProviderConfig:
         return f"llm:provider:{self.type}:api_key"
 
     @staticmethod
-    def _encode_secret_entry(entry: Any, key: str) -> str:
+    def _encode_secret_entry(entry: object, key: str) -> str:
         """把 SecretEntry 编码为 JSON 字符串（含 key 字段）。"""
         # entry 是 SecretEntry pydantic 模型，有 model_dump()
         if hasattr(entry, "model_dump"):
-            data = entry.model_dump()
+            data = entry.model_dump()  # type: ignore[attr-defined]
         else:
-            data = dict(entry)
+            data = dict(entry)  # type: ignore[call-overload]
         data["key"] = key
         return json.dumps(data)
 
     @staticmethod
-    def _decode_secret_entry(encoded: str) -> Any:
+    def _decode_secret_entry(encoded: str) -> "SecretEntry":
         """从 JSON 字符串解码 SecretEntry。返回带 .key 属性的对象。"""
         from agentkit.channels.secrets import SecretEntry
 
diff --git a/src/agentkit/llm/gateway.py b/src/agentkit/llm/gateway.py
index 0b7be8f..387b578 100644
--- a/src/agentkit/llm/gateway.py
+++ b/src/agentkit/llm/gateway.py
@@ -5,7 +5,7 @@ import logging
 import time
 from datetime import datetime, timezone
 from pathlib import Path
-from typing import Any
+from typing import TYPE_CHECKING, Protocol
 
 from agentkit.core.exceptions import LLMProviderError, ModelNotFoundError
 from agentkit.llm.config import LLMConfig
@@ -14,9 +14,40 @@ from agentkit.llm.providers.tracker import UsageSummary, UsageTracker
 from agentkit.telemetry.tracing import get_tracer, _OTEL_AVAILABLE
 from agentkit.telemetry.metrics import llm_token_histogram
 
+if TYPE_CHECKING:
+    from agentkit.llm.cache import LitellmCacheManager
+
 logger = logging.getLogger(__name__)
 
 
+# ---------------------------------------------------------------------------
+# TYPE_CHECKING Protocols — 避免 Any，描述运行时 lazy import 的对象
+# ---------------------------------------------------------------------------
+
+
+if TYPE_CHECKING:
+
+    class _QuotaServiceLike(Protocol):
+        """Quota service 最小契约（仅覆盖 gateway._enforce_quota 用到的方法）。"""
+
+        async def is_model_allowed(
+            self, db: Path, department_id: str, model: str
+        ) -> tuple[bool, str]: ...
+
+        async def check_quota(
+            self,
+            db: Path,
+            department_id: str,
+            quota_type: str,
+            period: str,
+            current: float,
+        ) -> tuple[bool, str]: ...
+
+        async def get_quota(
+            self, db: Path, department_id: str, quota_type: str, period: str
+        ) -> dict[str, object] | None: ...
+
+
 class QuotaExceededError(Exception):
     """Raised when a department's LLM quota is exceeded.
 
@@ -29,8 +60,8 @@ class QuotaExceededError(Exception):
         department_id: str,
         quota_type: str,
         period: str,
-        limit: Any,
-        current: Any,
+        limit: object,
+        current: object,
     ) -> None:
         self.department_id = department_id
         self.quota_type = quota_type
@@ -46,13 +77,13 @@ class QuotaExceededError(Exception):
 class LLMGateway:
     """LLM 网关 - Provider 注册、模型别名解析、Fallback、Usage 追踪、Cache"""
 
-    def __init__(self, config: LLMConfig | None = None, usage_store: Any = None):
+    def __init__(self, config: LLMConfig | None = None, usage_store: object | None = None):
         self._providers: dict[str, LLMProvider] = {}
         self._usage_tracker = UsageTracker(store=usage_store) if usage_store else UsageTracker()
         self._config = config or LLMConfig()
 
         # Cache (U17 — LiteLLM 缓存管理器，opt-in，默认禁用)
-        self._cache_manager: Any = None  # LitellmCacheManager | None
+        self._cache_manager: "LitellmCacheManager | None" = None
         if self._config.cache and self._config.cache.enabled:
             from agentkit.llm.cache import LitellmCacheConfig, LitellmCacheManager
 
@@ -601,7 +632,7 @@ class LLMGateway:
 
     async def _check_quota_value(
         self,
-        quota_service: Any,
+        quota_service: _QuotaServiceLike,
         db: Path,
         dept_id: str,
         period: str,
diff --git a/src/agentkit/llm/migration.py b/src/agentkit/llm/migration.py
index cae041a..6a9eb1b 100644
--- a/src/agentkit/llm/migration.py
+++ b/src/agentkit/llm/migration.py
@@ -27,12 +27,11 @@ from __future__ import annotations
 
 import logging
 from pathlib import Path
-from typing import Any
 
 logger = logging.getLogger(__name__)
 
 
-def migrate_api_keys_to_secrets(config_path: Path | str) -> dict[str, dict[str, Any]]:
+def migrate_api_keys_to_secrets(config_path: Path | str) -> dict[str, dict[str, object]]:
     """把 agentkit.yaml 中的 plaintext API Key 迁移到 SecretsStore。
 
     流程：
@@ -63,8 +62,8 @@ def migrate_api_keys_to_secrets(config_path: Path | str) -> dict[str, dict[str,
 
     store = SecretsStore()  # master key 从 env 加载
 
-    async def _run() -> dict[str, dict[str, Any]]:
-        report: dict[str, dict[str, Any]] = {}
+    async def _run() -> dict[str, dict[str, object]]:
+        report: dict[str, dict[str, object]] = {}
         for name, pconf in llm_config.providers.items():
             if pconf.api_key_source == "secrets_store" and not pconf.api_key:
                 report[name] = {"status": "skipped", "source": pconf.api_key_source}
@@ -93,9 +92,9 @@ def migrate_api_keys_to_secrets(config_path: Path | str) -> dict[str, dict[str,
     report = asyncio.run(_run())
 
     # 写回 YAML：更新 llm.providers 段，保留其它段
-    providers_out: dict[str, dict[str, Any]] = {}
+    providers_out: dict[str, dict[str, object]] = {}
     for name, pconf in llm_config.providers.items():
-        entry: dict[str, Any] = {
+        entry: dict[str, object] = {
             "type": pconf.type,
             "base_url": pconf.base_url,
             "models": pconf.models,
diff --git a/src/agentkit/llm/protocol.py b/src/agentkit/llm/protocol.py
index c6f5d54..21369c3 100644
--- a/src/agentkit/llm/protocol.py
+++ b/src/agentkit/llm/protocol.py
@@ -2,7 +2,6 @@
 
 from abc import ABC, abstractmethod
 from dataclasses import dataclass, field
-from typing import Any
 
 
 @dataclass
@@ -23,7 +22,7 @@ class ToolCall:
 
     id: str
     name: str
-    arguments: dict[str, Any]
+    arguments: dict[str, object]
 
 
 @dataclass
@@ -32,7 +31,7 @@ class LLMRequest:
 
     messages: list[dict[str, str]]
     model: str
-    tools: list[dict[str, Any]] | None = None
+    tools: list[dict[str, object]] | None = None
     tool_choice: str = "auto"
     temperature: float = 0.7
     max_tokens: int = 2000
@@ -42,13 +41,13 @@ class LLMRequest:
         self,
         messages: list[dict[str, str]],
         model: str,
-        tools: list[dict[str, Any]] | None = None,
+        tools: list[dict[str, object]] | None = None,
         tool_choice: str = "auto",
         temperature: float = 0.7,
         max_tokens: int = 2000,
         timeout: float | None = None,
-        cache: dict[str, Any] | None = None,
-        **kwargs: Any,
+        cache: dict[str, object] | None = None,
+        **kwargs: object,
     ):
         self.messages = messages
         self.model = model
@@ -59,7 +58,7 @@ class LLMRequest:
         self.timeout = timeout
         self._extra = kwargs
         # U17 — LiteLLM cache 参数（cache_key 或 no-cache），透传到 litellm.acompletion
-        self._cache: dict[str, Any] | None = cache
+        self._cache: dict[str, object] | None = cache
 
 
 @dataclass
diff --git a/src/agentkit/llm/providers/anthropic.py b/src/agentkit/llm/providers/anthropic.py
index 2829ac9..3a1c197 100644
--- a/src/agentkit/llm/providers/anthropic.py
+++ b/src/agentkit/llm/providers/anthropic.py
@@ -3,7 +3,6 @@
 import json
 import logging
 import time
-from typing import Any
 
 import httpx
 
@@ -99,7 +98,9 @@ class AnthropicProvider(LLMProvider):
             "content-type": "application/json",
         }
 
-    def _convert_messages(self, messages: list[dict[str, str]]) -> tuple[str | list[dict[str, Any]] | None, list[dict[str, Any]]]:
+    def _convert_messages(
+        self, messages: list[dict[str, str]]
+    ) -> tuple[str | list[dict[str, object]] | None, list[dict[str, object]]]:
         """将 OpenAI 风格消息转换为 Anthropic 格式
 
         Returns:
@@ -110,8 +111,8 @@ class AnthropicProvider(LLMProvider):
           - list[dict]: Anthropic content blocks(支持 cache_control,U2/G2)
           - None: 无 system 消息
         """
-        system_prompt: str | list[dict[str, Any]] | None = None
-        anthropic_messages: list[dict[str, Any]] = []
+        system_prompt: str | list[dict[str, object]] | None = None
+        anthropic_messages: list[dict[str, object]] = []
 
         for msg in messages:
             role = msg.get("role", "")
@@ -127,7 +128,7 @@ class AnthropicProvider(LLMProvider):
                 # 检查是否有 tool_calls (OpenAI 格式)
                 tool_calls = msg.get("tool_calls")
                 if tool_calls:
-                    blocks: list[dict[str, Any]] = []
+                    blocks: list[dict[str, object]] = []
                     # 如果有文本内容，先添加文本块
                     if content:
                         blocks.append({"type": "text", "text": content})
@@ -139,25 +140,29 @@ class AnthropicProvider(LLMProvider):
                                 arguments = json.loads(arguments)
                             except json.JSONDecodeError:
                                 arguments = {"raw": arguments}
-                        blocks.append({
-                            "type": "tool_use",
-                            "id": tc.get("id", ""),
-                            "name": func.get("name", ""),
-                            "input": arguments,
-                        })
+                        blocks.append(
+                            {
+                                "type": "tool_use",
+                                "id": tc.get("id", ""),
+                                "name": func.get("name", ""),
+                                "input": arguments,
+                            }
+                        )
                     anthropic_messages.append({"role": "assistant", "content": blocks})
                 else:
-                    anthropic_messages.append({
-                        "role": "assistant",
-                        "content": [{"type": "text", "text": content}],
-                    })
+                    anthropic_messages.append(
+                        {
+                            "role": "assistant",
+                            "content": [{"type": "text", "text": content}],
+                        }
+                    )
                 continue
 
             if role == "user":
                 # 检查是否是 tool_result 消息 (OpenAI 格式中 tool 角色的结果)
                 # OpenAI 格式: {"role": "tool", "tool_call_id": "...", "content": "..."}
                 if msg.get("tool_call_id"):
-                    tool_result_blocks: list[dict[str, Any]] = []
+                    tool_result_blocks: list[dict[str, object]] = []
                     tool_content = msg.get("content", "")
                     # tool_result 的 content 可以是字符串或内容块列表
                     if isinstance(tool_content, str):
@@ -167,56 +172,72 @@ class AnthropicProvider(LLMProvider):
                     else:
                         tool_result_blocks.append({"type": "text", "text": str(tool_content)})
 
-                    anthropic_messages.append({
-                        "role": "user",
-                        "content": [{
-                            "type": "tool_result",
-                            "tool_use_id": msg.get("tool_call_id", ""),
-                            "content": tool_result_blocks,
-                        }],
-                    })
+                    anthropic_messages.append(
+                        {
+                            "role": "user",
+                            "content": [
+                                {
+                                    "type": "tool_result",
+                                    "tool_use_id": msg.get("tool_call_id", ""),
+                                    "content": tool_result_blocks,
+                                }
+                            ],
+                        }
+                    )
                 else:
-                    anthropic_messages.append({
-                        "role": "user",
-                        "content": [{"type": "text", "text": content}],
-                    })
+                    anthropic_messages.append(
+                        {
+                            "role": "user",
+                            "content": [{"type": "text", "text": content}],
+                        }
+                    )
                 continue
 
             if role == "tool":
                 # OpenAI 格式中独立的 tool 消息
                 tool_content = msg.get("content", "")
                 if isinstance(tool_content, str):
-                    result_content: list[dict[str, Any]] | str = [{"type": "text", "text": tool_content}]
+                    result_content: list[dict[str, object]] | str = [
+                        {"type": "text", "text": tool_content}
+                    ]
                 elif isinstance(tool_content, list):
                     result_content = tool_content
                 else:
                     result_content = [{"type": "text", "text": str(tool_content)}]
 
-                anthropic_messages.append({
-                    "role": "user",
-                    "content": [{
-                        "type": "tool_result",
-                        "tool_use_id": msg.get("tool_call_id", ""),
-                        "content": result_content,
-                    }],
-                })
+                anthropic_messages.append(
+                    {
+                        "role": "user",
+                        "content": [
+                            {
+                                "type": "tool_result",
+                                "tool_use_id": msg.get("tool_call_id", ""),
+                                "content": result_content,
+                            }
+                        ],
+                    }
+                )
 
         return system_prompt, anthropic_messages
 
-    def _convert_tools(self, tools: list[dict[str, Any]]) -> list[dict[str, Any]]:
+    def _convert_tools(self, tools: list[dict[str, object]]) -> list[dict[str, object]]:
         """将 OpenAI function 格式转换为 Anthropic tool 格式"""
         anthropic_tools = []
         for tool in tools:
             if tool.get("type") == "function":
                 func = tool.get("function", {})
-                anthropic_tools.append({
-                    "name": func.get("name", ""),
-                    "description": func.get("description", ""),
-                    "input_schema": func.get("parameters", {"type": "object", "properties": {}}),
-                })
+                anthropic_tools.append(
+                    {
+                        "name": func.get("name", ""),
+                        "description": func.get("description", ""),
+                        "input_schema": func.get(
+                            "parameters", {"type": "object", "properties": {}}
+                        ),
+                    }
+                )
         return anthropic_tools
 
-    def _convert_tool_choice(self, tool_choice: str) -> dict[str, Any] | None:
+    def _convert_tool_choice(self, tool_choice: str) -> dict[str, object] | None:
         """将 OpenAI tool_choice 格式转换为 Anthropic 格式"""
         if tool_choice == "auto":
             return {"type": "auto"}
@@ -227,7 +248,7 @@ class AnthropicProvider(LLMProvider):
             return {"type": "tool", "name": tool_choice}
         return None
 
-    def _parse_response(self, data: dict[str, Any], model: str) -> LLMResponse:
+    def _parse_response(self, data: dict[str, object], model: str) -> LLMResponse:
         """将 Anthropic 响应转换为 LLMResponse"""
         content_blocks = data.get("content", [])
         text_parts: list[str] = []
@@ -238,11 +259,13 @@ class AnthropicProvider(LLMProvider):
             if block_type == "text":
                 text_parts.append(block.get("text", ""))
             elif block_type == "tool_use":
-                tool_calls.append(ToolCall(
-                    id=block.get("id", ""),
-                    name=block.get("name", ""),
-                    arguments=block.get("input", {}),
-                ))
+                tool_calls.append(
+                    ToolCall(
+                        id=block.get("id", ""),
+                        name=block.get("name", ""),
+                        arguments=block.get("input", {}),
+                    )
+                )
 
         usage_data = data.get("usage", {})
         usage = TokenUsage(
@@ -287,7 +310,7 @@ class AnthropicProvider(LLMProvider):
 
         system_prompt, anthropic_messages = self._convert_messages(request.messages)
 
-        payload: dict[str, Any] = {
+        payload: dict[str, object] = {
             "model": request.model,
             "max_tokens": request.max_tokens or self._max_tokens,
             "messages": anthropic_messages,
@@ -346,7 +369,7 @@ class AnthropicProvider(LLMProvider):
 
         system_prompt, anthropic_messages = self._convert_messages(request.messages)
 
-        payload: dict[str, Any] = {
+        payload: dict[str, object] = {
             "model": request.model,
             "max_tokens": request.max_tokens or self._max_tokens,
             "messages": anthropic_messages,
@@ -375,7 +398,7 @@ class AnthropicProvider(LLMProvider):
     async def _iterate_stream(self, response, request: LLMRequest):
         """Iterate over an already-open SSE stream and yield StreamChunks."""
         # Accumulated tool calls: tool_use_id -> {id, name, input_json_str}
-        accumulated_tool_calls: dict[str, dict[str, Any]] = {}
+        accumulated_tool_calls: dict[str, dict[str, object]] = {}
         current_tool_id: str | None = None
         current_tool_name: str | None = None
         current_tool_input_json: str = ""
@@ -433,7 +456,9 @@ class AnthropicProvider(LLMProvider):
                 # Finalize current tool call if any
                 if current_tool_id is not None:
                     try:
-                        arguments = json.loads(current_tool_input_json) if current_tool_input_json else {}
+                        arguments = (
+                            json.loads(current_tool_input_json) if current_tool_input_json else {}
+                        )
                     except json.JSONDecodeError:
                         arguments = {"raw": current_tool_input_json}
 
@@ -510,7 +535,7 @@ class AnthropicProvider(LLMProvider):
                 error_msg = error_info.get("message", "Stream error")
                 raise LLMProviderError("anthropic", error_msg)
 
-    def get_model_info(self) -> dict[str, Any]:
+    def get_model_info(self) -> dict[str, object]:
         """返回 Provider 和模型信息"""
         return {
             "provider": "anthropic",
diff --git a/src/agentkit/llm/providers/doubao.py b/src/agentkit/llm/providers/doubao.py
index ebd7f9a..9a15994 100644
--- a/src/agentkit/llm/providers/doubao.py
+++ b/src/agentkit/llm/providers/doubao.py
@@ -8,7 +8,6 @@ API：火山引擎 OpenAI 兼容接口
 from __future__ import annotations
 
 import logging
-from typing import Any
 
 from agentkit.llm.providers.openai import OpenAICompatibleProvider
 
@@ -48,7 +47,7 @@ class DoubaoProvider(OpenAICompatibleProvider):
         api_key: str,
         base_url: str = DOUBAO_DEFAULT_BASE_URL,
         default_model: str = "doubao-pro-32k",
-        **kwargs: Any,
+        **kwargs: object,
     ):
         super().__init__(
             api_key=api_key,
diff --git a/src/agentkit/llm/providers/gemini.py b/src/agentkit/llm/providers/gemini.py
index 0b57efe..f267c31 100644
--- a/src/agentkit/llm/providers/gemini.py
+++ b/src/agentkit/llm/providers/gemini.py
@@ -3,7 +3,6 @@
 import json
 import logging
 import time
-from typing import Any
 
 import httpx
 
@@ -90,14 +89,14 @@ class GeminiProvider(LLMProvider):
 
     def _convert_messages(
         self, messages: list[dict[str, str]]
-    ) -> tuple[dict[str, Any] | None, list[dict[str, Any]]]:
+    ) -> tuple[dict[str, object] | None, list[dict[str, object]]]:
         """将 OpenAI 风格消息转换为 Gemini 格式
 
         Returns:
             (system_instruction, contents)
         """
-        system_instruction: dict[str, Any] | None = None
-        contents: list[dict[str, Any]] = []
+        system_instruction: dict[str, object] | None = None
+        contents: list[dict[str, object]] = []
 
         for msg in messages:
             role = msg.get("role", "")
@@ -119,28 +118,34 @@ class GeminiProvider(LLMProvider):
                             tool_name = parsed.get("name", "")
                         except (json.JSONDecodeError, AttributeError):
                             pass
-                    contents.append({
-                        "role": "user",
-                        "parts": [{
-                            "functionResponse": {
-                                "name": tool_name,
-                                "response": {
-                                    "content": content,
-                                },
-                            },
-                        }],
-                    })
+                    contents.append(
+                        {
+                            "role": "user",
+                            "parts": [
+                                {
+                                    "functionResponse": {
+                                        "name": tool_name,
+                                        "response": {
+                                            "content": content,
+                                        },
+                                    },
+                                }
+                            ],
+                        }
+                    )
                 else:
-                    contents.append({
-                        "role": "user",
-                        "parts": [{"text": content}],
-                    })
+                    contents.append(
+                        {
+                            "role": "user",
+                            "parts": [{"text": content}],
+                        }
+                    )
                 continue
 
             if role == "assistant":
                 tool_calls = msg.get("tool_calls")
                 if tool_calls:
-                    parts: list[dict[str, Any]] = []
+                    parts: list[dict[str, object]] = []
                     if content:
                         parts.append({"text": content})
                     for tc in tool_calls:
@@ -151,54 +156,64 @@ class GeminiProvider(LLMProvider):
                                 arguments = json.loads(arguments)
                             except json.JSONDecodeError:
                                 arguments = {"raw": arguments}
-                        parts.append({
-                            "functionCall": {
-                                "name": func.get("name", ""),
-                                "args": arguments,
-                            },
-                        })
+                        parts.append(
+                            {
+                                "functionCall": {
+                                    "name": func.get("name", ""),
+                                    "args": arguments,
+                                },
+                            }
+                        )
                     contents.append({"role": "model", "parts": parts})
                 else:
-                    contents.append({
-                        "role": "model",
-                        "parts": [{"text": content}],
-                    })
+                    contents.append(
+                        {
+                            "role": "model",
+                            "parts": [{"text": content}],
+                        }
+                    )
                 continue
 
             if role == "tool":
                 # OpenAI format: {"role": "tool", "tool_call_id": "...", "content": "..."}
                 tool_name = msg.get("name", "")
                 tool_content = msg.get("content", "")
-                contents.append({
-                    "role": "user",
-                    "parts": [{
-                        "functionResponse": {
-                            "name": tool_name,
-                            "response": {
-                                "content": tool_content,
-                            },
-                        },
-                    }],
-                })
+                contents.append(
+                    {
+                        "role": "user",
+                        "parts": [
+                            {
+                                "functionResponse": {
+                                    "name": tool_name,
+                                    "response": {
+                                        "content": tool_content,
+                                    },
+                                },
+                            }
+                        ],
+                    }
+                )
 
         return system_instruction, contents
 
-    def _convert_tools(self, tools: list[dict[str, Any]]) -> list[dict[str, Any]]:
+    def _convert_tools(self, tools: list[dict[str, object]]) -> list[dict[str, object]]:
         """将 OpenAI function 格式转换为 Gemini functionDeclarations"""
         declarations = []
         for tool in tools:
             if tool.get("type") == "function":
                 func = tool.get("function", {})
-                declarations.append({
-                    "name": func.get("name", ""),
-                    "description": func.get("description", ""),
-                    "parameters": func.get("parameters", {"type": "object", "properties": {}}),
-                })
+                declarations.append(
+                    {
+                        "name": func.get("name", ""),
+                        "description": func.get("description", ""),
+                        "parameters": func.get("parameters", {"type": "object", "properties": {}}),
+                    }
+                )
         if not declarations:
             return []
         return [{"functionDeclarations": declarations}]
 
-    def _convert_tool_choice(self, tool_choice: str) -> dict[str, Any] | None:
+    def _convert_tool_choice(self, tool_choice: str) -> dict[str, object] | None:
         """将 OpenAI tool_choice 格式转换为 Gemini toolConfig"""
         if tool_choice == "auto":
             return {"functionCallingConfig": {"mode": "AUTO"}}
@@ -210,7 +225,7 @@ class GeminiProvider(LLMProvider):
             return {"functionCallingConfig": {"mode": "NONE"}}
         return None
 
-    def _parse_response(self, data: dict[str, Any], model: str) -> LLMResponse:
+    def _parse_response(self, data: dict[str, object], model: str) -> LLMResponse:
         """将 Gemini 响应转换为 LLMResponse"""
         candidates = data.get("candidates", [])
         text_parts: list[str] = []
@@ -225,11 +240,13 @@ class GeminiProvider(LLMProvider):
                     text_parts.append(part["text"])
                 elif "functionCall" in part:
                     fc = part["functionCall"]
-                    tool_calls.append(ToolCall(
-                        id=f"call_{tool_call_index}",
-                        name=fc.get("name", ""),
-                        arguments=fc.get("args", {}),
-                    ))
+                    tool_calls.append(
+                        ToolCall(
+                            id=f"call_{tool_call_index}",
+                            name=fc.get("name", ""),
+                            arguments=fc.get("args", {}),
+                        )
+                    )
                     tool_call_index += 1
 
         usage_metadata = data.get("usageMetadata", {})
@@ -275,7 +292,7 @@ class GeminiProvider(LLMProvider):
 
         system_instruction, contents = self._convert_messages(request.messages)
 
-        payload: dict[str, Any] = {
+        payload: dict[str, object] = {
             "contents": contents,
             "generationConfig": {
                 "temperature": request.temperature,
@@ -340,7 +357,7 @@ class GeminiProvider(LLMProvider):
 
         system_instruction, contents = self._convert_messages(request.messages)
 
-        payload: dict[str, Any] = {
+        payload: dict[str, object] = {
             "contents": contents,
             "generationConfig": {
                 "temperature": request.temperature,
@@ -374,7 +391,7 @@ class GeminiProvider(LLMProvider):
 
     async def _iterate_stream(self, response, request: LLMRequest):
         """Iterate over an already-open SSE stream and yield StreamChunks."""
-        accumulated_tool_calls: list[dict[str, Any]] = []
+        accumulated_tool_calls: list[dict[str, object]] = []
         model = request.model or self._model
 
         async for line in response.aiter_lines():
@@ -436,11 +453,13 @@ class GeminiProvider(LLMProvider):
                         )
                 elif "functionCall" in part:
                     fc = part["functionCall"]
-                    accumulated_tool_calls.append({
-                        "id": f"call_{len(accumulated_tool_calls)}",
-                        "name": fc.get("name", ""),
-                        "arguments": fc.get("args", {}),
-                    })
+                    accumulated_tool_calls.append(
+                        {
+                            "id": f"call_{len(accumulated_tool_calls)}",
+                            "name": fc.get("name", ""),
+                            "arguments": fc.get("args", {}),
+                        }
+                    )
 
             # Check for finish reason
             finish_reason = candidates[0].get("finishReason", "")
@@ -461,7 +480,7 @@ class GeminiProvider(LLMProvider):
                 )
                 accumulated_tool_calls = []
 
-    def get_model_info(self) -> dict[str, Any]:
+    def get_model_info(self) -> dict[str, object]:
         """返回 Provider 和模型信息"""
         return {
             "provider": "gemini",
diff --git a/src/agentkit/llm/providers/litellm_provider.py b/src/agentkit/llm/providers/litellm_provider.py
index 45d144a..e25784f 100644
--- a/src/agentkit/llm/providers/litellm_provider.py
+++ b/src/agentkit/llm/providers/litellm_provider.py
@@ -26,8 +26,7 @@ import inspect
 import json
 import logging
 import time
-from collections.abc import AsyncGenerator
-from typing import Any
+from collections.abc import AsyncGenerator, Iterable
 
 from agentkit.core.exceptions import LLMProviderError
 from agentkit.llm.protocol import (
@@ -81,13 +80,13 @@ class LitellmProvider(LLMProvider):
         api_key: str,
         base_url: str | None = None,
         provider_type: str = "openai",
-        **default_kwargs: Any,
+        **default_kwargs: object,
     ) -> None:
         self._model_prefix = model_prefix
         self._api_key = api_key
         self._base_url = base_url or None  # 空字符串视作未设置
         self._provider_type = provider_type
-        self._default_kwargs: dict[str, Any] = dict(default_kwargs)
+        self._default_kwargs: dict[str, object] = dict(default_kwargs)
 
     async def chat(self, request: LLMRequest) -> LLMResponse:
         """非流式 chat — 调用 ``litellm.acompletion`` 并翻译响应。"""
@@ -116,7 +115,7 @@ class LitellmProvider(LLMProvider):
 
         kwargs = self._build_kwargs(request, stream=True)
 
-        accumulated_tool_calls: dict[int, dict[str, Any]] = {}
+        accumulated_tool_calls: dict[int, dict[str, object]] = {}
         final_usage: TokenUsage | None = None
         final_model: str = request.model
 
@@ -158,9 +157,9 @@ class LitellmProvider(LLMProvider):
     # 内部辅助
     # ------------------------------------------------------------------
 
-    def _build_kwargs(self, request: LLMRequest, *, stream: bool) -> dict[str, Any]:
+    def _build_kwargs(self, request: LLMRequest, *, stream: bool) -> dict[str, object]:
         """从 LLMRequest 构造 litellm.acompletion kwargs。"""
-        kwargs: dict[str, Any] = {
+        kwargs: dict[str, object] = {
             "model": f"{self._model_prefix}{request.model}",
             "messages": request.messages,
             "temperature": request.temperature,
@@ -187,7 +186,7 @@ class LitellmProvider(LLMProvider):
 
     def _parse_response(
         self,
-        response: Any,
+        response: object,
         request_model: str,
         latency_ms: float,
     ) -> LLMResponse:
@@ -229,9 +228,9 @@ class LitellmProvider(LLMProvider):
 
     def _parse_stream_chunk(
         self,
-        chunk: Any,
+        chunk: object,
         request_model: str,
-        accumulated_tool_calls: dict[int, dict[str, Any]],
+        accumulated_tool_calls: dict[int, dict[str, object]],
     ) -> StreamChunk:
         """解析单个流式 chunk（非 final）。累计 tool_calls 到传入字典。"""
         choices = getattr(chunk, "choices", None) or []
@@ -262,7 +261,7 @@ class LitellmProvider(LLMProvider):
 
     def _finalize_tool_calls(
         self,
-        accumulated: dict[int, dict[str, Any]],
+        accumulated: dict[int, dict[str, object]],
     ) -> list[ToolCall]:
         """把累计的流式 tool_calls 字典转成 ToolCall 列表。"""
         tool_calls: list[ToolCall] = []
@@ -288,7 +287,7 @@ class LitellmProvider(LLMProvider):
 # ----------------------------------------------------------------------
 
 
-def _parse_tool_calls(raw_tool_calls: Any) -> list[ToolCall]:
+def _parse_tool_calls(raw_tool_calls: Iterable[object]) -> list[ToolCall]:
     """解析非流式响应的 tool_calls（OpenAI 格式 list[ChoiceMessageToolCall]）。"""
     result: list[ToolCall] = []
     for tc in raw_tool_calls:
@@ -312,7 +311,7 @@ def _parse_tool_calls(raw_tool_calls: Any) -> list[ToolCall]:
     return result
 
 
-def _parse_usage(usage_obj: Any) -> TokenUsage:
+def _parse_usage(usage_obj: object) -> TokenUsage:
     """解析 usage 对象（OpenAI CompletionUsage 或 dict）。"""
     prompt = getattr(usage_obj, "prompt_tokens", None)
     completion = getattr(usage_obj, "completion_tokens", None)
@@ -326,8 +325,8 @@ def _parse_usage(usage_obj: Any) -> TokenUsage:
 
 
 def _accumulate_stream_tool_calls(
-    raw_tool_calls: Any,
-    accumulated: dict[int, dict[str, Any]],
+    raw_tool_calls: Iterable[object],
+    accumulated: dict[int, dict[str, object]],
 ) -> None:
     """累计流式 chunk 里的 tool_calls 片段（OpenAI delta.tool_calls 格式）。
 
@@ -364,7 +363,7 @@ def create_litellm_provider(
     provider_type: str,
     api_key: str,
     base_url: str | None = None,
-    **kwargs: Any,
+    **kwargs: object,
 ) -> LitellmProvider:
     """根据 provider_type 创建 LitellmProvider 实例。
 
diff --git a/src/agentkit/llm/providers/usage_store.py b/src/agentkit/llm/providers/usage_store.py
index f7cf77d..3bd634d 100644
--- a/src/agentkit/llm/providers/usage_store.py
+++ b/src/agentkit/llm/providers/usage_store.py
@@ -18,7 +18,7 @@ import json
 import logging
 from dataclasses import dataclass, field
 from datetime import datetime, timedelta, timezone
-from typing import Any, Protocol, runtime_checkable
+from typing import Protocol, runtime_checkable
 
 from agentkit.llm.protocol import TokenUsage
 
@@ -294,8 +294,8 @@ class RedisUsageStore:
 
     def __init__(self, redis_url: str = "redis://localhost:6379"):
         self._redis_url = redis_url
-        self._redis: Any = None
-        self._sync_redis: Any = None
+        self._redis: object | None = None
+        self._sync_redis: object | None = None
         self._fallback: InMemoryUsageStore | None = None
         self._degraded = False
         self._health_check_task: asyncio.Task[None] | None = None
@@ -687,7 +687,7 @@ class RedisUsageStore:
 
     @staticmethod
     def _read_list(
-        r: Any,
+        r: object,
         list_key: str,
         start: datetime,
         end: datetime,
diff --git a/src/agentkit/llm/providers/wenxin.py b/src/agentkit/llm/providers/wenxin.py
index ae6ee8e..bdb173a 100644
--- a/src/agentkit/llm/providers/wenxin.py
+++ b/src/agentkit/llm/providers/wenxin.py
@@ -9,7 +9,6 @@ from __future__ import annotations
 
 import logging
 import time
-from typing import Any
 
 from agentkit.llm.providers.openai import OpenAICompatibleProvider
 from agentkit.llm.protocol import LLMRequest, LLMResponse
@@ -51,7 +50,7 @@ class WenxinProvider(OpenAICompatibleProvider):
         secret_key: str | None = None,
         base_url: str = WENXIN_DEFAULT_BASE_URL,
         default_model: str = "ernie-4.5-turbo-128k",
-        **kwargs: Any,
+        **kwargs: object,
     ):
         # If AK/SK provided, use token-based auth
         self._access_key = access_key
diff --git a/src/agentkit/llm/providers/yuanbao.py b/src/agentkit/llm/providers/yuanbao.py
index a055c36..2b61241 100644
--- a/src/agentkit/llm/providers/yuanbao.py
+++ b/src/agentkit/llm/providers/yuanbao.py
@@ -8,7 +8,6 @@ API：腾讯云 OpenAI 兼容接口
 from __future__ import annotations
 
 import logging
-from typing import Any
 
 from agentkit.llm.providers.openai import OpenAICompatibleProvider
 from agentkit.llm.protocol import LLMRequest, LLMResponse
@@ -48,7 +47,7 @@ class YuanbaoProvider(OpenAICompatibleProvider):
         base_url: str = YUANBAO_DEFAULT_BASE_URL,
         default_model: str = "hunyuan-turbos-latest",
         enable_enhancement: bool = False,
-        **kwargs: Any,
+        **kwargs: object,
     ):
         self._enable_enhancement = enable_enhancement
         super().__init__(
diff --git a/src/agentkit/llm/remote_provider.py b/src/agentkit/llm/remote_provider.py
index 1ec54df..706336a 100644
--- a/src/agentkit/llm/remote_provider.py
+++ b/src/agentkit/llm/remote_provider.py
@@ -3,7 +3,6 @@
 import json
 import logging
 from collections.abc import AsyncIterator, Awaitable, Callable
-from typing import Any
 
 import httpx
 
@@ -66,7 +65,7 @@ class RemoteLLMProvider(LLMProvider):
             "Content-Type": "application/json",
         }
 
-    def _build_payload(self, request: LLMRequest) -> dict[str, Any]:
+    def _build_payload(self, request: LLMRequest) -> dict[str, object]:
         """Convert LLMRequest to server API payload."""
         return {
             "messages": request.messages,
@@ -91,7 +90,7 @@ class RemoteLLMProvider(LLMProvider):
                 return str(body["error"])
         return str(body)
 
-    def _parse_response(self, data: dict[str, Any], request: LLMRequest) -> LLMResponse:
+    def _parse_response(self, data: dict[str, object], request: LLMRequest) -> LLMResponse:
         """Parse server response JSON into an LLMResponse."""
         usage_data = data.get("usage") or {}
         usage = TokenUsage(
@@ -115,7 +114,7 @@ class RemoteLLMProvider(LLMProvider):
             latency_ms=data.get("latency_ms", 0.0),
         )
 
-    def _parse_chunk(self, data: dict[str, Any], request: LLMRequest) -> StreamChunk:
+    def _parse_chunk(self, data: dict[str, object], request: LLMRequest) -> StreamChunk:
         """Parse a single SSE data payload into a StreamChunk."""
         usage: TokenUsage | None = None
         usage_data = data.get("usage")
@@ -218,9 +217,7 @@ class RemoteLLMProvider(LLMProvider):
                     if response.status_code == 502:
                         await response.aread()
                         detail = self._extract_error_detail(response)
-                        raise LLMProviderError(
-                            "remote", f"Server LLM gateway error: {detail}"
-                        )
+                        raise LLMProviderError("remote", f"Server LLM gateway error: {detail}")
                     if response.status_code != 200:
                         await response.aread()
                         raise LLMProviderError(
diff --git a/src/agentkit/llm/retry.py b/src/agentkit/llm/retry.py
index cc2990f..9659856 100644
--- a/src/agentkit/llm/retry.py
+++ b/src/agentkit/llm/retry.py
@@ -5,7 +5,7 @@ import logging
 import time
 from dataclasses import dataclass, field
 from enum import Enum
-from typing import Any, Callable
+from typing import Callable
 
 from agentkit.core.exceptions import LLMProviderError
 
@@ -20,9 +20,7 @@ class RetryConfig:
     base_delay: float = 1.0
     max_delay: float = 30.0
     exponential_base: float = 2.0
-    retryable_status_codes: set[int] = field(
-        default_factory=lambda: {429, 500, 502, 503, 529}
-    )
+    retryable_status_codes: set[int] = field(default_factory=lambda: {429, 500, 502, 503, 529})
 
 
 class CircuitState(Enum):
@@ -69,7 +67,7 @@ class RetryPolicy:
     def __init__(self, config: RetryConfig | None = None):
         self._config = config or RetryConfig()
 
-    async def execute(self, fn: Callable, *args: Any, **kwargs: Any) -> Any:
+    async def execute(self, fn: Callable, *args: object, **kwargs: object) -> object:
         """Execute fn with retry on retryable errors."""
         last_error: Exception | None = None
 
@@ -84,7 +82,7 @@ class RetryPolicy:
                     raise
 
                 delay = min(
-                    self._config.base_delay * (self._config.exponential_base ** attempt),
+                    self._config.base_delay * (self._config.exponential_base**attempt),
                     self._config.max_delay,
                 )
                 logger.warning(
@@ -142,7 +140,7 @@ class CircuitBreaker:
                 f"after {self._failure_count} failures"
             )
 
-    async def execute(self, fn: Callable, *args: Any, **kwargs: Any) -> Any:
+    async def execute(self, fn: Callable, *args: object, **kwargs: object) -> object:
         """Execute fn through the circuit breaker."""
         current_state = self.state
 
@@ -158,6 +156,6 @@ class CircuitBreaker:
             result = await fn(*args, **kwargs)
             self._on_success()
             return result
-        except Exception as e:
+        except Exception:
             self._on_failure()
             raise
diff --git a/src/agentkit/memory/adapters/base.py b/src/agentkit/memory/adapters/base.py
index eddedec..2c2e230 100644
--- a/src/agentkit/memory/adapters/base.py
+++ b/src/agentkit/memory/adapters/base.py
@@ -10,7 +10,6 @@ from __future__ import annotations
 
 import logging
 from abc import ABC, abstractmethod
-from typing import Any
 
 import httpx
 
@@ -95,8 +94,7 @@ class KBAdapter(ABC):
     async def delete_by_id(self, id: str) -> bool:
         """按文档 ID 删除（子类可覆盖）"""
         logger.warning(
-            f"{self.__class__.__name__} does not support delete_by_id; "
-            f"id '{id}' skipped"
+            f"{self.__class__.__name__} does not support delete_by_id; id '{id}' skipped"
         )
         return False
 
@@ -127,8 +125,7 @@ class KBAdapter(ABC):
     async def get_document(self, doc_id: str) -> Document | None:
         """按 ID 获取单个文档（子类可覆盖）"""
         logger.warning(
-            f"{self.__class__.__name__} does not support get_document; "
-            f"doc_id '{doc_id}' not found"
+            f"{self.__class__.__name__} does not support get_document; doc_id '{doc_id}' not found"
         )
         return None
 
@@ -156,5 +153,5 @@ class KBAdapter(ABC):
     async def __aenter__(self) -> KBAdapter:
         return self
 
-    async def __aexit__(self, *args: Any) -> None:
+    async def __aexit__(self, *args: object) -> None:
         await self.close()
diff --git a/src/agentkit/memory/adapters/confluence.py b/src/agentkit/memory/adapters/confluence.py
index 1478fb0..1aeb763 100644
--- a/src/agentkit/memory/adapters/confluence.py
+++ b/src/agentkit/memory/adapters/confluence.py
@@ -7,7 +7,6 @@
 from __future__ import annotations
 
 import logging
-from typing import Any
 
 import httpx
 
@@ -56,7 +55,9 @@ class ConfluenceAdapter(KBAdapter):
         )
         self._base_url = base_url.rstrip("/")
         if not is_safe_url(self._base_url):
-            raise ValueError(f"Unsafe base_url: {self._base_url}. Private/internal URLs are not allowed.")
+            raise ValueError(
+                f"Unsafe base_url: {self._base_url}. Private/internal URLs are not allowed."
+            )
         self._username = username
         self._api_token = api_token
         self._space_keys = space_keys or []
@@ -65,9 +66,7 @@ class ConfluenceAdapter(KBAdapter):
         """创建 Confluence API HTTP 客户端"""
         import base64
 
-        credentials = base64.b64encode(
-            f"{self._username}:{self._api_token}".encode()
-        ).decode()
+        credentials = base64.b64encode(f"{self._username}:{self._api_token}".encode()).decode()
         return httpx.AsyncClient(
             base_url=self._base_url,
             headers={
@@ -101,7 +100,7 @@ class ConfluenceAdapter(KBAdapter):
                 space_filter = " OR ".join(
                     f'space = "{_escape_cql(key)}"' for key in self._space_keys
                 )
-                cql = f'{cql} AND ({space_filter})'
+                cql = f"{cql} AND ({space_filter})"
 
             resp = await client.get(
                 "/rest/api/content/search",
@@ -115,6 +114,7 @@ class ConfluenceAdapter(KBAdapter):
                 body = page.get("body", {}).get("storage", {}).get("value", "")
                 # Strip HTML tags for plain text content
                 import re
+
                 content = re.sub(r"<[^>]+>", "", body) if body else page.get("title", "")
 
                 results.append(
@@ -136,8 +136,7 @@ class ConfluenceAdapter(KBAdapter):
 
         except httpx.HTTPStatusError as e:
             logger.error(
-                f"Confluence search HTTP error: {e.response.status_code} — "
-                f"{e.response.text[:200]}"
+                f"Confluence search HTTP error: {e.response.status_code} — {e.response.text[:200]}"
             )
             return []
         except Exception as e:
@@ -157,6 +156,7 @@ class ConfluenceAdapter(KBAdapter):
 
             body = page.get("body", {}).get("storage", {}).get("value", "")
             import re
+
             content = re.sub(r"<[^>]+>", "", body) if body else ""
 
             return Document(
@@ -191,13 +191,17 @@ class ConfluenceAdapter(KBAdapter):
                         source_type="confluence",
                     )
                 )
-            return sources if sources else [
-                SourceInfo(
-                    source_id=self._source_id,
-                    source_name=self._source_name,
-                    source_type=self._source_type,
-                )
-            ]
+            return (
+                sources
+                if sources
+                else [
+                    SourceInfo(
+                        source_id=self._source_id,
+                        source_name=self._source_name,
+                        source_type=self._source_type,
+                    )
+                ]
+            )
         except Exception as e:
             logger.error(f"Confluence list_sources error: {e}")
             return [
diff --git a/src/agentkit/memory/adapters/feishu.py b/src/agentkit/memory/adapters/feishu.py
index e28dec6..69ef235 100644
--- a/src/agentkit/memory/adapters/feishu.py
+++ b/src/agentkit/memory/adapters/feishu.py
@@ -8,7 +8,7 @@ from __future__ import annotations
 
 import logging
 import time
-from typing import Any
+from typing import TypeAlias
 
 import httpx
 
@@ -18,6 +18,9 @@ from agentkit.utils.security import is_safe_url
 
 logger = logging.getLogger(__name__)
 
+# 飞书搜索请求 payload：search_key/page_size/wiki_space_ids — 值为 str|int|list[str]。
+FeishuSearchPayload: TypeAlias = dict[str, object]
+
 
 class FeishuKBAdapter(KBAdapter):
     """飞书知识库适配器
@@ -54,7 +57,9 @@ class FeishuKBAdapter(KBAdapter):
         self._app_secret = app_secret
         self._base_url = base_url.rstrip("/")
         if not is_safe_url(self._base_url):
-            raise ValueError(f"Unsafe base_url: {self._base_url}. Private/internal URLs are not allowed.")
+            raise ValueError(
+                f"Unsafe base_url: {self._base_url}. Private/internal URLs are not allowed."
+            )
         self._space_ids = space_ids or []
         self._access_token: str | None = None
         self._token_expiry: float = 0.0
@@ -94,10 +99,7 @@ class FeishuKBAdapter(KBAdapter):
                 self._client = None
                 return self._access_token
             else:
-                logger.error(
-                    f"Feishu auth failed: code={data.get('code')}, "
-                    f"msg={data.get('msg')}"
-                )
+                logger.error(f"Feishu auth failed: code={data.get('code')}, msg={data.get('msg')}")
                 return None
         except Exception as e:
             logger.error(f"Feishu auth error: {e}")
@@ -121,7 +123,7 @@ class FeishuKBAdapter(KBAdapter):
 
         client = self._get_client()
         try:
-            payload: dict[str, Any] = {
+            payload: FeishuSearchPayload = {
                 "search_key": query,
                 "page_size": top_k,
             }
@@ -137,8 +139,7 @@ class FeishuKBAdapter(KBAdapter):
 
             if data.get("code") != 0:
                 logger.error(
-                    f"Feishu search failed: code={data.get('code')}, "
-                    f"msg={data.get('msg')}"
+                    f"Feishu search failed: code={data.get('code')}, msg={data.get('msg')}"
                 )
                 return []
 
@@ -162,8 +163,7 @@ class FeishuKBAdapter(KBAdapter):
 
         except httpx.HTTPStatusError as e:
             logger.error(
-                f"Feishu search HTTP error: {e.response.status_code} — "
-                f"{e.response.text[:200]}"
+                f"Feishu search HTTP error: {e.response.status_code} — {e.response.text[:200]}"
             )
             return []
         except Exception as e:
@@ -179,7 +179,7 @@ class FeishuKBAdapter(KBAdapter):
         client = self._get_client()
         try:
             resp = await client.get(
-                f"/wiki/v2/spaces/get_node",
+                "/wiki/v2/spaces/get_node",
                 params={"token": doc_id},
             )
             resp.raise_for_status()
@@ -230,13 +230,17 @@ class FeishuKBAdapter(KBAdapter):
                         source_type="feishu",
                     )
                 )
-            return sources if sources else [
-                SourceInfo(
-                    source_id=self._source_id,
-                    source_name=self._source_name,
-                    source_type=self._source_type,
-                )
-            ]
+            return (
+                sources
+                if sources
+                else [
+                    SourceInfo(
+                        source_id=self._source_id,
+                        source_name=self._source_name,
+                        source_type=self._source_type,
+                    )
+                ]
+            )
         except Exception as e:
             logger.error(f"Feishu list_sources error: {e}")
             return [
diff --git a/src/agentkit/memory/adapters/generic_http.py b/src/agentkit/memory/adapters/generic_http.py
index 38e8b9c..41dd26b 100644
--- a/src/agentkit/memory/adapters/generic_http.py
+++ b/src/agentkit/memory/adapters/generic_http.py
@@ -7,7 +7,6 @@
 from __future__ import annotations
 
 import logging
-from typing import Any
 
 import httpx
 
@@ -55,7 +54,9 @@ class GenericHTTPAdapter(KBAdapter):
         )
         self._endpoint_url = endpoint_url.rstrip("/")
         if not is_safe_url(self._endpoint_url):
-            raise ValueError(f"Unsafe endpoint_url: {self._endpoint_url}. Private/internal URLs are not allowed.")
+            raise ValueError(
+                f"Unsafe endpoint_url: {self._endpoint_url}. Private/internal URLs are not allowed."
+            )
         self._auth_config = auth_config or {}
         self._extra_headers = headers or {}
 
@@ -74,12 +75,11 @@ class GenericHTTPAdapter(KBAdapter):
                 headers["Authorization"] = f"Bearer {token}"
         elif auth_type == "basic":
             import base64
+
             username = self._auth_config.get("username", "")
             password = self._auth_config.get("password", "")
             if username and password:
-                credentials = base64.b64encode(
-                    f"{username}:{password}".encode()
-                ).decode()
+                credentials = base64.b64encode(f"{username}:{password}".encode()).decode()
                 headers["Authorization"] = f"Basic {credentials}"
         elif auth_type == "api_key":
             key_name = self._auth_config.get("header_name", "X-API-Key")
@@ -135,8 +135,7 @@ class GenericHTTPAdapter(KBAdapter):
 
         except httpx.HTTPStatusError as e:
             logger.error(
-                f"GenericHTTP search HTTP error: {e.response.status_code} — "
-                f"{e.response.text[:200]}"
+                f"GenericHTTP search HTTP error: {e.response.status_code} — {e.response.text[:200]}"
             )
             return []
         except Exception as e:
@@ -177,8 +176,7 @@ class GenericHTTPAdapter(KBAdapter):
 
         except httpx.HTTPStatusError as e:
             logger.error(
-                f"GenericHTTP ingest HTTP error: {e.response.status_code} — "
-                f"{e.response.text[:200]}"
+                f"GenericHTTP ingest HTTP error: {e.response.status_code} — {e.response.text[:200]}"
             )
             return []
         except Exception as e:
@@ -245,13 +243,17 @@ class GenericHTTPAdapter(KBAdapter):
                                 document_count=item.get("document_count", 0),
                             )
                         )
-                return sources if sources else [
-                    SourceInfo(
-                        source_id=self._source_id,
-                        source_name=self._source_name,
-                        source_type=self._source_type,
-                    )
-                ]
+                return (
+                    sources
+                    if sources
+                    else [
+                        SourceInfo(
+                            source_id=self._source_id,
+                            source_name=self._source_name,
+                            source_type=self._source_type,
+                        )
+                    ]
+                )
         except Exception as e:
             logger.debug(f"GenericHTTP list_sources error (endpoint may not exist): {e}")
 
diff --git a/src/agentkit/memory/base.py b/src/agentkit/memory/base.py
index 930a933..f3b9ae1 100644
--- a/src/agentkit/memory/base.py
+++ b/src/agentkit/memory/base.py
@@ -3,19 +3,29 @@
 from abc import ABC, abstractmethod
 from dataclasses import dataclass, field
 from datetime import datetime, timezone
-from typing import Any
+from typing import TypeAlias
+
+# 共享类型别名 — 跨 memory 子系统复用，避免 `Any` 残留。
+# MetadataValue 覆盖 metadata dict 中实际出现的原始类型；
+# MemoryValue 额外允许 dict/list 容器以容纳结构化负载（如 episodic 经验字典）。
+MetadataValue: TypeAlias = str | int | float | bool | None
+MetadataDict: TypeAlias = dict[str, MetadataValue]
+MemoryValue: TypeAlias = (
+    str | int | float | bool | None | dict[str, MetadataValue] | list[MetadataValue]
+)
 
 
 @dataclass
 class MemoryItem:
     """记忆条目"""
+
     key: str
-    value: Any
-    metadata: dict[str, Any] = field(default_factory=dict)
+    value: object
+    metadata: MetadataDict = field(default_factory=dict)
     score: float = 1.0
     created_at: datetime = field(default_factory=lambda: datetime.now(timezone.utc))
 
-    def to_dict(self) -> dict:
+    def to_dict(self) -> dict[str, object]:
         return {
             "key": self.key,
             "value": self.value,
@@ -35,7 +45,7 @@ class Memory(ABC):
     """
 
     @abstractmethod
-    async def store(self, key: str, value: Any, metadata: dict[str, Any] | None = None) -> None:
+    async def store(self, key: str, value: object, metadata: MetadataDict | None = None) -> None:
         """存储记忆"""
         ...
 
@@ -45,7 +55,9 @@ class Memory(ABC):
         ...
 
     @abstractmethod
-    async def search(self, query: str, top_k: int = 5, filters: dict[str, Any] | None = None) -> list[MemoryItem]:
+    async def search(
+        self, query: str, top_k: int = 5, filters: MetadataDict | None = None
+    ) -> list[MemoryItem]:
         """语义检索"""
         ...
 
@@ -54,7 +66,7 @@ class Memory(ABC):
         """删除记忆"""
         ...
 
-    async def store_batch(self, items: list[tuple[str, Any, dict | None]]) -> None:
+    async def store_batch(self, items: list[tuple[str, object, MetadataDict | None]]) -> None:
         """批量存储"""
         for key, value, metadata in items:
             await self.store(key, value, metadata)
diff --git a/src/agentkit/memory/chunking.py b/src/agentkit/memory/chunking.py
index ad0dbe4..67d0bd5 100644
--- a/src/agentkit/memory/chunking.py
+++ b/src/agentkit/memory/chunking.py
@@ -11,10 +11,18 @@ import logging
 import re
 import uuid
 from dataclasses import dataclass, field
-from typing import Any
+from typing import TypeAlias
+
+from agentkit.memory.base import MetadataDict
 
 logger = logging.getLogger(__name__)
 
+# 分块元数据：source_doc/position/char_count/chunking_strategy/heading/heading_level
+# — 全部为原始标量（str/int）。
+ChunkMetadata: TypeAlias = MetadataDict
+# _split_by_headings 返回的节段结构。
+SectionInfo: TypeAlias = dict[str, str | int]
+
 
 @dataclass
 class Chunk:
@@ -22,7 +30,7 @@ class Chunk:
 
     chunk_id: str
     content: str
-    metadata: dict[str, Any] = field(default_factory=dict)
+    metadata: ChunkMetadata = field(default_factory=dict)
 
     def __post_init__(self) -> None:
         if "source_doc" not in self.metadata:
@@ -30,7 +38,7 @@ class Chunk:
         if "position" not in self.metadata:
             self.metadata["position"] = 0
 
-    def to_dict(self) -> dict[str, Any]:
+    def to_dict(self) -> dict[str, object]:
         return {
             "chunk_id": self.chunk_id,
             "content": self.content,
@@ -57,7 +65,9 @@ class TextChunker:
             separator: 优先分割符
         """
         if chunk_overlap >= chunk_size:
-            raise ValueError(f"chunk_overlap ({chunk_overlap}) must be less than chunk_size ({chunk_size})")
+            raise ValueError(
+                f"chunk_overlap ({chunk_overlap}) must be less than chunk_size ({chunk_size})"
+            )
         self._chunk_size = chunk_size
         self._chunk_overlap = chunk_overlap
         self._separator = separator
@@ -66,7 +76,7 @@ class TextChunker:
         self,
         text: str,
         source_doc_id: str = "",
-        metadata: dict[str, Any] | None = None,
+        metadata: ChunkMetadata | None = None,
     ) -> list[Chunk]:
         """将文本分块
 
@@ -96,11 +106,13 @@ class TextChunker:
             chunk_meta = dict(base_meta)
             chunk_meta["position"] = i
             chunk_meta["char_count"] = len(chunk_text)
-            chunks.append(Chunk(
-                chunk_id=str(uuid.uuid4()),
-                content=chunk_text,
-                metadata=chunk_meta,
-            ))
+            chunks.append(
+                Chunk(
+                    chunk_id=str(uuid.uuid4()),
+                    content=chunk_text,
+                    metadata=chunk_meta,
+                )
+            )
 
         return chunks
 
@@ -142,7 +154,9 @@ class TextChunker:
                     overlap_text[overlap_start:], segments
                 )
                 current = overlap_segments
-                current_len = sum(len(s) for s in current) + len(self._separator) * max(0, len(current) - 1)
+                current_len = sum(len(s) for s in current) + len(self._separator) * max(
+                    0, len(current) - 1
+                )
 
             current.append(segment)
             current_len += seg_len + len(self._separator)
@@ -214,7 +228,7 @@ class StructuralChunker:
         self,
         text: str,
         source_doc_id: str = "",
-        metadata: dict[str, Any] | None = None,
+        metadata: ChunkMetadata | None = None,
     ) -> list[Chunk]:
         """将文本按结构分块
 
@@ -266,23 +280,25 @@ class StructuralChunker:
                 chunk_meta["heading"] = heading
                 chunk_meta["heading_level"] = level
                 chunk_meta["char_count"] = len(content)
-                chunks.append(Chunk(
-                    chunk_id=str(uuid.uuid4()),
-                    content=content,
-                    metadata=chunk_meta,
-                ))
+                chunks.append(
+                    Chunk(
+                        chunk_id=str(uuid.uuid4()),
+                        content=content,
+                        metadata=chunk_meta,
+                    )
+                )
                 position += 1
 
         return chunks
 
-    def _split_by_headings(self, text: str) -> list[dict[str, Any]]:
+    def _split_by_headings(self, text: str) -> list[SectionInfo]:
         """按标题分割 Markdown 文本
 
         Returns:
             列表，每项包含 heading, content, level
         """
         lines = text.split("\n")
-        sections: list[dict[str, Any]] = []
+        sections: list[SectionInfo] = []
         current_heading = ""
         current_level = 0
         current_lines: list[str] = []
@@ -296,11 +312,13 @@ class StructuralChunker:
                 if current_lines:
                     content = "\n".join(current_lines).strip()
                     if content:
-                        sections.append({
-                            "heading": current_heading,
-                            "content": content,
-                            "level": current_level,
-                        })
+                        sections.append(
+                            {
+                                "heading": current_heading,
+                                "content": content,
+                                "level": current_level,
+                            }
+                        )
 
                 # 开始新节
                 current_heading = match.group(2).strip()
@@ -313,18 +331,22 @@ class StructuralChunker:
         if current_lines:
             content = "\n".join(current_lines).strip()
             if content:
-                sections.append({
-                    "heading": current_heading,
-                    "content": content,
-                    "level": current_level,
-                })
+                sections.append(
+                    {
+                        "heading": current_heading,
+                        "content": content,
+                        "level": current_level,
+                    }
+                )
 
         # 如果没有标题结构，整体作为一个块
         if not sections:
-            sections.append({
-                "heading": "",
-                "content": text.strip(),
-                "level": 0,
-            })
+            sections.append(
+                {
+                    "heading": "",
+                    "content": text.strip(),
+                    "level": 0,
+                }
+            )
 
         return sections
diff --git a/src/agentkit/memory/contextual_retrieval.py b/src/agentkit/memory/contextual_retrieval.py
index 93eb47f..aad0388 100644
--- a/src/agentkit/memory/contextual_retrieval.py
+++ b/src/agentkit/memory/contextual_retrieval.py
@@ -9,10 +9,14 @@ from __future__ import annotations
 import hashlib
 import logging
 from dataclasses import dataclass
-from typing import Any
+from typing import TYPE_CHECKING
 
+from agentkit.memory.base import MetadataDict
 from agentkit.memory.embedder import EmbeddingCache
 
+if TYPE_CHECKING:
+    from agentkit.llm.gateway import LLMGateway
+
 logger = logging.getLogger(__name__)
 
 
@@ -24,7 +28,7 @@ class ContextualChunk:
     context_prefix: str
     enhanced_content: str
     chunk_index: int
-    metadata: dict[str, Any]
+    metadata: MetadataDict
 
     @property
     def content(self) -> str:
@@ -65,7 +69,7 @@ class ContextualChunker:
 
     def __init__(
         self,
-        llm_gateway: Any = None,
+        llm_gateway: LLMGateway | None = None,
         cache: EmbeddingCache | None = None,
         batch_size: int = 8,
         max_context_length: int = 200,
@@ -90,7 +94,7 @@ class ContextualChunker:
         self,
         document: str,
         chunks: list[str],
-        metadata: dict[str, Any] | None = None,
+        metadata: MetadataDict | None = None,
     ) -> list[ContextualChunk]:
         """为文档块添加上下文前缀
 
@@ -134,7 +138,7 @@ class ContextualChunker:
         document: str,
         chunks: list[str],
         start_index: int,
-        metadata: dict[str, Any] | None,
+        metadata: MetadataDict | None,
     ) -> list[ContextualChunk]:
         """处理一批文档块"""
         results: list[ContextualChunk] = []
diff --git a/src/agentkit/memory/document_loader.py b/src/agentkit/memory/document_loader.py
index 522bd53..d991221 100644
--- a/src/agentkit/memory/document_loader.py
+++ b/src/agentkit/memory/document_loader.py
@@ -12,7 +12,9 @@ import uuid
 from dataclasses import dataclass, field
 from datetime import datetime, timezone
 from pathlib import Path
-from typing import Any
+from typing import TypeAlias
+
+from agentkit.memory.base import MetadataDict
 
 logger = logging.getLogger(__name__)
 
@@ -23,6 +25,11 @@ MAX_CONTENT_SIZE = 100 * 1024 * 1024  # 100MB
 MAX_ROWS_PER_SHEET = 10_000
 MAX_CELL_CHARS = 10_000
 
+# 文档元数据：source/format/parser/page_count/table_count/sheet_count/row_count/
+# heading_count/created_at/title/truncated — 全部为原始标量。
+DocumentMetadata: TypeAlias = MetadataDict
+ParseResult: TypeAlias = tuple[str, DocumentMetadata]
+
 
 @dataclass
 class Document:
@@ -31,7 +38,7 @@ class Document:
     doc_id: str
     title: str
     content: str
-    metadata: dict[str, Any] = field(default_factory=dict)
+    metadata: DocumentMetadata = field(default_factory=dict)
 
     def __post_init__(self) -> None:
         if "source" not in self.metadata:
@@ -43,7 +50,7 @@ class Document:
         if "created_at" not in self.metadata:
             self.metadata["created_at"] = datetime.now(timezone.utc).isoformat()
 
-    def to_dict(self) -> dict[str, Any]:
+    def to_dict(self) -> dict[str, object]:
         return {
             "doc_id": self.doc_id,
             "title": self.title,
@@ -136,12 +143,14 @@ class DocumentLoader:
 
         parser = parsers.get(doc_format)
         if parser is None:
-            logger.warning(f"Unsupported format '{doc_format}' for {filename}, falling back to text")
+            logger.warning(
+                f"Unsupported format '{doc_format}' for {filename}, falling back to text"
+            )
             parser = self._parse_text
 
         text, extra_meta = parser(content, filename)
 
-        metadata: dict[str, Any] = {
+        metadata: DocumentMetadata = {
             "source": filename,
             "format": doc_format,
             "created_at": datetime.now(timezone.utc).isoformat(),
@@ -159,7 +168,7 @@ class DocumentLoader:
             metadata=metadata,
         )
 
-    def _parse_pdf(self, content: bytes, filename: str) -> tuple[str, dict[str, Any]]:
+    def _parse_pdf(self, content: bytes, filename: str) -> ParseResult:
         """解析 PDF 文件
 
         优先使用 PyMuPDF (fitz)，回退到 pdfplumber，最终回退到纯文本。
@@ -215,7 +224,7 @@ class DocumentLoader:
         logger.warning(f"No PDF parser available for {filename}, falling back to text extraction")
         return self._parse_text(content, filename)
 
-    def _parse_docx(self, content: bytes, filename: str) -> tuple[str, dict[str, Any]]:
+    def _parse_docx(self, content: bytes, filename: str) -> ParseResult:
         """解析 Word 文件
 
         使用 python-docx，回退到纯文本。
@@ -259,7 +268,7 @@ class DocumentLoader:
             logger.warning(f"python-docx parsing failed for {filename}: {e}")
             return self._parse_text(content, filename)
 
-    def _parse_xlsx(self, content: bytes, filename: str) -> tuple[str, dict[str, Any]]:
+    def _parse_xlsx(self, content: bytes, filename: str) -> ParseResult:
         """解析 Excel 文件
 
         使用 openpyxl，回退到纯文本。每个 sheet 转为 Markdown 表格，
@@ -313,7 +322,7 @@ class DocumentLoader:
             finally:
                 wb.close()
             text = "\n".join(sections).strip()
-            meta: dict[str, Any] = {
+            meta: DocumentMetadata = {
                 "parser": "openpyxl",
                 "sheet_count": sheet_count,
                 "row_count": total_rows,
@@ -328,7 +337,7 @@ class DocumentLoader:
             logger.warning(f"openpyxl parsing failed for {filename}: {e}")
             return self._parse_text(content, filename)
 
-    def _parse_markdown(self, content: bytes, filename: str) -> tuple[str, dict[str, Any]]:
+    def _parse_markdown(self, content: bytes, filename: str) -> ParseResult:
         """解析 Markdown 文件
 
         使用 mistune（如果可用），否则直接读取文本。
@@ -347,7 +356,7 @@ class DocumentLoader:
                 title = line_stripped.lstrip("#").strip()
                 break
 
-        meta: dict[str, Any] = {
+        meta: DocumentMetadata = {
             "parser": "markdown",
         }
         if title:
@@ -362,7 +371,7 @@ class DocumentLoader:
 
         return text, meta
 
-    def _parse_html(self, content: bytes, filename: str) -> tuple[str, dict[str, Any]]:
+    def _parse_html(self, content: bytes, filename: str) -> ParseResult:
         """解析 HTML 文件
 
         使用 BeautifulSoup 提取文本，回退到纯文本。
@@ -388,7 +397,7 @@ class DocumentLoader:
             if soup.title and soup.title.string:
                 title = soup.title.string.strip()
 
-            meta: dict[str, Any] = {
+            meta: DocumentMetadata = {
                 "parser": "beautifulsoup",
             }
             if title:
@@ -402,7 +411,7 @@ class DocumentLoader:
             logger.warning(f"BeautifulSoup parsing failed for {filename}: {e}")
             return self._parse_text(content, filename)
 
-    def _parse_text(self, content: bytes, filename: str) -> tuple[str, dict[str, Any]]:
+    def _parse_text(self, content: bytes, filename: str) -> ParseResult:
         """解析纯文本文件"""
         try:
             text = content.decode("utf-8")
diff --git a/src/agentkit/memory/embedder.py b/src/agentkit/memory/embedder.py
index 203ee69..6c47c39 100644
--- a/src/agentkit/memory/embedder.py
+++ b/src/agentkit/memory/embedder.py
@@ -1,12 +1,17 @@
 """Embedder 接口与实现 - 文本向量化"""
 
+from __future__ import annotations
+
 import hashlib
 import logging
 import os
 import time
 from abc import ABC, abstractmethod
 from collections import OrderedDict
-from typing import Any
+from typing import TYPE_CHECKING
+
+if TYPE_CHECKING:
+    import httpx
 
 logger = logging.getLogger(__name__)
 
@@ -97,13 +102,14 @@ class OpenAIEmbedder(Embedder):
         self._model = model
         self._base_url = base_url
         self._dimension = 1536  # text-embedding-3-small 默认维度
-        self._client: Any = None
+        self._client: httpx.AsyncClient | None = None
         self._cache = cache
 
-    def _get_client(self):
+    def _get_client(self) -> httpx.AsyncClient:
         """Lazily create and reuse a single httpx.AsyncClient."""
         if self._client is None:
             import httpx
+
             self._client = httpx.AsyncClient(timeout=30.0)
         return self._client
 
diff --git a/src/agentkit/memory/episodic.py b/src/agentkit/memory/episodic.py
index f6817e4..ba8a4c5 100644
--- a/src/agentkit/memory/episodic.py
+++ b/src/agentkit/memory/episodic.py
@@ -1,17 +1,22 @@
 """Episodic Memory - 基于 pgvector + PostgreSQL 的任务经验记忆"""
 
+from __future__ import annotations
+
 import json
 import logging
 import math
 from datetime import datetime, timezone
-from typing import Any
+from typing import TYPE_CHECKING
 
 from sqlalchemy import text
 
-from agentkit.memory.base import Memory, MemoryItem
+from agentkit.memory.base import Memory, MemoryItem, MetadataDict
 from agentkit.memory.embedder import Embedder
 from agentkit.utils.vector_math import compute_cosine_similarity
 
+if TYPE_CHECKING:
+    from sqlalchemy.ext.asyncio import AsyncSession
+
 logger = logging.getLogger(__name__)
 
 
@@ -28,8 +33,8 @@ class EpisodicMemory(Memory):
 
     def __init__(
         self,
-        session_factory: Any,
-        episodic_model: Any,
+        session_factory: object,
+        episodic_model: object,
         embedder: Embedder | None = None,
         decay_rate: float = 0.01,
         alpha: float = 0.7,
@@ -57,7 +62,7 @@ class EpisodicMemory(Memory):
         self._pgvector_enabled = pgvector_enabled
         self._table_name = table_name
 
-    async def store(self, key: str, value: Any, metadata: dict[str, Any] | None = None) -> None:
+    async def store(self, key: str, value: object, metadata: MetadataDict | None = None) -> None:
         """存储任务经验"""
         async with self._session_factory() as db:
             try:
@@ -68,7 +73,11 @@ class EpisodicMemory(Memory):
                 embedding = None
                 if self._embedder:
                     if isinstance(value, dict):
-                        text = value.get("output_summary", "") or value.get("input_summary", "") or json.dumps(value, ensure_ascii=False)[:500]
+                        text = (
+                            value.get("output_summary", "")
+                            or value.get("input_summary", "")
+                            or json.dumps(value, ensure_ascii=False)[:500]
+                        )
                     else:
                         text = str(value)
                     embedding = await self._embedder.embed(text)
@@ -106,13 +115,11 @@ class EpisodicMemory(Memory):
                 logger.error(f"Failed to retrieve episodic memory: {e}")
                 return None
 
-    async def _retrieve_pgvector(self, db: Any, query_embedding: list[float]) -> MemoryItem | None:
+    async def _retrieve_pgvector(
+        self, db: AsyncSession, query_embedding: list[float]
+    ) -> MemoryItem | None:
         """使用 pgvector ``<=>`` 算符检索最相似条目"""
-        sql = text(
-            f"SELECT * FROM {self._table_name} "
-            f"ORDER BY embedding <=> :query_vec "
-            f"LIMIT :lim"
-        )
+        sql = text(f"SELECT * FROM {self._table_name} ORDER BY embedding <=> :query_vec LIMIT :lim")
         result = await db.execute(sql, {"query_vec": str(query_embedding), "lim": 1})
         row = result.mappings().first()
 
@@ -147,7 +154,9 @@ class EpisodicMemory(Memory):
             created_at=row.get("created_at") or datetime.now(timezone.utc),
         )
 
-    async def _retrieve_client_side(self, db: Any, query_embedding: list[float]) -> MemoryItem | None:
+    async def _retrieve_client_side(
+        self, db: AsyncSession, query_embedding: list[float]
+    ) -> MemoryItem | None:
         """客户端 O(N) cosine similarity 检索（回退路径）"""
         Model = self._episodic_model
         from sqlalchemy import select
@@ -193,7 +202,13 @@ class EpisodicMemory(Memory):
             created_at=best_item.created_at or datetime.now(timezone.utc),
         )
 
-    async def search(self, query: str, top_k: int = 5, filters: dict[str, Any] | None = None, search_multiplier: int = 5) -> list[MemoryItem]:
+    async def search(
+        self,
+        query: str,
+        top_k: int = 5,
+        filters: MetadataDict | None = None,
+        search_multiplier: int = 5,
+    ) -> list[MemoryItem]:
         """语义检索相似历史案例
 
         Args:
@@ -214,10 +229,10 @@ class EpisodicMemory(Memory):
 
     async def _search_pgvector(
         self,
-        db: Any,
+        db: AsyncSession,
         query: str,
         top_k: int,
-        filters: dict[str, Any] | None,
+        filters: MetadataDict | None,
         search_multiplier: int,
     ) -> list[MemoryItem]:
         """使用 pgvector ``<=>`` 算符检索，再 Python 侧 time_decay 重排"""
@@ -225,7 +240,7 @@ class EpisodicMemory(Memory):
         fetch_limit = top_k * search_multiplier
 
         where_clauses = []
-        params: dict[str, Any] = {"query_vec": str(query_embedding), "lim": fetch_limit}
+        params: dict[str, object] = {"query_vec": str(query_embedding), "lim": fetch_limit}
 
         filters = filters or {}
         if filters.get("agent_name"):
@@ -256,7 +271,11 @@ class EpisodicMemory(Memory):
         items = []
         for row in rows:
             row_embedding = row.get("embedding")
-            age_hours = (datetime.now(timezone.utc) - row["created_at"]).total_seconds() / 3600 if row.get("created_at") else 0
+            age_hours = (
+                (datetime.now(timezone.utc) - row["created_at"]).total_seconds() / 3600
+                if row.get("created_at")
+                else 0
+            )
             decay = math.exp(-self._decay_rate * age_hours)
             time_decay_score = (row.get("quality_score") or 0.5) * decay
 
@@ -266,33 +285,37 @@ class EpisodicMemory(Memory):
             else:
                 score = time_decay_score
 
-            items.append(MemoryItem(
-                key=str(row.get("id", "")),
-                value={
-                    "input_summary": row.get("input_summary", ""),
-                    "output_summary": row.get("output_summary", ""),
-                    "outcome": row.get("outcome", "success"),
-                    "quality_score": row.get("quality_score", 0.5),
-                    "reflection": row.get("reflection", ""),
-                },
-                metadata={
-                    "agent_name": row.get("agent_name", ""),
-                    "task_type": row.get("task_type", ""),
-                    "created_at": row["created_at"].isoformat() if row.get("created_at") else None,
-                },
-                score=score,
-                created_at=row.get("created_at") or datetime.now(timezone.utc),
-            ))
+            items.append(
+                MemoryItem(
+                    key=str(row.get("id", "")),
+                    value={
+                        "input_summary": row.get("input_summary", ""),
+                        "output_summary": row.get("output_summary", ""),
+                        "outcome": row.get("outcome", "success"),
+                        "quality_score": row.get("quality_score", 0.5),
+                        "reflection": row.get("reflection", ""),
+                    },
+                    metadata={
+                        "agent_name": row.get("agent_name", ""),
+                        "task_type": row.get("task_type", ""),
+                        "created_at": row["created_at"].isoformat()
+                        if row.get("created_at")
+                        else None,
+                    },
+                    score=score,
+                    created_at=row.get("created_at") or datetime.now(timezone.utc),
+                )
+            )
 
         items.sort(key=lambda x: x.score, reverse=True)
         return items[:top_k]
 
     async def _search_client_side(
         self,
-        db: Any,
+        db: AsyncSession,
         query: str,
         top_k: int,
-        filters: dict[str, Any] | None,
+        filters: MetadataDict | None,
         search_multiplier: int,
     ) -> list[MemoryItem]:
         """客户端 O(N) cosine similarity 检索（回退路径）"""
@@ -300,6 +323,7 @@ class EpisodicMemory(Memory):
         filters = filters or {}
 
         from sqlalchemy import select
+
         stmt = select(Model)
 
         if filters.get("agent_name"):
@@ -322,7 +346,11 @@ class EpisodicMemory(Memory):
         # 计算得分并构建 MemoryItem
         items = []
         for entry in entries:
-            age_hours = (datetime.now(timezone.utc) - entry.created_at).total_seconds() / 3600 if entry.created_at else 0
+            age_hours = (
+                (datetime.now(timezone.utc) - entry.created_at).total_seconds() / 3600
+                if entry.created_at
+                else 0
+            )
             decay = math.exp(-self._decay_rate * age_hours)
             time_decay_score = (entry.quality_score or 0.5) * decay
 
@@ -333,30 +361,34 @@ class EpisodicMemory(Memory):
             else:
                 score = time_decay_score
 
-            items.append(MemoryItem(
-                key=str(entry.id),
-                value={
-                    "input_summary": entry.input_summary,
-                    "output_summary": entry.output_summary,
-                    "outcome": entry.outcome,
-                    "quality_score": entry.quality_score,
-                    "reflection": entry.reflection,
-                },
-                metadata={
-                    "agent_name": entry.agent_name,
-                    "task_type": entry.task_type,
-                    "created_at": entry.created_at.isoformat() if entry.created_at else None,
-                },
-                score=score,
-                created_at=entry.created_at or datetime.now(timezone.utc),
-            ))
+            items.append(
+                MemoryItem(
+                    key=str(entry.id),
+                    value={
+                        "input_summary": entry.input_summary,
+                        "output_summary": entry.output_summary,
+                        "outcome": entry.outcome,
+                        "quality_score": entry.quality_score,
+                        "reflection": entry.reflection,
+                    },
+                    metadata={
+                        "agent_name": entry.agent_name,
+                        "task_type": entry.task_type,
+                        "created_at": entry.created_at.isoformat() if entry.created_at else None,
+                    },
+                    score=score,
+                    created_at=entry.created_at or datetime.now(timezone.utc),
+                )
+            )
 
         items.sort(key=lambda x: x.score, reverse=True)
         if len(items) < top_k:
             logger.warning(
                 "EpisodicMemory.search returned %d results after scoring (top_k=%d). "
                 "Consider increasing search_multiplier (current=%d) to avoid missing relevant entries.",
-                len(items), top_k, search_multiplier,
+                len(items),
+                top_k,
+                search_multiplier,
             )
         return items[:top_k]
 
@@ -364,8 +396,9 @@ class EpisodicMemory(Memory):
         """删除指定经验"""
         async with self._session_factory() as db:
             try:
-                from sqlalchemy import select, delete as sql_delete
+                from sqlalchemy import delete as sql_delete
                 import uuid
+
                 Model = self._episodic_model
 
                 stmt = sql_delete(Model).where(Model.id == uuid.UUID(key))
diff --git a/src/agentkit/memory/http_rag.py b/src/agentkit/memory/http_rag.py
index 2e4d94f..9f170c8 100644
--- a/src/agentkit/memory/http_rag.py
+++ b/src/agentkit/memory/http_rag.py
@@ -3,13 +3,26 @@
 配置驱动，不直接依赖业务系统代码，通过 base_url + api_key 连接。
 """
 
+from __future__ import annotations
+
 import logging
-from typing import Any
+from typing import TYPE_CHECKING, TypeAlias
 
 import httpx
 
+from agentkit.memory.base import MetadataDict
+
+if TYPE_CHECKING:
+    from agentkit.llm.gateway import LLMGateway
+
 logger = logging.getLogger(__name__)
 
+# 标准化检索结果：id/content/score/source/document_id/document_title/
+# knowledge_base_id/metadata — 值为原始标量或嵌套 dict。
+RAGSearchResult: TypeAlias = dict[str, object]
+# ingest() 写入的文档负载：title/content/source_type/metadata。
+RAGIngestPayload: TypeAlias = dict[str, object]
+
 
 class HttpRAGService:
     """HTTP 客户端，调用业务系统的知识库检索 API
@@ -39,7 +52,7 @@ class HttpRAGService:
         knowledge_base_ids: list[str] | None = None,
         timeout: int = 30,
         contextual_chunking: bool = False,
-        llm_gateway: Any = None,
+        llm_gateway: LLMGateway | None = None,
     ):
         """
         Args:
@@ -74,7 +87,7 @@ class HttpRAGService:
         query: str,
         knowledge_base_ids: list[str] | None = None,
         top_k: int = 5,
-    ) -> list[dict[str, Any]]:
+    ) -> list[RAGSearchResult]:
         """语义检索知识库
 
         Args:
@@ -113,19 +126,23 @@ class HttpRAGService:
             normalized = []
             for r in results:
                 if isinstance(r, dict):
-                    normalized.append({
-                        "id": r.get("chunk_id", r.get("id", "")),
-                        "content": r.get("content", ""),
-                        "score": float(r.get("score", 0.0)),
-                        "source": r.get("source", "rag"),
-                        "document_id": r.get("document_id", ""),
-                        "document_title": r.get("document_title", ""),
-                        "metadata": r.get("metadata", {}),
-                    })
+                    normalized.append(
+                        {
+                            "id": r.get("chunk_id", r.get("id", "")),
+                            "content": r.get("content", ""),
+                            "score": float(r.get("score", 0.0)),
+                            "source": r.get("source", "rag"),
+                            "document_id": r.get("document_id", ""),
+                            "document_title": r.get("document_title", ""),
+                            "metadata": r.get("metadata", {}),
+                        }
+                    )
             return normalized
 
         except httpx.HTTPStatusError as e:
-            logger.error(f"RAG search HTTP error: {e.response.status_code} — {e.response.text[:200]}")
+            logger.error(
+                f"RAG search HTTP error: {e.response.status_code} — {e.response.text[:200]}"
+            )
             return []
         except httpx.RequestError as e:
             logger.error(f"RAG search request error: {e}")
@@ -141,7 +158,7 @@ class HttpRAGService:
         top_k: int = 5,
         use_rerank: bool = True,
         use_compression: bool = False,
-    ) -> list[dict[str, Any]]:
+    ) -> list[RAGSearchResult]:
         """增强语义检索知识库（支持 rerank 和 compression）
 
         对每个知识库分别调用 /bases/{kb_id}/retrieve 接口，
@@ -169,7 +186,7 @@ class HttpRAGService:
         }
 
         client = self._get_client()
-        all_results: list[dict[str, Any]] = []
+        all_results: list[RAGSearchResult] = []
 
         for kb_id in kb_ids:
             try:
@@ -189,28 +206,27 @@ class HttpRAGService:
                 # 标准化
                 for r in results:
                     if isinstance(r, dict):
-                        all_results.append({
-                            "id": r.get("chunk_id", r.get("id", "")),
-                            "content": r.get("content", ""),
-                            "score": float(r.get("score", 0.0)),
-                            "source": r.get("source", "rag"),
-                            "document_id": r.get("document_id", ""),
-                            "document_title": r.get("document_title", ""),
-                            "knowledge_base_id": kb_id,
-                            "metadata": r.get("metadata", {}),
-                        })
+                        all_results.append(
+                            {
+                                "id": r.get("chunk_id", r.get("id", "")),
+                                "content": r.get("content", ""),
+                                "score": float(r.get("score", 0.0)),
+                                "source": r.get("source", "rag"),
+                                "document_id": r.get("document_id", ""),
+                                "document_title": r.get("document_title", ""),
+                                "knowledge_base_id": kb_id,
+                                "metadata": r.get("metadata", {}),
+                            }
+                        )
 
             except httpx.HTTPStatusError as e:
                 if e.response.status_code == 404:
                     # This KB doesn't support enhanced search — fall back to
                     # standard search for THIS KB only, not all KBs.
                     logger.info(
-                        f"Enhanced search not available for KB {kb_id}, "
-                        f"using standard search"
-                    )
-                    std_result = await self.search(
-                        query, knowledge_base_ids=[kb_id], top_k=top_k
+                        f"Enhanced search not available for KB {kb_id}, using standard search"
                     )
+                    std_result = await self.search(query, knowledge_base_ids=[kb_id], top_k=top_k)
                     all_results.extend(std_result)
                 else:
                     logger.error(
@@ -232,9 +248,9 @@ class HttpRAGService:
     async def ingest(
         self,
         key: str,
-        value: Any,
-        metadata: dict[str, Any] | None = None,
-    ) -> dict[str, Any] | None:
+        value: object,
+        metadata: MetadataDict | None = None,
+    ) -> dict[str, object] | None:
         """写入文档到知识库（可选操作）
 
         When contextual_chunking is enabled and llm_gateway is configured,
@@ -308,5 +324,5 @@ class HttpRAGService:
     async def __aenter__(self) -> "HttpRAGService":
         return self
 
-    async def __aexit__(self, *args: Any) -> None:
+    async def __aexit__(self, *args: object) -> None:
         await self.close()
diff --git a/src/agentkit/memory/knowledge_base.py b/src/agentkit/memory/knowledge_base.py
index 84ef46d..2d23b94 100644
--- a/src/agentkit/memory/knowledge_base.py
+++ b/src/agentkit/memory/knowledge_base.py
@@ -11,7 +11,11 @@ from __future__ import annotations
 
 from dataclasses import dataclass, field
 from datetime import datetime, timezone
-from typing import Any, Protocol, runtime_checkable
+from typing import Protocol, TypeAlias, runtime_checkable
+
+from agentkit.memory.base import MetadataDict
+
+KBMetadata: TypeAlias = MetadataDict
 
 
 @dataclass
@@ -22,7 +26,7 @@ class Document:
     content: str
     title: str = ""
     source_id: str = ""
-    metadata: dict[str, Any] = field(default_factory=dict)
+    metadata: KBMetadata = field(default_factory=dict)
     created_at: datetime = field(default_factory=lambda: datetime.now(timezone.utc))
 
 
@@ -34,7 +38,7 @@ class QueryResult:
     source_id: str
     source_name: str
     score: float
-    metadata: dict[str, Any] = field(default_factory=dict)
+    metadata: KBMetadata = field(default_factory=dict)
     doc_id: str = ""
     title: str = ""
 
diff --git a/src/agentkit/memory/local_rag.py b/src/agentkit/memory/local_rag.py
index d9a02c1..8820131 100644
--- a/src/agentkit/memory/local_rag.py
+++ b/src/agentkit/memory/local_rag.py
@@ -11,25 +11,32 @@ from __future__ import annotations
 import json
 import logging
 import re
-import uuid
 from datetime import datetime, timezone
-from typing import Any
-
-_SAFE_TABLE_NAME_PATTERN = re.compile(r'^[a-zA-Z_][a-zA-Z0-9_]*$')
+from typing import TYPE_CHECKING, TypeAlias
 
 from agentkit.memory.chunking import Chunk, StructuralChunker, TextChunker
 from agentkit.memory.document_loader import Document as LoaderDocument
 from agentkit.memory.embedder import Embedder
 from agentkit.memory.knowledge_base import (
     Document,
-    KnowledgeBase,
     QueryResult,
     SourceInfo,
 )
 from agentkit.utils.vector_math import compute_cosine_similarity
 
+if TYPE_CHECKING:
+    from sqlalchemy.ext.asyncio import AsyncSession
+
+_SAFE_TABLE_NAME_PATTERN = re.compile(r"^[a-zA-Z_][a-zA-Z0-9_]*$")
+
 logger = logging.getLogger(__name__)
 
+# InMemoryLocalRAGService 内部存储的文档元信息结构。
+# 字段：title/source_id/format/chunk_ids/metadata/created_at — 值为标量或 list[str]。
+InMemoryDocInfo: TypeAlias = dict[str, object]
+# 内部 chunk 存储结构：content/embedding/metadata/source_doc_id。
+InMemoryChunkInfo: TypeAlias = dict[str, object]
+
 
 def _loader_doc_to_kb_doc(loader_doc: LoaderDocument) -> Document:
     """将 document_loader.Document 转换为 knowledge_base.Document"""
@@ -53,7 +60,7 @@ class LocalRAGService:
 
     def __init__(
         self,
-        session_factory: Any,
+        session_factory: object,
         embedder: Embedder,
         chunk_size: int = 1000,
         chunk_overlap: int = 200,
@@ -75,10 +82,14 @@ class LocalRAGService:
         self._chunk_overlap = chunk_overlap
         self._table_name = table_name
         if not _SAFE_TABLE_NAME_PATTERN.match(self._table_name):
-            raise ValueError(f"Invalid table_name: {self._table_name}. Must match [a-zA-Z_][a-zA-Z0-9_]*")
+            raise ValueError(
+                f"Invalid table_name: {self._table_name}. Must match [a-zA-Z_][a-zA-Z0-9_]*"
+            )
         self._pgvector_enabled = pgvector_enabled
         self._text_chunker = TextChunker(chunk_size=chunk_size, chunk_overlap=chunk_overlap)
-        self._structural_chunker = StructuralChunker(chunk_size=chunk_size, chunk_overlap=chunk_overlap)
+        self._structural_chunker = StructuralChunker(
+            chunk_size=chunk_size, chunk_overlap=chunk_overlap
+        )
 
     async def ingest(self, documents: list[Document]) -> list[str]:
         """摄取文档列表
@@ -136,9 +147,7 @@ class LocalRAGService:
             try:
                 from sqlalchemy import text as sql_text
 
-                sql = sql_text(
-                    f"DELETE FROM {self._table_name} WHERE source_doc_id = :doc_id"
-                )
+                sql = sql_text(f"DELETE FROM {self._table_name} WHERE source_doc_id = :doc_id")
                 await db.execute(sql, {"doc_id": id})
                 await db.commit()
                 return True
@@ -171,20 +180,15 @@ class LocalRAGService:
 
                 sources = []
                 for row in rows:
-                    meta = {}
-                    if row.get("doc_metadata"):
-                        try:
-                            meta = json.loads(row["doc_metadata"])
-                        except (json.JSONDecodeError, TypeError):
-                            pass
-
-                    sources.append(SourceInfo(
-                        source_id=row["source_doc_id"],
-                        source_name=row.get("source_title", ""),
-                        source_type=row.get("doc_format", "local"),
-                        document_count=row.get("chunk_count", 0),
-                        last_updated=row["created_at"] if row.get("created_at") else None,
-                    ))
+                    sources.append(
+                        SourceInfo(
+                            source_id=row["source_doc_id"],
+                            source_name=row.get("source_title", ""),
+                            source_type=row.get("doc_format", "local"),
+                            document_count=row.get("chunk_count", 0),
+                            last_updated=row["created_at"] if row.get("created_at") else None,
+                        )
+                    )
                 return sources
             except Exception as e:
                 logger.error(f"Failed to list sources: {e}")
@@ -271,7 +275,7 @@ class LocalRAGService:
 
     async def _query_pgvector(
         self,
-        db: Any,
+        db: AsyncSession,
         query_embedding: list[float],
         top_k: int,
     ) -> list[QueryResult]:
@@ -286,10 +290,13 @@ class LocalRAGService:
             f"LIMIT :lim"
         )
 
-        result = await db.execute(sql, {
-            "query_vec": str(query_embedding),
-            "lim": top_k,
-        })
+        result = await db.execute(
+            sql,
+            {
+                "query_vec": str(query_embedding),
+                "lim": top_k,
+            },
+        )
         rows = result.mappings().all()
 
         results = []
@@ -306,21 +313,23 @@ class LocalRAGService:
                 except (json.JSONDecodeError, TypeError):
                     pass
 
-            results.append(QueryResult(
-                content=row["content"],
-                source_id=row["source_doc_id"],
-                source_name=row.get("source_title", ""),
-                score=cosine,
-                metadata=chunk_meta,
-                doc_id=row["source_doc_id"],
-                title=row.get("source_title", ""),
-            ))
+            results.append(
+                QueryResult(
+                    content=row["content"],
+                    source_id=row["source_doc_id"],
+                    source_name=row.get("source_title", ""),
+                    score=cosine,
+                    metadata=chunk_meta,
+                    doc_id=row["source_doc_id"],
+                    title=row.get("source_title", ""),
+                )
+            )
 
         return results
 
     async def _query_client_side(
         self,
-        db: Any,
+        db: AsyncSession,
         query_embedding: list[float],
         top_k: int,
     ) -> list[QueryResult]:
@@ -363,15 +372,17 @@ class LocalRAGService:
                 except (json.JSONDecodeError, TypeError):
                     pass
 
-            candidates.append(QueryResult(
-                content=row["content"],
-                source_id=row["source_doc_id"],
-                source_name=row.get("source_title", ""),
-                score=cosine,
-                metadata=chunk_meta,
-                doc_id=row["source_doc_id"],
-                title=row.get("source_title", ""),
-            ))
+            candidates.append(
+                QueryResult(
+                    content=row["content"],
+                    source_id=row["source_doc_id"],
+                    source_name=row.get("source_title", ""),
+                    score=cosine,
+                    metadata=chunk_meta,
+                    doc_id=row["source_doc_id"],
+                    title=row.get("source_title", ""),
+                )
+            )
 
         candidates.sort(key=lambda x: x.score, reverse=True)
         return candidates[:top_k]
@@ -398,11 +409,15 @@ class InMemoryLocalRAGService:
         """
         self._embedder = embedder
         self._text_chunker = TextChunker(chunk_size=chunk_size, chunk_overlap=chunk_overlap)
-        self._structural_chunker = StructuralChunker(chunk_size=chunk_size, chunk_overlap=chunk_overlap)
+        self._structural_chunker = StructuralChunker(
+            chunk_size=chunk_size, chunk_overlap=chunk_overlap
+        )
 
         # 内存存储
-        self._chunks: dict[str, dict[str, Any]] = {}  # chunk_id → {content, embedding, metadata}
-        self._documents: dict[str, dict[str, Any]] = {}  # doc_id → {title, format, chunk_ids, metadata, created_at}
+        self._chunks: dict[str, InMemoryChunkInfo] = {}  # chunk_id → {content, embedding, metadata}
+        self._documents: dict[
+            str, InMemoryDocInfo
+        ] = {}  # doc_id → {title, format, chunk_ids, metadata, created_at}
 
     async def ingest(self, documents: list[Document]) -> list[str]:
         """摄取文档列表
@@ -459,15 +474,17 @@ class InMemoryLocalRAGService:
             source_doc_id = chunk_data["source_doc_id"]
             doc_info = self._documents.get(source_doc_id, {})
 
-            candidates.append(QueryResult(
-                content=chunk_data["content"],
-                source_id=source_doc_id,
-                source_name=doc_info.get("title", ""),
-                score=cosine,
-                metadata=chunk_data.get("metadata", {}),
-                doc_id=source_doc_id,
-                title=doc_info.get("title", ""),
-            ))
+            candidates.append(
+                QueryResult(
+                    content=chunk_data["content"],
+                    source_id=source_doc_id,
+                    source_name=doc_info.get("title", ""),
+                    score=cosine,
+                    metadata=chunk_data.get("metadata", {}),
+                    doc_id=source_doc_id,
+                    title=doc_info.get("title", ""),
+                )
+            )
 
         candidates.sort(key=lambda x: x.score, reverse=True)
         return candidates[:top_k]
@@ -488,13 +505,15 @@ class InMemoryLocalRAGService:
         """列出已摄取的文档"""
         sources = []
         for doc_id, doc_info in self._documents.items():
-            sources.append(SourceInfo(
-                source_id=doc_id,
-                source_name=doc_info["title"],
-                source_type=doc_info.get("format", "local"),
-                document_count=len(doc_info.get("chunk_ids", [])),
-                last_updated=doc_info.get("created_at"),
-            ))
+            sources.append(
+                SourceInfo(
+                    source_id=doc_id,
+                    source_name=doc_info["title"],
+                    source_type=doc_info.get("format", "local"),
+                    document_count=len(doc_info.get("chunk_ids", [])),
+                    last_updated=doc_info.get("created_at"),
+                )
+            )
         return sources
 
     async def health_check(self) -> bool:
diff --git a/src/agentkit/memory/multi_source_retriever.py b/src/agentkit/memory/multi_source_retriever.py
index 6ccf35d..ac0d40f 100644
--- a/src/agentkit/memory/multi_source_retriever.py
+++ b/src/agentkit/memory/multi_source_retriever.py
@@ -13,7 +13,6 @@ import asyncio
 import hashlib
 import logging
 from dataclasses import replace
-from typing import Any
 
 from agentkit.memory.knowledge_base import KnowledgeBase, QueryResult, SourceInfo
 
@@ -186,15 +185,13 @@ class MultiSourceRetriever:
         Returns:
             所有源的检索结果列表（已应用权重）
         """
+
         async def _query_one(name: str, kb: KnowledgeBase) -> list[QueryResult]:
             try:
                 results = await kb.query(query, top_k=top_k)
                 # 应用权重
                 weight = (weights or {}).get(name, 1.0)
-                return [
-                    replace(r, score=r.score * weight, source_name=name)
-                    for r in results
-                ]
+                return [replace(r, score=r.score * weight, source_name=name) for r in results]
             except Exception as e:
                 logger.error(f"Query failed for source '{name}': {e}")
                 return []
diff --git a/src/agentkit/memory/profile.py b/src/agentkit/memory/profile.py
index 6f7ace8..b7050d5 100644
--- a/src/agentkit/memory/profile.py
+++ b/src/agentkit/memory/profile.py
@@ -7,10 +7,10 @@
 from __future__ import annotations
 
 import re
-from dataclasses import dataclass, field
+from dataclasses import dataclass
 from datetime import datetime, timezone
 from pathlib import Path
-from typing import Any, Callable
+from typing import Callable
 
 
 class MemoryFile:
@@ -26,8 +26,9 @@ class MemoryFile:
 
     """
 
-    def __init__(self, path: Path, char_budget: int | None = None,
-                 protected_sections: set[str] | None = None):
+    def __init__(
+        self, path: Path, char_budget: int | None = None, protected_sections: set[str] | None = None
+    ):
         self.path = Path(path)
         self.char_budget = char_budget
         self._protected_sections = protected_sections or set()
@@ -138,7 +139,7 @@ class MemoryFile:
         for match in re.finditer(r"^## (.+)$", content, re.MULTILINE):
             name = match.group(1).strip()
             start = match.start()
-            next_match = re.search(r"^## ", content[match.end():], re.MULTILINE)
+            next_match = re.search(r"^## ", content[match.end() :], re.MULTILINE)
             if next_match:
                 end = match.end() + next_match.start()
             else:
@@ -146,7 +147,7 @@ class MemoryFile:
             sections.append((name, start, end))
 
         if not sections:
-            return content[:self.char_budget]
+            return content[: self.char_budget]
 
         # 保持原始顺序，标记每个 section 是否受保护
         ordered: list[tuple[str, str, bool]] = []  # (name, text, is_protected)
@@ -222,8 +223,9 @@ class MemoryStore:
 
     """
 
-    def __init__(self, base_dir: Path | str | None = None,
-                 on_change: Callable[[str], None] | None = None):
+    def __init__(
+        self, base_dir: Path | str | None = None, on_change: Callable[[str], None] | None = None
+    ):
         if base_dir is None:
             base_dir = Path.home() / ".agentkit"
         self.base_dir = Path(base_dir)
@@ -238,7 +240,9 @@ class MemoryStore:
             protected_sections={"版本", "更新历史"},
         )
         self._user = MemoryFile(self.base_dir / "memories" / "USER.md", char_budget=USER_BUDGET)
-        self._memory = MemoryFile(self.base_dir / "memories" / "MEMORY.md", char_budget=MEMORY_BUDGET)
+        self._memory = MemoryFile(
+            self.base_dir / "memories" / "MEMORY.md", char_budget=MEMORY_BUDGET
+        )
         self._daily_dir = self.base_dir / "memories" / "daily"
         self._daily_dir.mkdir(parents=True, exist_ok=True)
 
@@ -376,4 +380,5 @@ class MemoryStore:
             self._on_change(new_prompt)
         except Exception:
             import logging
+
             logging.getLogger(__name__).warning("Memory notify_change failed", exc_info=True)
diff --git a/src/agentkit/memory/query_transformer.py b/src/agentkit/memory/query_transformer.py
index 4bab9e6..defbb48 100644
--- a/src/agentkit/memory/query_transformer.py
+++ b/src/agentkit/memory/query_transformer.py
@@ -87,10 +87,22 @@ class RuleQueryTransformer(QueryTransformerBase):
     """
 
     _FILLER_WORDS_CN: list[str] = [
-        "帮我", "请", "一下", "分析", "看看", "告诉我", "想知道", "请问",
+        "帮我",
+        "请",
+        "一下",
+        "分析",
+        "看看",
+        "告诉我",
+        "想知道",
+        "请问",
     ]
     _FILLER_WORDS_EN: list[str] = [
-        "please", "can you", "help me", "could you", "i want to", "i need to",
+        "please",
+        "can you",
+        "help me",
+        "could you",
+        "i want to",
+        "i need to",
     ]
 
     def __init__(
@@ -101,9 +113,7 @@ class RuleQueryTransformer(QueryTransformerBase):
         self._synonyms = synonyms or {}
         self._max_sub_queries = max_sub_queries
         # Pre-compile filler patterns
-        self._filler_patterns_cn = [
-            re.compile(re.escape(w)) for w in self._FILLER_WORDS_CN
-        ]
+        self._filler_patterns_cn = [re.compile(re.escape(w)) for w in self._FILLER_WORDS_CN]
         self._filler_patterns_en = [
             re.compile(re.escape(w), re.IGNORECASE) for w in self._FILLER_WORDS_EN
         ]
@@ -166,7 +176,9 @@ def create_query_transformer(
     """工厂函数：根据策略创建查询改写器"""
     if strategy == "llm":
         if llm_gateway is None:
-            logger.warning("LLM strategy requested but no llm_gateway provided, falling back to NoOp")
+            logger.warning(
+                "LLM strategy requested but no llm_gateway provided, falling back to NoOp"
+            )
             return NoOpQueryTransformer()
         return LLMQueryTransformer(llm_gateway, max_sub_queries=max_sub_queries)
     elif strategy == "rule":
diff --git a/src/agentkit/memory/rag_loop.py b/src/agentkit/memory/rag_loop.py
index b0d6074..e621bde 100644
--- a/src/agentkit/memory/rag_loop.py
+++ b/src/agentkit/memory/rag_loop.py
@@ -7,11 +7,11 @@
 from __future__ import annotations
 
 import logging
-from dataclasses import dataclass, field
+from dataclasses import dataclass
 from enum import Enum
-from typing import Any
+from typing import TYPE_CHECKING
 
-from agentkit.memory.base import MemoryItem
+from agentkit.memory.base import MemoryItem, MetadataDict
 from agentkit.memory.query_transformer import QueryTransformerBase, NoOpQueryTransformer
 from agentkit.memory.relevance_scorer import (
     RelevanceScorer,
@@ -19,6 +19,10 @@ from agentkit.memory.relevance_scorer import (
     RetrievalEvaluation,
 )
 
+if TYPE_CHECKING:
+    # 避免与 retriever.py 形成运行时循环导入。
+    from agentkit.memory.retriever import MemoryRetriever
+
 logger = logging.getLogger(__name__)
 
 
@@ -70,7 +74,7 @@ class RAGSelfCorrectionLoop:
 
     def __init__(
         self,
-        retriever: Any,  # MemoryRetriever
+        retriever: MemoryRetriever,
         scorer: RelevanceScorer | None = None,
         query_transformer: QueryTransformerBase | None = None,
         max_retries: int = 3,
@@ -87,7 +91,7 @@ class RAGSelfCorrectionLoop:
         query: str,
         top_k: int = 5,
         token_budget: int = 3000,
-        filters: dict[str, Any] | None = None,
+        filters: MetadataDict | None = None,
     ) -> RAGLoopResult:
         """执行带自纠正的检索
 
@@ -107,8 +111,11 @@ class RAGSelfCorrectionLoop:
         while retry_count <= self._max_retries:
             # RETRIEVE
             items = await self._retriever.retrieve(
-                current_query, top_k=top_k, token_budget=token_budget,
-                filters=filters, _skip_correction=True,
+                current_query,
+                top_k=top_k,
+                token_budget=token_budget,
+                filters=filters,
+                _skip_correction=True,
             )
 
             # EVALUATE
@@ -144,9 +151,7 @@ class RAGSelfCorrectionLoop:
             # CORRECT — rewrite query and retry
             retry_count += 1
             if retry_count <= self._max_retries:
-                current_query = await self._rewrite_query(
-                    query, current_query, evaluation
-                )
+                current_query = await self._rewrite_query(query, current_query, evaluation)
                 continue
 
             # DEGRADE — exceeded max retries
@@ -154,9 +159,7 @@ class RAGSelfCorrectionLoop:
 
         # Degraded result: filter to relevant items and mark low confidence
         relevant_items = [
-            s.item
-            for s in evaluation.scores
-            if s.verdict != RelevanceVerdict.INCORRECT
+            s.item for s in evaluation.scores if s.verdict != RelevanceVerdict.INCORRECT
         ]
         result_items = relevant_items if relevant_items else items
 
diff --git a/src/agentkit/memory/relevance_scorer.py b/src/agentkit/memory/relevance_scorer.py
index 7866cce..79d8746 100644
--- a/src/agentkit/memory/relevance_scorer.py
+++ b/src/agentkit/memory/relevance_scorer.py
@@ -6,11 +6,9 @@
 from __future__ import annotations
 
 import logging
-import math
 import re
 from dataclasses import dataclass
 from enum import Enum
-from typing import Any
 
 from agentkit.memory.base import MemoryItem
 
@@ -120,9 +118,7 @@ class RelevanceScorer:
             reason=reason,
         )
 
-    def evaluate(
-        self, query: str, items: list[MemoryItem]
-    ) -> RetrievalEvaluation:
+    def evaluate(self, query: str, items: list[MemoryItem]) -> RetrievalEvaluation:
         """评估一次检索的整体质量"""
         if not items:
             return RetrievalEvaluation(
@@ -134,9 +130,7 @@ class RelevanceScorer:
             )
 
         scores = [self.score_item(query, item) for item in items]
-        relevant_count = sum(
-            1 for s in scores if s.verdict != RelevanceVerdict.INCORRECT
-        )
+        relevant_count = sum(1 for s in scores if s.verdict != RelevanceVerdict.INCORRECT)
         avg_score = sum(s.score for s in scores) / len(scores)
 
         # Overall verdict based on average score and relevant ratio
diff --git a/src/agentkit/memory/retriever.py b/src/agentkit/memory/retriever.py
index e1b36d2..01d9110 100644
--- a/src/agentkit/memory/retriever.py
+++ b/src/agentkit/memory/retriever.py
@@ -7,19 +7,16 @@ from __future__ import annotations
 
 import asyncio
 import logging
-import math
 from dataclasses import replace
-from datetime import datetime
-from typing import Any
 
-from agentkit.memory.base import Memory, MemoryItem
+from agentkit.memory.base import MemoryItem, MetadataDict
 from agentkit.memory.working import WorkingMemory
 from agentkit.memory.episodic import EpisodicMemory
 from agentkit.memory.semantic import SemanticMemory
 from agentkit.memory.query_transformer import QueryTransformerBase
 from agentkit.memory.rag_loop import RAGSelfCorrectionLoop
 from agentkit.memory.relevance_scorer import RelevanceScorer
-from agentkit.memory.knowledge_base import KnowledgeBase, QueryResult
+from agentkit.memory.knowledge_base import KnowledgeBase
 from agentkit.memory.multi_source_retriever import MultiSourceRetriever
 from agentkit.tools.base import Tool
 
@@ -32,11 +29,11 @@ def _estimate_tokens(text: str) -> int:
     Chinese characters typically use 1-2 tokens each.
     English words typically use 1 token each.
     """
-    cjk_count = sum(1 for c in text if '\u4e00' <= c <= '\u9fff')
+    cjk_count = sum(1 for c in text if "\u4e00" <= c <= "\u9fff")
     non_cjk = text
     for c in text:
-        if '\u4e00' <= c <= '\u9fff':
-            non_cjk = non_cjk.replace(c, ' ')
+        if "\u4e00" <= c <= "\u9fff":
+            non_cjk = non_cjk.replace(c, " ")
     word_count = len(non_cjk.split())
     return cjk_count * 2 + word_count
 
@@ -89,7 +86,7 @@ class MemoryRetriever:
         query: str,
         top_k: int = 5,
         token_budget: int = 3000,
-        filters: dict[str, Any] | None = None,
+        filters: MetadataDict | None = None,
         _skip_correction: bool = False,
         sources: list[str] | None = None,
         source_weights: dict[str, float] | None = None,
@@ -121,9 +118,7 @@ class MemoryRetriever:
                 query, top_k=top_k, token_budget=token_budget, filters=filters
             )
             if result.degraded:
-                logger.warning(
-                    f"RAG self-correction degraded after {result.total_retries} retries"
-                )
+                logger.warning(f"RAG self-correction degraded after {result.total_retries} retries")
             return result.items
         # Query transformation
         if self._query_transformer is not None:
@@ -139,9 +134,7 @@ class MemoryRetriever:
 
         # Sub-query search in parallel
         if sub_queries:
-            sub_tasks = [
-                self._search_layers(sq, top_k, filters) for sq in sub_queries
-            ]
+            sub_tasks = [self._search_layers(sq, top_k, filters) for sq in sub_queries]
             sub_results = await asyncio.gather(*sub_tasks, return_exceptions=True)
             for result in sub_results:
                 if isinstance(result, Exception):
@@ -178,7 +171,7 @@ class MemoryRetriever:
         self,
         query: str,
         top_k: int = 5,
-        filters: dict[str, Any] | None = None,
+        filters: MetadataDict | None = None,
     ) -> list[MemoryItem]:
         """Search all configured memory layers with a single query"""
         tasks = []
@@ -237,18 +230,20 @@ class MemoryRetriever:
         # QueryResult → MemoryItem
         items = []
         for r in kb_results:
-            items.append(MemoryItem(
-                key=r.source_id,
-                value=r.content,
-                metadata={
-                    **r.metadata,
-                    "source": "rag",
-                    "source_name": r.source_name,
-                    "doc_id": r.doc_id,
-                    "document_title": r.title,
-                },
-                score=r.score,
-            ))
+            items.append(
+                MemoryItem(
+                    key=r.source_id,
+                    value=r.content,
+                    metadata={
+                        **r.metadata,
+                        "source": "rag",
+                        "source_name": r.source_name,
+                        "doc_id": r.doc_id,
+                        "document_title": r.title,
+                    },
+                    score=r.score,
+                )
+            )
 
         # Token 预算管理
         selected = []
@@ -318,7 +313,9 @@ class MemoryRetriever:
         if source == "rag":
             kb_type = item.metadata.get("kb_type", "知识库")
             document_title = item.metadata.get("document_title", "未知文档")
-            return f"### 知识库参考 [来源: {kb_type} | 相关度: {score:.2f} | 文档: {document_title}]"
+            return (
+                f"### 知识库参考 [来源: {kb_type} | 相关度: {score:.2f} | 文档: {document_title}]"
+            )
         elif source == "graph":
             return f"### 知识图谱 [实体: {item.key} | 相关度: {score:.2f}]"
         elif source == "episodic":
@@ -330,7 +327,7 @@ class MemoryRetriever:
             return f"### 参考 [来源: {source} | 相关度: {score:.2f}]"
 
     async def store_episode(
-        self, key: str, value: Any, metadata: dict[str, Any] | None = None
+        self, key: str, value: object, metadata: MetadataDict | None = None
     ) -> None:
         """Store an episode into episodic memory if available.
 
@@ -386,12 +383,14 @@ class RetrieveKnowledgeTool(Tool):
             items = await self._retriever.retrieve(query, top_k=5)
             results = []
             for item in items:
-                results.append({
-                    "content": item.value,
-                    "score": item.score,
-                    "source": item.metadata.get("source", "unknown"),
-                    "document_title": item.metadata.get("document_title", ""),
-                })
+                results.append(
+                    {
+                        "content": item.value,
+                        "score": item.score,
+                        "source": item.metadata.get("source", "unknown"),
+                        "document_title": item.metadata.get("document_title", ""),
+                    }
+                )
             return {"query": query, "results": results, "call_count": self._call_count}
         except Exception as e:
             return {"error": str(e), "results": []}
diff --git a/src/agentkit/memory/semantic.py b/src/agentkit/memory/semantic.py
index 181c9e2..2fd6e5e 100644
--- a/src/agentkit/memory/semantic.py
+++ b/src/agentkit/memory/semantic.py
@@ -3,14 +3,45 @@
 适配器模式，对接外部 RAG 服务和知识图谱。
 """
 
-import logging
-from typing import Any
+from __future__ import annotations
 
-from agentkit.memory.base import Memory, MemoryItem
+import logging
+from typing import TYPE_CHECKING, Protocol
+
+from agentkit.memory.base import Memory, MemoryItem, MetadataDict
+
+if TYPE_CHECKING:
+    from agentkit.memory.http_rag import RAGSearchResult
 
 logger = logging.getLogger(__name__)
 
 
+class _RAGServiceLike(Protocol):
+    """RAG 检索服务最小接口契约（duck-typed）。"""
+
+    async def search(
+        self,
+        query: str,
+        knowledge_base_ids: list[str] | None = ...,
+        top_k: int = ...,
+    ) -> list[RAGSearchResult]: ...
+
+    async def enhanced_search(
+        self,
+        query: str,
+        knowledge_base_ids: list[str] | None = ...,
+        top_k: int = ...,
+        use_rerank: bool = ...,
+        use_compression: bool = ...,
+    ) -> list[RAGSearchResult]: ...
+
+
+class _GraphServiceLike(Protocol):
+    """知识图谱服务最小接口契约（duck-typed）。"""
+
+    async def query(self, query: str, depth: int = ...) -> list[dict[str, object]]: ...
+
+
 class SemanticMemory(Memory):
     """Semantic Memory - 知识库检索
 
@@ -19,8 +50,8 @@ class SemanticMemory(Memory):
 
     def __init__(
         self,
-        rag_service: Any = None,
-        graph_service: Any = None,
+        rag_service: _RAGServiceLike | None = None,
+        graph_service: _GraphServiceLike | None = None,
         knowledge_base_ids: list[str] | None = None,
         search_mode: str = "standard",
         use_rerank: bool = True,
@@ -45,9 +76,9 @@ class SemanticMemory(Memory):
         self._use_compression = use_compression
         self._kb_weights = kb_weights
 
-    async def store(self, key: str, value: Any, metadata: dict[str, Any] | None = None) -> None:
+    async def store(self, key: str, value: object, metadata: MetadataDict | None = None) -> None:
         """Semantic Memory 通常只读，写入委托给 RAG 服务的 ingest 方法"""
-        if self._rag_service and hasattr(self._rag_service, 'ingest'):
+        if self._rag_service and hasattr(self._rag_service, "ingest"):
             await self._rag_service.ingest(key, value, metadata)
         else:
             logger.warning("SemanticMemory.store: no RAG service configured for writing")
@@ -56,7 +87,9 @@ class SemanticMemory(Memory):
         """按 key 精确检索（Semantic Memory 通常不按 key 检索）"""
         return None
 
-    async def search(self, query: str, top_k: int = 5, filters: dict[str, Any] | None = None) -> list[MemoryItem]:
+    async def search(
+        self, query: str, top_k: int = 5, filters: MetadataDict | None = None
+    ) -> list[MemoryItem]:
         """语义检索知识库"""
         items = []
 
@@ -64,7 +97,9 @@ class SemanticMemory(Memory):
         if self._rag_service:
             try:
                 kb_ids = (filters or {}).get("knowledge_base_ids", self._knowledge_base_ids)
-                if self._search_mode == "enhanced" and hasattr(self._rag_service, "enhanced_search"):
+                if self._search_mode == "enhanced" and hasattr(
+                    self._rag_service, "enhanced_search"
+                ):
                     results = await self._rag_service.enhanced_search(
                         query,
                         knowledge_base_ids=kb_ids,
@@ -73,24 +108,28 @@ class SemanticMemory(Memory):
                         use_compression=self._use_compression,
                     )
                 else:
-                    results = await self._rag_service.search(query, knowledge_base_ids=kb_ids, top_k=top_k)
+                    results = await self._rag_service.search(
+                        query, knowledge_base_ids=kb_ids, top_k=top_k
+                    )
                 for r in results:
                     kb_id = r.get("knowledge_base_id", "")
                     score = r.get("score", 0.0)
                     # Apply per-KB weights
                     if self._kb_weights and kb_id in self._kb_weights:
                         score *= self._kb_weights[kb_id]
-                    items.append(MemoryItem(
-                        key=r.get("id", ""),
-                        value=r.get("content", ""),
-                        metadata={
-                            "source": r.get("source", "rag"),
-                            "score": score,
-                            "document_id": r.get("document_id"),
-                            "knowledge_base_id": kb_id,
-                        },
-                        score=score,
-                    ))
+                    items.append(
+                        MemoryItem(
+                            key=r.get("id", ""),
+                            value=r.get("content", ""),
+                            metadata={
+                                "source": r.get("source", "rag"),
+                                "score": score,
+                                "document_id": r.get("document_id"),
+                                "knowledge_base_id": kb_id,
+                            },
+                            score=score,
+                        )
+                    )
             except Exception as e:
                 logger.error(f"RAG search failed: {e}")
 
@@ -99,16 +138,18 @@ class SemanticMemory(Memory):
             try:
                 graph_results = await self._graph_service.query(query, depth=2)
                 for r in graph_results[:top_k]:
-                    items.append(MemoryItem(
-                        key=r.get("id", ""),
-                        value=r.get("content", ""),
-                        metadata={
-                            "source": "graph",
-                            "entities": r.get("entities", []),
-                            "relations": r.get("relations", []),
-                        },
-                        score=r.get("score", 0.0),
-                    ))
+                    items.append(
+                        MemoryItem(
+                            key=r.get("id", ""),
+                            value=r.get("content", ""),
+                            metadata={
+                                "source": "graph",
+                                "entities": r.get("entities", []),
+                                "relations": r.get("relations", []),
+                            },
+                            score=r.get("score", 0.0),
+                        )
+                    )
             except Exception as e:
                 logger.error(f"Graph search failed: {e}")
 
diff --git a/src/agentkit/memory/working.py b/src/agentkit/memory/working.py
index 3861f50..83e3368 100644
--- a/src/agentkit/memory/working.py
+++ b/src/agentkit/memory/working.py
@@ -3,11 +3,10 @@
 import json
 import logging
 from datetime import datetime, timezone
-from typing import Any
 
 import redis.asyncio as aioredis
 
-from agentkit.memory.base import Memory, MemoryItem
+from agentkit.memory.base import Memory, MemoryItem, MetadataDict
 
 logger = logging.getLogger(__name__)
 
@@ -32,7 +31,7 @@ class WorkingMemory(Memory):
     def _make_key(self, key: str) -> str:
         return f"{self._key_prefix}:{key}"
 
-    async def store(self, key: str, value: Any, metadata: dict[str, Any] | None = None) -> None:
+    async def store(self, key: str, value: object, metadata: MetadataDict | None = None) -> None:
         redis_key = self._make_key(key)
         item = MemoryItem(
             key=key,
@@ -57,10 +56,14 @@ class WorkingMemory(Memory):
             value=item_dict["value"],
             metadata=item_dict.get("metadata", {}),
             score=item_dict.get("score", 1.0),
-            created_at=datetime.fromisoformat(item_dict["created_at"]) if item_dict.get("created_at") else datetime.now(timezone.utc),
+            created_at=datetime.fromisoformat(item_dict["created_at"])
+            if item_dict.get("created_at")
+            else datetime.now(timezone.utc),
         )
 
-    async def search(self, query: str, top_k: int = 5, filters: dict[str, Any] | None = None) -> list[MemoryItem]:
+    async def search(
+        self, query: str, top_k: int = 5, filters: MetadataDict | None = None
+    ) -> list[MemoryItem]:
         """Working Memory 不支持语义检索，按 key 前缀匹配"""
         pattern = self._make_key(f"{query}*")
         keys = []
@@ -74,13 +77,15 @@ class WorkingMemory(Memory):
             data = await self._redis.get(key)
             if data:
                 item_dict = json.loads(data)
-                items.append(MemoryItem(
-                    key=item_dict["key"],
-                    value=item_dict["value"],
-                    metadata=item_dict.get("metadata", {}),
-                    score=1.0,
-                    created_at=datetime.now(timezone.utc),
-                ))
+                items.append(
+                    MemoryItem(
+                        key=item_dict["key"],
+                        value=item_dict["value"],
+                        metadata=item_dict.get("metadata", {}),
+                        score=1.0,
+                        created_at=datetime.now(timezone.utc),
+                    )
+                )
         return items
 
     async def delete(self, key: str) -> bool: