反思优化1.0(优化隐私输出、时间检索)

This commit is contained in:
lixinyue
2026-01-19 16:28:01 +08:00
parent 871304c89b
commit 5a0d3df689
9 changed files with 173 additions and 170 deletions

View File

@@ -24,15 +24,9 @@ from app.core.memory.utils.config.get_data import (
get_data,
get_data_statement,
)
from app.core.memory.utils.llm.llm_utils import get_llm_client
from app.core.memory.utils.prompt.template_render import (
render_evaluate_prompt,
render_reflexion_prompt,
)
from app.core.models.base import RedBearModelConfig
from app.core.response_utils import success
from app.repositories.neo4j.cypher_queries import (
UPDATE_STATEMENT_INVALID_AT,
neo4j_query_all,
neo4j_query_part,
neo4j_statement_all,
@@ -160,12 +154,11 @@ class ReflectionEngine:
self.neo4j_connector = Neo4jConnector()
if self.llm_client is None:
from app.core.memory.utils.config import definitions as config_defs
from app.core.memory.utils.llm.llm_utils import MemoryClientFactory
from app.db import get_db_context
with get_db_context() as db:
factory = MemoryClientFactory(db)
self.llm_client = factory.get_llm_client(config_defs.SELECTED_LLM_ID)
self.llm_client = factory.get_llm_client(self.config.model_id)
elif isinstance(self.llm_client, str):
# 如果 llm_client 是字符串model_id则用它初始化客户端
from app.core.memory.utils.llm.llm_utils import MemoryClientFactory
@@ -263,25 +256,23 @@ class ReflectionEngine:
# 2. 检测冲突(基于事实的反思)
conflict_data = await self._detect_conflicts(reflexion_data, statement_databasets)
print(100 * '-')
print(conflict_data)
print(100 * '-')
# # 检查是否真的有冲突
conflicts_found=''
conflict_list=[]
for i in conflict_data:
conflict_list.append(i['data'])
conflicts_found=''
conflicts_found=0
# 3. 解决冲突
solved_data = await self._resolve_conflicts(conflict_data, statement_databasets)
solved_data = await self._resolve_conflicts(conflict_list, statement_databasets)
if not solved_data:
return ReflectionResult(
success=False,
message="反思失败,未解决冲突",
message=f"没有{self.config.baseline}相关的冲突数据",
conflicts_found=conflicts_found,
execution_time=asyncio.get_event_loop().time() - start_time
)
print(100 * '*')
print(solved_data)
print(100 * '*')
conflicts_resolved = len(solved_data)
logging.info(f"解决了 {conflicts_resolved} 个冲突")
@@ -386,7 +377,7 @@ class ReflectionEngine:
memory_verifies.append(item['memory_verify'])
result_data['memory_verifies'] = memory_verifies
result_data['quality_assessments'] = quality_assessments
conflicts_found=''
conflicts_found = 0 # 初始化为整数0而不是空字符串
REMOVE_KEYS = {"created_at", "expired_at","relationship","predicate","statement_id","id","statement_id","relationship_statement_id"}
# Clearn conflict_dataAnd memory_verify和quality_assessment
cleaned_conflict_data = []
@@ -414,7 +405,7 @@ class ReflectionEngine:
cleaned_conflict_data_.append(cleaned_item)
print(cleaned_conflict_data_)
# 3. 解决冲突
solved_data = await self._resolve_conflicts(cleaned_conflict_data, source_data)
solved_data = await self._resolve_conflicts(cleaned_conflict_data_, source_data)
if not solved_data:
return ReflectionResult(
success=False,
@@ -739,4 +730,3 @@ class ReflectionEngine:
raise ValueError(f"未知的反思基线: {self.config.baseline}")

View File

@@ -24,7 +24,8 @@
- **身份冲突**: 同一实体被赋予不同类型或角色
- **隐私审核**: 存在隐私信息也作为冲突输出当{{ memory_verify }}是true的时候
### 混合冲突
检测所有逻辑不一致或相互矛盾的记录。
- 检测所有逻辑不一致或相互矛盾的记录。
- **隐私审核**: 存在隐私信息也作为冲突输出当{{ memory_verify }}是true的时候
**检测原则**:
- 重点检查相同实体的记录
- 分析description字段语义冲突

View File

@@ -63,7 +63,7 @@
**脱敏字段**: name、entity1_name、entity2_name、description、relationship
## 4. 处理流程
###如果存在冲突数据执行以下步骤不存在返回【】在data中
### 步骤1: 类型匹配验证
**匹配规则**:
- baseline="TIME": 只处理时间相关冲突(涉及时间表达式、日期、时间点)
@@ -78,7 +78,7 @@
### 步骤2: 冲突数据分组
**分组策略**:
- 时间冲突组: 涉及用户时间的记录
- 时间冲突组: 涉及用户时间的记录比如生日在2月17...
- 活动时间冲突组: 同一活动不同时间的记录
- 事实冲突组: 同一实体不同属性的记录
- 其他冲突组: 其他类型冲突记录
@@ -97,11 +97,12 @@
### 处理规则
** baseline是TIME
-保留正确记录不变修改错误记录的expired_at为当前时间(2025-12-16T12:00:00),以及name需要修改成正确的
** baseline不是TIME
- 只处理时间相关的内容,比如时间表达式、日期、时间点
-保留正确记录不变修改错误记录的expired_at为当前时间比如(2025-12-16T12:00:00)
** baseline是FACT或者HYBRID
- 处理不是时间相关的内容
- 修改字段内容( name、entity1_name、entity2_name、description、relationship字段内容是否正确如果不正确需要对这些字段的内容重新生成则不需要修改expired_at字段,
如果涉及到修改entity1_name/entity2_name字段的时候同时也需要修改description字段输出修改前和修改后的放入change里面的field
**核心原则**:
- 只输出需要修改的记录
- 优先保留策略: 时间冲突保留最可信created_at时间事实冲突选择最新且可信度最高记录
@@ -110,22 +111,26 @@
- 脱敏变更记录: 隐私脱敏变更也必须在change字段中记录{% endif %}
- 不可修改数据: 数据被判定为正确时不可修改,无数据可输出时为空
- 输出的结果reflexion字段中的reason字段和solution不允许含有expired_at设为2024-01-01T00:00:00Z、memory_verify=true、memory_verify=false)等原数据字段以及涉及需要修改的字段以及内容,
如果是FACT只记录事实冲突相关的数据如果是TIME只记录时间冲突相关的数据如果是HYBRID则记录所有冲突相关的数据
如果是FACT只记录事实冲突相关的数据如果是TIME只记录时间冲突相关的数据如果是HYBRID则记录所有冲突相关的数据,如果存在隐私审核隐私审核是true也需要放到reflexion的reason字段和solution
**变更记录格式**:
```json
"change": [
{
"field": [
{"id":修改字段对应的ID}
{"statement_id":需要修改的对象对应的statement_id}
{"字段名1": ["修改前的值1","修改后的值1"]},
{"字段名2": ["修改前的值2","修改后的值2"]}
{"id": "修改字段对应的ID"},
{"字段名1": ["修改前的值1", "修改后的值1"]},
{"字段名2": ["修改前的值2", "修改后的值2"]}
]
}
]
```
**resolved_memory格式说明**:
- 对于TIME类型冲突: 只需expired_at字段即可
- 对于FACT/HYBRID类型冲突: 需要包含完整的记录对象包括name、entity1_name、entity2_name、description、relationship等所有相关字段
- resolved_memory中只包含需要修改的记录不需要修改的记录不要包含在内
**类型不匹配处理**:
- 冲突类型与baseline不匹配时resolved设为null
- reflexion.reason说明类型不匹配原因
@@ -157,7 +162,8 @@
"conflict": true
},
"reflexion": {
"reason": "该冲突类型的原因分析如果是FACT就是存在事实冲突分析该冲突原因如果是TIME就是存在时间冲突分析该冲突原因如果是HYBRID可以输出存在时间与事实的混合冲突再添加上原因分析
"reason": "该冲突类型的原因分析如果是FACT就是存在事实冲突分析该冲突原因如果是TIME就是存在时间冲突分析该冲突原因如果是HYBRID可以输出存在时间与事实的混合冲突再添加上原因分析如果
隐私审核打开的时候如果存在冲突,分析该冲突的原因
不可以随意分配冲突类型以及原因不允许输出字段比如statement、description、entity1_name、entity2_name、name、memory_verify、expired_at、conflict等类似这种",
"solution": "该冲突类型的解决方案不允许输出字段比如statement、description、entity1_name、entity2_name、name、memory_verify、expired_at、conflict等类似这种"
},