geo/backend/app/utils/text.py

16 lines
447 B
Python

"""文本清理工具函数
清理原始响应中的无效控制字符,避免 PostgreSQL UTF-8 插入失败。
"""
import re
def sanitize_raw_response(text: str | None) -> str:
"""清理原始响应中的无效控制字符,避免 PostgreSQL UTF-8 插入失败
移除 NULL 字节及其他非法控制字符,保留 \\n \\t \\r
"""
if not text:
return ""
return re.sub(r"[\x00-\x08\x0b\x0c\x0e-\x1f]", "", text)